Мы разрабатываем AI-помощников для автоматизации поддержки клиентов Сбербанка в каналах чата. Наши решения на основе ML и LLM самостоятельно обрабатывают вопросы, сокращая нагрузку на операторов и обслуживая до 50+ млн клиентов в месяц. В составе команды вы будете отвечать за полный цикл создания AI/ML решений— от генерации идеи до внедрения в высоконагруженный продакшен. Мы ищем NLP Data Scientist’а для разработки и улучшения решений с упором на работу с LLM-моделями, прежде всего GigaChat. Обязанности Разработка и внедрение LLM моделей для решения NLU задач бизнеса (SFT, RAG (Retrieval Augmented Generation), Agents, Summarization, Text Ranking, Text Matching, Language Modeling) Дообучение LLM моделей Разработка подходов и процессов разметки данных для оценки качества работы LLM Формирование и работа с ML пайплайнами: работа с данными, обучение/дообучение NLP моделей, оценка качества решений, поддержка/автоматизация решений Оптимизация работы моделей для промышленного контура на CPU/GPU Работа с командой бизнес-представителей, DS-разработчиками Организация проверки и генерация гипотез для решения технических и бизнес-задач. Требования Опыт разработки на python, numpy, sklearn, pandas + библиотеки обработки текстовых данных Опыт работы с Pytorch для построения DL текстовых моделей Опыт работы с библиотеками LangChain/LangGraph Опыт практической работы с LLM через API Отличные теоретические знания классического и нейросетевого NLP, в тч LLM Опыт дообучения классических трансформеров и LLM Практический опыт, эксперименты, внедрение в ПРОД LLM решений Опыт prompt-engineering Знание sql Linux, Git. Будет плюсом: Работа с инструментами Hadoop (HDFS, Hive), Spark Опыт постановки и проведения a/b тестов Опыт работы с распределенным обучением, глубокое знание GPU архитектуры. Условия Комфортный современный офис рядом с м. Кутузовская Формат работы - возможен гибрид после испытательного срока Ежегодный пересмотр зарплаты, годовая премия Корпоративный спортзал и зоны отдыха Более 400 образовательных программ СберУниверситета для профессионального и карьерного развития Расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа Гибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБ Бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров Вознаграждение за рекомендацию друзей в команду Сбера.
Был опыт в одном из направлений: market intelligence/ data-аналитика/ data scientist. Практичный подход — результат важнее красивых презентаций.
Был опыт в одном из направлений: Data Scientist / ML Researcher. Практичный подход — результат важнее красивых презентаций. Глубокое знание высшей математики...
Опыт работы Data Scientist от 3 лет. Техническое образование (будет плюсом если выпускник - МГУ, МФТИ, ВШЭ и других ведущих вузов...
Опыт работы от 2–3 лет в роли Data Scientist или ML Engineer. Понимание основ статистики, теории вероятностей, математической логики.
Опыт работы Data Scientist от 2 лет, желательно в задачах поиска, ранжирования или рекомендаций. Уверенное владение классическим ML (градиентный бустинг...
Опыт в роли Chief Data Scientist/Team Lead DS и выше – от 5-ти лет. Владение английским языком — разговорный +...
Опыт работы не менее 3х лет в роли Data Scientist. Опыт работы с нейронными сетями для последовательных данных (временные...
Data Scientist с опытом в финтехе. Опыт работы в банковском/финансовом секторе от 3-х лет в роли аналитика/DS...
СберКорус в цифрах: Мы ищем Data Scientist (NLP, LLM) с релевантным опытом работы от 3 лет. Тестировать гипотезы по улучшению...
Опыт работы Data Scientist от 2 лет. Высшее образование (математика, статистика, IT, экономика). Уверенное владение Python (pandas, numpy, scikit-learn).
Опыт в качестве Data Scientist или ML engineer от 3ех лет. Знание Python. Знание классических алгоритмов и структур данных.
Опыт работы Data Scientist от 3х лет. Опыт работы с NLP от 2 лет. Практический опыт проведения процедур оценки...
Comfortable working in cross-functional teams with domain and technical experts. Oilfield data exposure (e.g., well data, reservoir simulations...
Высшее образование. Опыт работы на позициях lead data analyst, lead data scientist или аналогичных — не менее 5 лет в области...
Опыт работы в Data Science / ML от 3 лет. Хорошее понимание классического ML и практический опыт feature engineering.
Участие в олимпиадах по математике, экономике или Data Science; участие в соревнованиях по Data Science. Участие в хакатонах будет преимуществом.
Командная работа: Активное взаимодействие с Data Analyst для глубокого понимания бизнес-контекста и feature engineering, с Data Engineer — по вопросам...
Data & Infra: - Уверенное владение SQL (сложные джойны, оконные функции, оптимизация запросов) и знакомство с Big Data стеком (Spark, Hadoop). -
Знаешь базы данных (SQL, NoSQL) и big data технологии (Spark, Databricks). Уверенно работаешь с инструментами анализа данных (Pandas, NumPy, PySpark).
Знания в области математики, data science. Владение Python (pandas, numpy, torch, fastapi, langchain, etc). Знание SQL, spark. Высшее образование (МГУ...
Уверенный опыт в Data Science (senior+ / lead). Time series analysis (тренды, сезонность, смена режимов). Anomaly detection. Probabilistic / Bayesian мышление.
...трекинга экспериментов: MLflow, W&B, DVC или аналогов. Работы с оркестрацией и пайплайнами (Airflow / Prefect / Dagster) и продвинутыми data-процессами.
Наше главное ожидание - глубокая техническая экспертиза в области NLP Data Science, подкреплённая опытом реализации широкого спектра NLP/LLM-задач.
Коммерческий опыт в Data Science / ML от 4 лет. Уверенное знание Python и PyTorch. Хорошее знание классического ML и современного...
Опыт работы в Data Science не менее 4 лет, включая проекты с ML/Deep Learning. Высокий уровень владения Python, R...
Не менее 3 лет коммерческого опыта в области Data Science. Профессиональный опыт работы с данными: анализ, очистка, подготовка, отбор и...
Опыт работы в Data Science от 3 лет. Уверенное владение Python и SQL (написание чистого кода, оптимальных SQL-запросов).
Собирать и анализировать данные. Проводить feature engineering. Работаешь в Data Science более 3 лет. Работал с Python, SQL, ClickHouse, S...
Опыт работы в Data Science от 3 лет, из них минимум 1-2 года в антифроде, кредитном скоринге или близких...
Опыт работы в Data Science от 2 лет. – Умение внятно излагать мысли и представлять результаты своей работы. – Уверенный Python, умение...
Разработка: Уверенное знание Python (asyncio, aiohttp/FastAPI), опыт написания чистого, поддерживаемого кода. Big Data: Опыт работы с распределенными вычислениями (Spark...
Программирование: Python (Senior уровень) — Pandas, NumPy, Scikit-learn, PyTorch/TensorFlow, Чистый, модульный код. Data: Продвинутый SQL (оконные функции, оптимизация запросов).
Понимание уязвимостей LLM: промпт‑инъекции, джейлбрейки, data poisoning, галлюцинации — и способов защиты от них. Опыт построения гардрейлов (rule‑based, ML...
Отличное владение Python, опыт написания production-ready кода. Опыт работы с Big Data-стеком (Spark, Hadoop Ecosystem), умение строить и...
Имеете 2+ года опыта в Data Science / ML на продуктовых задачах и делали их end-to-end: от постановки...
Опыт работы в роли Data Science от 3-х лет. Наличие высшего образования. Опыт прогнозирования временных рядов: ARIMA, SARIMA, Prophet...
Опыт работы в Data Science от 3 лет. Уверенное владение Python и SQL (написание чистого кода, оптимальных SQL-запросов).
...данными и признаками (CatBoost / LightGBM / Scikit-learn). Дружит с Big Data: уверенно пишет сложные запросы на SQL (Hive/Spark) для...
Математическое моделирование. Исследование операций. Системный анализ. Компьютерные науки. Физика. Data Science. Опыт работы от 5 лет в области: Математического моделирования.
Код и базы данных: Отличные навыки Python и SQL (умение писать сложные, оптимизированные запросы). Big Data: Опыт подготовки табличных данных...
Уверенное знание Python: пишешь читаемые функции, умеешь создавать окружения и оптимизировать код под big data, уверенно работаешь с pandas, numpy...
Опыт/понимание: Git, CI/CD, контейнеризация (Docker), трекинг экспериментов/артефактов (MLflow или аналог), базовый мониторинг (качество модели, drift, data quality...
Анализ требований к витринам данных (взаимодействие с владельцем продукта, аналитиками, data scientist’ами). Понимание архитектуры экосистемы Hadoop и принципов работы...
Навыки оценки качества результатов модели с точки зрения Data Science и бизнес-потребностей. Продвинутый уровень знаний в области статистики и...
Работал с backend/data-сервисами (FastAPI, Flask, gRPC и др.). Знаешь основы работы с контейнерами Docker. Знаком с принципами командной...
2+ года опыта в Data Science / ML, основной уклон в NLP, LLM, bert-like системы. Высшее образование в области...
Опыт работы от 3-х лет в области Data Science. Знание мат. статистики и теории вероятности, критическое мышление.
Компетенции: Python, Classic ML, Deep Learning, LLM/Agents, MLOps. Понимание принципов разработки, внедрения и сопровождения AI-решений. Уметь писать хороший...
Опыт разработки на Python: pytorch, numpy, sklearn, pandas, библиотеки обработки текстовых данных. Базовые инженерные навыки: git, окружения, воспроизводимость и т...