Способны оценить применимость технологии под задачу (не обязательно быть data scientist, но важно понимать, что решает компьютерное зрение, а что...
Мы создаем основу для безопасного и эффективного использования ИИ в Банке. Наша команда разрабатывает мультиагентную систему для автономного мониторинга всех ИИ-агентов Банка в промышленной эксплуатации. Это не просто дашборды и алерты — это интеллектуальная платформа, которая должна понимать, как и почему агенты принимают решения, предсказывать сбои до их наступления и автоматически локализовать корневые причины. Мы предлагаем в озможность сыграть ключевую роль в разработке с нуля уникальной системы, от которой зависит надёжность всех ИИ-сервисов Банка для миллионов людей. Обязанности разработка, тестирование и внедрение ИИ-агентов (в том числе LLM-as-a-Judge) и классических ML-моделей для оценки качества, детекции аномалий, прогнозирования деградации и автоматической локализации причин сбоев исследование и внедрение новых подходов в области настройки LLM, LLM-as-a-Judge и RAG, чтобы сделать мониторинг точнее, стабильнее и понятнее. ведение проекта по полному циклу: от идеи и прототипа до рабочего решения в проде, его тестирования и поддержки проектирование пайплайнов для работы с данными (трейсами агентов) и обучения моделей, интегрируя их в нашу MLOps экосистему взаимодействие с командами разработки и валидации ИИ-агентов, MLOps для интеграции решений и формирования лучших практик. Требования глубокое знание математической статистики, алгоритмов классического ML и архитектур нейросетей опыт работы от 5 лет в роли Data Science / Machine Learning с полным циклом разработки — от исследований и прототипирования до внедрения в прод и мониторинга опыт проведения аналитических исследований (R D): умение самостоятельно изучать проблемную область, формулировать и проверять гипотезы, выбирать и адаптировать state-of-the-art методы под задачи проекта уверенное владение стеком технологий для анализа, экспериментов и разработки: NumPy, Pandas, Polars, Scikit-learn, XGBoost, LightGBM, CatBoostOptuna / Hyperopt навык написание чистого, модульного кода на Python, понимание принципов SOLID, опыт работы с Git. Будет преимуществом: опыт разработки ИИ-агентов / агентных систем, понимание принципов их работы, коммуникации и оркестрации опыт работы с трейсами и метаданными ИИ-агентов (OpenAI, Arize Phoenix, LangSmith) опыт работы с векторными базами данных знание observability-стека (OpenTelemetry, Prometheus, Grafana) для мониторинга ML-систем публикации или значимый вклад в open-source в области ML/NLP/LLM. Личные качества: проактивность: способность самостоятельно находить проблемы и предлагать эффективные решения системное мышление: умение видеть проект как целостную систему, понимать взаимосвязи и долгосрочные последствия решений результативность в условиях неопределенности: способность эффективно работать при неполных данных и в меняющихся условиях ответственность: понимание важности production-систем и SLA, готовность нести ответственность за свои решения. Условия комфортный современный офис: г. Москва, метро Кутузовский пр. формат работы– офис, по согласованию с руководителем возможно выполнение пула задач в гибридном формате ежегодный пересмотр зарплаты, годовая премия корпоративный спортзал и зоны отдыха более 400 образовательных программ СберУниверситета для профессионального и карьерного развития программа адаптации и помощь руководителя на старте расширенный ДМС (медицинское страхование), льготное страхование для семьи ипотека для сотрудников бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров вознаграждение за рекомендацию друзей в команду Сбера.
Мы строим высоконагруженные production-grade ML-системы для обеспечения банковской безопасности. Наш фокус: антифрод, управление рисками, обнаружение аномалий и оптимизация бизнес-процессов. Внедряем различные решения – от классического ML до state-of-the-art архитектур в DL. Ищем опытного DS, который умеет не только обучать модели, но и отвечать за их жизненный цикл в проде. Первый этап отбора на эту вакансию – общение с AI-рекрутером. После отклика ждите сообщение от него в Telegram, диалог займёт примерно 10 минут. Задача AI-рекрутера — уточнить недостающие детали и ускорить рассмотрение вашей кандидатуры. AI-рекрутер только начинает свой путь, поэтому просим относиться с пониманием. Ваш опыт и участие помогут сделать его удобным и полезным для всех! Обязанности Cоздание моделей: - Разработка алгоритмов. Работа как с классикой (LightGBM/CatBoost), так и современным стеком (LLM-агенты, RAG-системы) Раскатка моделей в прод: - Упаковка моделей в Docker - Настройка CI/CD пайплайнов - Версионирование данных, моделей и артефактов в MLflow - Деплой в Kubernetes Настройка процессов: - Проектирование end-to-end пайплайнов (от сырых логов до сервиса) - Cборка данных из SQL/NoSQL баз - Проектирование витрин признаков (Feature Engineering) - Автоматизация переобучения моделей в Airflow - Работа с потоковыми данными в Kafka Мониторинг: - Настройка мониторинга data drift и model decay - Логирование экспериментов (MLflow) - Анализ данных и валидация моделей Ифраструктура и интеграция: - Совместная работа DevOps/Backend по интеграции моделей в микросервисную архитектуру Требования DS-бэкграунд: - Опыт работы DS/DE от 3-х лет (с подтверждённым опытом вывода моделей в прод) - Понимание математики классического ML и архитектуры нейросетей (PyTorch/TF) - Мультидоменная экспертиза: минимум в 2 доменах (CV, NLP/LLM, TS, RL, RS, Audio). Инженерная база: - Уверенный Python (чистый код, знание numpy/pandas/scikit-learn) - Понимание микросервисной архитектуры и работы с очередями (Kafka) MLOps-инструментарий: - Опыт работы с Airflow (оркестрация), MLflow (трекинг), Docker/K8s (контейнеризация) - Опыт использования систем контроля версий Git/Bitbucket Data Infra: - Уверенное владение SQL (сложные джойны, оконные функции, оптимизация запросов) и знакомство с Big Data стеком (Spark, Hadoop) - Умение решить любую несложную инфраструктурную задачу, с которой не работал(а) ранее Будет плюсом: - Опыт с LLMs (fine-tuning, RAG, evaluation via RAGAS/DeepEval, vLLM). - Глубокая экспертиза в узком домене из списка - Опыт работы с Kafka/Spark - Уверенный опыт с LangChain, LangGraph, function calling - Законченный ШАД / OZON Masters / AI Masters Условия Инновационные, амбициозные проекты и задачи, которые развивают: всегда есть возможность прокачать свои навыки в работе и профессионально расти; Среда для обмена знаниями – высокая экспертиза внутри команды; Сплоченная команда, работающая над общими задачами и умеющая хорошо отдыхать; Нашу культуру создают сами сотрудники – мы их слышим и помогаем создавать и поддерживать корпоративные комьюнити по интересам Стабильная заработная плата и годовой бонус; Полностью офисный формат работы. Современный IT-офис вблизи Москва-Сити в пяти минутах от метро "Кутузовская", с фитнес залом; Более 400 образовательных программ СберУниверситета для профессионального и карьерного развития; Расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа; Гибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБ; Бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров; Вознаграждение за рекомендацию друзей в команду Сбера.
Мы разрабатываем AI-помощников для автоматизации поддержки клиентов Сбербанка в каналах чата. Наши решения на основе ML и LLM самостоятельно обрабатывают вопросы, сокращая нагрузку на операторов и обслуживая до 50+ млн клиентов в месяц. В составе команды вы будете отвечать за полный цикл создания AI/ML решений— от генерации идеи до внедрения в высоконагруженный продакшен. Мы ищем NLP Data Scientist’а для разработки и улучшения решений с упором на работу с LLM-моделями, прежде всего GigaChat. Обязанности Разработка и внедрение LLM моделей для решения NLU задач бизнеса (SFT, RAG (Retrieval Augmented Generation), Agents, Summarization, Text Ranking, Text Matching, Language Modeling) Дообучение LLM моделей Разработка подходов и процессов разметки данных для оценки качества работы LLM Формирование и работа с ML пайплайнами: работа с данными, обучение/дообучение NLP моделей, оценка качества решений, поддержка/автоматизация решений Оптимизация работы моделей для промышленного контура на CPU/GPU Работа с командой бизнес-представителей, DS-разработчиками Организация проверки и генерация гипотез для решения технических и бизнес-задач. Требования Опыт разработки на python, numpy, sklearn, pandas + библиотеки обработки текстовых данных Опыт работы с Pytorch для построения DL текстовых моделей Опыт работы с библиотеками LangChain/LangGraph Опыт практической работы с LLM через API Отличные теоретические знания классического и нейросетевого NLP, в тч LLM Опыт дообучения классических трансформеров и LLM Практический опыт, эксперименты, внедрение в ПРОД LLM решений Опыт prompt-engineering Знание sql Linux, Git. Будет плюсом: Работа с инструментами Hadoop (HDFS, Hive), Spark Опыт постановки и проведения a/b тестов Опыт работы с распределенным обучением, глубокое знание GPU архитектуры. Условия Комфортный современный офис рядом с м. Кутузовская Формат работы - возможен гибрид после испытательного срока Ежегодный пересмотр зарплаты, годовая премия Корпоративный спортзал и зоны отдыха Более 400 образовательных программ СберУниверситета для профессионального и карьерного развития Расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа Гибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБ Бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров Вознаграждение за рекомендацию друзей в команду Сбера.
Сбербанк Онлайн (СБОЛ) — приложения с 80+ млн клиентов. В приложении помимо привычного и классического функционала мы развиваем ИИ-сервисы, основной из которых это ИИ-Помощник. Основной вызов для нас — используя привычный клиентам поиск по СБОЛу, дополнить его функциональностью ИИ-Помощника так, чтобы без потери качества базовых функций научиться решать более сложные клиентские задачи. С участием Lead Data Scientist мы хотим: развить компетенцию DS на уровне подразделения. Это включает в себя работу с теми командами, которые занимаются или готовятся заниматься агентами или функциями для ИИ-Помощника. определить вектор развития Поиска с ИИ-помощником в СБОЛе, совместно с другими командами. Это направление во многом связано с адаптацией LLM под специфику продукта и с оценкой качества Поиска и ИИ-Помощника — и далее с изменениями, которые необходимо будет сделать по результатам оценок. С одной стороны - это исследования данных и проверка гипотез, а с другой — выстраивание общего и прозрачного процесса. Обязанности LLM-ориентированные решения: оптимизация производительности LLM в production (скорость, стоимость, точность) проектирование и разработка пайплайнов для получения обработки данных (RAG, агентские системы, семантический поиск). Работа с данными: пайплайны работы с данными постановка требований к разметке контроль качества датасетов оценка ROI ML-фич через метрики / эксперименты. Лидерство и экспертиза: умение переводить бизнес цели в ML – задачи, формирование требований к DS командам, участие в стратегии развития продукта и команды участие в постановке технических требований и взаимодействие с бизнес-заказчиками проработка с продуктами, системными аналитиками, смежными командами требований и вариантов решения задач проработка с отделом обучения тестовой и обучающей разметки для обучения юридическим навыкам GigaChat и других LLM подбор и развитие людей, менторство младших коллег, разработка best practices для команды анализ рисков и поиск компромиссов между качеством моделей, скоростью и стоимостью. Продакшен-инжиниринг: внедрение DS-моделей в production с использованием MLOps-практик. (CI/CD мониторинг, A/B-тесты). Требования высшее образование, опыт работы от 5 лет в DS/NLP, включая от 1 года работы с LLM, опыт с production готовность как писать код, пайплайны, обучать модели, так и писать документацию, проектировать системы и готовить спецификации на модели, данные, пайплайны глубокая экспертиза в адаптации LLM: SFT, RLHF, LoRA, prompt engineering опыт построения RAG-систем, агентских пайплайнов и сервисов на основе LLM, знание современных фреймворков (PyTorch, Hugging Face, LangChain, LlamaIndex) понимание компонентов инфраструктуры: Docker, Kubernetes, облачные платформы, MLOps: CI/CD, мониторинг дрифта данных, логирование опыт трансформации бизнес-задач в технические требования умение оценивать ROI DS-решений и балансировать между инновациями и практичностью, умение быстро делать прототипы решений и искать баланс между скоростью/качеством/производительностью. Условия формат работы: офис в Москве, гибрид - по договоренности, Бизнес-центр, Кутузовский проспект, д. 32, к.1 ежегодный пересмотр зарплаты и годовая премия более 400 образовательных программ СберУниверситета для профессионального и карьерного развития расширенный ДМС (медицинское страхование), льготное страхование для семьи бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров вознаграждение за рекомендацию друзей в команду Сбера.
Управление «Моделирование и исследование данных» — центр экспертизы Data Science в Блоке Сеть Продаж. Мы создаем и внедряем E2E-решения на основе машинного обучения и искусственного интеллекта, которые напрямую влияют на ключевые бизнес-процессы и клиентский опыт в отделениях Сбера. Для усиления нашего стратегического R D-направления ищем опытного лидера, который будет формировать технологическую повестку и доводить передовые AI-инициативы до реального бизнес-эффекта. Наша исследовательская AI-команда развивает Copilot сотрудника банка — виртуального ассистента, который участвует в диалоге с клиентом. Сейчас Copilot работает у каждого сотрудника отделения: подсказывает, ищет и исправляет ошибки, помогает вести диалог. Вашей задачей будет расширение функционала и улучшение качества работы ассистента, разработка новых продуктов и тестирование перспективных гипотез. Обязанности Стратегическое лидерство R D-направления: Поиск, оценка и внедрение новых технологий (ML/DL/LLM, агенты), формирование технологического видения развития AI в Блоке. Управление портфелем AI-проектов: Ответственность за жизненный цикл E2E-проектов — от анализа бизнес-проблемы до промышленного внедрения в бизнес-процесс. Руководство командой: Управление командой Data Scientist (постановка задач, менторинг, развитие компетенций, оценка эффективности). Ключевая коммуникация с заказчиками: глубокое погружение в бизнес-процессы, трансляция сложных технических концепций на язык бизнес-ценности, оценка трудоемкости и управление ожиданиями. Требования Опыт руководства командой Data Scientist/ML от 2-х лет. Глубокий экспертный бэкграунд в Data Science: опыт работы с ML/DL/NLP от 5+ лет, понимание полного цикла разработки и внедрения моделей. Доказанный опыт успешного вывода в продакшн сложных ML/AI-решений, включая LLM-решения и агентов. Продвинутые soft skills: лидерство, стратегическое мышление, умение вести переговоры и аргументированно отстаивать позицию на всех уровнях управления. Опыт разработки на Python, уверенное владение стеком DS/ML, опыт работы с большими данными (Hadoop/Spark, GreenPlum, SQL). Знание основ управления проектами (Agile/Scrum, Waterfall). Условия Полное соблюдение ТК РФ, льготные условия по программам страхования, кредитования для сотрудников Банка; График 5/2, офис на м. Кутузовская; Режим работы на выбор — офис или гибрид. Достойный уровень вознаграждения (оклад + внушительная годовая премия); ДМС с первого дня работы и льготная мед. страховка для близких родственников; Социальная поддержка сотрудников; Возможность стать частью команды, реализующей программы цифровой трансформации банка — на основе передового опыта и инновационных идей; Широкие возможности для профессионального развития: корпоративный университет и множество онлайн-программ обучения. Корпоративное обучение за счет компании; Бесплатная подписка СберПрайм+, многочисленные скидки и бонусы от партнеров: СберМаркет, МегаМаркет, Самокат, Еаптека и др.; Корпоративная пенсионная программа.
Практический опыт внедрения и эксплуатации ML-моделей в production. Глубокое понимание ключевых методов и алгоритмов машинного обучения, а также знание...
Опыт в ML от 3 лет. Понимание принципа работы основных алгоритмов классического ML (классификации, кластеризации, регрессии, временные ряды).
Глубокое понимание современных архитектур и методов обучения языковых моделей. Практический опыт файнтюнинга различных LLM под продуктовые задачи (SFT, PEFT, RLHF...
Занимались построением рисковых моделей. Имеете практический опыт полного цикла решения ML задачи: предобработка данных, выбор алгоритмов и тюнинг их параметров...
Не менее 3 лет коммерческого опыта в области Data Science. Профессиональный опыт работы с данными: анализ, очистка, подготовка, отбор и...
Есть знания принципов работы риск-менеджмента и инструментов влияния через DS сервисы: Cost of risk, Decision cost, EL, PD.
Навыки и опыт: опыт в ML от 4 лет, подтвержденный опыт в прогнозировании или рекомендательных системах. понимание основных алгоритмов ML...
Искать и апробировать новые технологии и методы для повышения эффективности защиты. Анализировать и исследовать данные, закономерности в них.
Опыт работы в области анализа данных (data processing / data science) от 3 лет. Владение классическими инструментами анализа данных (SPSS, Excel...
Опыта руководства командой LLM инженеров / Data scientists от года. Способности работать в команде, собирать команду под проект, доносить идеи до...
Опыт работы в роли Data scientist от 2 лет. - Знание основных подходов для предобработки и векторизации текста. - Наличие опыта решения...
Опыт работы в роли Data scientist от 2 лет. - Работа с одним из фреймворков PyTorch/TensorFlow. - Знание основных подходов для...
Знание Python (Scala/Java могут оказаться плюсом). Знание классических алгоритмов и структур данных. Знание теоретических и практических продвинутых методов машинного...
Владение SQL — мы используем PySpark (SQL API) и Hadoop-стек; опыт с Big Data будет значительным преимуществом. Опыт внедрения ML...
Знание Python (Scala/Java могут оказаться плюсом). Знание классических алгоритмов и структур данных. Знание теоретических и практических продвинутых методов машинного...