Сбер ищет Chief Data Science (цифровой кредитный мониторинг).
Дивизион Цифровой кредитный мониторинг - занимается анализом и сопровождением заемщиков – юридических лиц на протяжении жизненного цикла кредита.
Основная задача продукта, на которой открыта вакансия — координация команд моделирования и продуктов дивизиона для выполнения целей AI трансформации Сбера.
В рамках бизнес-процессов дивизиона собраны задачи из большого количества областей Data Science, например:
- Классический Machine Learning (задачи прогнозирования выхода на просрочку, недостатка ликвидности и т.п.)
- NLP (мониторинг СМИ, решение задач NER)
- CV (распознавание фасадов для мониторинга залогов и обработка спутниковых снимков) и OCR (распознавание клиентских документов)
- Графовая аналитика (доп. фичи для улучшения существующих моделей)
Обязанности:
Моделирование:
- Запрос требований у заказчика, участие в процессе создания ТЗ
- Анализ и утверждение предложенных Data Scientist методов моделирования для решения бизнес-задачи
- Разработка и/или утверждение предложенной Data Scientist архитектуры модели
Понимание бизнеса:
- Формирование предложений по решению бизнес-задач аналитическими способами/ методами
- Подготовка и участие в проведении демонстрации полученных результатов моделирования бизнес-заказчикам
Определение потребности и готовности данных:
- Подтверждение выполнения требований к данным для перехода на этап "моделирование"
- Определение требований к перечню, объему и качеству данных, необходимых для решения бизнес-задачи
Участие в проектах по автоматизации процессов и процедур:
- Курирование проектной деятельности, направленной на оптимизацию процессов управления и оценки
- Консультирование на этапе реализации/ автоматизации моделей на этапе внедрения/ тиражирования при необходимости
- Управление процессом разработки модели для получения результатов в оговоренные с заказчиками сроки
- Руководство командой по оптимизации процессов, постановка задач при необходимости
- Развитие и наставничество DS трайба
Требования:
- Знание структур данных
- Языки программирования (Python) и языков запросов (SQL)
- Знание стека работы с данными (numpy, pandas, scipy)
- Теория вероятностей, математическая статистик, теория графов, оптимизационные методы, случайные процессы
- Знание стека Machine Learning (NLP, XGBoost и аналоги, TimeSeries, CV) и Deep learning (Keras/TensorFlow/PyTorch), Big Data (Apache Hadoop, Spark ML, PySpark, GraphX)
- Знание банковских процессов (преимущество – знание кредитных рисков)
- Навыки бизнес и системного анализа
Условия:
- Развитая IT архитектура. Мощный GPU кластер, возможность расчётов на суперкомпьютере top-30 в мире
- Комфортный офис, большой выбор вариантов по питанию, бесплатный фитнес в офисе
- Скидки на продукты банка и экосистемы
- Постоянное развитие: обучающие курсы от лучших университетов и компаний (МФТИ, ВШЭ, NVIDIA и другие), участие в конференциях
- Развитое DS community