Вакансия на удаленке.
Lamoda ищет Data Science Team Lead (Ranking & Navigation).
Немного о команде и продукте:
В дирекции Data & Analytics в отделе Data Science (отдел анализа данных и машинного обучения) открывают позицию Team Lead в команду Ранжирования и Навигации.
Команда решает задачи, критичные для бизнеса:
- Развитие алгоритмов ранжирования товаров в каталоге: усиление learning-to-rank подхода за счет разработки новых факторов, экспериментов с таргетами в обучении, оптимизации разнообразия и персонализации выдачи под каждого клиента
- Улучшение качества поиска (NER, исправление опечаток, обогащение текстового описания товаров) и инструментов навигации (поисковые саджесты, фильтры)
Чем вам предстоит заниматься:
- Совместно с менеджером продукта и командой работать над наполнением, оценкой и декомпозицией продуктового бэклога
- Отвечать за распределение задач, ресурсы и приоритеты внутри команды DS-ов (5+ человек)
- Следить за технологическими и продуктовыми новинками в индустрии, SOTA решениями, изучать профессиональные публикации
- Развивать компетенции команды, быть наставником
Компания ожидает:
- Опыт в области анализа данных и машинного обучения (от 5 лет)
- Опыт руководства командой (от 1 года)
- Опыт работы с SQL, Hadoop, Hive, Spark
- Владение Python, Linux, методами работы с большими данными
- Опыт работы как минимум с 2 ML библиотеками: CatBoost, Scikit-learn, Spark ML, PyTorch, LightFM
- Знания теории вероятностей и математической статистики; машинного обучения, прогнозного моделирования и методов статистического анализа; алгоритмов и структур данных
- Английский язык на уровне технического чтения и профессионального общения
О команде:
- Хорошо выстроенные процессы: квартальное планирование по методологии OKR, двухнедельные спринты, регулярные стендапы и проектные встречи для синхронизации
- Сильная команда middle и senior специалистов, развитое DS-сообщество, где есть возможность обмениваться знаниями на внутренних митапах
- Представлен полный жизненный цикл разработки data-driven продуктов с применением ML - от идеи и генерации гипотез до запуска АБ тестов. В части разработки онлайн-сервисов и деплоя моделей помогает команда инженеров
Как работают:
- Пишут на Python 3.6+ и PySpark 3.0
- Для ресерча доступны два сервера (80 cores, 650 Gb RAM), на которых развернут JupyrerHub и есть доступ к Hadoop-кластеру
- Код с логикой ML-пайплайнов упаковывют в Docker и выкатывают, используя CI/CD-инструменты с запуском code style проверок и тестов
- Используют Airflow для управления ML-пайплайнами и запуском их по расписанию
- В командах есть культура code review как для изменений по части продакшен-пайплайнов, так и для ресерч-задач
- Регулярно проводят командные брейнштормы с целью генерации новых идей по развитию data-driven продуктов
- В компании внедрена культура принятия решений на основании данных, и все изменения тестируют через АБ-эксперименты