Крупнейшая интегрированная нефтегазохимическая компания Сибур ждет отклики кандидатов на вакансию Руководитель группы «Продвинутая аналитика».
Чем вам предстоит заниматься:
Отвечать за разработку и доведение до ПРОДа алгоритмов машинного обучения и продвинутой аналитики
Развивать команду аналитиков данных: найм, обучение, развитие
Накапливать компетенцию в реализации проектов продвинутой аналитики и предметной области в рамках реализуемых проектов
Взаимодействовать с коллегами подразделения: инженеры данных, архитекторы данных, data governance.
От вас:
Уверенное владение Excel, PowerPoint
Умение работать с реляционными базами данных (SQL/MSSQL/ProtgreSQL) и навык написания SQL-запросов
Владение языком програмирования Python
Использование классических подходов и методов машинного обучения для анализа и прогнозирования временных рядов
Знание основ статистики (проверка гипотез, статистические тесты)
Знание алгоритмов машинного обучения (обучение без учителя), метрик качества алгоритмов (Precision, Recall, ROC-кривая)
Навык тестирования и валидаци алгоритмов ML — оффлайн/онлайн тестирование, оценка эффекта модели, управление ошибками 1го/2го рода
Знание основных библиотек Python для обработки и визуализации структурированных данных — matplotlib, pandas, seaborn etc
Владение библиотеками матричных вычислений и оптимизации numpy, scipy
Владение специализированными библиотеками для обработки и преобразовния специальных представлений данных (excel-документы сложной структуры, парсинг HTML-текста)
Навык обучения сложных алгоритмов машинного обучения: градиентный бустинг, бэггинг, стекинг
Понимание методов кластеризации: k-Means, иерархическая кластеризация, DBSCAN
Навык интерпретации алгоритмов ML — расчет feature importances, интертерация конкретных примеров решающих правил
Навыки анализа сетевых и графовых структур
Навык работы с текстовыми данными: bag of words, word2vec, морфологический разбор
Навык подбора гипер-параметров алгоритмов и оптимизации данного процесса по времени
Понимание алгоритмов работы и инструментов обработки больших массивов данных. Hadoop stack, MapReduce, Spark
Знание теоретических основ нейронных сетей, базовых архитектур, опыт работы с одним из фреймворков для построения и обучения НС (PyTorch, TensorFlow/Keras, Caffe)
Умение использовать сверточные сети для базовых задач компьютерного зрения (классификация, сегментация)умение использовать сверточные и рекуррентные нейронные сети для задач анализа текста
Умение использовать сверточные и рекуррентные нейронные сети для задач анализа текста
Полное владение инструментарием искусственных нейронных сетей — понимание применимости архитектур для различных задач, умение строить подходящие архитектуры для нестандартных задач, анализировать результаты обучения нейронной сети
Знание байесовских методов в машинном обучении
Методы машинного обучения для обучения на графах (теория, инструменты, практика применения)
Навык проведения бизнес-анализа задачи — формирование целевой переменной, feature engineering’а совместно с заказчиком
Желательно:
Знание платформы ElasticSearch
Знание методов интеграции программных решений. Протоколы взаимодействия
Знание принятой в команде технологии разработки и подготовки моделей к релизу на MLFW
Знание функций, API и примитивов сервиса модели предоставляемых MLFW
Предложат:
Возможность удаленной работы (график обсуждается индивидуально в зависимости от роли)
Заработная плата по результатам собеседования, премии за эффективную работу и результат
Действительно нестандартные задачи, которые требуют креатива и новых подходов
Современный стек и гибкие методологии разработки, работа в команде высококлассных профессионалов из разных технологических областей
Возможность обучения и участия в жизни IT-сообщества: большой выбор курсов в корпоративном университете, посещение митапов, конференций
Корпоративные льготы: ДМС, льготное страхование родственников, большой выбор внутренних спортивных секций, скидки на абонементы сети World Class.

