Data Scientist (аналитик-разработчик) в модерацию рекламы
Яндекс
Полная занятость
Опыт: 3-6 лет
Описание:
Мы — команда ML-аналитиков, отвечающая за безопасность и качество рекламы в Яндекс Директе. Наша цель — защитить пользователей от вредоносного контента и мошенничества, используя передовые технологии машинного обучения. Ежедневно через сервис проходят миллионы объявлений, и мы обеспечиваем их соответствие не только законодательству, но и высоким стандартам безопасности. Какие задачи вас ждут Разрабатывать пайплайн классификации медийной рекламы:Понадобится работать над ним end-to-end: от анализа данных до внедрения моделей в продакшен. Работать с разноформатными данными:Это могут быть изображения, видео, HTML5-креативы. Вы будете совмещать методы Computer Vision (CV) и NLP. Участвовать во всех этапах жизненного цикла ML-моделей:Это разметка данных, обучение (включая дистилляцию для оптимизации), деплой, мониторинг и дообучение. Взаимодействовать со смежными командами:Вы станете много общаться со смежными командами, чтобы вместе улучшать метрики качества и ускорять обработку рекламы. Мы ждем, что вы От трёх лет работали в ML-проектах с фокусом на Computer Vision и NLP, умеете работать с мультимодальными данными Владеете Python и стандартным стеком для ML и анализа данных (Pandas, NumPy, TensorFlow/PyTorch, OpenCV) Умеете работать с большими данными (SQL, Hadoop) Будет плюсом, если вы Оптимизировали модели (квантизация, дистилляция) для высоконагруженных систем Знаете C++ Знакомы со спецификой обработки видео или динамического контента (HTML5) Понимаете основы кибербезопасности, фрод-аналитики