Из большого количества названий должностей выделяются узкие специалисты: NLP-инженер и CV-инженер, которые работают с конкретными областями искусственного интеллекта, и более обширные — дата-сайентист и ML-разработчик.
Предобработкой и очисткой данных занимаются почти все, а вот доводят ML-модели до продакшн senior-специалисты.
Тимлиды и руководители чаще всего занимаются обучением и развитием команды. NLP-моделями занимается меньшинство.
Типы задач в зависимости от грейда
Используемые языки программирования
Языки программирования в зависимости от должности
Библиотеки для машинного обучения
Виды используемых
облачных сервисов
Остальные специалисты в данном направлении — это либо смежные (аналитики, программисты, software-инженеры), которые тоже могут создавать ML-продукты, либо случайные респонденты.
Уровень развития ML в компаниях
Каких навыков/знаний не хватает дата-сайентистам
Есть микросервисы, использующие ML-модели, которые работают на продакшн и приносят пользу бизнесу. Выстроены процессы по код-ревью. Налажены CI/CD-процессы.
Используем ML для исследовательских задач или задач аналитики. Или есть готовые/купленные продукты (сторонние разработки), где строятся модели и запускаются на их основе продакшн-решения.
Только начинаем работать с AI и ML. Алгоритмы используются для прогнозирования и запускаются при необходимости.
Есть простые модели, которые работают как сервис и решают определенные задачи. В основном используются модели классического ML, работают на продакшн как сервис. Не налажен CI/CD, нет возможностей масштабирования.
Модели самообучаемы, есть системы для версионирования дата-сетов и моделей. Развит MLOps.