Исследование рынка
ДАТА-профессий
«Новая нефть», «профессия будущего», «самая сексуальная профессия XXI века» — так сегодня говорят о дата-рынке.
Что в исследовании
Мы попытались выяснить, как изменился рынок в период мировой пандемии, как повлияла удаленка на рынок, сильнее погрузились в отдельные дата-направления и узнали, сколько сегодня зарабатывают дата-специалисты.
Методология сбора данных
Всего 320 специалистов приняли участие в исследовании. Респондентов приглашали пройти опрос в социальных сетях и профессиональных чатах, также использовали внутреннюю базу дата-специалистов.

Для получения объективных данных очищали базу от выбросов и пропусков, использовали частоту ответов, рассчитывали метрики центральной тенденции, анализировали разброс показателей и квантили различных уровней.

Мы сравнили показатели 2021 года с 2020-м. Данные для сравнения взяли из нашего прошлогоднего исследования.
Данные были собраны в декабре 2019-го, они актуальны и для начала 2020 года. Для упрощения мы указали 2021 и 2020 годы.
Наши эксперты
Пётр Царенко
Chief Data Officer
Kolesa Group
Думан Уватаев
Chief Data Officer
Kaspi
Андрей Остафичук
Директор по управлению данными
Beeline
Алексей Самойлов
Team lead DS
Казахтелеком
Портрет дата-профессий
Должности
В разных компаниях один и тот же набор обязанностей и компетенций может называться по-разному. Приведём примеры:
Специалист занимается кластеризацией пользователей для улучшения продуктовых показателей. В зависимости от компании название должности отличается: дата-сайентист, product-аналитик или ML-инженер.
Сотрудник занимается созданием и поддержкой инфраструктуры данных, создает витрины данных и ETL-процессы. Он может иметь должность дата-аналитика, BI-аналитика, software engineer или DWH-инженера.
По полученным данным мы взяли на себя смелость и разделили рынок дата-профессий на три больших направления:
Дата-сайентисты
Создание продуктов и сервисов на основе искусственного интеллекта и машинного обучения.
Дата-инженеры
Создание и поддержка инфраструктуры, ETL-процессы, сбор и обработка.
Анализ и обработка данных, поиск инсайтов в данных, подготовка дашбордов и презентаций.
Дата-аналитики
Считаете ли вы, что на рынке есть неразбериха с названиями должностей и обязанностями?
Алексей Самойлов
Казахтелеком
Действительно, в настоящее время присутствует неразбериха в названиях и обязанностях. Думаю, это связано с тем, что эти направления еще достаточно молоды (особенно на рынке Казахстана) и не все понимают суть каждого отдельно взятого специалиста по данным. Также каждая компания адаптирует обязанности дата-специалистов, исходя из специфики их бизнеса.
Пётр Царенко
Kolesa Group
Конечно, на рынке есть неразбериха с должностями. По названию должности невозможно понять, чем же занимается человек. Дата-сайентист может называться и научным сотрудником, и разработчиком, и аналитиком… Например, на собеседования приходили дата-сайентисты, которые работают с данными в Excel, или дата-аналитики, которые строят DWH.
Проблем с названиями должностей не имеется, скорее это адаптация под запросы и понимание каждой компании. Есть концептуальные понятия и задачи, которые не меняются, а есть сложившаяся культура, индивидуальные потребности бизнеса, ну и красивые хайповые названия, которые также вносят коррективы.
Beeline
Андрей Остафичук
Считаете ли вы такое деление на три широких направления оправданным?
Андрей Остафичук
Beeline
Базовое разделение на три направления вполне оправданно для общего представления и понимания области. Есть популярное представление о наборе функций и знаний в виде треугольника, и у всех трех ролей эти функции одинаковы, вопрос только в смещении фокуса направления.
Пётр Царенко
Kolesa Group
Верхнеуровневое деление на три направления оправданно. Либо ты делаешь продукт, либо ищешь инсайты, либо строишь инфраструктуру. Но если закопаться глубже, то каждое из направлений можно еще разделить на несколько. Также встречаются специалисты, задачи которых находятся на стыке направлений.
у дата-инженера — сильный уклон в девелоперскую часть;
у дата-аналитика — в доменную область и анализ;
дата-сайентист может сочетать навыки инженера и аналитика. Он должен подстроиться под конкретную задачу и решить её.
Вполне оправданное деление. Разница между профессиями — в приоритетах и специализации:
Казахтелеком
Алексей Самойлов
Соответствует ли это вашей картине мира датa-специалистов?
Андрей Остафичук
Beeline
В ближайшем будущем точно добавятся еще функции и направления, но на текущий момент эта картина полностью отражает реальность датa-специалистов.
Направления работы
Дата-аналитики составили половину респондентов. Они приносят пользу бизнесу через анализ данных, поиск инсайтов, подготовку отчетов.

Оставшуюся часть пирога поделили между собой дата-сайентисты (создают продукты с использованием алгоритмов машинного обучения) и дата-инженеры (создают и поддерживают процессы сбора, обработки и хранения данных).
Источники постановки задач
Дата-аналитики в основном получают задачи от линейного руководителя или топ-менеджмента. Часто самостоятельно принимают решения касательно своих задач.

Главный источник задач для дата-инженеров — отдел аналитики и руководитель.

Дата-сайентисты помимо задач от руководства получают задачи от разработки и продуктовых команд, но редко берут на себя задачи самостоятельно.
Медианный респондент
Профессия
Работает в казахстанской IT-компании на должности дата-аналитика. Задачи получает от топ-менеджмента и линейного руководителя.

За последние пять лет два раза сменил место работы и в ближайший год не планирует.

Компания
В штате компании 100 человек, аналитикой занимаются 10, из которых 5 — дата-аналитики. В компании средний уровень аналитики: простые регулярные отчеты в BI, простые разовые исследования по требованию.

Основной пул задач — выгрузка данных.

Процесс работы
Для визуализации и представления информации использует Power BI. Расчеты и хранение данных происходит в Excel/Google-таблицах.

Мотивация
При выборе места работы на первое место ставит уровень заработной платы, на второе — возможность обучаться и на третье — интересные задачи.

Проблемы
Считает, что ему не хватает навыков работы с Big data. Премии не получает, размер зп не удовлетворяет.
Мужчина, 26 лет
Грейд:
Middle
Опыт работы в сфере анализа данных:
2 года
Образование:
высшее + курсы
Место жительства
Сократилась доля специалистов из Алматы и Нур-Султана. Но в три раза выросло число респондентов из других городов Казахстана.

Увеличилось число респондентов, не проживающих в Казахстане.
Дата-профессии немного повзрослели за счет роста доли людей старше 30 лет. Однако по-прежнему остаются очень молодыми, так как 44% составляют респонденты младше 25 лет.
Возраст
Гендер
Рост количества девушек в профессии увеличивается, но в общей численности составляет чуть менее 30%.
Средний возраст мужчин и женщин совпал – 28 лет.
женщины
27 лет
мужчины
26 лет
Медианный возраст
Уровень образования
89%
Респондентов закончили один и более курсов для повышения квалификации.
Как можете объяснить, что доля специалистов из Алматы и Нур-Султана сокращается, а растёт доля людей, работающих в других городах РК и за её пределами?
Андрей Остафичук
Beeline
Такие результаты региональной представленности вкратце можно объяснить, социально-экономическими факторами: развитием регионов, появлением локальных игроков и возможностью дистанционной работы, включая финансовые потребности специалистов, карьерный рост и миграцию.
Алексей Самойлов
Казахтелеком
Это связано прежде всего с карантинными ограничениями в период пандемии Covid 2020 года, когда компании стали переводить сотрудников на удаленный формат работы. За прошлый год компании смогли перестроить свои процессы так, чтобы у сотрудников была возможность работать в удаленном формате, некоторые из них смогли перевести штат на полностью удаленную работу.
Пётр Царенко
Kolesa Group
Чем-то это напоминает жизненный цикл принятия технологий. Если несколько лет назад с данными работали только новаторы и ранние последователи (компании из Алматы и Нур-Султана), то сейчас, когда польза этого направления становится бесспорной, начинает подтягиваться большинство: компании из других городов и новых для работы с данными отраслей (производство, госсектор, ретейл).

Также идет расширение по сферам: к телекому, банкам и продуктовым компаниям добавляется ретейл, государственный и производственные секторы.
Растёт ли доля девушек в вашей компании в дата-направлениях?
Думан Уватаев
Kaspi
В нашей компании возрастает не только численность девушек в дата-направлениях, но и доля представителей женского пола в общей численности персонала. К примеру, в 2014 году доля представителей женского пола составляла всего 37% от общей численности, а по состоянию на сегодняшний день доля превышает 53%. При этом данная пропорция, безусловно, отличается в зависимости от профиля подразделения – аналитика, machine learning, дата-инжиниринг или имплементация стратегий и решений.
Андрей Остафичук
Beeline
Да, возможно, рост женского пола статистически незначим, но картина радует, что девушек в нашей области становится все больше.
За год доля почти не выросла, но остаётся по-прежнему достаточно высокой. Сейчас в дата-команде Колёс 45% девушек, что выше среднего показателя по Казахстану
Kolesa Group
Пётр Царенко
Нужна ли магистратура/аспирантура/докторантура, чтобы быть успешным представителем дата-профессий?
Алексей Самойлов
Казахтелеком
Как показывает практика, острой необходимости в этом нет. Порой для успеха в карьере дата-профессий будет достаточно пройти 2-3 хороших курса на обучающих платформах (если, конечно, у тебя достаточно уверенные базовые знания).
Думан Уватаев
Kaspi
Разные ступени профессионального образования только приветствуются в работе, но никогда не выступают гарантами результативности и эффективности сотрудников. Мы не видим зависимости между наличием учёной степени и успешной карьерой. Даже бывают случаи, когда, наоборот, люди, посвятившие много лет науке, сложнее адаптируются в условиях жёстких дедлайнов, многозадачности и новых вызовов рынка.
Пётр Царенко
Kolesa Group
В обучении точно не важен диплом, но очень важны знания и понимание этих знаний. Дата-сайентистам и дата-аналитикам будет сложно работать качественно без знаний статистики, теории вероятности, высшей математики. Но не менее важным является опыт и насмотренность. А этого в вузе не получишь.
Продолжать обучение в магистратуре или где-нибудь еще желательно, но необязательно – вся экспертиза в анализе данных на 80% нарабатывается собственным опытом!
Beeline
Андрей Остафичук
Грейды и опыт работы
Опыт работы по годам
Опыт работы по направлениям
Растёт доля специалистов с опытом работы 4 года и больше. На графиках видно, что растет и доля специалистов старше 30 лет.
75%
Специалистов в профессии не больше трёх лет.
При этом рынок дата-специалистов по-прежнему остается неопытным.
Опытные специалисты работают в сфере дата-инжиниринга.
Частотность опыта работы от гендера
Грейды
Медианный опыт работы не различается, но медианный возраст у девушек чуть выше.
Имеют опыт работы год и менее. Но есть малая доля специалистов этого грейда с большим опытом.
87%
Стажеров и Junior-специалистов
С опытом работы от 2 до 4 лет, при этом у 36% опыт работы – год и менее.
Middle-специалистов
57%
Руководителей или тимлидов имеют опыт работы от 3 лет. 37% специалистов этого уровня – опыт 2 года и менее.
Senior-специалистов
63%
Доля грейдов от опыта работы
С ростом опыта работы растет доля тимлидов и senior-специалистов.
Но встречаются респонденты с небольшим опытом работы, которые занимают высокие грейды или даже руководящие позиции.
Вероятно, это специалисты, которые пришли из смежной профессии.
Опыт работы в зависимости от возраста респондента
Высокий процент датa-специалистов составляют респонденты старше 30 лет, не имеющие многолетнего опыта работы с данными.
Это говорит о том, что в датa-направление приходят специалисты из других отраслей.
Видна ли тенденция, что дата-направление становится более взрослым и опытным?
Думан Уватаев
Kaspi
Дата-направление становится более взрослым, ввиду того что первые поколения датa-специалистов приступили к работе 5–10 лет назад, но в то же время ежегодно на работу трудоустраивается большое количество начинающих молодых специалистов. По этой причине средний возраст дата-специалистов практически не пошатнулся.
Андрей Остафичук
Beeline
Тенденция взросления, безусловно, есть, в первую очередь по причине роста запросов от бизнеса и количества уже набитых шишек, а это тот самый опыт, который необходим для развития.
Может ли middle-специалист иметь опыт работы год и менее?
Думан Уватаев
Kaspi
Middle-специалист, возможно, может иметь опыт работы год и менее, хотя это и не самый распространенный сценарий развития начинающего специалиста. Степень готовности перехода на уровень middle-специалиста определяется прежде результативностью и уровнем достижений. При наличии достижений должного уровня, хорошей обратной связи заказчиков и руководителя junior-специалист в течение года может вырасти до специалиста среднего уровня без сложностей.
Пётр Царенко
Kolesa Group
Для этого должно сложиться воедино несколько факторов: хорошая базовая подготовка (которую может дать вуз), дата-ориентированный менеджер, сильный тимлид, задачи, способствующие росту, и, главное, мотивация самого специалиста к росту. У нас в команде были такие прецеденты.
Может ли дата-специалист, имея опыт в отрасли два года и менее, стать руководителем или тимлидом?
Алексей Самойлов
Казахтелеком
Имея опыт в смежных профессиях, вполне возможно стать руководителем за короткий срок. Руководитель или тимлид – это не просто человек, который может закрыть вопрос моделирования. Чтобы стать руководителем направления, необходимо иметь так называемые hard skills. Необходимо вести диалог с заказчиками модели, доказывать финансовую составляющую работы команды, показывать результаты работы топ-менеджменту, решать конфликты внутри команды.
Андрей Остафичук
Beeline
Руководителем можно стать за два года, но это зависит от персональных качеств и бэкграунда. Такие примеры есть, но их немного, что только подтверждает исключение из правил.
С чем может быть связано большое количество middle- и senior-специалистов с маленьким опытом работы?
Алексей Самойлов
Казахтелеком
Определенно связано с нехваткой кадров уровня middle- и senior-специалистов. Также многие компании не могут себе позволить пригласить опытного специалиста из-за его стоимости.
Пётр Царенко
Kolesa Group
Думаю, что главной причиной являются абсолютно разные требования к грейдам в разных компаниях, а где-то и их отсутствие. В одной компании один и тот же специалист может иметь грейд Middle, в другой – Junior. И я замечал, что требования к миддлам в казахстанских компаниях часто занижены.
Данная отрасль относительно молодая во всем мире. Соответственно, в этом направлении дата-специалист может развиваться стремительными темпами.

Компании, которые только начинают внедрение направления работы с данными, могут форсировать развитие, присваивая специалистам более высокий уровень должности.

Отсутствие единых стандартов в определении уровня дата-сотрудников, а также отсутствие систематизации оценки уровня компетенции в компаниях также влияют на процесс продвижения тех или иных сотрудников.

Ну и нельзя исключать, что это могут быть талантливые, сверхпродуктивные и результативные сотрудники, продвижение которых вполне оправданно в короткие сроки, чем для остальных.
Выделим несколько причин, с которыми может быть связано то, что большинство middle- и senior-специалистов с маленьким опытом работы:
Kaspi
Думан Уватаев
Компании респондентов
Страна компании-работодателя
Сфера деятельности компании
95% опрошенных составляют жители РК, но из них только 83% работают на казахстанские компании.
Дата-рынок развивается вширь.
Доля специалистов, работающих в телеком-компаниях, банках и продуктовых компаниях, снижается за счет роста доли сотрудников из других отраслей: госсектора, образования, строительства, производственного сектора, консалтинга.
В продуктовых компаниях и банках среди дата-специалистов преобладают дата-аналитики, в телеком-компаниях — дата-инженеры, в госсекторе и стартапах — дата-сайентисты.
Опыт компаний в работе с данными
Наличие тимлида в командах
Количество сотрудников на аналогичной должности
респондентов
не имеют тимлида
35%
Рост количества дата-специалистов в зависимости от размера команды
25%
Составил медианный рост количества сотрудников за последний год.
Формат работы
2020 год изменил рынок из-за карантина.
В 8.5 раза увеличилась доля людей, работающих удалённо, и значительно сократилась доля сотрудников, которые работают offline.
Желаемый формат работы
Мнения разделились почти поровну. Чуть больше половины респондентов хотят работать в офисе, чуть меньше половины желают работать удаленно.
Только у 69% сотрудников, работающих по найму, совпало желаемое с действительным.
Офисных работников желают работать удалённо.
34%
Сотрудников, работающих удалённо, предпочитают офис.
28%
Треть опрошенных отметили отсутствие условий для полноценной удалённой работы.
Чего не хватает при удалённом формате работы
Пункт «отсутствие условий» состоит из
*Ответы собраны среди тех, кто отметил, что работает удалённо.
Считаете ли вы рост вширь закономерным для отрасли по работе с данными?
Алексей Самойлов
Казахтелеком
Да, и спрос растёт, и рынок специалистов. Рост произошел и со стороны кадров: повышается количество и квалификация специалистов благодаря вузам, которые выпускают студентов с необходимой базой знаний, и открытым обучающим ресурсам.
Андрей Остафичук
Beeline
Рост вширь является закономерным для отрасли по работе с данными, так как у компаний/рынка уже формируется восприятие анализа данных. Это полезный и мощный инструмент не только для отчётности, который может принести пользу и преимущества бизнесу, но и государственному сектору. Поэтому рост вширь закономерен и будет еще расти. К примеру, уже сейчас в странах СНГ основными драйверами роста и развития технологий Big data наравне с бизнесом являются государственные структуры.
Правда ли, что главные потребители данных – это банки, телеком-операторы и IT-компании?
Алексей Самойлов
Казахтелеком
Да, эти компании генерируют огромные потоки данных внутри себя. Петабайты генерируемых данных позволяют банкам, телекому и IT быть на передовой потребления, анализа и моделирования.
Думан Уватаев
Kaspi
Безусловно, банки, телеком-операторы и IT-компании чаще имеют не только сравнительно большие объёмы данных разных направленностей, но и подготовленную инфраструктуру, профиль деятельности по обработке и анализу данных, а также стратегические задачи в отношении их использования.

Однако я знаком с большим количеством кейсов, когда даже представители малого бизнеса уделяли внимание данным и оптимизировали большую часть своих неэффективных процессов. Гипотетически любая компания может анализировать результаты своей деятельности на основании данных, подвергая сомнению эффективность как бизнес-процессов, так и конкретных сотрудников.
Андрей Остафичук
Beeline
Банки, телеком-операторы и IT-компании не только потребители, но и генераторы этих данных, потому что у них больше накопленной информации о своих пользователях. Поэтому закономерно, что банки, телеком- и IT-компании пытаются извлечь из них пользу. Важнее решения, которые принимаются на основе этих данных.
Видите ли вы в своих командах рост дата-направления на 25%?
Алексей Самойлов
Казахтелеком
Рост определенно есть. Практический опыт работы в компании по DS и ML, а также улучшение базы знаний и поиск новых решений повысили квалификацию кадров. Особо радует, что формируется политика управления данными и рост доверия к новым технологиям от бизнес-представителей компании.
Думан Уватаев
Kaspi
Компании, которые не так давно начали развитие дата-направлений, наверняка прирастали в численности персонала быстрее, чем компании, которые уже имеют устоявшуюся структуру и инфраструктуру работы с данными.
Андрей Остафичук
Beeline
Мы видим рост дата-направления и все чаще возвращаемся к тому, что идет быстрый поток запросов на разного рода дата-сервисы.
Может ли команда работать эффективно без тимлида?
Думан Уватаев
Kaspi
Команда может эффективно работать, когда тимлид формально отсутствует, но в таком случае кто-то из более инициативных членов команды возьмет на себя функционал, так как без правильной координации будет сложно организовать работу команды. Идейный вдохновитель и координатор задач в любом случае должен быть вне зависимости от того, как его будут называть.
Андрей Остафичук
Beeline
Эффективно работать без наставника можно. Но это во многом зависит от уровня компетенции специалистов, уровня сложности поставленных задач, уровня развития самой компании в data-driven-процессах, разнородности бизнес-процессов компании.
Как быстро можно получить первые результаты после создания отдела по работе с данными?
Думан Уватаев
Kaspi
Экспериментальные результаты отдела по работе с данными можно получить в первые месяцы работы отдела. В компаниях, в которых не практиковались data-driven-подходы, первые инсайты и значимые выводы можно получить по результатам работы даже одного компетентного дата-специалиста и имплементировать в работу без значимых доработок и организации «тяжелой» инфраструктуры работы с данными.
Андрей Остафичук
Beeline
Получение результатов зависит от текущего состояния данных в компании и того, что хотим получить от отдела (какой результат): систему отчетности, аналитическое хранилище, ML-проекты и т. д. Чем четче видение, тем быстрее этого можно добиться. Самую простенькую отчетность при небольшом количестве систем и источников можно и за пару недель поднять.
Пётр Царенко
Kolesa Group
Первый важный результат — это когда руководитель задумался о том, что для принятия решения ему нужны данные! Это первый шаг на пути к Data Driven.

Если серьезно, то все очень зависит от того, что считать результатом, от того, какие данные есть сейчас и какие данные могут быть получены в будущем.

Главное, чтобы компании понимали, чего они хотят от дата-направления, и чтобы шли в этом направлении не ради хайпа, а ради результатов, роста и ответов на вопросы.