Путеводитель по профессиям Data Science

Путеводитель по профессиям Data Science

Сколько профессий Data Science вы знаете? Data Scientist… хорошо, а дальше? Прекрасно, если вы назвали 3 или 4 варианта. А что если мы вам скажем, что их больше 10?

Data Science  — это сфера, в которой с помощью различных методов и алгоритмов анализируются данные, выявляются закономерности, строятся прогнозы и, в конечном итоге, принимаются бизнес-решения. Наука о данных объединяет знания и навыки из таких областей как статистика, математика, информатика и машинное обучение.

Data Science применяется во многих отраслях, включая бизнес, медицину, финансы, маркетинг, транспорт. С ее помощью можно делать такие вещи, как прогнозирование спроса на товары, оптимизацию производственных процессов, анализ медицинских данных, создание рекомендательных систем. Не удивительно, что в этой сфере появляются новые и новые профессии. Некоторые из них уже популярны в России, а некоторым только предстоит пройти этот путь. Об этом мы и расскажем в этой статье.

Начнем с 4 самых популярных профессий в Data Science в России.

Data Scientist

(дата-сайентист)

Дата-сайентисты работают с крупными объемами информации, выбирают полезные источники данных, подходящие под бизнес-запрос. Далее автоматизируют процессы сбора данных, анализируют и обрабатывают их, создают прогностические модели, оценивают результаты исследований и предоставляют отчеты начальству с рекомендациями. Это если кратко. Более подробно можно почитать в этой статье.

Средняя зарплата: ≈ 200 тыс. рублей.

Если вы хотите узнать, какие зарплаты в других странах или какими hard и soft skills нужно обладать, чтобы устроиться на работу, то нажмите сюда.

Data Analyst

(дата-аналитик)

Дата-аналитики, в отличие от дата-сайентистов используют структурированные данные для решения бизнес-проблем. С помощью инструментов, таких как SQL, Python, R, статистического анализа и визуализации данных, дата-аналитики собирают, очищают и обрабатывают данные для анализа и выявления тенденций, которые могут быть превращены в деловые идеи. Они являются связующим звеном между дата-сайентистами и бизнес-аналитиками.

Средняя зарплата: ≈ 160 тыс. рублей.

Data Engineer

(инженер данных)

Основная обязанность Data Engineer — предоставить данные для Data Scientist по заданию Data Architect. После того как архитектор данных ставит задачу, инженер данных из гигантских массивов информации выбирает самое важное, создает инфраструктуру качественных интегрированных и оптимизированных данных. Далее он будет ее тестировать, улучшать и поддерживать, например, периодически чистить устаревшие данные. В результате дата-сайентист получит очищенные и качественные данные, и на их основе сможет запускать свои алгоритмы/строить модели.

Средняя зарплата: ≈ 211 тыс. рублей.

Machine Learning Engineer

(ML-инженер или инженер машинного обучения)

Machine Learning Engineer — это специалист, который занимается разработкой и реализацией алгоритмов машинного обучения в рамках проектов Data Science. Он работает над созданием моделей машинного обучения, выбирает подходящие алгоритмы, настраивает гиперпараметры моделей, обучает модели на тренировочных данных и оценивает их производительность на тестовых данных. В конечном итоге, ML-инженер стремится создать модели, которые могут обнаруживать паттерны и делать прогнозы на основе имеющихся данных. Инженер машинного обучения тесно сотрудничает с дата-сайентистами, инженерами данных и бизнес-аналитиками: от первых он получает задачи и анализ данных — на их основе он создает модели машинного обучения; от вторых он получает необходимые наборы данных для обучения моделей; от последних — понимание требований и целей проекта.

Средняя зарплата: ≈ 220 тыс. рублей.

Перейдем к профессиям, которые не на слуху. но тоже важны и нужны.

Data Architect

(архитектор данных)

Архитектор данных — это руководитель в команде специалистов по обработке данных, который определяет как компания собирает, организует и интегрирует данные. Он также проектирует, создает, развертывает и поддерживает архитектуру данных и отвечает за соответствие требованиям компании к базам данных и их создание в соответствии с внутренними и внешними нормативными актами. Одна из главных задач Data Architect — предоставлять  сотрудникам компании доступ к информации, когда они в ней нуждаются. Он гарантирует, что у инженера данных и остальной команды есть лучшие инструменты и системы для работы.

Средняя зарплата: ≈ 280 тыс. рублей.

Business Intelligence Developer

(BI-разработчик или разработчик бизнес-интеллекта)

BI-разработчик занимается разработкой и обслуживанием BI-платформы,  проектированием и внедрением многомерных моделей баз данных, аналитических систем и созданием отчетов и панелей управления, которые предоставляют бизнес-пользователям доступ к важным метрикам и аналитическим данным. Это включает программирование и создание систем бизнес-аналитики — то есть оптимизация бизнес-процессов с помощью информационных технологий. Также BI-разработчик может вырасти до BI-архитектора.

Средняя зарплата: ≈ 157 тыс. рублей.

Business Intelligence Analyst

(BI-аналитик)

В отличие от BI-разработчика BI-аналитик не занимается разработкой и поддержкой BI-систем. BI-аналитик фокусируется на анализе данных и создании отчетов, графиков и диаграмм, исследует тренды и паттерны. Однако в некоторых компаниях эти роли могут перекрываться, и один человек может выполнять обе функции.

Чем же тогда отличается BI-аналитик от Data Scientist? — BI аналитик фокусируется на конкретных бизнес-задачах на основе существующих данных в системе компании, тогда как Data Scientist имеет более техническую экспертизу и глубокое понимание алгоритмов и статистики,  работает с более сложными аналитическими задачами и разрабатывает прогностические модели и алгоритмы для решения глобальных вопросов.

Средняя зарплата: ≈ 160 тыс. рублей.

Natural Language Processing Engineer

(NLP-инженер)

Natural Language Processing — это область искусственного интеллекта, которая занимается обработкой и анализом естественного языка, то есть языка, на котором говорят и пишут люди.

NLP-инженер пишет и применяет алгоритмы, модели для обработки и анализа естественного языка компьютерами. В его задачи входит: предобработка текста, разработка моделей машинного обучения, работа с языковыми ресурсами и оптимизация производительности. NLP-инженеры используют методы глубокого обучения, такие как рекуррентные нейронные сети (RNN), сверточные нейронные сети (CNN) и трансформеры, чтобы достичь высокой производительности и точности моделей.

Средняя зарплата: ≈ 211 тыс. рублей.

Database Administrator

(DBA или администратор баз данных)

Администратор баз данных, он же менеджер баз данных, занимается управлением баз данных в организации, а именно: установкой и настройкой баз данных, обеспечением безопасности данных, мониторингом и оптимизацией баз данных, резервным копированием, обновлением и восстановлением данных.

Чем отличается Database Administrator от Data Engineer? — DBA занимается управлением и обслуживанием баз данных, Data Engineer — разработкой и управлением инфраструктуры данных.

Средняя зарплата: ≈ 184 тыс. рублей.

Database Developer

(Разработчик БД)

Database Developer разрабатывает и оптимизирует базы данных. Основная задача — обеспечить эффективное хранение и доступ к данным.

Средняя зарплата: ≈ 189 тыс. рублей.

В чем состоит разница между Разработчиком БД, Администратором БД, Инженером данных и архитектором данных?

  • Database Developer занимается разработкой и поддержкой баз данных, созданием структуры баз данных и написанием запросов на языке SQL.
  • Database Administrator отвечает за установку, настройку и обслуживание баз данных, обеспечивает их безопасность, доступность и производительность.
  • Data Engineer занимается созданием и обслуживанием инфраструктуры для обработки больших объемов данных, разработкой ETL-процессов и инструментов для обработки данных.
  • Data Architect проектирует общую структуру и организацию данных, разрабатывает стратегии хранения данных и управляет метаданными.

Итог

Наверно, ни одна компания в мире не имеет всех специальностей Data Science в штате. Но мы можем сравнить Data Science отделы с кухней. Если ресторан большой, у него будут и повара горячего цеха, холодного цеха, кондитеры, мойщики и даже собственный шоколатье. Но в небольших забегаловках все функции будет совмещать в себе один сотрудник — в нашем случае — это Data Scientist. Естественно — это не значит, что один Data Scientist сможет прокормить большой ресторан.

Хотим отметить также, что Data Scientist в крупных компаниях больше сконцентрирован на статистике и математике, а в маленьких фирмах становится тысячеруким буддой. Обучившись основам Data Science у вас будет широкий выбор в какую специализацию уйти.

Вышеперечисленные профессии — это только вершина айсберга Data Science, существуют еще: Statistician, Applications Architect, Enterprise Architect, Computer Systems Analyst, Marketing Analyst, Data Mining Specialist, Computer Vision Engineer, ML Researcher, NLP Researcher, Data Journalist, Subject Matter Expert, Infrastructure Architect — но о них мы поговорим чуть позже…

Софья Пирогова

Софья Пирогова

Главный редактор / Автор статей