Путеводитель по профессиям Data Science
Сколько профессий Data Science вы знаете? Data Scientist… хорошо, а дальше? Прекрасно, если вы назвали 3 или 4 варианта. А что если мы вам скажем, что их больше 10?
Data Science — это сфера, в которой с помощью различных методов и алгоритмов анализируются данные, выявляются закономерности, строятся прогнозы и, в конечном итоге, принимаются бизнес-решения. Наука о данных объединяет знания и навыки из таких областей как статистика, математика, информатика и машинное обучение.
Data Science применяется во многих отраслях, включая бизнес, медицину, финансы, маркетинг, транспорт. С ее помощью можно делать такие вещи, как прогнозирование спроса на товары, оптимизацию производственных процессов, анализ медицинских данных, создание рекомендательных систем. Не удивительно, что в этой сфере появляются новые и новые профессии. Некоторые из них уже популярны в России, а некоторым только предстоит пройти этот путь. Об этом мы и расскажем в этой статье.
Начнем с 4 самых популярных профессий в Data Science в России.
Data Scientist
(дата-сайентист)
Дата-сайентисты работают с крупными объемами информации, выбирают полезные источники данных, подходящие под бизнес-запрос. Далее автоматизируют процессы сбора данных, анализируют и обрабатывают их, создают прогностические модели, оценивают результаты исследований и предоставляют отчеты начальству с рекомендациями. Это если кратко. Более подробно можно почитать в этой статье.
Средняя зарплата: ≈ 200 тыс. рублей.
Если вы хотите узнать, какие зарплаты в других странах или какими hard и soft skills нужно обладать, чтобы устроиться на работу, то нажмите сюда.
Data Analyst
(дата-аналитик)
Дата-аналитики, в отличие от дата-сайентистов используют структурированные данные для решения бизнес-проблем. С помощью инструментов, таких как SQL, Python, R, статистического анализа и визуализации данных, дата-аналитики собирают, очищают и обрабатывают данные для анализа и выявления тенденций, которые могут быть превращены в деловые идеи. Они являются связующим звеном между дата-сайентистами и бизнес-аналитиками.
Средняя зарплата: ≈ 160 тыс. рублей.
Data Engineer
(инженер данных)
Основная обязанность Data Engineer — предоставить данные для Data Scientist по заданию Data Architect. После того как архитектор данных ставит задачу, инженер данных из гигантских массивов информации выбирает самое важное, создает инфраструктуру качественных интегрированных и оптимизированных данных. Далее он будет ее тестировать, улучшать и поддерживать, например, периодически чистить устаревшие данные. В результате дата-сайентист получит очищенные и качественные данные, и на их основе сможет запускать свои алгоритмы/строить модели.
Средняя зарплата: ≈ 211 тыс. рублей.
Machine Learning Engineer
(ML-инженер или инженер машинного обучения)
Machine Learning Engineer — это специалист, который занимается разработкой и реализацией алгоритмов машинного обучения в рамках проектов Data Science. Он работает над созданием моделей машинного обучения, выбирает подходящие алгоритмы, настраивает гиперпараметры моделей, обучает модели на тренировочных данных и оценивает их производительность на тестовых данных. В конечном итоге, ML-инженер стремится создать модели, которые могут обнаруживать паттерны и делать прогнозы на основе имеющихся данных. Инженер машинного обучения тесно сотрудничает с дата-сайентистами, инженерами данных и бизнес-аналитиками: от первых он получает задачи и анализ данных — на их основе он создает модели машинного обучения; от вторых он получает необходимые наборы данных для обучения моделей; от последних — понимание требований и целей проекта.
Средняя зарплата: ≈ 220 тыс. рублей.
Перейдем к профессиям, которые не на слуху. но тоже важны и нужны.
Data Architect
(архитектор данных)
Архитектор данных — это руководитель в команде специалистов по обработке данных, который определяет как компания собирает, организует и интегрирует данные. Он также проектирует, создает, развертывает и поддерживает архитектуру данных и отвечает за соответствие требованиям компании к базам данных и их создание в соответствии с внутренними и внешними нормативными актами. Одна из главных задач Data Architect — предоставлять сотрудникам компании доступ к информации, когда они в ней нуждаются. Он гарантирует, что у инженера данных и остальной команды есть лучшие инструменты и системы для работы.
Средняя зарплата: ≈ 280 тыс. рублей.
Business Intelligence Developer
(BI-разработчик или разработчик бизнес-интеллекта)
BI-разработчик занимается разработкой и обслуживанием BI-платформы, проектированием и внедрением многомерных моделей баз данных, аналитических систем и созданием отчетов и панелей управления, которые предоставляют бизнес-пользователям доступ к важным метрикам и аналитическим данным. Это включает программирование и создание систем бизнес-аналитики — то есть оптимизация бизнес-процессов с помощью информационных технологий. Также BI-разработчик может вырасти до BI-архитектора.
Средняя зарплата: ≈ 157 тыс. рублей.
Business Intelligence Analyst
(BI-аналитик)
В отличие от BI-разработчика BI-аналитик не занимается разработкой и поддержкой BI-систем. BI-аналитик фокусируется на анализе данных и создании отчетов, графиков и диаграмм, исследует тренды и паттерны. Однако в некоторых компаниях эти роли могут перекрываться, и один человек может выполнять обе функции.
Чем же тогда отличается BI-аналитик от Data Scientist? — BI аналитик фокусируется на конкретных бизнес-задачах на основе существующих данных в системе компании, тогда как Data Scientist имеет более техническую экспертизу и глубокое понимание алгоритмов и статистики, работает с более сложными аналитическими задачами и разрабатывает прогностические модели и алгоритмы для решения глобальных вопросов.
Средняя зарплата: ≈ 160 тыс. рублей.
Natural Language Processing Engineer
(NLP-инженер)
Natural Language Processing — это область искусственного интеллекта, которая занимается обработкой и анализом естественного языка, то есть языка, на котором говорят и пишут люди.
NLP-инженер пишет и применяет алгоритмы, модели для обработки и анализа естественного языка компьютерами. В его задачи входит: предобработка текста, разработка моделей машинного обучения, работа с языковыми ресурсами и оптимизация производительности. NLP-инженеры используют методы глубокого обучения, такие как рекуррентные нейронные сети (RNN), сверточные нейронные сети (CNN) и трансформеры, чтобы достичь высокой производительности и точности моделей.
Средняя зарплата: ≈ 211 тыс. рублей.
Database Administrator
(DBA или администратор баз данных)
Администратор баз данных, он же менеджер баз данных, занимается управлением баз данных в организации, а именно: установкой и настройкой баз данных, обеспечением безопасности данных, мониторингом и оптимизацией баз данных, резервным копированием, обновлением и восстановлением данных.
Чем отличается Database Administrator от Data Engineer? — DBA занимается управлением и обслуживанием баз данных, Data Engineer — разработкой и управлением инфраструктуры данных.
Средняя зарплата: ≈ 184 тыс. рублей.
Database Developer
(Разработчик БД)
Database Developer разрабатывает и оптимизирует базы данных. Основная задача — обеспечить эффективное хранение и доступ к данным.
Средняя зарплата: ≈ 189 тыс. рублей.
В чем состоит разница между Разработчиком БД, Администратором БД, Инженером данных и архитектором данных?
- Database Developer занимается разработкой и поддержкой баз данных, созданием структуры баз данных и написанием запросов на языке SQL.
- Database Administrator отвечает за установку, настройку и обслуживание баз данных, обеспечивает их безопасность, доступность и производительность.
- Data Engineer занимается созданием и обслуживанием инфраструктуры для обработки больших объемов данных, разработкой ETL-процессов и инструментов для обработки данных.
- Data Architect проектирует общую структуру и организацию данных, разрабатывает стратегии хранения данных и управляет метаданными.
Итог
Наверно, ни одна компания в мире не имеет всех специальностей Data Science в штате. Но мы можем сравнить Data Science отделы с кухней. Если ресторан большой, у него будут и повара горячего цеха, холодного цеха, кондитеры, мойщики и даже собственный шоколатье. Но в небольших забегаловках все функции будет совмещать в себе один сотрудник — в нашем случае — это Data Scientist. Естественно — это не значит, что один Data Scientist сможет прокормить большой ресторан.
Хотим отметить также, что Data Scientist в крупных компаниях больше сконцентрирован на статистике и математике, а в маленьких фирмах становится тысячеруким буддой. Обучившись основам Data Science у вас будет широкий выбор в какую специализацию уйти.
Вышеперечисленные профессии — это только вершина айсберга Data Science, существуют еще: Statistician, Applications Architect, Enterprise Architect, Computer Systems Analyst, Marketing Analyst, Data Mining Specialist, Computer Vision Engineer, ML Researcher, NLP Researcher, Data Journalist, Subject Matter Expert, Infrastructure Architect — но о них мы поговорим чуть позже…