Кто такой Data Scientist и чем он занимается?

Профессия Data Science Интернет профессии

Здравствуйте дорогие подписчики и читатели нашего блога!

Наша очередная статья посвящена одной из самых сложных, а для кого-то, может быть, и совсем непонятных, интернет-профессий – Data Scientist. Я расскажу о том, что собой представляет этот специалист, чем занимается и сколько зарабатывает. Для тех кого заинтересует эта профессия, думаю, будет интересно узнать, где обучают таких специалистов.

Кто такой Data Science?

Начну, пожалуй, с банального – все мы каждый день заходим в интернет и видим, что даже при простейшем поиске по интересующей теме, нас практически заваливают информацией, представленной в разном виде. Нужно это все «переварить» и сделать какие-то выводы для принятия решения.

А теперь представьте ситуацию, когда нужно переработать большой массив  информации для того, чтобы спрогнозировать, как будет развиваться ситуация, например, с курсом валюты или стоимостью акций, а может быть просто нужно сделать прогноз результатов матчей. И здесь уже нельзя ограничиться просто личными умозаключениями для принятия решения, все выводы нужно облечь в реальные данные. Как это сделать, если вся информация представлена в разрозненном виде и не структурирована.

Вот такой работой и занимается специалист в области  data science. Это человек, который работает с огромными объемами неструктурированных данных, и с помощью методов машинного обучения и математической статистики приводит эти данные в сопоставимый вид, анализирует и делает прогнозы.

Тематика может быть какой угодно – от прогноза погоды или результатов матча до  сложных научных гипотез. По итогам обработки и анализа баз данных, дата-сайентист  составляет прогнозную модель, которая представляет собой наиболее оптимальный вариант решения или развития событий при заданных параметрах.

С результатами работы таких профессионалов мы постоянно сталкиваемся в сети интернета, но многие, наверное, даже не задумывались об этом. Дата-сайентисты создают голосовые помощники, прогнозы погоды, систему подбора возможных знакомых в социальной сети, сервисы распознавания лиц по определенным параметрам и многое другое.

Это только некоторые из направлений работы специалиста. Прогнозные модели могут быть совершенно разной тематики и направления – от простых до супер сложных.

Обязанности специалиста

Как я уже говорила, дата-сайентист  не только собирает и анализирует большой массив неструктурированных данных, но и разрабатывает и тестирует прогнозные модели (гипотезы), которые соответствуют запрашиваемой концепции. Это только общее описание профессии, а если разобрать более подробно, то список обязанностей специалиста выглядит примерно так:

  • сбор различных данных (структурированные и нет) по установленной тематике из максимально возможного числа источников;
  • обработка полученных данных;
  • анализ возможных вариантов развития ситуации (поведение пользователей, изменение курса валют и другие) и разработка прогнозной модели, а вернее нескольких моделей;
  • оценка рисков по всем вариантам развития;
  • тестирование моделей, выявление недостатков и их исправление;
  • составление итоговых аналитических отчетов и прогнозов по итогам тестирования.

Итоговая модель затем внедряется в работу. А дата-сайентист продолжает работать с моделью, анализирует, улучшает, корректирует. Техническим результатом  всего  процесса разработки является код, который дает возможность созданной модели работать. Для справки: этап подготовки и очистки данных занимает почти 60% рабочего времени.

Знания и навыки для работы Data Scientist

Чтобы стать грамотным специалистом в данной профессии необходимо в первую очередь профильное образование, желательно программиста. При этом просто машинного обучения недостаточно.

Чтобы решать сложные задачи необходимо не просто знать основы программирования, но виртуозно владеть им. Нужно хорошо знать все алгоритмы, разбираться в структуре данных и принципах работы системы. А еще  специалист должен знать основы математики, теории вероятности и математической статистики.

Я думаю, вы понимаете, что самостоятельно, с нуля, без подготовительной базы освоить все это очень сложно.

Помимо профессиональных знаний, дата-сайентист должен обладать определенными качествами, без которых в этой профессии не обойтись:

  • усидчивость;
  • внимательность к деталям;
  • целеустремленность;
  • математический склад ума;
  • инициативность;
  • коммуникабельность;
  • умение не пасовать перед трудностями.

Если все эти качества про вас – то профессия дата-сайентист имеет все шансы стать  работой вашей мечты.

Отличие от бизнес-аналитика

Профессия Data Scientist имеет много общего с другими специальностями в области аналитики, в частности с бизнес-аналитиком. И некоторые даже думают, что это одно и тоже. В этих профессиях есть, конечно, некоторое сходство, но тем не менее они разные. Поэтому  немного расскажу о том, чем они отличаются.

Главное отличие в том, что дата сайентист предсказывает результат на основании обработанных массивов данных, то есть прогнозирует будущее проекта с помощью технических средств – программирование и математическая статистика.

А бизнес-аналитик  направлен не на технические результаты, а на коммерческие. Он оценивает, в первую очередь, эффективность проекта, используя статистические и аналитические данные.

При решении сложных задач (разработка алгоритма, обработка большого массива данных) бизнес-аналитик может привлечь дата-сайентиста для решения технических вопросов. Бизнес-аналитик может предложить варианты решения, которые дадут лучшие коммерческие результаты, но он не решает технические задачи, этим уже занимается дата-сайентист.

Как и где найти работу?

Специфика профессии в настоящее время в том, что большая часть вакансий размещается в Москве, частично в Санкт-Петербурге, а вот по другим регионам такие вакансии очень редко встречаются. Возможно, в будущем эта ситуация будет меняться.

Работать по специальности можно как оффлайн, так и удаленно – все зависит от требований работодателя. В основном такие специалисты требуются в IT-компаниях, банках, и лишь иногда в других сферах деятельности.

Анализ существующих вакансий показывает, что большая часть работодателей хочет видеть на этой работе специалистов, которые:

  • имеют высокие математические навыки (высшая математика, теория вероятности, математическая статистика);
  • знают язык программирования Python и основные библиотеки;
  • имеют навыки работы с базами данных SQL;
  • знакомы с  системами визуализации данных (Table an, Metabase, Power BI);
  • прошли машинное обучение.

Иногда требуется  знание технического английского, так как вся печатная техническая литература представлена на нем.

Чаще всего в профессию идут те, кто имеет серьезную математическую подготовку и базовое профильное образование. Также дорасти до Data Scientist может аналитик данных, системный аналитик и специалист по Python-разработке. Ведь это основные составляющие профессии.

Развиваться в профессии можно как вертикально, так и горизонтально. Простой специалист может стать руководителем отдела или перейти на аналогичную работу в другой, более сложной сфере.

Уровень дохода дата сайентиста

А теперь немного о самом популярном вопросе – сколько зарабатывает специалист? Дата сайентист – это одна из самых быстро развивающихся профессий и спрос на таких специалистов постоянно увеличивается. Интерес к аналитике больших данных будет расти еще долгое время.  А вот найти высококлассного специалиста  в этой сфере очень проблематично. Поэтому, если решили остановиться на данной профессии и считаете, что вам она по плечу, тогда есть все шансы найти хорошую перспективную работу, которая будет приносить вам высокий доход.

Заработная плата по этой специальности значительно отличается в зависимости от сферы деятельности и региона. В Москве начинающий специалист без опыта или со стажем до 1 года может найти работу с зарплатой до 100 тысяч рублей! Да, платят таким специалистам хорошо. В СПБ начинающий дата сайентист может получать от 45 до 85 тысяч рублей. По другим регионам, если появляются вакансии, доход меньше.

Профессионал уровня middle с опытом от 5 лет может рассчитывать на ежемесячный доход в разы больше: в Москве до 500 тысяч рублей, в СПБ – в среднем 150-200 тысяч рублей.

В качестве бонуса многие работодатели предлагают дополнительное обучение (повышение квалификации) за счет средств компании.

Плюсы и минусы профессии

Data Scientist достаточно сложная и специфическая профессия. Она имеет существенные преимущества, но при этом обладает и некоторыми недостатками. Вот наиболее существенные:

Высокие доходы
Большая востребованность
Возможность работать удаленно
Есть перспективы роста как до уровня руководителя, так и в другой сфере деятельности
Большая нагрузка
Высокий уровень ответственности
Необходимо профильное образование (одними курсами не обойтись)
Требуется хорошая устойчивость в стрессовых ситуациях

Видео-обзор профессии

Чтобы лучше осмыслить суть профессии, предлагаю вам посмотреть видео-интервью с практикующим специалистом, который от первого лица расскажет все о своей любимой профессии. Это запись интервью с Вячеславом Архиповым (Data scientist  компании Banuba):

Где научиться специальности?

Как я уже говорила, для профессии дата-сайентист необходимо профильное образование программиста или математическое. А чтобы освоить специфику именно работы с большими массивами данных как структурированных, так и неструктурированных, можно дополнительно пойти на специализированные курсы.

Предлагаю рассмотреть несколько таких вариантов:

1. «Профессия Data Scientist» от SkillBox

SkillBox – онлайн-университет, участник проекта Skolkovo, обладатель премии рунета за 2018 и 2019 годы.

  • Чему научитесь: программировать на Python, работать с базами данных, визуализировать результаты, применять нейронные сети для решения реальных задач.
  • Длительность обучения: более 1,5 лет.
  • Формат обучения: онлайн-лекции, воркшопы, домашние задания, 2 дипломных проекта-соревнования на Kaggle; работа с наставником.
  • Преимущества: рассрочка платежа, первый платеж только через 6 месяцев; 2 специальности в одной программе; помощь в трудоустройстве; 1,5 года стажировки в специализированной компании; диплом установленного образца.
  • Стоимость: Общая стоимость около 162 000 рублей; возможна рассрочка без переплат по 3 675 рублей в месяц, начиная с 7-го месяца обучения.

Курс «Профессия Data Scientist» от Skillbox

2. «Профессия Data Scientist» от SkillFactory

SkillFactory – специализированная онлайн-школа по обучению Python, Data Science, Machine Learning, разработке и управлению продуктами. На рынке с 2016 года.

  • Чему научитесь: основам программирования на языке Python; изучите математику и статистику для специализации;  освоите практическое машинное обучение и нейронные сети; дополнительно изучите менеджмент для управления проектом и командой.
  • Длительность обучения: 24 месяца.
  • Формат обучения: занятия в форме тренажера, практика с проверкой домашних заданий, работа с куратором, занятия по 6 часов в неделю.
  • Преимущества: курсы-тренажеры; реальные проекты для портфолио; помощь персональная от ментора; соревнования и хакатоны; помощь в трудоустройстве; возможность выбрать уровень обучения (junior, middle, senior); сертификат школы; беспроцентная рассрочка платежа.
  • Стоимость: около 220 000 рублей за базовый курс, или в рассрочку по 9 722 рублей в месяц.

Курс «Профессия Data Scientist» от SkillFactory

 

3, «Data Scientist» от Нетологии

Нетология – онлайн-университет, который за программу «Профессия Data Scientist» в 2019 году получил премию «Знак качества» в номинации «Подготовка профессионалов цифровой индустрии».

  • Чему научитесь: работать с SQL, использовать Python и библиотеки, строить модели машинного обучения.
  • Длительность обучения: 12 месяцев.
  • Формат обучения: вебинары и онлайн-лекции, практика, домашние задания, лабораторные и проектные работы, сопровождение ментора.
  • Преимущества: первый платеж через полгода; диплом о профессиональной переподготовке установленного образца; помощь в трудоустройстве; 10 кейсов в портфолио; пошаговый план погружения в профессию.
  • Стоимость: 126 000 рублей, или по 5 250 рублей в месяц на 2 года.

Курс «Data Scientist» от Нетологии

Еще больше курсов по профессии вы найдете в статье Курсы по обучению Data Science для начинающих: ТОП-20+ лучших платных и бесплатных.  Возможно, также вам будут интересны курсы по программированию.

Дополнительно вы можете прочитать книги по Data Science, правда такая литература представлена в основном на английском языке. На русском почти нет профессиональных книг, пока издана только одна: «Глубокое погружение в мир нейронных сетей» от С.Николенко, А.Кадурина и Е.Архангельской. Подойдет для начинающих специалистов.

Заключение

На этом я заканчиваю обзор профессии Data Scientist. С основными аспектами я вас познакомила. Но может быть, вам недостаточно информации и вы хотели бы узнать что-то еще? Напишите, пожалуйста, об этом в своих комментариях. А я пока прощаюсь с вами. До новых встреч!

Елена Савельева

Закончила университет по специальности «Экономика и управление производством».
С 2010 года работаю финансовым аналитиком.
В мае 2020 года начала осваивать новую профессию копирайтера.
Люблю книги и путешествия. Нравится познавать мир и открывать для себя что-то новое.

Оцените автора
Блог Iprodvinem.com | Удаленная работа и заработок денег в интернете
Добавить комментарий

Нажимая на кнопку "Отправить комментарий", я даю согласие на обработку персональных данных и принимаю политику конфиденциальности.

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам: