Big Data — самая сексуальная профессия XXI века

Технологии 28.08.2018 12:56

Почти каждая статья про дата-аналитиков или машинное обучение начинается с острой нехватки кадров, так ли это на самом деле?

На сайтах работодателей все чаще мелькают объявления. Больше компаний осознают этот тренд и создают у себя подразделения, специализирующиеся на данных. Также появляются новые молодые компании, работающие конкретно с данными. Так как эта очень молодая область, в вузах только-только начинают появляться соответствующие специализации — все это приводит к существенному недостатку специалистов на рынке, росту зарплат в этой области. А это, несомненно, делает профессию специалиста по работе с данными еще привлекательней.

На отечественном рынке, конечно, есть спрос, но в основном привлекают специалистов из соседних стран. Это логично, в стране пока нет среды для обучения и дальнейшей практики. Большой бум нехватки специалистов пойдет, когда государство начнет внедрять Big data в полном масштабе в рамках «Цифрового Казахстана». Если вы подумываете углубиться и сделать карьеру в данной области, сейчас самое подходящее время.

Who is who? Чем занимаются?

Чем на самом деле занимаются специалисты по обработке Big Data? Так называемые аналитики больших данных занимаются обработкой информации и анализом для получения наглядных, воспринимаемых человеческим глазом результатов. К таким людям обычно причисляют специалистов: Big Data Engineer, Machine Learning Engineer, Business Intelligence Analyst, Data Scientist. В этой статье мы более углубленно остановимся на Data Scientist.

Data scientist (Data Analytics) — названа самой сексуальной профессией XXI века [Harvard Business Review]. Есть такая шутка: Data Scientist — это человек, который умеет программировать лучше, чем статистик, и знает статистику лучше, чем программист.

Data Science — это прикладная область науки, в которой требуется хорошее знание математики, начиная от математического анализа и аналитической геометрии и заканчивая теорией вероятностей и статистикой.

Чтобы стать специалистом в этой области, нужно уметь хорошо программировать, знать современные языки, для которых уже существует множество специализированных научных библиотек и компонентов для работы с Big Data.

Наука о данных пока еще не имеет четких границ, и на вопрос о том, что же должен уметь Data Scientist, много ответов. Вышеизложенная схема не является окончательной. Специалист в области Data Scientist — настоящий «швейцарский нож» в области аналитики и статистики, всегда незаменимый и востребованный.

Сколько зарабатывает Data scientist

Средняя заработная плата в США Data Scientist — $91 тысяча в год [данные PayScale]. В России от 60−70 тысяч рублей в месяц для совсем новичков и доходит до 500 000 тысяч рублей для опытных специалистов. На казахстанском рынке заработная плата начинается от 150 000 тысяч тенге в месяц для совсем «зеленых» и доходит до 2 000 000 тг для джедай-специалистов.

Где работают?

Существует миф, что Big Data внедряется только в крупном бизнесе. История очень популярна на постсоветском пространстве. В США и Европе эта тема обсуждается более активно. В пример приводятся сервисы Followerwonk, YouTube Analytics и Tweriod. Некоторые представители малого и среднего бизнеса успешно пользуются облачными решениями, например, платформой Amazon, построенной специально для вычислений на основе Big Data.

Важно отметить, что на Западе уже существуют биржи данных для малого бизнеса, вокруг которых можно строить бизнес или улучшать организационные и маркетинговые процессы.

Скорее можно назвать области, где сейчас не применяются большие данные. Будь то космические технологии, образование, банковское дело, розничная торговля, страхование, телекоммуникации, добыча полезных ископаемых, производство, обслуживание клиентов или конкурентные виды спорта, логистика, большие данные стали решающим фактом среди рыночной конкуренции.

Попробуйте ответить на несколько вопросов, которые задают лидеры IT-рынка на собеседовании.

Facebook:

1. У скольких пользователей Facebook сегодня день рождения?

2. У вас есть две таблицы: первая таблица содержит данные о пользователях и их друзьях, вторая содержит данные о пользователях и страницах, которые им понравились. Напишите SQL-запрос, чтобы создать список рекомендаций, используя страницы, которые понравились вашим друзьям. Результат запроса не должен рекомендовать страницы, которые уже понравились пользователю.

Google:

1. Объясните процесс синтаксического анализа строк в R.

2. Диск вращается на шпинделе, но направления вы не знаете. Как узнать это, используя несколько иголок?

3. Опишите процесс анализа данных.

4. Как разрезать круглый пирог на 8 равных частей?

Выводы

Ситуация за пределами страны показывает, что действительно существует большая нехватка кадров. Лидеры IT-рынка начали самостоятельное онлайн-обучение, Google, Яндекс, Microsoft открывают свои курсы, школы по обучению обработке больших данных и машинному обучению.

А еще бытует мнение, что лет через 10−20 любому менеджеру в продвинутой компании будет просто необходимо владеть хотя бы базовыми навыками Data Science. Как однажды рекрутер Линда Берч сказала в своем интервью Mashable: «Если вы не помешаны на данных, то через десять лет вам просто не найдется места в рядах начальников».

Автор: Сергей Ахметов, эксперт в области обработки больших данных (Big Data).

Узнавайте больше об интересных событиях в Казахстане и за рубежом.
Подписывайтесь на нас в Telegram

Загрузка...
Перейти на полную версию сайта