Возможности и путь вперед

Введение

Краткое объяснение науки о данных

Наука о данных — это дисциплина, которая объединяет миры математики, статистики, компьютерных наук и знаний в предметной области, чтобы извлекать хорошие идеи из данных и рассказывать убедительные истории. Думайте об этом как о команде мечты Шерлока Холмса и Роальда Даля цифрового мира, исследующей данные и изображающей результаты в ярком повествовании, чтобы решать проблемы реального мира и помогать другим принимать обоснованные решения.

Как специалист по данным, ваша миссия состоит в том, чтобы превратить скучные данные в сверкающие жемчужины информации. Вам поручено отвечать на вопросы, делать прогнозы и создавать продукты данных, которые можно применять на практике. Это захватывающая и динамичная область, которая требует сочетания технического мастерства, пытливого ума и исключительных навыков рассказывания историй.

Моя мотивация для изучения науки о данных

Я очень хочу погрузиться в мир науки о данных, поскольку считаю, что это набор навыков, который уже пользуется большим спросом и останется таковым в ближайшем будущем. С учетом количества данных, которые генерируются в наши дни, возможность их анализа и осмысления становится все более важной. Меня привлекает изобилие доступных бесплатных данных, и мне не терпится применить свои (в конечном счете) новообретенные навыки работы с данными, превращая пресную информацию в повествования, которые делают ее доступной для всех, кто заинтересован в прослушивании.

На постоянно развивающемся рынке труда изучение науки о данных — это разумный способ защитить свою карьеру в будущем и оставаться на шаг впереди. Таким образом, я смогу принимать обоснованные решения на основе информации, основанной на данных, что сделает меня ценным на любой должности. Я уверен, что благодаря усердной работе и самоотверженности я смогу реально изменить мир с помощью решений, основанных на данных.

Цель этого поста в блоге

У меня есть миссия — узнать много нового об этом мощном поле и применить его на практике. И я хочу взять тебя с собой на прогулку.

Теперь я знаю, что вы думаете: «Изучение науки о данных звучит потрясающе, но с чего мне вообще начать?» Не бойся, мой друг. Вот тут-то и появляется этот блог. Я планирую документировать свое путешествие по мере того, как я учусь, и делиться своим опытом и идеями на этом пути. Я буду использовать всевозможные ресурсы, от онлайн-курсов до книг, и обязательно поделюсь всем, что нахожу полезным.

Итак, если вы планируете изучать науку о данных или просто заинтересованы в путешествии, присоединяйтесь ко мне, когда я вступаю на этот захватывающий путь. Кто знает, может быть, вы тоже вдохновитесь начать!

Понимание науки о данных

Что такое наука о данных

Позвольте мне рассказать вам об удивительном мире науки о данных немного подробнее. Это область, которая уже некоторое время находится на подъеме с тех пор, как слово «наука о данных» впервые было упомянуто в 1974 году¹. В то время это просто означало информатику. Его значение менялось со временем, а популярность резко возросла в 2012 году, когда профессия Data Scientist была объявлена ​​самой сексуальной профессией 21 века² — и нетрудно понять, почему. Наука о данных — это междисциплинарный подход к анализу и осмыслению данных, объединяющий навыки статистики, математики, информатики и предметной области. При наличии огромного количества данных, доступных сегодня, возможность обрабатывать и анализировать их, а также строить на их основе повествование важнее, чем когда-либо.

Специалисты по данным используют свой набор алгоритмов, языков программирования и инструментов визуализации данных, чтобы превратить необработанные данные в полезную информацию. Затем эти идеи можно использовать для информирования при принятии решений, поддержки научных открытий и решения реальных проблем. Будь то построение прогностических моделей, выполнение исследовательского анализа данных или сообщение результатов заинтересованным сторонам, специалисты по обработке и анализу данных находятся в авангарде поиска решений сложных проблем.

Итак, какой смысл во всей этой обработке данных? Проще говоря, все дело в том, чтобы оказать значимое влияние и рассказать убедительную историю. Используя методы, основанные на данных, специалисты по данным могут решать сложные проблемы и находить решения, которые имеют значение. И давайте не будем забывать, что спрос на специалистов по данным только растет, поэтому, если вы ищете интересную и востребованную карьеру, наука о данных может быть именно тем, что вам нужно!

Где применяется наука о данных

Готовы ли вы исследовать универсальный и востребованный мир науки о данных? Тогда давайте погрузимся! Наука о данных — это мастер на все руки в цифровом мире, оставивший свой след в самых разных отраслях и областях.

Возьмем, к примеру, здравоохранение. Наука о данных — лучший друг врача, помогающий анализировать данные пациентов и разрабатывать прогностические модели для улучшения результатов и снижения затрат. Или финансы, где наука о данных становится консультантом, помогая анализировать рыночные тенденции, выявлять мошенничество и принимать инвестиционные решения.

Наука о данных также хорошо разбирается в технологиях, используя свои навыки для анализа поведения пользователей, повышения производительности веб-сайта и разработки систем рекомендаций в технологической отрасли. В розничной торговле наука о данных — это эксперт по продажам, который анализирует данные о продажах и разрабатывает персонализированные маркетинговые кампании.

И давайте не будем забывать правительство и государственный сектор в целом, где наука о данных определяет политику и использует данные о населении для обоснования решений и улучшения государственных услуг.

Это лишь небольшой выбор, и по мере роста спроса на аналитику, основанную на данных, влияние науки о данных будет только продолжать распространяться на новые отрасли. Итак, пристегнитесь, ребята! Будущее науки о данных яркое и полное бесконечных возможностей!

Карьерные возможности в науке о данных

Высокий спрос на специалистов по данным

Потребность в специалистах по данным и тесно связанных с ними должностях, таких как инженер данных или бизнес-аналитик, стремительно растет, поскольку компании стремятся использовать силу данных для принятия бизнес-решений и оставаться на шаг впереди.

Спустя десятилетие эта работа как никогда востребована работодателями и рекрутерами. ИИ становится все более популярным в бизнесе, и компании всех размеров и местоположений считают, что им нужны специалисты по данным для разработки моделей ИИ. К 2019 году количество публикаций для специалистов по данным на сайте Indeed выросло на 256%, и Бюро статистики труда США прогнозирует, что наука о данных будет расти больше, чем почти в любой другой области до 2029 года.³

Специалисты по данным обладают редким сочетанием навыков, сочетая технические навыки в области анализа данных и кодирования со способностью передавать идеи и рассказывать убедительные истории данных. С обилием данных и растущим значением принятия решений на основе данных фирмы во множестве отраслей ищут талантливых специалистов по данным, которые помогут им разобраться в своих данных. Таким образом, карьера в области науки о данных является заманчивым и прибыльным выбором для людей со склонностью к работе с данными.

Различные рабочие роли, требующие навыков работы с данными

Давайте взглянем на несколько наиболее востребованных ролей в сфере науки о данных:

Ученый по обработке и анализу данных. Человек, который занимается сбором, анализом и интерпретацией огромных объемов данных, а затем использует полученные результаты для составления описания и помощи команде в принятии обоснованных решений.

Бизнес-аналитик. Эксперт по бизнесу. Тот, кто просеивает данные и видит, как их можно связать для получения информации и роста бизнеса. Помогает остальной команде общаться с бизнесом.

Инженер данных: архитектор инфраструктуры, необходимой для хранения, обработки и анализа больших объемов данных.

Архитектор данных: разрабатывает и реализует стратегию данных, а также планирует и внедряет сквозную архитектуру данных. Управляет системами баз данных.

Инженер по машинному обучению. Разработчик и создатель моделей машинного обучения, которые можно использовать для прогнозирования или обоснованных решений.

Это лишь некоторые из многих ролей в экосистеме науки о данных. Итак, если вы любите работать с данными, у вас есть широкий выбор профилей работы.

Потенциальная заработная плата и возможности роста в области науки о данных

Если вы хотите произвести фурор на рынке труда и взять под контроль свое финансовое будущее, вам стоит подумать о карьере в области науки о данных.

Послушайте, потому что это действительно хорошие новости: специалисты по данным пользуются большим спросом, и в результате они получают впечатляющие зарплаты.

Востребованная работа, как правило, хорошо оплачивается; медианная зарплата опытного специалиста по данным в Калифорнии приближается к 200 000 долларов США.³

Но дело не только в деньгах, о нет! Спрос на навыки работы с данными только растет, растет, растет. Это означает, что у вас, опытных людей, есть огромный потенциал для долгосрочного карьерного роста и продвижения по службе.

Итак, если у вас есть нужные навыки и опыт, карьера в области науки о данных — это путь не только к высокой зарплате, но и к полноценному и полезному будущему.

Мой путь к изучению науки о данных

Мой фон

Позвольте мне поделиться своей историей о том, как я отправился в это увлекательное путешествие. Я хорошо разбираюсь в математике и статистике и получил степень доктора философии. по математике некоторое время назад (точное время я сохраню в тайне, чтобы не раскрывать свою старость). У меня есть базовые знания в области компьютерного программирования и некоторый опыт работы с C++, Python и несколькими специализированными математическими языками. Поскольку Python — любимый язык дата-сайентистов, я решил для начала копнуть глубже и взял несколько книг о машинном обучении с помощью Python⁴.

После недели или двух экспериментов с scikit-learn и NLTK, но не имея представления о том, что я делаю, я понял, что это неструктурированный подход, и мне нужна лучшая основа и путь, по которому нужно следовать. Я знал, что Coursera — это вещь. Поэтому я зашел на YouTube и поискал лучшие курсы по машинному обучению на Coursera. Я нашел отличный (не аффилированный, без комиссии для меня), который дает надежный путь к величию (по крайней мере, я на это надеюсь).

Короче говоря, сейчас я пойду по этому пути:

  1. Сертификат IBM Data Science Professional
  2. Специализация машинного обучения, Эндрю Нг
  3. Специализация глубокого обучения от Эндрю Нг
  4. Практическая наука о данных на AWS

Я начал получать сертификат IBM Data Science Professional примерно две недели назад и пока не могу сказать слишком много. В качестве основы для десяти, вот некоторые основы:

  • Местоположение: Coursera
  • Обязательство по времени: 5 месяцев при обучении по 4 часа в неделю. По моему опыту, это займет гораздо меньше времени, чем это.
  • Стоимость: курс бесплатный, но поскольку мне нужен сертификат, я плачу 39 долларов в месяц.

Сертификат состоит из следующих 10 курсов. Если вам это интересно, читайте подробнее здесь.

  1. Что такое наука о данных?
  2. Инструменты для науки о данных
  3. Методология науки о данных
  4. Python для науки о данных, искусственного интеллекта и разработки
  5. Проект Python для науки о данных
  6. Базы данных и SQL для науки о данных с Python
  7. Анализ данных с помощью Python
  8. Визуализация данных с помощью Python
  9. Машинное обучение с Python
  10. Краеугольный камень прикладной науки о данных

Я пока не могу сказать ничего определенного, так как учусь всего три недели. Однако, исходя из моего первого выражения, сочетание книг и онлайн-курсов оказывается выигрышной формулой. Я могу получить твердое представление о науке о данных и встать на путь становления квалифицированным специалистом по данным.

Итак, берите свои книги по Python и записывайтесь на курс Coursera (опять же, здесь нет членства или комиссий!), и давайте вместе покорять мир науки о данных!

Что дальше

Продолжая свой путь к величию науки о данных, я решил задокументировать свой прогресс и поделиться своими размышлениями со всем миром. Я планирую написать серию статей здесь, на Medium, в которых подробно расскажу о взлетах и ​​падениях своего путешествия. Я буду подробно описывать то, что я узнал, какие препятствия я преодолел, и мой практический опыт работы с реальными данными.

В следующей статье этой серии будет подробно рассказано о сертификате IBM Data Science Professional Certificate. Народ, скрестим пальцы, что у меня получилось. Иначе статьи не будет.

Я стремлюсь предоставить дорожную карту для тех, кто только начинает заниматься наукой о данных или хочет усовершенствовать свои навыки. Итак, если вы хотите следить за моим прогрессом, дайте мне подписаться на Twitter или подпишитесь на мой список адресов электронной почты и следите за моими последними статьями и обновлениями.

Рекомендации

  1. Питер Наур предложил его как альтернативное название информатики.
  2. Давенпорт, Томас (1 октября 2012 г.). «Data Scientist: самая сексуальная профессия 21 века». Гарвардский бизнес-обзор.
  3. Давенпорт, Томас; Патил, ди-джей (15 июля 2022 г.). Является ли Data Scientist самой сексуальной профессией 21 века?. Гарвардский бизнес-обзор.
  4. Юси Лю, Машинное обучение на Python на примере: самый простой способ освоить машинное обучение
    Орельен Герон, Практическое машинное обучение с помощью Scikit–Learn и TensorFlow