Возможности и путь вперед
Введение
Краткое объяснение науки о данных
Наука о данных — это дисциплина, которая объединяет миры математики, статистики, компьютерных наук и знаний в предметной области, чтобы извлекать хорошие идеи из данных и рассказывать убедительные истории. Думайте об этом как о команде мечты Шерлока Холмса и Роальда Даля цифрового мира, исследующей данные и изображающей результаты в ярком повествовании, чтобы решать проблемы реального мира и помогать другим принимать обоснованные решения.
Как специалист по данным, ваша миссия состоит в том, чтобы превратить скучные данные в сверкающие жемчужины информации. Вам поручено отвечать на вопросы, делать прогнозы и создавать продукты данных, которые можно применять на практике. Это захватывающая и динамичная область, которая требует сочетания технического мастерства, пытливого ума и исключительных навыков рассказывания историй.
Моя мотивация для изучения науки о данных
Я очень хочу погрузиться в мир науки о данных, поскольку считаю, что это набор навыков, который уже пользуется большим спросом и останется таковым в ближайшем будущем. С учетом количества данных, которые генерируются в наши дни, возможность их анализа и осмысления становится все более важной. Меня привлекает изобилие доступных бесплатных данных, и мне не терпится применить свои (в конечном счете) новообретенные навыки работы с данными, превращая пресную информацию в повествования, которые делают ее доступной для всех, кто заинтересован в прослушивании.
На постоянно развивающемся рынке труда изучение науки о данных — это разумный способ защитить свою карьеру в будущем и оставаться на шаг впереди. Таким образом, я смогу принимать обоснованные решения на основе информации, основанной на данных, что сделает меня ценным на любой должности. Я уверен, что благодаря усердной работе и самоотверженности я смогу реально изменить мир с помощью решений, основанных на данных.
Цель этого поста в блоге
У меня есть миссия — узнать много нового об этом мощном поле и применить его на практике. И я хочу взять тебя с собой на прогулку.
Теперь я знаю, что вы думаете: «Изучение науки о данных звучит потрясающе, но с чего мне вообще начать?» Не бойся, мой друг. Вот тут-то и появляется этот блог. Я планирую документировать свое путешествие по мере того, как я учусь, и делиться своим опытом и идеями на этом пути. Я буду использовать всевозможные ресурсы, от онлайн-курсов до книг, и обязательно поделюсь всем, что нахожу полезным.
Итак, если вы планируете изучать науку о данных или просто заинтересованы в путешествии, присоединяйтесь ко мне, когда я вступаю на этот захватывающий путь. Кто знает, может быть, вы тоже вдохновитесь начать!
Понимание науки о данных
Что такое наука о данных
Позвольте мне рассказать вам об удивительном мире науки о данных немного подробнее. Это область, которая уже некоторое время находится на подъеме с тех пор, как слово «наука о данных» впервые было упомянуто в 1974 году¹. В то время это просто означало информатику. Его значение менялось со временем, а популярность резко возросла в 2012 году, когда профессия Data Scientist была объявлена самой сексуальной профессией 21 века² — и нетрудно понять, почему. Наука о данных — это междисциплинарный подход к анализу и осмыслению данных, объединяющий навыки статистики, математики, информатики и предметной области. При наличии огромного количества данных, доступных сегодня, возможность обрабатывать и анализировать их, а также строить на их основе повествование важнее, чем когда-либо.
Специалисты по данным используют свой набор алгоритмов, языков программирования и инструментов визуализации данных, чтобы превратить необработанные данные в полезную информацию. Затем эти идеи можно использовать для информирования при принятии решений, поддержки научных открытий и решения реальных проблем. Будь то построение прогностических моделей, выполнение исследовательского анализа данных или сообщение результатов заинтересованным сторонам, специалисты по обработке и анализу данных находятся в авангарде поиска решений сложных проблем.
Итак, какой смысл во всей этой обработке данных? Проще говоря, все дело в том, чтобы оказать значимое влияние и рассказать убедительную историю. Используя методы, основанные на данных, специалисты по данным могут решать сложные проблемы и находить решения, которые имеют значение. И давайте не будем забывать, что спрос на специалистов по данным только растет, поэтому, если вы ищете интересную и востребованную карьеру, наука о данных может быть именно тем, что вам нужно!
Где применяется наука о данных
Готовы ли вы исследовать универсальный и востребованный мир науки о данных? Тогда давайте погрузимся! Наука о данных — это мастер на все руки в цифровом мире, оставивший свой след в самых разных отраслях и областях.
Возьмем, к примеру, здравоохранение. Наука о данных — лучший друг врача, помогающий анализировать данные пациентов и разрабатывать прогностические модели для улучшения результатов и снижения затрат. Или финансы, где наука о данных становится консультантом, помогая анализировать рыночные тенденции, выявлять мошенничество и принимать инвестиционные решения.
Наука о данных также хорошо разбирается в технологиях, используя свои навыки для анализа поведения пользователей, повышения производительности веб-сайта и разработки систем рекомендаций в технологической отрасли. В розничной торговле наука о данных — это эксперт по продажам, который анализирует данные о продажах и разрабатывает персонализированные маркетинговые кампании.
И давайте не будем забывать правительство и государственный сектор в целом, где наука о данных определяет политику и использует данные о населении для обоснования решений и улучшения государственных услуг.
Это лишь небольшой выбор, и по мере роста спроса на аналитику, основанную на данных, влияние науки о данных будет только продолжать распространяться на новые отрасли. Итак, пристегнитесь, ребята! Будущее науки о данных яркое и полное бесконечных возможностей!
Карьерные возможности в науке о данных
Высокий спрос на специалистов по данным
Потребность в специалистах по данным и тесно связанных с ними должностях, таких как инженер данных или бизнес-аналитик, стремительно растет, поскольку компании стремятся использовать силу данных для принятия бизнес-решений и оставаться на шаг впереди.
Спустя десятилетие эта работа как никогда востребована работодателями и рекрутерами. ИИ становится все более популярным в бизнесе, и компании всех размеров и местоположений считают, что им нужны специалисты по данным для разработки моделей ИИ. К 2019 году количество публикаций для специалистов по данным на сайте Indeed выросло на 256%, и Бюро статистики труда США прогнозирует, что наука о данных будет расти больше, чем почти в любой другой области до 2029 года.³
Специалисты по данным обладают редким сочетанием навыков, сочетая технические навыки в области анализа данных и кодирования со способностью передавать идеи и рассказывать убедительные истории данных. С обилием данных и растущим значением принятия решений на основе данных фирмы во множестве отраслей ищут талантливых специалистов по данным, которые помогут им разобраться в своих данных. Таким образом, карьера в области науки о данных является заманчивым и прибыльным выбором для людей со склонностью к работе с данными.
Различные рабочие роли, требующие навыков работы с данными
Давайте взглянем на несколько наиболее востребованных ролей в сфере науки о данных:
Ученый по обработке и анализу данных. Человек, который занимается сбором, анализом и интерпретацией огромных объемов данных, а затем использует полученные результаты для составления описания и помощи команде в принятии обоснованных решений.
Бизнес-аналитик. Эксперт по бизнесу. Тот, кто просеивает данные и видит, как их можно связать для получения информации и роста бизнеса. Помогает остальной команде общаться с бизнесом.
Инженер данных: архитектор инфраструктуры, необходимой для хранения, обработки и анализа больших объемов данных.
Архитектор данных: разрабатывает и реализует стратегию данных, а также планирует и внедряет сквозную архитектуру данных. Управляет системами баз данных.
Инженер по машинному обучению. Разработчик и создатель моделей машинного обучения, которые можно использовать для прогнозирования или обоснованных решений.
Это лишь некоторые из многих ролей в экосистеме науки о данных. Итак, если вы любите работать с данными, у вас есть широкий выбор профилей работы.
Потенциальная заработная плата и возможности роста в области науки о данных
Если вы хотите произвести фурор на рынке труда и взять под контроль свое финансовое будущее, вам стоит подумать о карьере в области науки о данных.
Послушайте, потому что это действительно хорошие новости: специалисты по данным пользуются большим спросом, и в результате они получают впечатляющие зарплаты.
Востребованная работа, как правило, хорошо оплачивается; медианная зарплата опытного специалиста по данным в Калифорнии приближается к 200 000 долларов США.³
Но дело не только в деньгах, о нет! Спрос на навыки работы с данными только растет, растет, растет. Это означает, что у вас, опытных людей, есть огромный потенциал для долгосрочного карьерного роста и продвижения по службе.
Итак, если у вас есть нужные навыки и опыт, карьера в области науки о данных — это путь не только к высокой зарплате, но и к полноценному и полезному будущему.
Мой путь к изучению науки о данных
Мой фон
Позвольте мне поделиться своей историей о том, как я отправился в это увлекательное путешествие. Я хорошо разбираюсь в математике и статистике и получил степень доктора философии. по математике некоторое время назад (точное время я сохраню в тайне, чтобы не раскрывать свою старость). У меня есть базовые знания в области компьютерного программирования и некоторый опыт работы с C++, Python и несколькими специализированными математическими языками. Поскольку Python — любимый язык дата-сайентистов, я решил для начала копнуть глубже и взял несколько книг о машинном обучении с помощью Python⁴.
После недели или двух экспериментов с scikit-learn и NLTK, но не имея представления о том, что я делаю, я понял, что это неструктурированный подход, и мне нужна лучшая основа и путь, по которому нужно следовать. Я знал, что Coursera — это вещь. Поэтому я зашел на YouTube и поискал лучшие курсы по машинному обучению на Coursera. Я нашел отличный (не аффилированный, без комиссии для меня), который дает надежный путь к величию (по крайней мере, я на это надеюсь).
Короче говоря, сейчас я пойду по этому пути:
- Сертификат IBM Data Science Professional
- Специализация машинного обучения, Эндрю Нг
- Специализация глубокого обучения от Эндрю Нг
- Практическая наука о данных на AWS
Я начал получать сертификат IBM Data Science Professional примерно две недели назад и пока не могу сказать слишком много. В качестве основы для десяти, вот некоторые основы:
- Местоположение: Coursera
- Обязательство по времени: 5 месяцев при обучении по 4 часа в неделю. По моему опыту, это займет гораздо меньше времени, чем это.
- Стоимость: курс бесплатный, но поскольку мне нужен сертификат, я плачу 39 долларов в месяц.
Сертификат состоит из следующих 10 курсов. Если вам это интересно, читайте подробнее здесь.
- Что такое наука о данных?
- Инструменты для науки о данных
- Методология науки о данных
- Python для науки о данных, искусственного интеллекта и разработки
- Проект Python для науки о данных
- Базы данных и SQL для науки о данных с Python
- Анализ данных с помощью Python
- Визуализация данных с помощью Python
- Машинное обучение с Python
- Краеугольный камень прикладной науки о данных
Я пока не могу сказать ничего определенного, так как учусь всего три недели. Однако, исходя из моего первого выражения, сочетание книг и онлайн-курсов оказывается выигрышной формулой. Я могу получить твердое представление о науке о данных и встать на путь становления квалифицированным специалистом по данным.
Итак, берите свои книги по Python и записывайтесь на курс Coursera (опять же, здесь нет членства или комиссий!), и давайте вместе покорять мир науки о данных!
Что дальше
Продолжая свой путь к величию науки о данных, я решил задокументировать свой прогресс и поделиться своими размышлениями со всем миром. Я планирую написать серию статей здесь, на Medium, в которых подробно расскажу о взлетах и падениях своего путешествия. Я буду подробно описывать то, что я узнал, какие препятствия я преодолел, и мой практический опыт работы с реальными данными.
В следующей статье этой серии будет подробно рассказано о сертификате IBM Data Science Professional Certificate. Народ, скрестим пальцы, что у меня получилось. Иначе статьи не будет.
Я стремлюсь предоставить дорожную карту для тех, кто только начинает заниматься наукой о данных или хочет усовершенствовать свои навыки. Итак, если вы хотите следить за моим прогрессом, дайте мне подписаться на Twitter или подпишитесь на мой список адресов электронной почты и следите за моими последними статьями и обновлениями.
Рекомендации
- Питер Наур предложил его как альтернативное название информатики.
- Давенпорт, Томас (1 октября 2012 г.). «Data Scientist: самая сексуальная профессия 21 века». Гарвардский бизнес-обзор.
- Давенпорт, Томас; Патил, ди-джей (15 июля 2022 г.). Является ли Data Scientist самой сексуальной профессией 21 века?. Гарвардский бизнес-обзор.
- Юси Лю, Машинное обучение на Python на примере: самый простой способ освоить машинное обучение
Орельен Герон, Практическое машинное обучение с помощью Scikit–Learn и TensorFlow