В этом учебном пособии по проекту машинного обучения по науке о данных мы собираемся создать сквозной проект машинного обучения, а затем развернуть его через Heroku.

Не стесняйтесь протестировать приложение здесь

ВСТУПИТЬ В ГРУППУ ТЕЛЕГРАМ

Я пишу эту статью, потому что с моей нынешней ролью менеджера по продуктам и консультанта по науке о данных для нескольких компаний я ежемесячно беру интервью почти у 25 специалистов по данным для моей компании и других компаний, которым я помогаю расти. В процессе собеседования я вижу кандидатов, которые действительно заинтересованы в работе в компании, но у них нет ничего, чтобы доказать свое желание или подтвердить свои навыки. Иногда мне больно отказываться от них, но я не могу завербовать кого-то, основываясь только на одном чувственном желании. Желание — это первое, что я ищу, но мне нужны доказательства, чтобы оправдать это желание. Поэтому я отдаю предпочтение тем, у кого есть портфолио.

Data Scientist — невероятная профессия. По крайней мере, хорошая карьера, чтобы пережить следующую смену карьеры. Вы согласитесь со мной, что получить работу в Data Science не так уж и просто, учитывая базовую зарплату в 120 000 долларов, этого достаточно, чтобы сделать вашу жизнь раем на земле.

Но как попасть в FRESHER?

Я покажу вам, как скоро. наберитесь терпения и продолжайте читать…

Давайте посмотрим на некоторые из описаний работы специалиста по обработке и анализу данных.

Это всего лишь два скриншота, которые я сделал на Glassdoor для описания работы Data Scientist. Вы можете просто выполнить поиск в Google и увидеть требование. Эти навыки не являются невозможными для достижения, но их нелегко получить одному человеку, если вы не добавите немного колдовства... лол. Вы можете строить его постепенно, но вы должны быть умными и строить его правильно, иначе на это у вас уйдут годы. Самое важное из всех – это основа. Если вы правильно разберетесь с основой, все остальное будет просто дополнением.

Мой совет: начните с курса, посвященного обучению и созданию комплексных проектов по науке о данных. Под сквозным я имею в виду от очистки данных до развертывания.

Прежде чем мы начнем, обратите внимание, что это руководство является частью Программы мастерства по работе с данными, которая представляет собой практическое практическое руководство для всех, кто хочет изучить данные. науки прямо с основ, чтобы продвигаться вперед, создавая проекты и большое портфолио Data Science. Не стесняйтесь проверить это.

Что вы можете сделать, так это создать портфолио Data Science. Возьмите формулировку проблемы и постройте ее от начала до конца. От очистки данных до развертывания. Не просто делайте это, запишите процесс, что поможет рекрутерам узнать, что входит в проект. Он также служит ссылкой на некоторые понятия, о которых вы можете забыть позже. Опубликуйте его, чтобы увеличить вашу видимость. Я нанял 4 Data Scientist на Medium просто потому, что увидел их статью о проекте, который они сделали, и я был убежден, что они могут быть находчивыми, если у них будет такая возможность, хотя я знаю, что они могли скопировать код или решение откуда-то еще. , но я также знаю, что они могут найти выход, если их немного подтолкнуть.

Если я хочу нанять Data Scientist, я хочу что-то увидеть. Не обязательно супергерой, но тот, кому есть что показать, да, я могу найти выход, если вы дадите мне задание, потому что я уже делал что-то связанное с этим раньше.

Позвольте мне сделать паузу и спросить вас. Как вы думаете, почему работодатели спрашивают об опыте работы?

Ответ прост: им нужны доказательства концепции.

Поэтому, если вы с нетерпением ждете начала своего пути в качестве Data Scientist, убедитесь, что у вас есть подтверждение концепции, подготовив свое портфолио Data Science.

Я просто покажу вам простой проект, за которым вы можете следовать другим проектам, в том числе очень интуитивным.

Здесь мы будем прогнозировать цены различных авиакомпаний в Индии.

Давайте сделаем это шаг за шагом

  1. Выберите вариант использования
  2. Подготовьте свой набор данных, создайте свою модель и выберите лучшую модель
  3. Создайте веб-приложение с помощью Flask
  4. Зафиксируйте свой код на Github
  5. Создайте свою учетную запись на Heroku
  6. Свяжите свою учетную запись Heroku со своей учетной записью Github
  7. Разверните и протестируйте свое приложение

Давайте начнем !!

В этом проекте по науке о данных мы в основном будем использовать Python для науки о данных. Если вы не знакомы с Python или хотите освежить свои навыки в Python, вы можете использовать это видео, где я объяснил все концепции, которые вам нужно знать о Python для Data Science.

Если вы здесь, я полагаю, вы знакомы с Python, и мы можем продолжить.

>>

Первый шаг, который мы собираемся сделать, это выбрать вариант использования. В этом сценарии мы будем прогнозировать цены различных авиакомпаний в Индии, как упоминалось ранее. Не стесняйтесь выбирать свой собственный вариант использования.

Прежде всего, давайте подготовим файлы. Вы можете скачать эти файлы и работать вместе со мной.

Необходимые инструменты:

  1. Блокнот Jupyter ИЛИ Google Colabs
  2. Pycharm (обязательно загрузите версию сообщества бесплатно) ИЛИ любую другую IDE по вашему выбору
  3. Колба
  4. Героку

Необходимые файлы:

  1. Подготовленный блокнот

Все Загрузки файлов

ВАЖНО!!!!!

Что касается концепций Flask и API, я объяснил в предыдущем видео о Zomato (агрегаторе индийских ресторанов и стартапе по доставке еды, основанном Deepinder Goyal и Pankaj Chaddah в 2008 году), которое вы, возможно, захотите посмотреть, прежде чем двигаться дальше.

Смотрите ВЕСЬ ПЛЕЙЛИСТ ЗДЕСЬ

==========

Надеюсь, вы посмотрели рекомендованные видео по предыдущему проекту и вам понравилось.

Хорошо, теперь, когда мы на одной странице, давайте продолжим…

Чтобы вы могли лучше понять и извлечь максимальную пользу из этого урока, я снял видео обо всем, что вам нужно знать, чтобы вы могли лучше следовать ему.

Смотрите ВЕСЬ ПЛЕЙЛИСТ ЗДЕСЬ

Если вы заинтересованы в правильном изучении науки о данных, я советую вам начать с этого курса, который фокусируется на обучении и создании комплексных проектов по науке о данных.

Я также буду публиковать больше БЕСПЛАТНЫХ проектов по науке о данных на канале Youtube, поэтому не забудьте подписаться и нажать на колокольчик, чтобы получать уведомления в любое время, когда я их публикую.