Наука о данных — это быстрорастущая область с растущим спросом на профессионалов с нужными навыками и знаниями. Создание сильного портфолио проектов — это один из способов продемонстрировать свой опыт и выделиться среди других соискателей. В этой статье мы рассмотрим 5 лучших портфолио проектов для науки о данных, а также их исходный код и ссылки.

  1. Прогнозирование сердечных заболеваний с помощью машинного обучения Этот проект включает в себя прогнозирование наличия сердечных заболеваний у пациентов с использованием модели машинного обучения. Набор данных, используемый для этого проекта, представляет собой набор данных Cleveland Clinic Foundation по сердечным заболеваниям, который включает 14 атрибутов, таких как возраст, пол, артериальное давление, уровень холестерина и другие. Проект включает в себя исследование данных, разработку функций, выбор модели и оценку. Исходный код проекта и набор данных можно найти на GitHub:

https://github.com/musfiqur-joy/heart-disease-prediction.

2. Система рекомендаций фильмов Этот проект включает в себя создание системы рекомендаций фильмов с использованием методов совместной фильтрации. Набор данных, используемый для этого проекта, — это набор данных MovieLens, который включает информацию о рейтингах фильмов, жанрах и тегах. Проект включает в себя предварительную обработку данных, построение системы рекомендаций и оценку производительности системы. Исходный код проекта и набор данных можно найти на GitHub:

https://github.com/mohit-sh/Data-Science-Projects/tree/master/Movie-Recommendation-System.

3. Анализ настроений в обзорах фильмов Этот проект включает в себя анализ настроений в обзорах фильмов с использованием методов обработки естественного языка. Набор данных, используемый для этого проекта, представляет собой набор данных обзоров фильмов IMDb, который включает 50 000 обзоров фильмов, помеченных как положительные или отрицательные. Проект включает в себя предварительную обработку данных, извлечение признаков, обучение модели и оценку. Исходный код проекта и набор данных можно найти на GitHub:

https://github.com/cjhutto/vaderSentiment.

4. Обнаружение мошенничества с кредитными картами Этот проект включает в себя обнаружение мошеннических транзакций по кредитным картам с использованием методов машинного обучения. Набор данных, используемый для этого проекта, представляет собой набор данных обнаружения мошенничества с кредитными картами, который включает транзакции, совершенные держателями кредитных карт в сентябре 2013 года. Проект включает в себя предварительную обработку данных, разработку функций, обучение модели и оценку. Исходный код проекта и набор данных можно найти на GitHub:

https://github.com/shreyagopal/Credit-Card-Fraud-Detection.

5. Классификация изображений с использованием глубокого обучения. Этот проект включает в себя создание модели классификации изображений с использованием методов глубокого обучения. Набор данных, используемый для этого проекта, представляет собой набор данных CIFAR-10, который включает 60 000 цветных изображений 32x32 в 10 классах. Проект включает в себя предварительную обработку данных, выбор модели и оценку. Исходный код проекта и набор данных можно найти на GitHub:

https://github.com/floydhub/cifar10-fast.

В заключение, создание сильного портфолио проектов необходимо для всех, кто хочет продолжить карьеру в области науки о данных. Эти 5 лучших портфолио проектов по науке о данных помогут продемонстрировать ваши навыки и знания потенциальным работодателям. Предоставляя исходный код и ссылки, мы надеемся облегчить вам начало работы над этими проектами и продвижение вашей карьеры в науке о данных.