Машинное обучение — это мощный инструмент, который можно использовать для решения широкого круга задач. Тем не менее, многие люди не знают, с чего начать, когда дело доходит до изучения этого навыка.
В этом посте я представлю пять проектов, которые вы можете использовать, чтобы начать свое путешествие в мир машинного обучения.
- Титаник: машинное обучение после катастрофы
Этот проект идеально подходит для начинающих, которые хотят начать работу с алгоритмами классификации.
Набор данных Titanic широко используется в сообществе машинного обучения и предоставляет прекрасную возможность узнать о разработке функций и алгоритмах дерева решений.
Вы можете найти набор данных на Kaggle по адресу https://kaggle.com/c/titanic.
2. Качество вина
Набор данных Wine Quality — еще одна классическая проблема, которую можно использовать для изучения алгоритмов как регрессии, так и классификации.
Этот проект — отличный способ закрепить то, что вы уже узнали, и отточить свои навыки в разработке функций и выборе моделей.
Вы можете найти набор данных на Kaggle по адресу https://kaggle.com/rajyellow46/wine-quality.
3. Цены на жилье
Теперь, когда вы понимаете проблемы классификации, пришло время заняться регрессией.
Набор данных House Prices предоставляет прекрасную возможность узнать о передовых методах регрессии, разработке функций и выборе модели.
Вы можете найти набор данных на Kaggle по адресу https://kaggle.com/c/house-prices-advanced-regression-techniques.
4. Данные о сегментации клиентов торгового центра
Неконтролируемое обучение — важная область машинного обучения, а набор данных «Сегментация клиентов торгового центра» — отличный способ начать работу.
С помощью этого набора данных вы узнаете, как сегментировать клиентов на основе их покупательских привычек и характеристик. Это отличный способ открыть для себя новые идеи и нацелить свои маркетинговые усилия.
Вы можете найти набор данных на Kaggle по адресу https://kaggle.com/vjchoudhary7/customer-segmentation-tutorial-in-python.
5. Вызов Walmart
Анализ временных рядов — еще одна большая область, охватываемая машинным обучением, и набор данных Walmart — отличный способ начать работу.
С помощью этого набора данных вы научитесь прогнозировать будущие продажи на основе исторических данных и поймете влияние различных факторов на продажи. Это отличный способ получить представление и улучшить свои навыки прогнозирования.
Вы можете найти набор данных на Kaggle по адресу https://kaggle.com/blechley/course-material-walmart-challenge.
Эти проекты — отличная отправная точка для всех, кто интересуется машинным обучением. Они обеспечивают прочную основу для понимания различных методов и алгоритмов, используемых в этой области. Работая над этими проектами, вы получите знания и навыки, необходимые для решения более сложных задач и перехода на новый уровень машинного обучения.
Вы можете подписаться на меня, чтобы узнать больше о машинном обучении, искусственном интеллекте и науке о данных. Вместе мы можем учиться и расти в этой захватывающей области.