Публикации по теме 'data-analytics'
Логистическая регрессия объяснила часть 1
Объяснение логистической регрессии
Введение
Что такое логистическая регрессия?
Логистическая регрессия – это тип статистического анализа , который используется для предсказания вероятности наступления события на основе одной или нескольких входных переменных. Это как калькулятор, который может помочь нам определить вероятность того, что что-то произойдет при определенных условиях.
Например, предположим, что мы хотим предсказать, сдаст ли учащийся тест, основываясь на..
В чем вопрос? Лучший способ распаковать набор инструментов для обработки и анализа данных
Мы часто делим работу с данными на прогнозный и предписывающий анализ. В то время как «прогнозная» категория в основном состоит из методов машинного обучения, существует широкий спектр методов в «предписывающем» наборе инструментов и в науке о данных в целом.
"В чем вопрос?" (Наука, том 347) намного лучше раскрывает набор инструментов для обработки и анализа данных. Авторы описывают шесть типов анализа: описательный, исследовательский, выводной, предсказательный, причинный и..
Изучение метода кластеризации KMeans для анализа данных
В последние годы в области анализа данных наблюдается экспоненциальный рост. С появлением больших данных и машинного обучения предприятия и исследователи изучают новые способы извлечения информации из огромных объемов данных. Одним из таких методов является метод кластеризации KMeans, мощный алгоритм обучения без учителя , используемый для кластеризации данных.
Анализ прогноза сердечных заболеваний с помощью Orange GUI Tool
Цель:
Цель состоит в том, чтобы проанализировать набор данных для прогнозирования сердечных заболеваний, изучить основные взаимосвязи между переменными и разработать модель для определения характеристик, которые играют важную роль в прогнозировании того, страдает ли человек сердечным заболеванием.
Набор данных:
Используемый набор данных представляет собой выдержку из Heart Disease UCI от Kaggle.
Обзор набора данных:
Возможности:
возраст (в годах) пол..
Почему мультиколлинеарность является проблемой?
Что такое мультиколлинеарность? и почему мы должны позаботиться о мультиколлинеарности, прежде чем создавать модель машинного обучения
Разберемся, что такое мультиколлинеарность. Почему мультиколлинеарность является проблемой? и как справиться с мультиколлинеарностью в этом блоге.
Что такое мультиколлинеарность?
Мультиколлинеарность — это сценарий, в котором две независимые переменные сильно коррелированы . Итак, теперь вопрос в том, что такое корреляция ? Корреляция — это..
Интересные вопросы, которые вам нужно задать в проекте по науке о данных
Знаете ли вы, что наука о данных — это задавать вопросы? Да, в любом проекте, за который вы беретесь, успех зависит от вопроса, который вы задаете. Только в этом случае рабочими данными является допрашиваемая сторона, ну а она должна давать ответы следственной группе.
"Наука о данных — это задавание интересных вопросов на основе данных, которые у вас есть, а часто и данных, которых у вас нет".
~ Сара Джарвис, директор по прикладному машинному обучению и науке о данных в Secondmind..