Публикации по теме 'data-analytics'


Логистическая регрессия объяснила часть 1
Объяснение логистической регрессии Введение Что такое логистическая регрессия? Логистическая регрессия  – это тип статистического анализа , который используется для предсказания вероятности наступления события на основе одной или нескольких входных переменных. Это как калькулятор, который может помочь нам определить вероятность того, что что-то произойдет при определенных условиях. Например, предположим, что мы хотим предсказать, сдаст ли учащийся тест, основываясь на..

В чем вопрос? Лучший способ распаковать набор инструментов для обработки и анализа данных
Мы часто делим работу с данными на прогнозный и предписывающий анализ. В то время как «прогнозная» категория в основном состоит из методов машинного обучения, существует широкий спектр методов в «предписывающем» наборе инструментов и в науке о данных в целом. "В чем вопрос?" (Наука, том 347) намного лучше раскрывает набор инструментов для обработки и анализа данных. Авторы описывают шесть типов анализа: описательный, исследовательский, выводной, предсказательный, причинный и..

Изучение метода кластеризации KMeans для анализа данных
В последние годы в области анализа данных наблюдается экспоненциальный рост. С появлением больших данных и машинного обучения предприятия и исследователи изучают новые способы извлечения информации из огромных объемов данных. Одним из таких методов является метод кластеризации KMeans, мощный алгоритм обучения без учителя , используемый для кластеризации данных.

Анализ прогноза сердечных заболеваний с помощью Orange GUI Tool
Цель: Цель состоит в том, чтобы проанализировать набор данных для прогнозирования сердечных заболеваний, изучить основные взаимосвязи между переменными и разработать модель для определения характеристик, которые играют важную роль в прогнозировании того, страдает ли человек сердечным заболеванием. Набор данных: Используемый набор данных представляет собой выдержку из Heart Disease UCI от Kaggle. Обзор набора данных: Возможности: возраст (в годах) пол..

Почему мультиколлинеарность является проблемой?
Что такое мультиколлинеарность? и почему мы должны позаботиться о мультиколлинеарности, прежде чем создавать модель машинного обучения Разберемся, что такое мультиколлинеарность. Почему мультиколлинеарность является проблемой? и как справиться с мультиколлинеарностью в этом блоге. Что такое мультиколлинеарность? Мультиколлинеарность — это сценарий, в котором две независимые переменные сильно коррелированы . Итак, теперь вопрос в том, что такое корреляция ? Корреляция — это..

Интересные вопросы, которые вам нужно задать в проекте по науке о данных
Знаете ли вы, что наука о данных — это задавать вопросы? Да, в любом проекте, за который вы беретесь, успех зависит от вопроса, который вы задаете. Только в этом случае рабочими данными является допрашиваемая сторона, ну а она должна давать ответы следственной группе. "Наука о данных — это задавание интересных вопросов на основе данных, которые у вас есть, а часто и данных, которых у вас нет". ~ Сара Джарвис, директор по прикладному машинному обучению и науке о данных в Secondmind..