Публикации по теме 'statistics'


Интуитивные микро- и макроварианты показателей машинного обучения
Интуитивные микро- и макроварианты показателей машинного обучения Введение Демонстрация четкого понимания микро- и макроэкономических показателей выделит вас как человека, который может извлекать надежные и действенные уроки из данных. Освоение интуиции, лежащей в основе микро- и макростатистических измерений, необходимо для получения более точной информации из ваших экспериментов и их воздействия. Среднее значение Почему необходимо различать микро- и макроварианты метрик?..

Точность, точность, отзыв, оценка F1 — Столкновение показателей оценки!
Интуиция, стоящая за метриками оценки классификации Проблема Представьте, что вы создаете модель обнаружения мошенничества для выявления мошеннических транзакций, совершенных с использованием кредитной карты. Вы просматриваете данные и обнаруживаете, что большинство транзакций не являются мошенническими (99%), и только 1% транзакций являются мошенническими. Вы просто отметили каждую транзакцию как немошенническую и получили точность 99 %, ВАУ! Но, если вы пойдете к клиенту..

Центральная тенденция с использованием Python
Среднее арифметическое, гармоническое и геометрическое, медиана, мода и ожидаемое значение случайной величины Центральная тенденция - это отдельное значение, которое представляет собой центр распределения данных. Это очень важно и является краеугольным камнем многих статистических моделей и теорий, таких как проверка гипотез, доверительные интервалы, алгоритм кластеризации k-mean, нормальное и другие распределения данных и т. д. Наиболее распространенными мерами центральной тенденции..

Варианты использования коэффициента корреляции Пирсона, часть 3 (машинное обучение + статистика)
Коэффициент корреляции Пирсона как мера для сертификации и количественной оценки многомерной запутанности (arXiv) Автор: С. Джебаратинам , Дом Дипанкар , Урбаси Синха Аннотация: Недавно была предложена схема для характеристики запутанности с использованием статистической меры корреляции, определяемой коэффициентом корреляции Пирсона (PCC), которая осталась неисследованной за пределами случая кубита. На пути к применению этой схемы для многомерных состояний ключевой шаг был сделан..

Вопросы для интервью по науке о данных Недавно мне и моим друзьям задавали вопросы (IV)
Наука о данных действительно очень большая и разнообразная область. Поэтому трудно быть мастером по всем предметам. В этом и нескольких следующих постах я хочу поделиться несколькими вопросами, которые мне и моим друзьям задавали в 2021 году. Если вам интересна эта тема, вы также можете найти другие статьи ниже: Вопросы для интервью по науке о данных Недавно мне и моим друзьям задавали вопросы (I) Наука о данных — действительно очень большая и..

Эффект Фраппучино: корреляция не указывает на причинно-следственную связь
Эффект Фраппучино — интригующее явление, которое подчеркивает опасность вывода причинно-следственной связи из корреляции без учета лежащих в ее основе факторов. Придуманный как сатирический термин, он относится к наблюдению, что по мере увеличения продаж фраппучино в Starbucks увеличивается и количество случаев утопления в плавательных бассейнах. Хотя между ними может быть положительная корреляция, было бы ошибочно утверждать, что фраппучино вызывает утопление. Настоящим..

Парный t-тест для оценки классификаторов машинного обучения с использованием Python
Парный t-тест для оценки классификаторов машинного обучения с использованием Python Узнайте, как сравнивать классификаторы с помощью проверки гипотез Введение В своей последней статье я говорил о важности правильного сравнения различных моделей с использованием статистических инструментов, чтобы выбрать лучшую модель на этапе выбора. В этой статье я хочу сосредоточиться на одном статистическом тесте, который вам, как специалисту по данным или инженеру по машинному обучению,..