Публикации по теме 'clustering'


Сходства в машинном обучении - пример динамического искажения времени
В машинном обучении мы можем реализовать кластеризацию. Кластеризация - это способ группировать похожие элементы. Для этого нам нужно сравнить предметы между собой. Различные типы данных для сравнения Например, чтобы сравнить 2 цены (100 и 200), мы можем провести вычитание. 200 - 100 = 100. Расстояние между двумя ценами - 100. Вычисление расстояния может быть менее тривиальным. Предположим, у нас есть данные о бриллиантах. У нас есть их цены, день для каждой цены и бренд,..

Полное руководство по кластеризации методом K-средних: Часть 2. Программирование с нуля
В этом выпуске серии из 3 частей мы шаг за шагом рассмотрим все, что вам нужно знать, чтобы понять кластеризацию K-средних: Часть 1: Основы Основы: понимание кластеризации, евклидовых расстояний и т. д. Интуиция: визуальное пошаговое руководство по K-средним в действии Часть 2: Кодирование алгоритма с нуля Алгоритм: формальный обзор Реализация кода: реализация Python с нуля Часть 3: Реальная реализация Вывод: использование K-Means от scikit для сжатия изображений Не..

Модели гауссовой смеси (GMM) Кластеризация в Python
Смешанная модель Гаусса ( GMM ) — это вероятностная модель , используемая для кластеризации, оценки плотности и уменьшения размерности. Это мощный алгоритм для обнаружения основных закономерностей в наборе данных. В этом руководстве мы узнаем, как реализовать кластеризацию GMM в Python с помощью библиотеки scikit-learn. Шаг 1: Импорт библиотек

Анализ изменений между кластерами
Анализ изменений в наборе пространственно-временных данных Кластеризация данных в неконтролируемом обучении — это немного нечеткие вещи для ИИ из-за его неконтролируемой природы. Мы не знаем, является ли результат кластеризации лучшим, или нам нужно дополнительно настроить параметры. Однако мы всегда пытаемся добиться наилучшего результата, используя эвристику или другие средства. Сегодня я собираюсь написать о том, как я обнаруживаю изменения в пространственно-временных набор данных...

Обзор BIRCH: сбалансированное итеративное сокращение и кластеризация с использованием иерархий
Введение: Кластеризация — это процесс организации данных в классы или кластеры таким образом, чтобы объекты внутри кластера были очень похожи друг на друга, но существенно отличались от объектов в других кластерах. Иерархический метод и метод разделения — это два основных типа методов кластеризации. При иерархической кластеризации объекты данных группируются в кластеры, которые затем группируются в более крупные кластеры и т. д., создавая иерархию кластеров. Регулировка невозможна при..

Сегментация клиентов с использованием KNN с RFM-анализом
Всем привет! Давайте попробуем применить кластеризацию K-средних , которая является одним из алгоритмов машинного обучения, для сегментации клиентов в наборе данных онлайн-торговли. Мы узнаем характеристики каждой сегментации клиентов с помощью RFM-анализа. Прежде чем перейти к анализу, давайте посмотрим, почему важно сегментировать клиентов . Справочная информация: почему важна сегментация клиентов? Сегментация клиентов описывает процесс выявления групп или сегментов клиентов..