Публикации по теме 'clustering'
Сходства в машинном обучении - пример динамического искажения времени
В машинном обучении мы можем реализовать кластеризацию. Кластеризация - это способ группировать похожие элементы.
Для этого нам нужно сравнить предметы между собой.
Различные типы данных для сравнения
Например, чтобы сравнить 2 цены (100 и 200), мы можем провести вычитание. 200 - 100 = 100.
Расстояние между двумя ценами - 100.
Вычисление расстояния может быть менее тривиальным.
Предположим, у нас есть данные о бриллиантах. У нас есть их цены, день для каждой цены и бренд,..
Полное руководство по кластеризации методом K-средних: Часть 2. Программирование с нуля
В этом выпуске серии из 3 частей мы шаг за шагом рассмотрим все, что вам нужно знать, чтобы понять кластеризацию K-средних:
Часть 1: Основы
Основы: понимание кластеризации, евклидовых расстояний и т. д. Интуиция: визуальное пошаговое руководство по K-средним в действии
Часть 2: Кодирование алгоритма с нуля
Алгоритм: формальный обзор Реализация кода: реализация Python с нуля
Часть 3: Реальная реализация
Вывод: использование K-Means от scikit для сжатия изображений
Не..
Модели гауссовой смеси (GMM) Кластеризация в Python
Смешанная модель Гаусса ( GMM ) — это вероятностная модель , используемая для кластеризации, оценки плотности и уменьшения размерности. Это мощный алгоритм для обнаружения основных закономерностей в наборе данных. В этом руководстве мы узнаем, как реализовать кластеризацию GMM в Python с помощью библиотеки scikit-learn.
Шаг 1: Импорт библиотек
Анализ изменений между кластерами
Анализ изменений в наборе пространственно-временных данных
Кластеризация данных в неконтролируемом обучении — это немного нечеткие вещи для ИИ из-за его неконтролируемой природы. Мы не знаем, является ли результат кластеризации лучшим, или нам нужно дополнительно настроить параметры. Однако мы всегда пытаемся добиться наилучшего результата, используя эвристику или другие средства. Сегодня я собираюсь написать о том, как я обнаруживаю изменения в пространственно-временных набор данных...
Обзор BIRCH: сбалансированное итеративное сокращение и кластеризация с использованием иерархий
Введение:
Кластеризация — это процесс организации данных в классы или кластеры таким образом, чтобы объекты внутри кластера были очень похожи друг на друга, но существенно отличались от объектов в других кластерах. Иерархический метод и метод разделения — это два основных типа методов кластеризации. При иерархической кластеризации объекты данных группируются в кластеры, которые затем группируются в более крупные кластеры и т. д., создавая иерархию кластеров.
Регулировка невозможна при..
Сегментация клиентов с использованием KNN с RFM-анализом
Всем привет! Давайте попробуем применить кластеризацию K-средних , которая является одним из алгоритмов машинного обучения, для сегментации клиентов в наборе данных онлайн-торговли. Мы узнаем характеристики каждой сегментации клиентов с помощью RFM-анализа. Прежде чем перейти к анализу, давайте посмотрим, почему важно сегментировать клиентов .
Справочная информация: почему важна сегментация клиентов?
Сегментация клиентов описывает процесс выявления групп или сегментов клиентов..