Дерево решений - это своего рода алгоритм, который строится, начиная с первоначального решения и продвигаясь вперед с вариантами выбора, чтобы найти точный ответ на вопрос, как данные зависят от другой переменной.

Это поможет вам найти наилучший результат в зависимости от различных условий.

Я могу попытаться объяснить вам это на примере демографических данных и типа программы, которую смотрел человек на Netflix.

Я беру здесь небольшой пример, хотя извлечение данных решений в реальной жизни будет более сложным, чем этот.

Теперь в приведенных выше данных давайте сначала нацелимся на "возраст", и мы увидим, что все люди младше 20 лет любят смотреть "Во все тяжкие".

Из остальных данных, если мы выберем «пол» как независимую переменную, мы ясно увидим, что мужчины в возрастной группе старше 20 лет хотели бы видеть «побег из тюрьмы», а женщины хотели бы видеть «безумцев».

Все эти данные могут быть представлены в виде дерева решений очень просто, как показано ниже:

Надеюсь, что применение дерева решений ясно из приведенного выше примера. Теперь на его основе Netflix может рекомендовать людям шоу.

Спасибо за прочтение!

Первоначально опубликовано на https://www.numpyninja.com 15 сентября 2020 г.