Дерево решений - это своего рода алгоритм, который строится, начиная с первоначального решения и продвигаясь вперед с вариантами выбора, чтобы найти точный ответ на вопрос, как данные зависят от другой переменной.
Это поможет вам найти наилучший результат в зависимости от различных условий.
Я могу попытаться объяснить вам это на примере демографических данных и типа программы, которую смотрел человек на Netflix.
Я беру здесь небольшой пример, хотя извлечение данных решений в реальной жизни будет более сложным, чем этот.
Теперь в приведенных выше данных давайте сначала нацелимся на "возраст", и мы увидим, что все люди младше 20 лет любят смотреть "Во все тяжкие".
Из остальных данных, если мы выберем «пол» как независимую переменную, мы ясно увидим, что мужчины в возрастной группе старше 20 лет хотели бы видеть «побег из тюрьмы», а женщины хотели бы видеть «безумцев».
Все эти данные могут быть представлены в виде дерева решений очень просто, как показано ниже:
Надеюсь, что применение дерева решений ясно из приведенного выше примера. Теперь на его основе Netflix может рекомендовать людям шоу.
Спасибо за прочтение!
Первоначально опубликовано на https://www.numpyninja.com 15 сентября 2020 г.