Это продолжение моего предыдущего поста о прогнозе экономии топлива.

Выбор функций для прогнозирования выбросов CO2

наша цель состояла в том, чтобы использовать свойства/особенности автомобиля для прогнозирования выбросов CO2. Мы выбрали числовые переменные с лучшей корреляцией и категориальные переменные.

Характеристики: цилиндры, рабочий объем, привод, тип топлива, марка, модель, год выпуска, коробка передач, VClass, co2TailpipeGpm.

Документацию по данным можно найти здесь.

Изучение числовых признаков

Из приведенных выше диаграмм видно, что displ (объем двигателя в литрах) имеет сильную положительную корреляцию с Co2TailpipeGpm.

цилиндры также показывают сильную корреляцию с co2TailpipeGpm.

Изучение категорийных данных

Мы исследовали категориальную переменную, агрегируя по среднему показателю co2TailpipeCpm для каждой категории.

Эмиссия по производителям

2 гистограммы показывают марки автомобилей с наибольшим средним выбросом CO2 в выхлопной трубе и с наименьшим средним выбросом CO2 в выхлопной трубе.

Выбросы CO2 из выхлопных труб транспортным средством

На 2 гистограммах показаны автомобили с наибольшим выбросом CO2TailPipe и с наименьшим выбросом CO2 соответственно.

Выбросы CO2 из выхлопной трубы на типе топлива

Моделирование данных

Мы использовали 70% данных для обучения и 30% для проверки. Кроме того, мы разделили данные по типу топлива, чтобы обеспечить сохранение распределения в данных поезда и проверки.

Мы обучаем данные с использованием 4 алгоритмов: RandomForest, K-Nearest Neighbor, Decision Tree, Artificial Neural Network, Extratree Regressor.

Мы использовали показатель оценки R² для оценки моделей, а также использовали перекрестную проверку Gridsearch для точной настройки гиперпараметров для каждой модели.

Дерево решений

K-ближайший сосед

Случайный лес

Регрессор ExtraTree

Искусственная нейронная сеть

Регрессор Extratree с оценкой R² 100% для данных поезда и 99% для тестовых данных является лучшим алгоритмом для нашей модели.

Важность функции

Эта гистограмма показывает функции и их важность для модели.

Заключение

В рамках этого проекта мы (я и Осуагву Олучи) открыли захватывающую область выбросов CO2 и экономии топлива в транспортных средствах. Наш анализ определил автомобили с самой высокой экономией топлива и выбросами CO2, проливая свет на решающие факторы, способствующие этим экстремальным значениям. Понимая эти факторы, мы можем работать над разработкой более устойчивых транспортных решений, которые способствуют топливной экономичности, сокращению выбросов CO2 и прокладывают путь к более экологичному будущему.

По мере того, как мы продолжаем исследовать и использовать возможности машинного обучения, у нас есть потенциал революционизировать автомобильную промышленность и добиться положительных изменений в наших усилиях по борьбе с изменением климата. Ставя во главу угла топливную экономичность и сокращая выбросы CO2, мы можем создать более устойчивый и экологически безопасный транспорт для будущих поколений.