Один из наиболее распространенных методов исследования данных - построение гистограммы. Мы рассмотрим, как создать его в Pandas с минимальными требованиями.
Подготовка данных
Сначала установите Pandas и Matplotlib, если вы еще этого не сделали. Matplotlib будет использоваться для создания диаграммы и сохранения ее в файл.
Сначала давайте прочитаем данные из файла Excel в фреймворк Pandas:
import pandas as pd df = pd.read_excel('meanZscores.xlsx')
При необходимости сначала отфильтруйте ненужные столбцы из набора данных.
Создание гистограммы
Создать гистограмму в Pandas так же просто, как написать:
res = df.plot.hist(bins=20)
Количество столбцов (ячеек) по умолчанию - 10.
Сохранение файла
Теперь нам нужно сохранить изображение в файл. Это тоже легко, просто запустите этот код:
fig = res.get_figure() fig.savefig('hist.png')
Вот и все
Легко, не правда ли?
Дополнительную информацию можно найти в документации Pandas.
Больше контента на plainenglish.io