Один из наиболее распространенных методов исследования данных - построение гистограммы. Мы рассмотрим, как создать его в Pandas с минимальными требованиями.

Подготовка данных

Сначала установите Pandas и Matplotlib, если вы еще этого не сделали. Matplotlib будет использоваться для создания диаграммы и сохранения ее в файл.

Сначала давайте прочитаем данные из файла Excel в фреймворк Pandas:

import pandas as pd

df = pd.read_excel('meanZscores.xlsx')

При необходимости сначала отфильтруйте ненужные столбцы из набора данных.

Создание гистограммы

Создать гистограмму в Pandas так же просто, как написать:

res = df.plot.hist(bins=20)

Количество столбцов (ячеек) по умолчанию - 10.

Сохранение файла

Теперь нам нужно сохранить изображение в файл. Это тоже легко, просто запустите этот код:

fig = res.get_figure()
fig.savefig('hist.png')

Вот и все

Легко, не правда ли?

Дополнительную информацию можно найти в документации Pandas.

Больше контента на plainenglish.io