Позвольте мне рассказать вам, почему эти книги должны быть в вашем списке.

Вы знаете, когда вы читаете хорошую книгу. Вы не можете оторваться от него и должны продолжать читать его страницу за страницей. Это похоже на запойное чтение, точно так же, как мы запоем смотрим сериалы на Netflix.

Когда я начал изучать науку о данных, я был просто поражен количеством книг, которые смог найти. Между посещением курсов, практикой над проектами и соревнованиями на Kaggle… как вы могли найти достаточно времени, чтобы закончить книгу? Единственный ответ — выбирать книги, которые вы не можете перестать читать.

Вот 3 книги, которые я буквально запоем прочитал за последние недели.

Интерпретируемое машинное обучение: руководство по созданию объяснимых моделей черного ящика Кристоф Молнар

Невероятно, но факт: вы можете прочитать бесплатную html-версию книги на GitHub автора. Вы также можете купить его здесь.

Вы можете прочитать его, независимо от того, являетесь ли вы новичком или более продвинутым специалистом по данным. Кристоф Молнар даже рекомендует вам выбрать любую главу, которую вы хотите прочитать, и не обязательно следовать порядку глав.

Содержание. Эта книга содержит подробное, но доступное объяснение современного состояния интерпретируемости машинного обучения. Интерпретируемый здесь означает, что он может быть понят людьми.

Книга служит хорошим введением. Эта книга с техническими терминами и советами помогает быть в курсе последних событий в этой области. Автор предоставляет критический обзор моделей машинного обучения (линейная регрессия, деревья решений…), а также методов, не зависящих от модели, раскрывая их сильные и слабые стороны.

Вы не ошибетесь с этой книгой.

Бонус: начинается с 3 рассказов-антиутопий в стиле «Черного зеркала». Страшный.

«Эффективные панды» Мэтта Харрисона

Содержание. Это моя любимая книга по работе с данными с помощью Pandas. Автор сосредоточился на всех лучших практиках, которые сделают вас джедаем Панд. Мы много думали о том, как разбить тему, чтобы она была очень хорошо организована. От работы с сериями до построения графиков с помощью Pandas или отладки.

Одной из особенностей этой книги является то, что она хорошо объясняет метод цепочек для написания кода. Он представляет полезные методы Pandas, такие как pipe или assigns, которые не часто встречаются в курсах.

Если вы изучаете Pandas или являетесь опытным пользователем Pandas, вам наверняка будет полезно прочитать эту книгу.

Бонус: в конце каждой главы вы найдете упражнения, которые заставят вас сразу же практиковать только что прочитанные концепции. Мой личный совет: делайте их!

Предиктивная аналитика: способность предсказывать, кто нажмет, купит, солжет или умрет, Эрик Сигел

Содержание. Это нетехническая книга, которая представляет собой отличное введение в прогнозную аналитику. Я бы посоветовал эту книгу, если вы хотите узнать больше о применении PA и понять его возможности.

Автор показывает, откуда взялось поле, кто основные игроки и как оно используется в различных секторах и отраслях.

Предиктивная аналитика часто воспринимается как некое мистическое или магическое искусство, являющееся одновременно и панацеей, и проклятием. Автор разбивает концепции таким образом, чтобы облегчить их понимание учеными, не занимающимися данными.

Бонус: автор приводит много реальных примеров с использованием предиктивной аналитики, в том числе и самого себя. Они легко читаются и позволяют представить, каким может быть будущее (или уже есть…).

Дайте мне знать, читали ли вы эти книги и нравятся ли они вам или нет. Надеюсь, вам они понравятся так же, как и мне.

Спасибо, что читаете меня! Нажмите кнопку Подписаться, если хотите читать мои будущие посты. Предыдущие можно найти здесь.

Вы также можете найти меня в LinkedIn.

Дополнительные материалы на PlainEnglish.io. Подпишитесь на нашу бесплатную еженедельную рассылку новостей. Подпишитесь на нас в Twitter и LinkedIn. Посетите наш Community Discord и присоединитесь к нашему Коллективу талантов.