С исходным кодом















Бонус - Лучшие ресурсы по науке о данных и машинному обучению, организованные следующим образом:

  1. Лучшие курсы
  2. Лучшие каналы и блоги
  3. Лучшие методы науки о данных - 23 хака по науке о данных
  4. Вопросы на собеседовании по ML
  5. Лучшие подкасты
  6. Малоизвестные библиотеки Python для науки о данных
  7. Лучшие соревнования
  8. Полезные руководства / руководства по ноутбукам Ipython
  9. Лучшие наборы данных
  10. Проекты в области науки о данных и машинного обучения
  11. Новости и информационные бюллетени
  12. Инструменты и процессы
  13. Шпаргалки, советы и хитрости
  14. Бесплатные книги и полные руководства
  15. Ресурсы для глубокого обучения
  16. Бесплатные книги по информатике, машинному обучению, науке о данных, глубокому обучению

Курсы

Список базовых курсов:

Базовые курсы - Python и информатика

Базовый курс - Статистика

Базовый курс - SQL

Базовый курс - математика

Базовые курсы - Data Science

Базовый курс - Data Engineer

Базовый курс - ИИ для бизнес-менеджеров

Хотите учиться у Гарварда?



Базовый курс - Машинное обучение

Книги по машинному обучению (в статье ниже) -



Базовый курс - искусственный интеллект

Базовый курс - Jupyter



Список продвинутых курсов:

3. Лучшие каналы и блоги

Примечание. Я слежу за всеми

Каналы и видео Youtube:

Аккаунты Twitter:

Аккаунты Facebook:

Блоги:



4. Лучшие методы науки о данных - 23 метода анализа данных

Работа специалиста по данным - непростая задача, поэтому важно знать несколько хитростей в области науки о данных, которые могут сэкономить ваше драгоценное время и упростить вашу жизнь. В посте ниже я расскажу о 23 методах анализа данных, которые я использовал.



5. Вопросы на собеседовании по ML

Средняя заработная плата за машинное обучение, согласно исследованию Indeed, составляет примерно 146 085 долларов (поразительное увеличение на 344% с 2015 года). Это часть 1 из 3-х частей интервью по ML.



6. Лучшие подкасты:

7. Очистите табличные данные и малоизвестные библиотеки Python для науки о данных

Сбор данных - это процесс импорта информации с веб-сайта в электронную таблицу или локальный файл в вашей системе, и это один из наиболее эффективных способов получения данных из Интернета. Многие из вас должны быть знакомы с библиотекой Cheerio или Python с Beautiful Soup для очистки данных.

8. Лучшие соревнования:

9. Полезные учебники / руководства для ноутбуков Ipython:

10. Лучшие наборы данных:

11. Проекты в области науки о данных и машинного обучения.

  1. Анализ настроений в Twitter с использованием Python
  2. Обнаружение спама с помощью python
  3. Создание и развертывание веб-приложения для машинного обучения
  4. Прогнозирование продаж с использованием набора данных Walmart
  5. Проект ML для прогнозирования продаж BigMart - узнайте об алгоритмах неконтролируемого машинного обучения
  6. Обзоры продуктов электронной торговли - Парный рейтинг и анализ настроений
  7. Классификация рукописных цифр MNIST
  8. Data Science Project - TalkingData AdTracking Fraud Detection
  9. Tensor2Robot (T2R) от Google Research
  10. Генеративные модели в TensorFlow 2
  11. Google Research Football - Уникальная среда обучения с подкреплением
  12. Gaussian YOLOv3: точный и быстрый детектор объектов для автономного вождения
  13. Сверхлегкий и быстрый детектор лиц
  14. Удаление видеообъекта
  15. DeepPrivacy - впечатляющий метод анонимизации изображений
  16. SiamMask - быстрое онлайн-отслеживание и сегментация объектов
  17. Анализ текста в отчете правительства Мексики за 2019 год - блестящее применение НЛП
  18. LazyNLP для создания массивных текстовых наборов данных
  19. Реализация BigGAN DeepMind в PyTorch
  20. Удаление человека в реальном времени с помощью TensorFlow.js
  21. Удаление человека в реальном времени с помощью TensorFlow.js
  22. Проект системы рекомендаций фильмов
  23. Проект распознавания речевых эмоций


12. Новости и информационные бюллетени

  1. KDNuggets - Эта платформа полностью посвящена искусственному интеллекту и аналитике.
  2. BananaData - этот информационный бюллетень анализирует новости и отправляет главные информационные сообщения на ваш почтовый ящик один раз в неделю.
  3. AI Digest. Еженедельный информационный бюллетень, чтобы быть в курсе событий в области искусственного интеллекта, машинного обучения и анализа данных.

13. Инструменты и процессы

  • Weka представляет собой набор алгоритмов машинного обучения для задач интеллектуального анализа данных.
  • Datalab от Google легко исследует, визуализирует, анализирует и трансформирует данные с помощью знакомых языков, таких как Python и SQL, в интерактивном режиме.
  • ML Workspace - универсальная среда разработки для машинного обучения и анализа данных.
  • R - это бесплатная программная среда для статистических вычислений и графики.
  • IDE RStudio - мощный пользовательский интерфейс для R. Это бесплатная программа с открытым исходным кодом, работает на Windows, Mac и Linux.
  • Питон - Анаконда
  • Машинное обучение Scikit-Learn на Python
  • NumPy является фундаментальным для научных вычислений с Python.
  • SciPy SciPy работает с массивами NumPy и предоставляет эффективные процедуры для численного интегрирования и оптимизации.
  • Инструментарий Data Science
  • Инструментарий Data Science
  • Datadog Решения, код и разработки для крупномасштабной науки о данных.
  • Apache Flink Платформа для эффективной распределенной универсальной обработки данных.
  • A / B Testing - Блог об A / B тестировании.
  • Apache Hama Apache Hama - проект верхнего уровня Apache с открытым исходным кодом.
  • Octave GNU Octave - интерпретируемый язык высокого уровня, в первую очередь предназначенный для численных вычислений. (Free Matlab)
  • Apache Spark Молниеносные кластерные вычисления
  • Bloom Filters - блокнот на Python о фильтрах цветения.
  • Фильтры Блума - Фильтры Блума.
  • Отбор проб из резервуара - учебник по отбору проб из резервуара.
  • Фреймворк глубокого обучения Caffe
  • Факел Научно-вычислительный фреймворк.
  • Intel framework - Intel® Deep Learning Framework
  • Datawrapper - платформа визуализации данных с открытым исходным кодом.
  • Tensor Flow - TensorFlow - это программная библиотека с открытым исходным кодом для машинного интеллекта.
  • Инструментарий естественного языка
  • Юлия - высокоуровневый, высокопроизводительный язык динамического программирования.
  • Apache Zeppelin - блокнот на базе Интернета, который обеспечивает управляемую данными, интерактивную аналитику данных и совместную работу с документами с помощью SQL, Scala и т. Д.
  • Featuretools - фреймворк с открытым исходным кодом для автоматизированной разработки функций, написанный на Python.
  • Цепь Маркова Монте-Карло.
  • Многопоточность и очереди - Как построить многопоточность и очереди.
  • Основы многопоточности и очередей - охватывает основы многопоточности и очередей.
  • Optimus - очистка, предварительная обработка, разработка функций, исследовательский анализ данных и легкий машинный перевод.
  • AWS Data Wrangler - пакет Python с открытым исходным кодом, который использует и расширяет возможности библиотеки Pandas до AWS, соединяя DataFrames и сервисы, связанные с данными AWS.
  • Lightwood - фреймворк на основе Pytorch, который разбивает задачи машинного обучения на более мелкие блоки, которые можно решить для построения прогнозных моделей с помощью одной строчки кода.

14. Шпаргалки, советы и хитрости

Основы Python и импорт данных

Python - мощный язык программирования общего назначения. Он используется для разработки веб-приложений, обработки данных, создания прототипов программного обеспечения и так далее. К счастью для новичков, Python имеет простой и удобный синтаксис. Это делает Python отличным языком программирования для начинающих.

Лучший MOOC для изучения основ Python: https://www.edx.org/course/python-basics-for-data-science

Обзор курса MOOC: по завершении вы сможете писать собственные сценарии Python и выполнять базовый практический анализ данных с помощью нашей лабораторной среды на основе Jupyter. Это один из лучших курсов.

Рейтинг: 8/10

Вы можете найти шпаргалку здесь: Шпаргалка по основам Python

Вы можете найти шпаргалку здесь: Python for Data Science: Importing Data Cheat Sheet

Блокнот Jupyter

Jupyter Notebook - это веб-приложение с открытым исходным кодом, которое позволяет создавать и обмениваться документами, содержащими живой код, уравнения, визуализации и повествовательный текст. Области применения: очистка и преобразование данных, численное моделирование, статистическое моделирование, визуализация данных, машинное обучение и многое другое.

Вы можете найти шпаргалку здесь: Шпаргалка по Jupyter Notebook

Математика

SciPy - это один из базовых пакетов для научных вычислений в Python, который предоставляет математические алгоритмы и удобные функции, построенные на расширении Python NumPy.

Вы можете найти шпаргалку здесь: Шпаргалка по линейной алгебре Scipy

Манипуляция данными

NumPy

NumPy - это основная библиотека для научных вычислений на Python. Он предоставляет высокопроизводительный объект многомерного массива и инструменты для работы с этими массивами.

Вы можете найти шпаргалку здесь: Шпаргалка по основам NumPy

Панды

Pandas - это быстрый, мощный, гибкий и простой в использовании инструмент для анализа и обработки данных с открытым исходным кодом, созданный на основе языка программирования Python.

Вы можете найти шпаргалку здесь: Шпаргалка по основам Pandas

Обработка данных Pandas

Обработка данных включает в себя обработку данных в различных форматах, таких как слияние, группирование, объединение и т. Д., С целью анализа или подготовки их к использованию с другим набором данных. Python имеет встроенные функции для применения этих методов борьбы с различными наборами данных для достижения аналитической цели.

15. Ресурсы для глубокого обучения

Глубокое обучение - это ветвь машинного обучения, по сути, реализация нейронных сетей с более чем одним скрытым слоем нейронов.

Людвиг из Uber

Uber представил фреймворк для обучения и тестирования моделей глубокого обучения без необходимости писать код и назвал его Ludwig -

Ludwig - это набор инструментов, созданный на основе TensorFlow, который позволяет нам обучать и тестировать модели глубокого обучения без необходимости писать код.

Основные принципы дизайна Ludwig (источник: Ludwig Github):

  • Не требуется кодирование: не требуется навыков кодирования для обучения модели и использования ее для получения прогнозов.
  • Общность: новый подход к проектированию моделей глубокого обучения, основанный на типах данных, который позволяет использовать этот инструмент во многих различных сценариях использования.
  • Гибкость: опытные пользователи имеют полный контроль над построением моделей и обучением, а новички сочтут это простым в использовании.
  • Расширяемость: легко добавлять новую архитектуру модели и новые типы данных функций.
  • Интерпретируемость и понятность. Ludwig включает визуализации, которые помогают специалистам по обработке данных понять эффективность моделей машинного обучения.


16. Бесплатная компьютерная наука, машинное обучение, наука о данных, книги по глубокому обучению.

Вся статистика

Автор: Ларри Вассерман

Получите книгу: http://link.springer.com/openurl?genre=book&isbn=978-0-387-21736-9

Дискретная математика

Автор: Ласло Ловас, Йожеф Пеликан, Каталин Вестергомби

Получите книгу: http://link.springer.com/openurl?genre=book&isbn=978-0-387-21777-2

Численная оптимизация

Автор: Хорхе Нокедаль, Стивен Райт

Получите книгу: http://link.springer.com/openurl?genre=book&isbn=978-0-387-40065-5

Анализ временных рядов

Автор: Джонатан Д. Крайер, Кунг-Сик Чан

Получите книгу: http://link.springer.com/openurl?genre=book&isbn=978-0-387-75959-3

Вводная статистика с R

Автор: Питер Далгаард

Получите книгу: http://link.springer.com/openurl?genre=book&isbn=978-0-387-79054-1

Элементы статистического обучения

Автор: Тревор Хасти, Роберт Тибширани, Джером Фридман

Получите книгу: http://link.springer.com/openurl?genre=book&isbn=978-0-387-84858-7

Вводный временной ряд с R

Автор: Пол С.П. Каупертвейт, Эндрю В. Меткалф

Получите книгу: http://link.springer.com/openurl?genre=book&isbn=978-0-387-88698-5

Руководство по R для новичков

Автор: Ален Зуур, Елена Н. Иено, Эрик Мистерс

Получите книгу: http://link.springer.com/openurl?genre=book&isbn=978-0-387-93837-0

Введение в дифференциальные уравнения с частными производными

Автор: Дэвид Бортвик

Получите книгу: http://link.springer.com/openurl?genre=book&isbn=978-3-319-48936-0

Структуры данных и алгоритмы с Python

Автор: Кент Д. Ли, Стив Хаббард

Получите книгу: http://link.springer.com/openurl?genre=book&isbn=978-3-319-13072-9

Методы математического моделирования

Автор: Томас Вительски, Марк Боуэн

Получите книгу: http://link.springer.com/openurl?genre=book&isbn=978-3-319-23042-9

Руководство по разработке алгоритмов

Автор: Стивен С. Скиена

Получите книгу: http://link.springer.com/openurl?genre=book&isbn=978-1-84800-070-4

Введение в статистику и анализ данных

Автор: Кристиан Хойманн, Майкл Шомакер, Shalabh

Получите книгу: http://link.springer.com/openurl?genre=book&isbn=978-3-319-46162-5

Принципы интеллектуального анализа данных

Автор: Макс Брамер

Получите книгу: http://link.springer.com/openurl?genre=book&isbn=978-1-4471-7307-6

Прикладной многомерный статистический анализ

Автор: Вольфганг Карл Хердл, Леопольд Симар

Получите книгу: http://link.springer.com/openurl?genre=book&isbn=978-3-662-45171-7

Робототехника, зрение и управление

Автор: Питер Корк

Получите книгу: http://link.springer.com/openurl?genre=book&isbn=978-3-319-54413-7

Компьютерное зрение

Автор: Ричард Селиски

Получите книгу: http://link.springer.com/openurl?genre=book&isbn=978-1-84882-935-0

Интеллектуальный анализ данных

Автор: Чару К. Аггарвал

Получите книгу: http://link.springer.com/openurl?genre=book&isbn=978-3-319-14142-8

Вычислительная геометрия

Автор: Марк де Берг, Отфрид Чеонг, Марк ван Кревельд, Марк Овермарс

Получите книгу: http://link.springer.com/openurl?genre=book&isbn=978-3-540-77974-2

Вероятность

Автор: Джим Питман

Получите книгу: http://link.springer.com/openurl?genre=book&isbn=978-1-4612-4374-8

Моделирование жизни

Автор: Алан Гарфинкель, Джейн Шевцова, Ина Го

Получите книгу: http://link.springer.com/openurl?genre=book&isbn=978-3-319-59731-7

Учебник по научному программированию с помощью Python

Автор: Ханс Петтер Лангтанген

Получите книгу: http://link.springer.com/openurl?genre=book&isbn=978-3-662-49887-3

Статистический анализ и отображение данных

Автор: Ричард М. Хейбергер, Burt Holland

Получите книгу: http://link.springer.com/openurl?genre=book&isbn=978-1-4939-2122-5

Элементарный анализ

Автор: Кеннет А. Росс

Получите книгу: http://link.springer.com/openurl?genre=book&isbn=978-1-4614-6271-2

Теория вероятности

Автор: Боровков Александр Александрович

Получите книгу: http://link.springer.com/openurl?genre=book&isbn=978-1-4471-5201-9

Статистика и анализ данных для финансового инжиниринга

Автор: Дэвид Рупперт, Дэвид С. Маттесон

Получите книгу: http://link.springer.com/openurl?genre=book&isbn=978-1-4939-2614-5

Дифференциальные уравнения и их приложения

Автор: Мартин Браун

Получите книгу: http://link.springer.com/openurl?genre=book&isbn=978-1-4612-4360-1

Уравнения в частных производных

Автор: Юрген Йост

Получите книгу: http://link.springer.com/openurl?genre=book&isbn=978-1-4614-4809-9

Случайные процессы и исчисления

Автор: Уве Хасслер

Получите книгу: http://link.springer.com/openurl?genre=book&isbn=978-3-319-23428-1

Байесовские и частотные методы регрессии

Автор: Джон Уэйкфилд

Получите книгу: http://link.springer.com/openurl?genre=book&isbn=978-1-4419-0925-1

Руководство по проектированию для науки о данных

Автор: Стивен С. Скиена

Получите книгу: http://link.springer.com/openurl?genre=book&isbn=978-3-319-55444-0

Введение в машинное обучение

Автор: Мирослав Кубат

Получите книгу: http://link.springer.com/openurl?genre=book&isbn=978-3-319-63913-0

Руководство по дискретной математике

Автор: Джерард О’Реган

Получите книгу: http://link.springer.com/openurl?genre=book&isbn=978-3-319-44561-8

Введение в временные ряды и прогнозирование

Автор: Питер Дж. Броквелл, Ричард А. Дэвис

Получите книгу: http://link.springer.com/openurl?genre=book&isbn=978-3-319-29854-2

Многомерное исчисление и геометрия

Автор: Шон Динин

Получите книгу: http://link.springer.com/openurl?genre=book&isbn=978-1-4471-6419-7

Линейное и нелинейное программирование

Автор: Дэвид Г. Люенбергер, Yinyu Ye

Получите книгу: http://link.springer.com/openurl?genre=book&isbn=978-3-319-18842-3

Правильная линейная алгебра

Автор: Шелдон Акслер

Получите книгу: http://link.springer.com/openurl?genre=book&isbn=978-3-319-11080-6

Основы робототехнических механических систем

Автор: Хорхе Анхелес

Получите книгу: http://link.springer.com/openurl?genre=book&isbn=978-3-319-01851-5

Линейная алгебра

Автор: Йорг Лизен, Фолькер Мерманн

Получите книгу: http://link.springer.com/openurl?genre=book&isbn=978-3-319-24346-7

Понимание анализа

Автор: Стивен Эбботт

Получите книгу: http://link.springer.com/openurl?genre=book&isbn=978-1-4939-2712-8

Обыкновенные дифференциальные уравнения

Автор: Уильям А. Адкинс, Марк Дж. Дэвидсон

Получите книгу: http://link.springer.com/openurl?genre=book&isbn=978-1-4614-3618-8

Анализ статистики с помощью R

Автор: Рэндалл Шумакер, Сара Томек

Получите книгу: http://link.springer.com/openurl?genre=book&isbn=978-1-4614-6227-9

Введение в статистическое обучение

Автор: Гарет Джеймс, Даниэла Виттен, Тревор Хасти, Роберт Тибширани

Получите книгу: http://link.springer.com/openurl?genre=book&isbn=978-1-4614-7138-7

Статистическое обучение с точки зрения регрессии

Автор: Ричард А. Берк

Получите книгу: http://link.springer.com/openurl?genre=book&isbn=978-3-319-44048-4

Прикладные дифференциальные уравнения с частными производными

Автор: Дж. Дэвид Логан

Получите книгу: http://link.springer.com/openurl?genre=book&isbn=978-3-319-12493-3

Стратегии регрессионного моделирования

Автор: Фрэнк Э. Харрелл-младший.

Получите книгу: http://link.springer.com/openurl?genre=book&isbn=978-3-319-19425-7

Прикладные количественные финансы

Автор: Вольфганг Карл Хердл, Кэти Йи-Сюань Чен, Людгер Овербек

Получите книгу: http://link.springer.com/openurl?genre=book&isbn=978-3-662-54486-0

Современное введение в вероятность и статистику

Автор: Ф.М. Деккинг, К. Краайкамп, Х.П. Лопухаа, Л. Мистер

Получите книгу: http://link.springer.com/openurl?genre=book&isbn=978-1-84628-168-6

Комплексный анализ

Автор: Джозеф Бак, Дональд Дж. Ньюман

Получите книгу: http://link.springer.com/openurl?genre=book&isbn=978-1-4419-7288-0

Книга Python

Автор: Бен Стивенсон

Получите книгу: http://link.springer.com/openurl?genre=book&isbn=978-3-319-14240-1

Основы программирования на Python

Автор: Кент Д. Ли

Получите книгу: http://link.springer.com/openurl?genre=book&isbn=978-1-4471-6642-9

Машинное обучение в медицине - полный обзор

Автор: Тон Дж. Клеофас, Эилко Х. Звиндерман

Получите книгу: http://link.springer.com/openurl?genre=book&isbn=978-3-319-15195-3

Объектно-ориентированный анализ, проектирование и реализация

Автор: Брахма Датан, Сарнатх Рамнатх

Получите книгу: http://link.springer.com/openurl?genre=book&isbn=978-3-319-24280-4

Введение в науку о данных

Автор: Лаура Игуаль, Санти Сеги

Получите книгу: http://link.springer.com/openurl?genre=book&isbn=978-3-319-50017-1

Исчисление с приложениями

Автор: Питер Д. Лакс, Мария Ши Террелл

Получите книгу: http://link.springer.com/openurl?genre=book&isbn=978-1-4614-7946-8

Прикладное прогнозное моделирование реального анализа

Автор: Макс Кун, Кьелл Джонсон

Получите книгу: http://link.springer.com/openurl?genre=book&isbn=978-1-4614-6849-3

Теория вероятности

Автор: Ахим Кленке

Получите книгу: http://link.springer.com/openurl?genre=book&isbn=978-1-4471-5361-0

Продолжайте учиться и писать код;)

Хотите прочитать юмор программистов?









Рекомендуемые статьи -