Статьи по теме data-science

Публикации по теме 'data-science'

Оценка плотности ядра объясняется шаг за шагом

Интуитивный вывод формулы KDE Введение Чтобы получить представление о распределении данных, мы рисуем функции плотности вероятности (PDF). Мы рады, когда данные хорошо соответствуют общей функции плотности, например нормальной, Пуассоновой, геометрической и т. д. Тогда можно использовать подход максимального правдоподобия для соответствия функции плотности данным. К сожалению, распределение данных иногда бывает слишком неравномерным и не похоже ни на один из обычных..

Худшие проекты Python для сборки

Добро пожаловать! Python — потрясающий язык программирования с массой возможностей. Если вы новичок в Python, перейдите по ссылке ниже, чтобы узнать о нем больше:

Лучшие МООК и книги для специалистов по данным

В этой истории я хочу поделиться с вами лучшими курсами, которые я прошел, и лучшими книгами, которые я прочитал до сих пор по науке о данных. Я хотел бы, чтобы эта история помогла людям найти правильный путь при изучении науки о данных, потому что за последние несколько лет значительно увеличилось количество курсов и книг по науке о данных, и может быть трудно угадать правильный путь для вас, чтобы получить хорошую работу. МООК Введение в машинное обучение с Tensorflow (Udacity)..

Использование машинного обучения для борьбы с распространением оружия в данных о российской торговле

Осмысление больших данных Использование машинного обучения для борьбы с распространением оружия в данных о российской торговле Как мы построили и повторили модель машинного обучения для выявления случаев незаконной торговли оружием из России. Автор: Эллиот Ганн Команда специалистов по анализу данных: Шон Антосяк, Эллиот Ганн, Эндрю Микол, Джейсон Нова Руководитель проекта: Элан Ризнис Введение В этом посте мы описываем, как мы разработали новый подход к..

Наука о данных с Python — Кластерный анализ

Эта статья является частью серии «Наука о данных с помощью Python». Другие истории из этой серии вы можете найти ниже: Наука о данных с Python также известный как лучший язык программирования для специалистов по данным medium.com Кластерный анализ является важной частью науки о данных. Он состоит из группировки похожих точек данных вместе на основе их характеристик. Сегодня мы рассмотрим, как выполнять кластерный анализ в Python...

Осваиваем основы алгоритмов машинного обучения 📝 📚 — Часть 2

⭐️ Смотрите Часть-1 здесь ⭐️ Случайные леса Случайные леса — это ансамблевые методы обучения, которые объединяют несколько деревьев решений для прогнозирования. Они уменьшают переоснащение и повышают точность по сравнению с отдельными деревьями решений. Математические формулы: Случайные леса строятся на деревьях решений и не требуют дополнительных математических формул. Предположения: То же, что деревья решений. Бэггинг (объединение Bootstrap): Бэгинг – это метод,..

Какая политическая партия, по прогнозам AI, выиграет президентскую гонку 2024 года?

В своем предыдущем посте я обсуждал, как машинное обучение может предсказывать, какой кандидат в президенты победит на президентских выборах 2020 года, а также обнаруживать любые аномалии голосования, такие как экспоненциальный рост голосов на выборах 2020 года по сравнению с предыдущими выборами. Ссылку на мой предыдущий пост можно найти здесь: https://medium.com/ai-in-plain-english/what-candidate-did-random-forest-predict-would-win-the-2020-presidential -выборы-2250176a1ba1» В этом..