Публикации по теме 'data-science'
Оценка плотности ядра объясняется шаг за шагом
Интуитивный вывод формулы KDE
Введение
Чтобы получить представление о распределении данных, мы рисуем функции плотности вероятности (PDF). Мы рады, когда данные хорошо соответствуют общей функции плотности, например нормальной, Пуассоновой, геометрической и т. д. Тогда можно использовать подход максимального правдоподобия для соответствия функции плотности данным.
К сожалению, распределение данных иногда бывает слишком неравномерным и не похоже ни на один из обычных..
Худшие проекты Python для сборки
Добро пожаловать! Python — потрясающий язык программирования с массой возможностей. Если вы новичок в Python, перейдите по ссылке ниже, чтобы узнать о нем больше:
Лучшие МООК и книги для специалистов по данным
В этой истории я хочу поделиться с вами лучшими курсами, которые я прошел, и лучшими книгами, которые я прочитал до сих пор по науке о данных. Я хотел бы, чтобы эта история помогла людям найти правильный путь при изучении науки о данных, потому что за последние несколько лет значительно увеличилось количество курсов и книг по науке о данных, и может быть трудно угадать правильный путь для вас, чтобы получить хорошую работу.
МООК
Введение в машинное обучение с Tensorflow (Udacity)..
Использование машинного обучения для борьбы с распространением оружия в данных о российской торговле
Осмысление больших данных
Использование машинного обучения для борьбы с распространением оружия в данных о российской торговле
Как мы построили и повторили модель машинного обучения для выявления случаев незаконной торговли оружием из России.
Автор: Эллиот Ганн
Команда специалистов по анализу данных: Шон Антосяк, Эллиот Ганн, Эндрю Микол, Джейсон Нова
Руководитель проекта: Элан Ризнис
Введение В этом посте мы описываем, как мы разработали новый подход к..
Наука о данных с Python — Кластерный анализ
Эта статья является частью серии «Наука о данных с помощью Python». Другие истории из этой серии вы можете найти ниже:
Наука о данных с Python также известный как лучший язык программирования для специалистов по данным medium.com
Кластерный анализ является важной частью науки о данных. Он состоит из группировки похожих точек данных вместе на основе их характеристик.
Сегодня мы рассмотрим, как выполнять кластерный анализ в Python...
Осваиваем основы алгоритмов машинного обучения 📝 📚 — Часть 2
⭐️ Смотрите Часть-1 здесь ⭐️
Случайные леса
Случайные леса — это ансамблевые методы обучения, которые объединяют несколько деревьев решений для прогнозирования. Они уменьшают переоснащение и повышают точность по сравнению с отдельными деревьями решений.
Математические формулы:
Случайные леса строятся на деревьях решений и не требуют дополнительных математических формул.
Предположения:
То же, что деревья решений.
Бэггинг (объединение Bootstrap):
Бэгинг – это метод,..
Какая политическая партия, по прогнозам AI, выиграет президентскую гонку 2024 года?
В своем предыдущем посте я обсуждал, как машинное обучение может предсказывать, какой кандидат в президенты победит на президентских выборах 2020 года, а также обнаруживать любые аномалии голосования, такие как экспоненциальный рост голосов на выборах 2020 года по сравнению с предыдущими выборами. Ссылку на мой предыдущий пост можно найти здесь: https://medium.com/ai-in-plain-english/what-candidate-did-random-forest-predict-would-win-the-2020-presidential -выборы-2250176a1ba1»
В этом..