Публикации по теме 'data-science'


Очистка данных в науке о данных, машинном обучении и бизнес-аналитике — одна из самых недооцененных задач. Ключевое топливо для богатого анализа и…
Очистка данных в науке о данных, машинном обучении и бизнес-аналитике — одна из самых недооцененных задач. Ключевым топливом для богатого анализа и понимания являются данные; а нечистые или нерелевантные данные могут привести к тому, что бизнес-лидеры будут принимать необдуманные решения; тем самым негативно влияя на эффективность бизнеса. Прежде чем перейти к тактической стороне дела, важно понять охват «очистки данных» — то есть, какие различные показатели или факторы охватываются..

Исследовательский анализ данных (часть 2)
В Части 1 исследовательского анализа данных мы обсуждали, как понимать данные с помощью чисел. В этой части мы научимся визуализировать данные, чтобы установить отношения между ними. Это можно сделать двумя способами: Первый способ : найти корреляцию между столбцами и построить тепловую карту , используя только этот столбец, связанный с графиком. 2-й способ : построить взаимосвязь между столбцами отсутствующих , непрерывными столбцами, дискретными столбцами и..

Работа с томом Малера, часть 3 (машинное обучение)
Нижняя граница малеровского объема симметричных выпуклых множеств (arXiv) Автор : Яшар Мемариан Аннотация: Целью данной статьи является представление нижней оценки малеровского объема по крайней мере четырехмерных симметричных выпуклых тел. Мы определяем вычислимую константу, зависящую от размерности, с помощью двумерной вариационной (макс-мин) процедуры и показываем, что малеровский объем каждого (по крайней мере, четырехмерного) симметричного выпуклого тела больше, чем (простая)..

Выделите свои табличные данные с помощью интерфейса командной строки с помощью этих советов и приемов
Повышение удобочитаемости: советы по отображению наборов данных в CLI Пару дней назад я хотел помочь отцу решить проблему. Ему нужно было собрать, отфильтровать и отобразить некоторые данные как можно быстрее. Ну… правда в том, что он печатал данные (где-то по 10 страниц каждый раз!!) и искал данные вручную! Я увидел его трудности и решил немедленно помочь ему. Ничего сложного для того, кто может анализировать данные, как я: данные уже были в формате Excel, поэтому Jupyter Notebook..

5 авторов, пишущих о технологиях, о которых стоит прочитать на Medium
Независимо от того, являетесь ли вы программистом, специалистом по обработке данных или инженером по машинному обучению Medium наводнен тысячами разработчиков, пишущих статьи по науке о данных, автоматизации, программированию и машинному обучению. Есть сотни вводных статей о Python, Firebase, SQL и AWS. Со всеми этими авторами и статьями очень легко упустить некоторых интересных писателей и экспертов в области технологий, которые любят свое дело и, честно говоря, могут не получить..

Суммирование текста, часть 1 — Нежное введение в автоматическое суммирование текста
Эта серия сообщений в блоге посвящена печально известной области, которая сочетает в себе искусственный интеллект и лингвистику: суммирование текста. Хотя эта серия сообщений в блоге предназначена для людей с минимальными знаниями о НЛП ( обработка естественного языка ), эту первую вводную главу может прочитать и понять любой достаточно любопытный о том, как такая задача, как суммирование текста, которая и без того сложна для выполнения людьми, решается с помощью алгоритма или ИИ...

Статистическая математика для уменьшения размерности в науке о данных.
Что я буду обсуждать: Что такое разработка функций и уменьшение размерности Дисперсия и центральная тенденция (среднее) Ковариация Как это можно использовать в машинном обучении Вывод Разработка функций и уменьшение размерности Разработка функций, вероятно, является одним из наиболее важных шагов, которые необходимо предпринять перед обработкой входных матриц функций в модели машинного обучения. Разработка функций направлена ​​на выяснение отношений и свойств различных случайных..