Статьи по теме data-science

Публикации по теме 'data-science'

Машинное обучение в электронной коммерции: как машинное обучение изменило оптимизацию цен?

Машинное обучение в электронной коммерции: как машинное обучение изменило оптимизацию цен? Машинное обучение в электронной коммерции — это крайне необходимая методология, которая помогает ритейлерам определять наилучшую возможную стоимость каждого товара и прогнозировать реакцию клиентов. Раньше ритейлеры использовали традиционные модели ценообразования, предполагающие ручное вмешательство и трудоемкие процессы. В результате владельцы бизнеса электронной коммерции сочли невозможным..

Последние обновления по изучению словарей, часть 4 (AI)

Обучение словарю симметриями через представления групп (arXiv) Автор: Субхрошехар Гош , Аарон Ю. Р. Лоу , Ён Шэн Со , Чжуохан Фэн , Брендан К. Ю. Тан Аннотация: Проблему изучения словаря можно рассматривать как управляемый данными процесс изучения подходящего преобразования, чтобы данные были разрежены непосредственно из примеров данных. В этой статье мы исследуем проблему изучения словаря, инвариантного относительно заранее заданной группы преобразований. Естественные настройки..

Финальный проект USC по машинному обучению

Блокнот Colab с Кодом Введение Этот набор данных Прогнозирование инсульта используется для прогнозирования вероятности инсульта у пациента на основе входных переменных, включая пол, возраст, различные заболевания и статус курения. Каждая строка содержит соответствующую информацию об отдельных пациентах и используется для анализа следующего вопроса: Какие факторы в наибольшей степени влияют на пациентов с инсультом? Как эта информация может помочь врачам реализовать..

Взломайте код: как методы кодирования могут изменить вашу игру по анализу данных!

Введение Представьте себе мир, в котором наши компьютеры могут понимать только числа и не могут расшифровать богатую информацию, скрытую в словах, категориях или ярлыках. Это ограничение создает серьезную проблему в области науки о данных, где наборы данных часто содержат категориальные переменные, которые не могут быть напрямую использованы алгоритмами машинного обучения. Как нам восполнить этот пробел? Именно здесь на помощь приходят методы кодирования, раскрывающие возможности..

Изучение потоковой передачи PySpark: преобразования и приложения для обработки данных в реальном времени

PySpark Streaming: преобразование потоковых данных для анализа в реальном времени вступление В PySpark DStreams (дискретизированные потоки) — это фундаментальная абстракция, предоставляемая Spark Streaming для обработки потоков данных в реальном времени. DStreams представляет собой последовательность RDD (устойчивых распределенных наборов данных), где каждый RDD содержит данные за определенный интервал времени. В PySpark доступны различные преобразования для DStream, которые..

Классификация видео с использованием глубоких нейронных сетей

Обучение компьютеров классификации видео Содержание Введение Мотивация Предпосылки Понимание и подготовка данных Извлечение видеокадров Создание набора данных для обучения и тестирования Модельная архитектура и обучение Оценка Заключение и дальнейшая работа использованная литература 1. Введение Видео можно определить как серию изображений / кадров, извлеченных за период времени, что вводит новое измерение в кадры / изображения во временном направлении. Чтобы..

Наука о данных: развертывание модели

В прошлой главе мы обсудили Оценку модели . В этой главе мы обсудим, как развернуть вашу модель машинного обучения в производственной среде, и что следует учитывать при этом. Ваш проект по науке о данных принесет какую-либо ценность/влияние на бизнес, только если вы развернули его в рабочей среде, пользователи используют его и оставляют отзывы. Упаковка и распространение модели После того, как все различные модели будут оценены и одна модель будет принята бизнес-/конечными..