Статьи по теме data-science

Публикации по теме 'data-science'

Пророк: оценка прогнозирования временных рядов

Прогнозирование временных рядов Prophet на наборе данных Hold-Out Введение Анализ временных рядов является важным методом для понимания и прогнозирования точек данных, упорядоченных в хронологическом порядке. ͏Он находит применение в различных областях, включая финансы, экономику, прогнозирование погоды и продажи. Точное прогнозирование временных рядов расширяет возможности принятия решений, позволяет осуществлять упреждающее планирование и помогает понять основные закономерности и..

Обучение и оценка моделей глубокого обучения (3/6)

Предыдущий ‹‹ Обучение и оценка моделей глубокого обучения (2/6) Хотя модели глубокого обучения можно использовать для любого вида машинного обучения, они особенно полезны для работы с данными, состоящими из больших массивов числовых значений, например изображений . Модели машинного обучения, работающие с изображениями, лежат в основе области искусственного интеллекта под названием компьютерное зрение , а методы глубокого обучения способствовали удивительным достижениям в этой..

Создание кода: 11 методов создания чистых и читаемых шедевров Python

Путь аналитика данных к совершенствованию чистоты кода «Хорошо составленный код подобен тонкому гобелену. он рассказывает историю, передает цель и делает комплекс легким и элегантным». — Аноним Как аналитик данных с более чем десятилетним опытом анализа и визуализации данных, я понял важность написания чистого и читаемого кода. Это не только важно для моего собственного здравомыслия при повторном посещении проектов, но также улучшает сотрудничество с товарищами по команде и..

Предварительная обработка текстовых данных для модели НЛП

❓ Почему важна предварительная обработка текстовых данных? Цель НЛП (обработки естественного языка) состоит в том, чтобы заставить компьютеры понимать текст и произносимые слова почти так же, как люди. НЛП применяет статистические модели, модели машинного обучения и глубокого обучения к большим текстовым данным, чтобы понять намерения и чувства говорящего или пишущего. Входные данные могут сильно повлиять на производительность модели НЛП. Крайне важно удалить шум из текстовых..

Исследование белковых языковых моделей, часть 2 (искусственный интеллект)

Ankh: оптимизированная белковая языковая модель открывает возможности для универсального моделирования (arXiv) Автор: Ахмед Эльнаггар , Хазем Эссам , Вафаа Салах-Элдин , Валид Мустафа , Мохамед Элькердави , Шарлотта Рошеро , Буркхард Рост . Аннотация: В отличие от масштабирования моделей белкового языка (PLM), мы стремимся повысить производительность за счет оптимизации, специфичной для белка. Несмотря на то, что пропорциональность между размером языковой модели и богатством ее..

Измерение корреляции: сравнение коэффициентов Пирсона и Спирмена

Разбивка того, как измерить корреляцию в различных сценариях Фон Как специалисты по данным, мы тратим много времени на просмотр и анализ больших наборов данных. Этот процесс широко известен как Объяснительный анализ данных (EDA) . Одна из ключевых вещей, которую мы ищем, особенно когда дело доходит до моделирования, это то, как переменные влияют друг на друга или коррелируют друг с другом. Это информирует нас о прогнозируемости функции для целевой переменной. В этом посте я..

5 способов потерпеть неудачу в машинном обучении

ИИ — это будущее. Это не спорное утверждение. На самом деле, я уверен, что вы много слышали об этом. Мы используем ИИ для улучшения взаимодействия с пользователем, снижения рисков, продажи рекламы и, возможно, когда-нибудь, чтобы управлять нашими автомобилями. Между реальностью искусственного интеллекта и заявлением о том, что «специалист по данным будет самой сексуальной профессией 21-го века», мы все слышали шумиху. Однако: 80% проектов по машинному обучению не доводятся до стадии..