Статьи по теме data-science

Публикации по теме 'data-science'

Когда SQL — не лучший ответ: выявление проблем с графиками и когда графики могут помочь

Специалисты по данным работают со столбцами и строками. Это лежит в основе нашего обучения, и мы очень хороши в этом! От таблиц SQL до фреймов данных Pandas и всего, что между ними, нам нравятся наши столбцовые данные. Нам лучше всего удается предположить, что каждая из наших строк представляет собой независимый тип данных, никак не связанный ни с одной из других строк. Мы живем в этой парадигме настолько полно, что подавляющее большинство наших моделей машинного обучения..

Поглощение ИИ: нужно ли вмешательство для человечества?

На данный момент мы все боимся удивительных вещей, которые может сделать искусственный интеллект, учитывая выпуск Chatgpt и других платформ, управляемых ИИ. Мы не уверены в будущих достижениях, которые это может принести, поэтому нам нужно начать использовать возможности, которые, по нашему мнению, уникальны для нас и незаменимы для технологий. Chatgpt, Perplexity, Tome, а недавно и Notion — инструменты, ломающие Интернет. Это так безумно, этот блог мог быть сгенерирован одним из этих..

8 опасностей, угрожающих системам машинного обучения в производстве

MLOps 8 опасностей, угрожающих системам машинного обучения в производстве На что следует обращать внимание при обслуживании систем машинного обучения Разрабатывать и развертывать модели машинного обучения непросто, а тем более интегрировать их с окружающими конвейерами данных для создания крупномасштабных систем машинного обучения. Однако самая сложная часть наступает позже, когда вся система будет протестирована, развернута и запущена. Развертывание - это еще не конец пути...

В Python тостер может изменить цвет ваших волос, и это большое дело

Наконец, по-настоящему понять глобальные переменные и побочные эффекты Если вы хотите писать чистый код , который будет легко использовать другим, вы должны хорошо понимать, что такое побочные эффекты и как с ними бороться. Что такое функция? Если вы использовали Python или почти любой язык программирования, появившийся после 50-х годов, вы, вероятно, уже слышали о функциях, на самом деле вы, вероятно, уже использовали многие функции. Концепция функции довольно проста, как..

Методы ансамбля: бэггинг, бустинг и стекирование

Демистификация ансамблевых методов: обзор бэггинга, бустинга и стекирования Цель методики ансамбля состоит в том, чтобы объединить слабых учащихся и сформировать сильную модель. Техники ансамбля: Бэггинг → Случайный лес Boosting → Adaboost, Gradient Boosting и Extreme Gradient Boosting Укладка 1. Упаковка:- Однородные слабые ученики: все модели одного и того же алгоритма. Например, при бэггинге все модели строятся по одному алгоритму либо линейной регрессии, либо..

Разработка дизайна системы

Проектирование системы включает в себя рассмотрение различных компонентов и технологий, обеспечивающих эффективную обработку данных, анализ и совместную работу. Вот общий обзор дизайна системы для специалистов по данным: 1. Хранение данных и управление ими: — выберите масштабируемую и распределенную систему хранения, такую как Apache Hadoop Distributed File System (HDFS), Apache Cassandra, или облачные решения для хранения данных (например, Amazon S3). , Google Cloud Storage). —..

Простая линейная регрессия с использованием Python

Простая линейная регрессия — это статистическая методология, используемая для оценки связи между двумя количественными переменными, чтобы можно было оценить или спрогнозировать зависимую переменную с использованием независимой переменной. Вы можете использовать простую линейную регрессию, когда хотите узнать: (1) насколько сильна связь между двумя переменными ; (2) Значение зависимой переменной при определенном значении независимой переменной. Этот метод широко используется в..