Публикации по теме 'data-science'
Когда SQL — не лучший ответ: выявление проблем с графиками и когда графики могут помочь
Специалисты по данным работают со столбцами и строками. Это лежит в основе нашего обучения, и мы очень хороши в этом! От таблиц SQL до фреймов данных Pandas и всего, что между ними, нам нравятся наши столбцовые данные. Нам лучше всего удается предположить, что каждая из наших строк представляет собой независимый тип данных, никак не связанный ни с одной из других строк. Мы живем в этой парадигме настолько полно, что подавляющее большинство наших моделей машинного обучения..
Поглощение ИИ: нужно ли вмешательство для человечества?
На данный момент мы все боимся удивительных вещей, которые может сделать искусственный интеллект, учитывая выпуск Chatgpt и других платформ, управляемых ИИ. Мы не уверены в будущих достижениях, которые это может принести, поэтому нам нужно начать использовать возможности, которые, по нашему мнению, уникальны для нас и незаменимы для технологий.
Chatgpt, Perplexity, Tome, а недавно и Notion — инструменты, ломающие Интернет. Это так безумно, этот блог мог быть сгенерирован одним из этих..
8 опасностей, угрожающих системам машинного обучения в производстве
MLOps
8 опасностей, угрожающих системам машинного обучения в производстве
На что следует обращать внимание при обслуживании систем машинного обучения
Разрабатывать и развертывать модели машинного обучения непросто, а тем более интегрировать их с окружающими конвейерами данных для создания крупномасштабных систем машинного обучения. Однако самая сложная часть наступает позже, когда вся система будет протестирована, развернута и запущена. Развертывание - это еще не конец пути...
В Python тостер может изменить цвет ваших волос, и это большое дело
Наконец, по-настоящему понять глобальные переменные и побочные эффекты
Если вы хотите писать чистый код , который будет легко использовать другим, вы должны хорошо понимать, что такое побочные эффекты и как с ними бороться.
Что такое функция?
Если вы использовали Python или почти любой язык программирования, появившийся после 50-х годов, вы, вероятно, уже слышали о функциях, на самом деле вы, вероятно, уже использовали многие функции.
Концепция функции довольно проста, как..
Методы ансамбля: бэггинг, бустинг и стекирование
Демистификация ансамблевых методов: обзор бэггинга, бустинга и стекирования
Цель методики ансамбля состоит в том, чтобы объединить слабых учащихся и сформировать сильную модель.
Техники ансамбля:
Бэггинг → Случайный лес Boosting → Adaboost, Gradient Boosting и Extreme Gradient Boosting Укладка
1. Упаковка:-
Однородные слабые ученики: все модели одного и того же алгоритма. Например, при бэггинге все модели строятся по одному алгоритму либо линейной регрессии, либо..
Разработка дизайна системы
Проектирование системы включает в себя рассмотрение различных компонентов и технологий, обеспечивающих эффективную обработку данных, анализ и совместную работу. Вот общий обзор дизайна системы для специалистов по данным:
1. Хранение данных и управление ими: — выберите масштабируемую и распределенную систему хранения, такую как Apache Hadoop Distributed File System (HDFS), Apache Cassandra, или облачные решения для хранения данных (например, Amazon S3). , Google Cloud Storage). —..
Простая линейная регрессия с использованием Python
Простая линейная регрессия — это статистическая методология, используемая для оценки связи между двумя количественными переменными, чтобы можно было оценить или спрогнозировать зависимую переменную с использованием независимой переменной. Вы можете использовать простую линейную регрессию, когда хотите узнать: (1) насколько сильна связь между двумя переменными ; (2) Значение зависимой переменной при определенном значении независимой переменной.
Этот метод широко используется в..