Публикации по теме 'data-science'


Что такое анализ данных?
Анализ данных в машинном обучении и науке о данных Анализ данных является важной темой в машинном обучении и науке о данных. Анализ данных, как следует из названия, представляет собой процедуру изменения, обработки и очистки необработанных данных с целью получения полезных и актуальных данных, которые помогут специалистам по данным в вынесении суждений. В этой статье я хотел бы дать вам подробное объяснение об анализе данных анализе . Что такое анализ данных? Процесс..

Руководство для начинающих по гиперпараметрам LightGBM, которые необходимо знать
Самые важные параметры LightGBM, что они делают и как их настроить LightGBM — популярный фреймворк для повышения градиента. Обычно вы начинаете указывать следующие основные параметры : objective и metric для постановки задачи seed для воспроизводимости verbose для отладки num_iterations , learning_rate и early_stopping_round для обучения Но куда вы пойдете отсюда? LightGBM имеет более 100 параметров [2], которые можно настраивать. Кроме того, каждый..

Визуализация вложения графов с помощью t-SNE в Python
Практические руководства Визуализация вложения графов с помощью t-SNE в Python Как качественно оценить вложения графа Neo4j Вступление В моем предыдущем посте мы обсуждали цель и природу встраивания графов. Основная идея заключается в том, что для машинного обучения на графе нам нужно преобразовать граф в серию векторов (встраивания), которые затем мы можем использовать для обучения наших моделей машинного обучения (ML). Загвоздка в том, что вложения графов бывает сложно..

Понимание нейронных касательных ядер, часть 1 (искусственный интеллект)
1. Нейронное касательное ядро: обзор ( arXiv ) Автор : Евгений Голиков , Эдуард Поконечный , Владимир Корвяков Аннотация: Основополагающая работа [Jacot et al., 2018] продемонстрировала, что обучение нейронной сети при определенной параметризации эквивалентно выполнению определенного метода ядра, поскольку ширина стремится к бесконечности. Эта эквивалентность открыла многообещающее направление для применения результатов богатой литературы по ядерным методам к нейронным..

6 бесплатных книг по науке о данных для начинающих
Все книги, необходимые для начала, бесплатно Наука о данных является междисциплинарной областью и требует широкого спектра навыков из нескольких областей, включая информатику, математику, статистику и машинное обучение. Будучи полным новичком в изучении науки о данных, может быть трудно понять, с чего начать. Программы на получение степени в области науки о данных и учебные лагеря помогут вам пройти структурированный учебный план. Однако, если у вас нет тысяч долларов, чтобы..

T-распределенное стохастическое встраивание соседей (t-SNE)
Введение T-Distributed Stochastic Neighbor Embedding (t-SNE) — это мощный метод уменьшения размерности, который штурмом покорил сообщества машинного обучения и визуализации данных. В эпоху больших данных и многомерных наборов данных t-SNE обеспечивает простой подход к сокращению сложных данных до менее размерного пространства, обеспечивая визуализацию и понимание базовой структуры данных. Во многих приложениях, включая классификацию изображений, анализ текста, экспрессию генов и многие..

Первая неделя, шаги для начинающих по SQL
Язык структурированных запросов (SQL) — язык программирования, широко известный в мире науки о данных и анализа данных для хранения, запроса и управления данными в реляционной базе данных. SQL может выглядеть простым и понятным, но может выполнять сложные и мощные задачи в области анализа данных. Я не думаю, что одной или двух статей в блоге было бы достаточно для SQL, чтобы показать, насколько мощным он является как инструмент не только для аналитика данных, но и для многих..