Статьи по теме data-science

Публикации по теме 'data-science'

Использование методов машинного обучения для классификации трафика TOR

Сеть Tor — это проект, целью которого является предоставление частного трафика своим пользователям, чтобы они могли, помимо прочего, блокировать трекеры, защищаться от слежки, противостоять снятию отпечатков пальцев и иметь многоуровневое шифрование трафика. Tor дает пользователям возможность обойти цензуру и конфиденциально исследовать Интернет. В этом эссе я использую методы машинного обучения для обнаружения и классификации трафика, который проходит через Tor, что в определенной..

Работа с теорией Громова-Виттена, часть 6 (Информационная геометрия)

Теория Громова-Виттена и инварианты матроидов (arXiv) Автор: Дхрув Ранганатан , Джереми Усатин Аннотация: Мы используем методы теории Громова-Виттена для построения новых инвариантов матроидов, принимающих значения в группах Чоу пространств рациональных кривых в пермутоэдральном торическом многообразии. Когда матроид реализуем с помощью сложной компоновки гиперплоскости, наши инварианты совпадают с виртуальными фундаментальными классами, используемыми для определения логарифмической..

Машинное обучение с помощью Scikit-Learn

Часть 6. Бикластеризация документов с помощью алгоритма спектральной кластеризации Добро пожаловать на мой канал, чтобы посмотреть еще один пример машинного обучения с использованием scikit-learn. Сегодня мы поговорим о бикластеризации документов с помощью алгоритма Spectral Co-clustering. Помните, что вам нужно попробовать это самостоятельно, чтобы получить наиболее эффективное обучение. Вся информация и код были получены из scikit-learn. орг . Я очень благодарен за сильное..

Как создать поддельные изображения, которые выглядят реальными, всего за несколько строк кода

Вы когда-нибудь задумывались, как некоторые веб-сайты или приложения могут создавать реалистичные изображения людей, животных или мест, которых не существует в реальной жизни? Как они это делают? И каковы последствия создания и использования таких изображений? В этой статье я познакомлю вас с одним из самых захватывающих и мощных методов в области машинного обучения: генеративно-состязательными сетями или сокращенно GAN . GAN — это тип глубокой нейронной сети, которая может..

Введение в рекомендательные системы

Создание системы рекомендаций — нетривиальная задача, и она сопряжена со своим собственным набором проблем и сложностей. Эта статья представляет собой попытку дать читателям более глубокое представление о создании рекомендательных систем. Система рекомендаций — это приложение машинного обучения, которое предоставляет пользователям рекомендации о том, что им может понравиться, на основе их исторических предпочтений. Его можно далее определить как систему, которая выдает..

Преимущество производительности операций без копирования DataFrame

Как StaticFrame может превзойти Pandas, используя представления массива NumPy Массив NumPy — это объект Python, который хранит данные в непрерывном буфере C-массива. Превосходная производительность этих массивов обусловлена не только их компактным представлением, но и способностью массивов совместно использовать представления этого буфера среди многих массивов. NumPy часто использует операции с массивами без копирования , создавая производные массивы без копирования подчиненных..

Как развернуть GitLab с помощью Docker за 5 секунд или меньше

Самый быстрый способ раскрутить готовый экземпляр GitLab Введение GitLab — это веб-инструмент управления репозиторием Git, который помогает командам совместно работать над кодом. Кроме того, он предоставляет полную платформу DevOps, включая контроль версий, проверку кода, отслеживание проблем и CI/CD. Одним из ключевых преимуществ Gitlab является его универсальность и гибкость, поскольку его можно размещать локально и легко настраивать в соответствии с потребностями каждой команды...