Статьи по теме deep-learning

Публикации по теме 'deep-learning'

Парный t-тест для оценки классификаторов машинного обучения с использованием Python

Парный t-тест для оценки классификаторов машинного обучения с использованием Python Узнайте, как сравнивать классификаторы с помощью проверки гипотез Введение В своей последней статье я говорил о важности правильного сравнения различных моделей с использованием статистических инструментов, чтобы выбрать лучшую модель на этапе выбора. В этой статье я хочу сосредоточиться на одном статистическом тесте, который вам, как специалисту по данным или инженеру по машинному обучению,..

Многозадачное обучение останется с 2023 г., часть 6 (машинное обучение + RL)

Точная диффузия подпространства для децентрализованного многозадачного обучения (arXiv) Автор: Шрея Вадехра , Рула Нассиф , Стефан Власки . Аннотация: Классические парадигмы распределенного обучения, такие как федеративный или децентрализованный градиентный спуск, используют механизмы консенсуса для обеспечения однородности среди агентов. Хотя эти стратегии доказали свою эффективность в i.i.d. сценариях они могут привести к значительному снижению производительности, когда агенты..

Как работает обнаружение границ в разных сценариях, часть 4 (Компьютерное зрение + ИИ)

EDoG: Обнаружение состязательных краев для графовых нейронных сетей (arXiv) Автор: Сяоцзюнь Сюй , Юэ Ю , Ханьчжан Ван , Алок Лал , Карл А. Гюнтер , Бо Ли . Аннотация: графовые нейронные сети (GNN) широко применяются для решения различных задач, таких как биоинформатика, разработка лекарств и социальные сети. Однако недавние исследования показали, что GNN уязвимы для состязательных атак, которые стремятся ввести в заблуждение предсказание классификации узлов или подграфов,..

Раскрывая силу прямого распространения: прогнозирование выходных данных в нейронных сетях

Введение: Нейронные сети произвели революцию в области искусственного интеллекта, позволив нам решать сложные задачи с поразительной точностью. В основе нейронных сетей лежит концепция прямого распространения, которая позволяет нам прогнозировать выходные данные на основе входных данных. В этом сообщении блога мы отправимся в путешествие, чтобы понять тонкости прямого распространения, исследуя задействованные математические вычисления и их значение в архитектуре нейронных сетей...

Работа с предварительным обучением в машинном обучении, часть 4

FDAPT: федеративное доменно-адаптивное предварительное обучение для языковых моделей (arXiv) Автор: Лекан Цзян , Филип Свобода , Николас Д. Лейн . Аннотация: Сочетание предметно-адаптивного предварительного обучения (DAPT) с федеративным обучением (FL) может улучшить адаптацию модели за счет использования более конфиденциальных и распределенных данных при сохранении конфиденциальности данных. Однако мало исследований посвящено этому методу. Поэтому мы проводим первое всестороннее..

Как далеко мы ушли от зеркального спуска, часть 1 (машинное обучение)

Неточный онлайн-проксимальный зеркальный спуск для изменяющейся во времени композитной оптимизации (arXiv) Автор: Woocheol Choi , Myeong-Su Lee , Seok-Bae Yun . Аннотация: В этой статье мы рассматриваем онлайн-проксимальный зеркальный спуск для решения сложных задач оптимизации во времени. Для различных приложений алгоритм естественным образом содержит ошибки в градиентном и проксимальном операторе. Получены точные оценки динамического сожаления алгоритма, когда регулярная часть..

Понимание программирования квантовых вычислений с помощью Google Cirq

Фреймворк стал одним из самых популярных стеков в новой вселенной разработки квантовых вычислений. Недавно я запустил образовательный информационный бюллетень, посвященный ИИ, у которого уже более 125 000 подписчиков. TheSequence — это информационный бюллетень, ориентированный на машинное обучение, без BS (то есть без шумихи, без новостей и т. д.)…