1.IAN: повторяющиеся адаптивные окрестности для многообразного обучения и оценки размерности (arXiv)

Автор:Лучано Дибалла, Стивен В. Цукер

Выдержка. Использование предположения о многообразии в машинном обучении требует знания геометрии и размеров многообразия, а теория определяет, сколько образцов требуется. Однако в приложениях данные ограничены, выборка может быть неравномерной, а свойства множества неизвестны и (возможно) нечисты; это означает, что районы должны адаптироваться к местной структуре. Мы вводим алгоритм для вывода адаптивных окрестностей для данных, заданных ядром подобия. Начиная с локально-консервативного графа соседства (Габриэля), мы итеративно разрежаем его в соответствии с взвешенным аналогом. На каждом шаге линейная программа дает минимальные окрестности в глобальном масштабе, а объемная статистика выявляет соседние выбросы, которые могут нарушить геометрию многообразия. Мы применяем наши адаптивные окрестности для нелинейного уменьшения размерности, геодезических вычислений и оценки размерности. Сравнение со стандартными алгоритмами, использующими, например, k ближайших соседей, демонстрирует их полезность.

2.LAMA-Net: неконтролируемая адаптация домена посредством скрытого выравнивания и многообразного обучения для прогнозирования RUL (arXiv)

Автор:Ману Джозеф, Варчита Лалвани

Аннотация: Прогностика и управление здоровьем (PHM) — это новая область, которая привлекла большое внимание обрабатывающей промышленности из-за преимуществ и эффективности, которые она приносит. Прогнозирование оставшегося срока полезного использования (RUL) лежит в основе любой системы PHM. Самые последние исследования, основанные на данных, требуют значительных объемов помеченных обучающих данных, прежде чем производительную модель можно будет обучить в рамках контролируемой парадигмы обучения. Именно здесь вступают в действие методы трансферного обучения (TL) и адаптации домена (DA), которые позволяют нам обобщить контролируемую модель на другие домены с другим распределением данных без помеченных данных. В этой статье мы предлагаем \textit{LAMA-Net}, модель на основе кодера-декодера (преобразователь) с индуцированным узким местом, скрытым выравниванием с использованием максимального среднего расхождения (MMD) и многообразным обучением для решения проблемы неконтролируемой однородной области. Адаптация для предсказания RUL. \textit{LAMA-Net} проверяется НАСА с использованием набора данных C-MAPSS Turbofan Engine и сравнивается с другими современными методами для DA. Результаты показывают, что предложенный метод предлагает многообещающий подход для выполнения адаптации домена при прогнозировании RUL. Код будет доступен после того, как статья выйдет из рецензирования.

3. Оценка визуальной информации из аудио с помощью многообразного обучения (arXiv)

Автор: Фабрицио Педерсоли, Драйден Вибе, Амин Баниталеби, Ён Чжан, Джордж Цанетакис, Кван Му И

Аннотация: мы предлагаем новую структуру для извлечения визуальной информации о сцене только с использованием аудиосигналов. Методы на основе звука могут преодолеть некоторые ограничения методов, основанных на зрении, т. е. они не требуют прямой видимости, устойчивы к окклюзиям и изменениям освещения и могут функционировать в качестве резервной копии на случай, если датчики зрения/лидара неудача. Следовательно, методы на основе аудио могут быть полезны даже для приложений, в которых представляет интерес только визуальная информация. Наша структура основана на многообразном обучении и состоит из двух этапов. Во-первых, мы обучаем векторно-квантованный вариационный автокодировщик для изучения многообразия данных конкретной визуальной модальности, которая нас интересует. Во-вторых, мы обучаем сеть преобразования аудио для сопоставления многоканальных аудиосигналов со скрытым представлением соответствующего визуального представления. образец. Мы показываем, что наш метод способен создавать осмысленные изображения из аудио, используя общедоступный набор аудио/визуальных данных. В частности, мы рассматриваем предсказание следующих визуальных модальностей по аудио: глубина и семантическая сегментация. Мы надеемся, что результаты нашей работы могут облегчить дальнейшие исследования в области извлечения визуальной информации из аудио. Код доступен по адресу: https://github.com/ubc-vision/audio_manifold