Публикации по теме 'computer-vision'


Глубокая лидарная одометрия с учетом геометрии
Глубокая лидарная одометрия с учетом геометрии Это краткое изложение исследования — лишь одно из многих, которые еженедельно распространяются в информационном бюллетене ученых по искусственному интеллекту. Чтобы начать получать еженедельный информационный бюллетень, зарегистрируйтесь здесь . Часто модули одометрии основаны на моделях и ориентированы на использование камер RGB-D и LiDAR. Несмотря на высокие характеристики, методы на основе моделей сталкиваются с проблемами,..

Понимание сверточных нейронных сетей (часть 2)
Компьютерное зрение Понимание сверточных нейронных сетей (часть 2) Если вы еще не читали предыдущую часть этого блога, перейдите сюда, чтобы лучше понять темы, представленные в этом блоге. — Понимание сверточных нейронных сетей (часть 1) В последнем блоге мы изучили несколько основ, лежащих в основе работы сверточных нейронных сетей, таких как отступы, шаг, ядра, фильтры и так далее. Давайте рассмотрим еще несколько идей CNN и посмотрим, как нейронная сеть свертки работает на..

Подсчет повторений на основе видения в дикой природе
Обзор различных подходов к подсчету повторений на основе зрения. В этой статье я попытаюсь объяснить, как я исследую различные методы подсчета повторений на основе зрения, и обсудить их плюсы и минусы. В частности, я выделяю пять основных способов использования компьютерного зрения для подсчета повторений. Носимые датчики были довольно популярны для подсчета повторений и подходов. Из-за того, что эти датчики дороги и в большинстве случаев ограничены отслеживанием определенной..

Еженедельный обзор arXiv #10
Приветствую, Среднее сообщество, В этом выпуске представлены публикации, опубликованные на arXiv с 27 мая по 2 июня, и представлены идеи и анализ наиболее значимых исследований и тенденций. Давайте погрузимся! Обнаружение контекстных объектов с мультимодальными моделями больших языков Мультимодальные модели больших языков улучшают качество обнаружения визуальных отношений. Недавние мультимодальные модели большого языка (MLLM) замечательно справляются с задачами языка зрения,..

Анонс CLIP-as-service: уровень бесплатного пользования
CLIP как услуга Анонс CLIP-as-service: уровень бесплатного пользования Реструктуризация CLIP-as-service и выпуск бесплатного уровня В течение некоторого времени Jina AI размещала бесплатный экземпляр CLIP-as-service — готовую, масштабируемую и надежную реализацию CLIP, которая может генерировать встраивание текста и изображений, предоставлять подписи к изображениям и выполнять множество задач визуального мышления. До сих пор этот сервер был доступен напрямую через cURL или gRPC...

Рост сверточных нейронных сетей в компьютерном зрении
Введение Сверточные нейронные сети (CNN) — это тип алгоритма глубокого обучения, который широко используется в области компьютерного зрения. Они предназначены для анализа визуальных данных, таких как изображения и видео, и могут использоваться для различных задач, включая классификацию изображений, обнаружение объектов и семантическую сегментацию. CNN были вдохновлены структурой и функцией зрительной коры головного мозга человека, и было показано, что они особенно эффективны в задачах,..

СИСТЕМА РЕКОМЕНДАЦИЙ ФИЛЬМОВ — 2-Й СПОСОБ — С ИСХОДНЫМ КОДОМ
В этом блоге мы увидим еще один способ реализации системы рекомендаций фильмов. Этот блог тоже будет очень интересным, так что без дальнейших рассуждений. Простая интуиция этого 2-го способа заключается в том, что мы будем комбинировать основные характеристики, такие как актерский состав, режиссер, жанры и т. д., и наблюдать сходство между ними, потому что большую часть времени одни и те же режиссеры снимают похожие фильмы, похожие актеры любят выступать в некоторых фильмах. подобные..