Статьи по теме computer-vision

Публикации по теме 'computer-vision'

Сверточные нейронные сети (CNN)

Слой свертки — это первый слой для извлечения признаков из входного изображения. Изучая особенности изображения с помощью небольшого квадрата входных данных, сверточный слой сохраняет взаимосвязь между пикселями. Это математическая операция, которая принимает два входа, таких как матрица изображения и ядро или фильтр. Размер матрицы изображения: h×w×d . Размер фильтра: fh×fw×d . Размер вывода: (h-fh+1)×(w-fw+1)×1 . Давайте начнем с рассмотрения изображения 5 * 5, значения..

Советы и рекомендации FiftyOne по компьютерному зрению — 30 сентября 2022 г.

Добро пожаловать в наш еженедельный блог с советами и рекомендациями FiftyOne, где мы резюмируем интересные вопросы и ответы, недавно появившиеся на Slack , GitHub , Stack Overflow и Reddit. Подождите, а что такое FiftyOne? FiftyOne — это набор инструментов машинного обучения с открытым исходным кодом, который позволяет группам специалистов по обработке и анализу данных повышать производительность своих моделей компьютерного зрения, помогая им выбирать высококачественные наборы..

Stereo Vision: создание карты глубины с нуля!

Добро пожаловать во вторую часть этой серии! Теперь, когда мы понимаем концепцию Stereo Vision (Часть 1) , давайте, наконец, перейдем к созданию нашей карты глубины. Давай запустим эту камеру! Все скрипты, которые мы будем использовать в этом руководстве, написаны на Python. Для начала клонируем мой репозиторий StereoVision . Требования Если вы еще не настроили свой Jetson Nano, посетите этот сайт . Предполагая, что ваш Jetson Nano настроен и работает, давайте установим..

Распознавание рукописного ввода с использованием глубокого обучения

Проект UTMIST Джастина Трана, Фернандо Асада, Киары Чонг, Армаана Лалани и Ишана Нарулы. Введение Распознавание рукописного текста — давно изучаемая проблема машинного обучения, при этом одним из самых известных наборов данных является MNIST [1] для рукописных цифр. Хотя распознавание отдельных цифр является решаемой проблемой, ученые ищут способы одновременного распознавания всего корпуса текста, поскольку это упрощает оцифровку документов. Мы представляем решение этой проблемы..

Как Луиджи познакомил меня с ИИ

Мне было 6 лет, когда я получил свою первую приставку Nintendo DS. Не DSI (да тот, с камерой 😔). И не 3DS (тоже с камерой). Моей любимой игрой на моем DS была Матч памяти Super Mario Bros. Вот как Луиджи объясняет игру: «Выберите две совпадающие карты, чтобы они исчезли. Очистите все карты, чтобы выиграть. Если вы сделаете три ошибки, Луиджи выиграет ». Позвольте мне сделать кое-что очень быстрое: Я был ужасен в этой игре. Луиджи украл все мои деньги из-за многократных..

Классификация видео с использованием глубоких нейронных сетей

Обучение компьютеров классификации видео Содержание Введение Мотивация Предпосылки Понимание и подготовка данных Извлечение видеокадров Создание набора данных для обучения и тестирования Модельная архитектура и обучение Оценка Заключение и дальнейшая работа использованная литература 1. Введение Видео можно определить как серию изображений / кадров, извлеченных за период времени, что вводит новое измерение в кадры / изображения во временном направлении. Чтобы..