Это видео представляет собой подробный технический обзор демонстрации, представленной на https://youtu.be/I_hqzdqQ5vE, где я запускаю многоязычные голосовые запросы к финансовым документам, используя две современные модели Transformer для преобразования речи в текст и семантического поиска в менее 100 строк Python:

— Подготовка набора данных на основе файлов SEC, загруженных с помощью AWS SDK. Подробнее см. https://youtu.be/SU1L6f0N6iw.

— Эксперимент в блокноте Jupyter, доступен по адресу https://gitlab.com/juliensimon/huggingface-demos/-/tree/main/voice-queries.

— Реализация приложения Hugging Face Spaces, доступного по адресу https://huggingface.co/spaces/juliensimon/voice-queries.