Публикации по теме 'nlp'


Выполнение многоязычных голосовых запросов к финансовым документам
Это видео представляет собой подробный технический обзор демонстрации, представленной на https://youtu.be/I_hqzdqQ5vE , где я запускаю многоязычные голосовые запросы к финансовым документам, используя две современные модели Transformer для преобразования речи в текст и семантического поиска в менее 100 строк Python: — Подготовка набора данных на основе файлов SEC, загруженных с помощью AWS SDK. Подробнее см. https://youtu.be/SU1L6f0N6iw . — Эксперимент в блокноте Jupyter, доступен по..

WordPiece: алгоритм токенизации на основе подслов
Понимание алгоритма токенизации на основе подслов, используемого в современных моделях НЛП - WordPiece За последние несколько лет появилось много шума в области ИИ и особенно НЛП. 😎 Понимание и анализ человеческого языка - это не только сложная задача, но и увлекательная. Человеческий язык выглядит простым, но очень сложным, поскольку даже короткий текст может содержать ссылки как на личную жизнь, так и на внешний мир. 🧐 Эта сложность приносит много проблем. Исследователи во всем..

Your Daily AI Research tl;dr — 2022–09–20 🧠
Библиотека для языкового зрения, генерации естественного языка в несколько выстрелов и ECCV! Добро пожаловать в ваш официальный ежедневный исследовательский tl;dr (часто с кодом и новостями) для профессионалов в области ИИ, где я делюсь самыми интересными статьями, которые я нахожу ежедневно, а также однострочным резюме, которое поможет вам быстро определить, является ли статья (и код) является…

Что такое аннотация текстовых данных?
Аннотация текстовых данных Текст является наиболее часто используемым типом данных. Аннотации данных текста включают в себя различные аннотации, такие как настроение, намерение, атрибут, отношение, сущность, категория и поиск. Целью текстовых аннотаций является помощь машинам в понимании естественного человеческого языка. Целями являются ключевые слова, символы, фразы или предложения и даже подразумеваемые эмоции. Таким образом, машины учатся распознавать человеческие намерения или..

Вложение слов
Гостевая статья Моны Шриваставы В этой статье рассказывается о концепции встраивания слов и о том, как разработать и обучить модель встраивания слов для приложений НЛП на Python с помощью Gensim. Что такое встраивание слов? Встраивание слов - это тип представления слов, который позволяет словам с одинаковым значением иметь одинаковое представление. Это улучшение по сравнению с моделью Bag-Of-Words. В модели «мешок слов» кодирование слов приводит к большим и разреженным векторам,..

Введение в ChatGPT: Часть 1. Понимание основ языковой модели OpenAI
ChatGPT — это современная модель обработки естественного языка (NLP), разработанная OpenAI. Его способность генерировать человеческие ответы на ввод текста делает его идеальным для различных приложений, от чат-ботов и виртуальных помощников до языкового перевода и генерации текста. В этой серии из трех частей мы представляем всесторонний обзор ChatGPT, изучаем его архитектуру, приложения и перспективы на будущее. В части 1 мы углубимся в основы ChatGPT и в то, как он работает. Что..

Достижения в области обработки естественного языка (NLP) и будущие ожидания
Введение: Обработка естественного языка (NLP) стала революционной областью искусственного интеллекта, которая позволяет компьютерам понимать, интерпретировать и взаимодействовать с человеческим языком. За прошедшие годы NLP добился значительных успехов, включая прорывы в глубоком обучении и моделях на основе преобразователей, таких как BERT и GPT-3. Эти достижения не только изменили то, как мы общаемся с машинами, но и открыли новые возможности в различных секторах, включая обслуживание..