Публикации по теме 'nlp'


Ансамбль LLM с LLM-Blender
✨ LLM-Blender: объединение больших языковых моделей с попарным ранжированием и генеративным слиянием ✨ Дунфу Цзян, Сян Рен и Билл Ючен Лин. LLM-Blender — это ансамблевая структура, предназначенная для достижения стабильно высокой производительности за счет использования разнообразных сильных сторон нескольких моделей больших языков с открытым исходным кодом (LLM). Есть ли необходимость в сборке LLM? LLM с открытым исходным кодом демонстрируют различные сильные и слабые стороны..

Могут ли машины определить теорию заговора?
Научное исследование данных онлайн-дискурса с помощью анализа естественного языка сообществ субреддитов TL;DR: смотрите репо здесь! Фон Лично я являюсь давним пользователем популярной «Главной страницы Интернета», также известной как Reddit.com. Что мне больше всего нравится на этом веб-сайте, так это огромный объем мыслей и мнений по любому вообразимому вопросу. Когда я изучал философию в бакалавриате, я проводил немало времени в субреддите r/AskPhilosophy , где люди..

Тенденции ИИ 2022 — IV — Усиленное обучение
Усиленное обучение — это ветвь машинного обучения, в которой специалисты по обработке и анализу данных фокусируются на принятии решений и обучении на основе вознаграждения. Обучение с подкреплением работает, изучая окружающую среду и корректируя ее поведение, чтобы максимизировать вознаграждение. Это имитирует то, как мы учимся: мы не всегда получаем положительное подкрепление, делаем ошибки и идем путем проб и ошибок, чтобы достичь своих целей. Обучение с подкреплением широко..

ChatGPT — революционный продукт , но он вычисляет по одному слову за раз
Получение краткого ответа на веб-поиск намного предпочтительнее, чем поисковая система, возвращающая длинный список результатов поиска. ChatGPT дает представление о том, как может выглядеть поисковая система будущего. Основываясь на активном использовании платформы за последние несколько месяцев, я должен сказать, что этот новый способ поиска ежедневно экономит мне массу времени. Только в нескольких случаях я вернусь к использованию поиска Google, и каждый раз, когда я это делаю, я хочу,..

Еженедельный обзор arXiv #10
Приветствую, Среднее сообщество, В этом выпуске представлены публикации, опубликованные на arXiv с 27 мая по 2 июня, и представлены идеи и анализ наиболее значимых исследований и тенденций. Давайте погрузимся! Обнаружение контекстных объектов с мультимодальными моделями больших языков Мультимодальные модели больших языков улучшают качество обнаружения визуальных отношений. Недавние мультимодальные модели большого языка (MLLM) замечательно справляются с задачами языка зрения,..

Выполнение многоязычных голосовых запросов к финансовым документам
Это видео представляет собой подробный технический обзор демонстрации, представленной на https://youtu.be/I_hqzdqQ5vE , где я запускаю многоязычные голосовые запросы к финансовым документам, используя две современные модели Transformer для преобразования речи в текст и семантического поиска в менее 100 строк Python: — Подготовка набора данных на основе файлов SEC, загруженных с помощью AWS SDK. Подробнее см. https://youtu.be/SU1L6f0N6iw . — Эксперимент в блокноте Jupyter, доступен по..

WordPiece: алгоритм токенизации на основе подслов
Понимание алгоритма токенизации на основе подслов, используемого в современных моделях НЛП - WordPiece За последние несколько лет появилось много шума в области ИИ и особенно НЛП. 😎 Понимание и анализ человеческого языка - это не только сложная задача, но и увлекательная. Человеческий язык выглядит простым, но очень сложным, поскольку даже короткий текст может содержать ссылки как на личную жизнь, так и на внешний мир. 🧐 Эта сложность приносит много проблем. Исследователи во всем..