Публикации по теме 'nlp'
Ансамбль LLM с LLM-Blender
✨ LLM-Blender: объединение больших языковых моделей с попарным ранжированием и генеративным слиянием ✨
Дунфу Цзян, Сян Рен и Билл Ючен Лин.
LLM-Blender — это ансамблевая структура, предназначенная для достижения стабильно высокой производительности за счет использования разнообразных сильных сторон нескольких моделей больших языков с открытым исходным кодом (LLM).
Есть ли необходимость в сборке LLM?
LLM с открытым исходным кодом демонстрируют различные сильные и слабые стороны..
Могут ли машины определить теорию заговора?
Научное исследование данных онлайн-дискурса с помощью анализа естественного языка сообществ субреддитов
TL;DR: смотрите репо здесь!
Фон
Лично я являюсь давним пользователем популярной «Главной страницы Интернета», также известной как Reddit.com. Что мне больше всего нравится на этом веб-сайте, так это огромный объем мыслей и мнений по любому вообразимому вопросу. Когда я изучал философию в бакалавриате, я проводил немало времени в субреддите r/AskPhilosophy , где люди..
Тенденции ИИ 2022 — IV — Усиленное обучение
Усиленное обучение — это ветвь машинного обучения, в которой специалисты по обработке и анализу данных фокусируются на принятии решений и обучении на основе вознаграждения. Обучение с подкреплением работает, изучая окружающую среду и корректируя ее поведение, чтобы максимизировать вознаграждение. Это имитирует то, как мы учимся: мы не всегда получаем положительное подкрепление, делаем ошибки и идем путем проб и ошибок, чтобы достичь своих целей.
Обучение с подкреплением широко..
ChatGPT — революционный продукт , но он вычисляет по одному слову за раз
Получение краткого ответа на веб-поиск намного предпочтительнее, чем поисковая система, возвращающая длинный список результатов поиска. ChatGPT дает представление о том, как может выглядеть поисковая система будущего. Основываясь на активном использовании платформы за последние несколько месяцев, я должен сказать, что этот новый способ поиска ежедневно экономит мне массу времени. Только в нескольких случаях я вернусь к использованию поиска Google, и каждый раз, когда я это делаю, я хочу,..
Еженедельный обзор arXiv #10
Приветствую, Среднее сообщество,
В этом выпуске представлены публикации, опубликованные на arXiv с 27 мая по 2 июня, и представлены идеи и анализ наиболее значимых исследований и тенденций.
Давайте погрузимся!
Обнаружение контекстных объектов с мультимодальными моделями больших языков
Мультимодальные модели больших языков улучшают качество обнаружения визуальных отношений.
Недавние мультимодальные модели большого языка (MLLM) замечательно справляются с задачами языка зрения,..
Выполнение многоязычных голосовых запросов к финансовым документам
Это видео представляет собой подробный технический обзор демонстрации, представленной на https://youtu.be/I_hqzdqQ5vE , где я запускаю многоязычные голосовые запросы к финансовым документам, используя две современные модели Transformer для преобразования речи в текст и семантического поиска в менее 100 строк Python:
— Подготовка набора данных на основе файлов SEC, загруженных с помощью AWS SDK. Подробнее см. https://youtu.be/SU1L6f0N6iw .
— Эксперимент в блокноте Jupyter, доступен по..
WordPiece: алгоритм токенизации на основе подслов
Понимание алгоритма токенизации на основе подслов, используемого в современных моделях НЛП - WordPiece
За последние несколько лет появилось много шума в области ИИ и особенно НЛП. 😎 Понимание и анализ человеческого языка - это не только сложная задача, но и увлекательная. Человеческий язык выглядит простым, но очень сложным, поскольку даже короткий текст может содержать ссылки как на личную жизнь, так и на внешний мир. 🧐 Эта сложность приносит много проблем. Исследователи во всем..