Статьи по теме artificial-intelligence

Публикации по теме 'artificial-intelligence'

Как увеличить пропускную способность запроса LLM на графическом процессоре.

Итак, я спросил на stackoverflow , как увеличить пропускную способность LLM-запроса на GPU, и людям там мой вопрос, похоже, не понравился, поэтому вместо этого я спросил ChatGPT (GPT 4.0). Честно говоря, раньше я думал, что Stackoverflow был намного лучше. :( Вот ответ от ChatGPT (GPT 4.0) : Увеличение пропускной способности запросов к большой языковой модели (LLM) при тех же настройках графического процессора может быть достигнуто несколькими способами. Однако обратите внимание, что..

Понимание нейронных касательных ядер, часть 1 (искусственный интеллект)

1. Нейронное касательное ядро: обзор ( arXiv ) Автор : Евгений Голиков , Эдуард Поконечный , Владимир Корвяков Аннотация: Основополагающая работа [Jacot et al., 2018] продемонстрировала, что обучение нейронной сети при определенной параметризации эквивалентно выполнению определенного метода ядра, поскольку ширина стремится к бесконечности. Эта эквивалентность открыла многообещающее направление для применения результатов богатой литературы по ядерным методам к нейронным..

3 Алгоритмы актер-критик

Это третья статья из серии, в которой я резюмирую лекции с CS285, прочитанные профессором Сергеем Левиным, которому все заслуги принадлежат. Все изображения взяты из его лекций. Эта статья , которую я написал, представляет собой введение в глубокое обучение с подкреплением. Алгоритмы актор-критик основаны на структуре градиента политики, которую мы обсуждали в этой статье . Кроме того, они также дополнены функциями изученного значения и Q-функциями. Улучшение градиента политики..

6 бесплатных книг по науке о данных для начинающих

Все книги, необходимые для начала, бесплатно Наука о данных является междисциплинарной областью и требует широкого спектра навыков из нескольких областей, включая информатику, математику, статистику и машинное обучение. Будучи полным новичком в изучении науки о данных, может быть трудно понять, с чего начать. Программы на получение степени в области науки о данных и учебные лагеря помогут вам пройти структурированный учебный план. Однако, если у вас нет тысяч долларов, чтобы..

Почему ChatGPT — это революция?

ChatGPT появился как революционная технология, изменившая способ взаимодействия с машинами и компьютерами. ChatGPT открыл несколько возможностей в разных отраслях благодаря своей способности генерировать человеческие ответы и вести полноценные беседы. В этой статье я расскажу, почему chatGPT — это революция. Раскрытие творчества Один из замечательных аспектов chatGPT — дать волю творчеству. Он может создавать творческий и уникальный контент с помощью своего сложного алгоритма...

Изучение плюсов и минусов сигмовидной функции активации в нейронных сетях

Сигмовидная функция активации — одна из самых ранних и наиболее часто используемых функций активации в нейронных сетях. Это нелинейная функция, которая сопоставляет любое входное значение со значением от 0 до 1. Сигмовидная функция особенно полезна для задач бинарной классификации, где на выходе нейронной сети должен быть либо 0, либо 1. В этом посте мы рассмотрим плюсы и минусы использования сигмовидной функции активации в нейронных сетях. Мы рассмотрим ее сильные и слабые стороны и..

Тензоры - представление данных в нейронных сетях

Что вы узнаете? Тензоры Ключевые атрибуты тензора Примеры тензоров из реального мира Что такое тензор? Это контейнер данных, который помогает хранить различные измерения данных в нейронных сетях. Библиотека машинного обучения Google TensorFlow была названа в их честь. Скалярные тензоры или тензоры ранга 0 или 0-D Тензор, содержащий только одно число, называется скаляром. Скалярный тензор имеет 0 осей (ndim == 0) Число осей называется рангом тензора. Код:..