Публикации по теме 'artificial-intelligence'
Как увеличить пропускную способность запроса LLM на графическом процессоре.
Итак, я спросил на stackoverflow , как увеличить пропускную способность LLM-запроса на GPU, и людям там мой вопрос, похоже, не понравился, поэтому вместо этого я спросил ChatGPT (GPT 4.0). Честно говоря, раньше я думал, что Stackoverflow был намного лучше. :(
Вот ответ от ChatGPT (GPT 4.0) :
Увеличение пропускной способности запросов к большой языковой модели (LLM) при тех же настройках графического процессора может быть достигнуто несколькими способами. Однако обратите внимание, что..
Понимание нейронных касательных ядер, часть 1 (искусственный интеллект)
1. Нейронное касательное ядро: обзор ( arXiv )
Автор : Евгений Голиков , Эдуард Поконечный , Владимир Корвяков
Аннотация: Основополагающая работа [Jacot et al., 2018] продемонстрировала, что обучение нейронной сети при определенной параметризации эквивалентно выполнению определенного метода ядра, поскольку ширина стремится к бесконечности. Эта эквивалентность открыла многообещающее направление для применения результатов богатой литературы по ядерным методам к нейронным..
3 Алгоритмы актер-критик
Это третья статья из серии, в которой я резюмирую лекции с CS285, прочитанные профессором Сергеем Левиным, которому все заслуги принадлежат. Все изображения взяты из его лекций. Эта статья , которую я написал, представляет собой введение в глубокое обучение с подкреплением. Алгоритмы актор-критик основаны на структуре градиента политики, которую мы обсуждали в этой статье . Кроме того, они также дополнены функциями изученного значения и Q-функциями.
Улучшение градиента политики..
6 бесплатных книг по науке о данных для начинающих
Все книги, необходимые для начала, бесплатно
Наука о данных является междисциплинарной областью и требует широкого спектра навыков из нескольких областей, включая информатику, математику, статистику и машинное обучение. Будучи полным новичком в изучении науки о данных, может быть трудно понять, с чего начать.
Программы на получение степени в области науки о данных и учебные лагеря помогут вам пройти структурированный учебный план. Однако, если у вас нет тысяч долларов, чтобы..
Почему ChatGPT — это революция?
ChatGPT появился как революционная технология, изменившая способ взаимодействия с машинами и компьютерами. ChatGPT открыл несколько возможностей в разных отраслях благодаря своей способности генерировать человеческие ответы и вести полноценные беседы.
В этой статье я расскажу, почему chatGPT — это революция.
Раскрытие творчества
Один из замечательных аспектов chatGPT — дать волю творчеству. Он может создавать творческий и уникальный контент с помощью своего сложного алгоритма...
Изучение плюсов и минусов сигмовидной функции активации в нейронных сетях
Сигмовидная функция активации — одна из самых ранних и наиболее часто используемых функций активации в нейронных сетях. Это нелинейная функция, которая сопоставляет любое входное значение со значением от 0 до 1. Сигмовидная функция особенно полезна для задач бинарной классификации, где на выходе нейронной сети должен быть либо 0, либо 1.
В этом посте мы рассмотрим плюсы и минусы использования сигмовидной функции активации в нейронных сетях. Мы рассмотрим ее сильные и слабые стороны и..
Тензоры - представление данных в нейронных сетях
Что вы узнаете?
Тензоры Ключевые атрибуты тензора Примеры тензоров из реального мира
Что такое тензор?
Это контейнер данных, который помогает хранить различные измерения данных в нейронных сетях.
Библиотека машинного обучения Google TensorFlow была названа в их честь.
Скалярные тензоры или тензоры ранга 0 или 0-D
Тензор, содержащий только одно число, называется скаляром. Скалярный тензор имеет 0 осей (ndim == 0) Число осей называется рангом тензора.
Код:..