Публикации по теме 'data-science'


Break Into AI: встреча по анализу настроений @ in5
9 июля 2018 г. в Центре инноваций in5 в Дубае состоится 3-я сессия Break into AI, посвященная искусственному интеллекту, его влиянию и способам создания реальных решений AI. Эти занятия проводятся представителями IBM Cloud Developer Advocates в Дубае. На предыдущих сессиях обсуждалась концепция ИИ и ее отношение к машинному обучению и глубокому обучению, как он влияет на нашу жизнь и где мы взаимодействуем с инструментами ИИ в нашей повседневной жизни. Мы также обсудили алгоритмы,..

GPT-3: Создание анализатора настроений
Создание веб-приложения Sentiment Analyzer с использованием GPT-3 и Streamlit Мы можем понять, как люди относятся к данной теме, используя мощный инструмент анализа настроений. Анализ настроений дает важные сведения о коллективных эмоциях группы, независимо от того, используется ли он для измерения удовлетворенности клиентов продуктом, оценки общественного мнения по политической теме или понимания того, о чем говорят люди. В…

Раскрытие возможностей больших языковых моделей: создание синтетических данных для НЛП
Введение В обработке естественного языка (NLP) доступ к разнообразным и высококачественным наборам данных необходим для обучения эффективных и устойчивых моделей. Тем не менее, получение размеченных данных может быть как дорогостоящим, так и длительным. К счастью, появление передовых языковых моделей, таких как GPT-3.5, предоставило нам мощный ресурс для создания синтетических данных. В этой статье рассматривается потенциал больших языковых моделей в создании синтетических данных для..

Состояние исследований детекторов гамма-излучения, часть 2 (Космология + физика элементарных частиц)
Детектор гамма-излучения и моделирование проекта миссии (arXiv) Автор: Эрик А. Чарльз , Хенрике Флейшхак , Клио Слейтор . Аннотация: Детекторы для гамма-астрономии сложны: они часто включают в себя несколько подсистем и используют новые и/или специально разработанные компоненты детектора и считывающую электронику. Гамма-лучи обычно не обнаруживаются напрямую: наземные детекторы измеряют обширные воздушные ливни заряженных частиц, инициированные космическими гамма-лучами, и даже..

Я выучил классификатор knn, мое объяснение.
K-ближайшие соседи (KNN) — это тип алгоритма обучения с учителем, используемый как для регрессии, так и для классификации. KNN пытается предсказать правильный класс для тестовых данных, вычисляя расстояние между тестовыми данными и всеми точками обучения. Затем выберите количество точек K, которое ближе всего к тестовым данным. Алгоритм KNN вычисляет вероятность того, что тестовые данные принадлежат классам обучающих данных «K», и будет выбран класс с наибольшей вероятностью. В случае..

Вот как сделать Pandas Iteration в 150 раз быстрее
Нет, это не кликбейт. В течение некоторого времени я сомневался в способности Python делать что-то быстро. Посмотрим правде в глаза, о скорости Python по сравнению с другими языками, такими как C или Go, говорят много всякой ерунды. Теперь я попытался заниматься наукой о данных в Go - и это возможно, но даже отдаленно не приятно, как в Python, в основном из-за статической природы языка и науки о данных, являющейся в основном исследовательской областью. Я не говорю, что вы не..

Аналитика данных — это не получение информации
Я провел последнее десятилетие в области анализа данных от генетических исследований до производства. Это заставило меня понять, что аналитика данных — это больше, чем просто получение информации. По сути, это планирование ресурсов. Люди считают аналитику данных важнейшей частью цифровой трансформации, но успех таких проектов падает. Почему мы терпят неудачу в такой важной части всего движения…