Публикации по теме 'data-science'


Готовое портфолио аналитика данных
Анализ данных — это область, которая быстро растет, и поэтому потребность в аналитиках данных возрастает. Однако с ростом числа аналитиков данных на рынке важно выделиться среди потенциальных работодателей. Один из способов сделать это — создать портфолио аналитика данных, демонстрирующее ваши навыки, опыт и прошлые проекты. В этой статье мы обсудим шаги, которые вы можете предпринять для создания эффективного портфолио аналитика данных. Шаг 1: Определите свои цели и целевую..

Введение в анализ данных
Нежное введение в анализ данных с точки зрения новичка Пролог Я начинающий специалист по данным с академическим образованием в области биомедицинской инженерии. Я люблю решать проблемы, используя данные. Поэтому я написал эту статью, чтобы познакомить с анализом данных студентов с нетехническим образованием. Кто должен читать? Эта статья предназначена для студентов, не имеющих предварительных знаний в области программирования. Кроме того, эта статья будет полезна студентам,..

Практическая многоцелевая классификация с использованием Python
Практическая многоцелевая классификация с использованием Python Обзор подходов, показателей оценки и лучших практик Введение В настоящее время я работаю над разработкой алгоритма машинного обучения, способного идентифицировать различные типы повреждений, обнаруженных в зданиях. Повреждения не все одинаковы, у каждого из них разные причины и риски, поэтому мы выделили около 4 разных типов переломов. Затем алгоритм будет развернут на беспилотнике, который автоматически будет..

Решение проблемы дисбаланса классов — часть 1/4
Обучение на несбалансированных данных — понимание проблемы и выбор подходящих методов для ее смягчения. Известно, что проблема дисбаланса классов значительно ухудшает эффективность классификации и привлекает все большее внимание исследователей. Чтобы применить на практике текущие стратегии смягчения последствий и создать новые, крайне важно понять, как проблема дисбаланса классов проявляется в наборе данных. Здравствуйте, читатели Медиума! Наконец-то я нашел время и набрался..

Полное руководство по кластеризации методом K-средних: Часть 2. Программирование с нуля
В этом выпуске серии из 3 частей мы шаг за шагом рассмотрим все, что вам нужно знать, чтобы понять кластеризацию K-средних: Часть 1: Основы Основы: понимание кластеризации, евклидовых расстояний и т. д. Интуиция: визуальное пошаговое руководство по K-средним в действии Часть 2: Кодирование алгоритма с нуля Алгоритм: формальный обзор Реализация кода: реализация Python с нуля Часть 3: Реальная реализация Вывод: использование K-Means от scikit для сжатия изображений Не..

Постдокторский научный сотрудник Мика Голдблюм публикует статью в журнале Applied Research Capital One…
В документе подчеркивается эффективность совместных инноваций и содержится информация о будущем машинного обучения. Постдокторский научный сотрудник CDS Мика Голдблюм недавно опубликовал исследовательскую работу под названием Перенос обучения с помощью глубоких табличных моделей в сотрудничестве с Группой прикладных исследований Capital One , которая использует искусственный интеллект для улучшения своих финансовых услуг и поддерживает отношения сотрудничества с CDS. Голдблюм..

Ансамбль LLM с LLM-Blender
✨ LLM-Blender: объединение больших языковых моделей с попарным ранжированием и генеративным слиянием ✨ Дунфу Цзян, Сян Рен и Билл Ючен Лин. LLM-Blender — это ансамблевая структура, предназначенная для достижения стабильно высокой производительности за счет использования разнообразных сильных сторон нескольких моделей больших языков с открытым исходным кодом (LLM). Есть ли необходимость в сборке LLM? LLM с открытым исходным кодом демонстрируют различные сильные и слабые стороны..