Публикации по теме 'data-science'
Готовое портфолио аналитика данных
Анализ данных — это область, которая быстро растет, и поэтому потребность в аналитиках данных возрастает. Однако с ростом числа аналитиков данных на рынке важно выделиться среди потенциальных работодателей. Один из способов сделать это — создать портфолио аналитика данных, демонстрирующее ваши навыки, опыт и прошлые проекты. В этой статье мы обсудим шаги, которые вы можете предпринять для создания эффективного портфолио аналитика данных.
Шаг 1: Определите свои цели и целевую..
Введение в анализ данных
Нежное введение в анализ данных с точки зрения новичка
Пролог
Я начинающий специалист по данным с академическим образованием в области биомедицинской инженерии. Я люблю решать проблемы, используя данные. Поэтому я написал эту статью, чтобы познакомить с анализом данных студентов с нетехническим образованием.
Кто должен читать?
Эта статья предназначена для студентов, не имеющих предварительных знаний в области программирования. Кроме того, эта статья будет полезна студентам,..
Практическая многоцелевая классификация с использованием Python
Практическая многоцелевая классификация с использованием Python
Обзор подходов, показателей оценки и лучших практик
Введение
В настоящее время я работаю над разработкой алгоритма машинного обучения, способного идентифицировать различные типы повреждений, обнаруженных в зданиях. Повреждения не все одинаковы, у каждого из них разные причины и риски, поэтому мы выделили около 4 разных типов переломов. Затем алгоритм будет развернут на беспилотнике, который автоматически будет..
Решение проблемы дисбаланса классов — часть 1/4
Обучение на несбалансированных данных — понимание проблемы и выбор подходящих методов для ее смягчения.
Известно, что проблема дисбаланса классов значительно ухудшает эффективность классификации и привлекает все большее внимание исследователей. Чтобы применить на практике текущие стратегии смягчения последствий и создать новые, крайне важно понять, как проблема дисбаланса классов проявляется в наборе данных.
Здравствуйте, читатели Медиума! Наконец-то я нашел время и набрался..
Полное руководство по кластеризации методом K-средних: Часть 2. Программирование с нуля
В этом выпуске серии из 3 частей мы шаг за шагом рассмотрим все, что вам нужно знать, чтобы понять кластеризацию K-средних:
Часть 1: Основы
Основы: понимание кластеризации, евклидовых расстояний и т. д. Интуиция: визуальное пошаговое руководство по K-средним в действии
Часть 2: Кодирование алгоритма с нуля
Алгоритм: формальный обзор Реализация кода: реализация Python с нуля
Часть 3: Реальная реализация
Вывод: использование K-Means от scikit для сжатия изображений
Не..
Постдокторский научный сотрудник Мика Голдблюм публикует статью в журнале Applied Research Capital One…
В документе подчеркивается эффективность совместных инноваций и содержится информация о будущем машинного обучения.
Постдокторский научный сотрудник CDS Мика Голдблюм недавно опубликовал исследовательскую работу под названием Перенос обучения с помощью глубоких табличных моделей в сотрудничестве с Группой прикладных исследований Capital One , которая использует искусственный интеллект для улучшения своих финансовых услуг и поддерживает отношения сотрудничества с CDS. Голдблюм..
Ансамбль LLM с LLM-Blender
✨ LLM-Blender: объединение больших языковых моделей с попарным ранжированием и генеративным слиянием ✨
Дунфу Цзян, Сян Рен и Билл Ючен Лин.
LLM-Blender — это ансамблевая структура, предназначенная для достижения стабильно высокой производительности за счет использования разнообразных сильных сторон нескольких моделей больших языков с открытым исходным кодом (LLM).
Есть ли необходимость в сборке LLM?
LLM с открытым исходным кодом демонстрируют различные сильные и слабые стороны..