Статьи по теме data-science

Публикации по теме 'data-science'

Новый выпуск обновления Scikit-Learn V.1.1.0

Захватывающее обновление от Scikit-Learn Scikit-Learn — это основной пакет машинного обучения для специалистов по данным, использующих среду Python. Пакет предлагает множество полезных API для использования в нашей повседневной работе. В мае 2022 года Scikit-Learn выпустила новое обновление V.1.1.0, которое предлагает различные интересные обновления функций. Какие обновления? Давайте углубимся в это. Тем не менее, пожалуйста, обновите Scikit-Learn до последней версии, прежде..

Новое исследование скалярной темной материи, часть 1 (Космология)

Новое окно в гравитационно созданную скалярную темную материю (arXiv) Автор: Маркос А. Г. Гарсия , Матиас Пьер , Сарунас Вернер . Аннотация: Обычные сценарии чисто гравитационного происхождения темной материи с массами ниже параметра Хаббла в конце инфляции противоречат ограничениям космического микроволнового фона (CMB) на изокривизну спектра мощности. Мы исследуем более общий сценарий с неминимальной связью между скалярным полем темной материи и гравитацией, который допускает..

Data Engineer vs Data Scientist: роли и обязанности

Прошло не так много времени с тех пор, как начался разговор о различиях между учеными и инженерами данных. Область, которая раньше была одной из самых неоднозначных в технологиях, с каждым годом становится все более популярной. Позиции, роли, обязанности еще созревают. Однако основные отличия уже ясно проявились. В этой статье мы поделимся нашим опытом по сбору команд по науке о данных и разработке данных и дадим представление об их реальных должностных обязанностях и ролях. Почему..

TensorFlow 2.0: API tf.data

Если вы помните время, когда в TensorFlow 1.x были доступны только очереди в качестве структуры данных для конвейера ETL (извлечение / преобразование / загрузка), и как иногда было сложно управлять некоторыми ограничениями и неявными ловушками . Но ТЕПЕРЬ есть очень успешный модуль, который организует весь конвейер ETL : tf.data . Я хочу кратко рассказать об использовании tf.data API. tf.data работает с разными типами входных данных: CSV NumPy Текст Картинки..

Обнимание наборов данных лиц: краткое введение в легкий доступ к данным и исследование

В прошлом посте я писал про Обнимание лица моделей. Иногда вам не хватает наборов данных. Итак, в этом кратком руководстве я подробно расскажу, как использовать наборы данных Hugging face. Hugging Face Datasets — это мощная библиотека, которая упрощает доступ к данным, их исследование и предварительную обработку для задач машинного обучения. С наборами данных Hugging Face вы можете легко загружать и манипулировать широким спектром наборов данных, что делает его незаменимым..

Беседа о карьере с учеными данных

На протяжении многих лет были написаны книги о карьерном росте программистов. Но специалистам по данным не хватает хороших и структурированных советов по карьере. Давайте это изменим! Я ловлю себя на том, что читаю советы по карьере в области разработки программного обеспечения и беру те части, которые применимы к науке о данных. Я также расспрашиваю других специалистов по данным об их карьерном росте и выборе. Но это кажется неоптимальным процессом, который может повторить..

Уловка Pandas # 1 - Измените количество строк по умолчанию, возвращаемых из метода head

Метод pandas DataFrame head по умолчанию возвращает первые 5 строк. Это контролируется параметром n . В этом трюке мы будем использовать partialmethod из стандартной библиотеки functools , чтобы установить n на другое число. Этот трюк доступен на YouTube-канале Dunder Data (подписывайтесь!) . Стать экспертом Если вы хотите, чтобы вам доверяли принимать решения с помощью панд, вы должны стать экспертом. Я полностью освоил pandas и разработал курсы и упражнения, которые..