Привет всем, это мой первый блог, я надеюсь, вам понравится этот блог, и в этом блоге я делюсь своими знаниями, основанными на моем опыте в области науки о данных.

Таким образом, в любом сквозном жизненном цикле проекта Data Science инженер данных, аналитик данных, инженер по машинному обучению и специалист по данным играют важную роль.

Типы работ в жизненном цикле проекта Data Science:

· Сбор данных: сбор данных из различных ресурсов, таких как внутренние или внешние, в хранилище данных или внутри экосистемы проекта.

· Очистка данных: преобразование необработанных данных в информативные путем очистки зашумленных данных.

· Анализ данных: получение осмысленных выводов из данных и преобразование их в знания.

· Построение модели: преобразуйте знания в интеллект для решения проблем будущих событий.

· Развертывание модели: развертывание модели в среде реального времени для прогнозирования будущих событий.

Роли/обязанности:

· Инженер данных. Инженер данных в основном связан с начальными двумя фазами жизненного цикла любого проекта по науке о данных, т. е. данными сбором из разных баз данных/данных. источники и создать хранилище данных / экосистему, куда будут поступать данные, чтобы они были легко применимы и доступны для аналитика данных и специалиста по данным или инженера по машинному обучению, они также должны убедиться, что они будут обновлять системы новыми версиями и повышать эффективность баз данных, просто вы можете сказать, что Data Engineer предоставляет вам необработанные данные, которые в некоторой степени очищаются.

· Аналитик данных. Аналитик данных в основном связан с двумя этапами жизненного цикла проекта по науке о данных, т. е. Очистка данных и Анализ данных. Аналитик данных разбирается в бизнесе. определение проблемы, а также знает, какую проблему они собираются решать/решать. Аналитик данных извлекает данные из базы данных и очищает эти данные, а затем анализирует их с помощью инструментов для создания отчетов/панелей мониторинга, чтобы продемонстрировать информацию из данных заинтересованным сторонам или клиентам.

· Инженер по машинному обучению. Инженер по машинному обучению в основном связан с двумя последними фазами жизненного цикла проекта Data Science, т.е. Построение модели и Развертывание модели, Инженеры по машинному обучению используют алгоритмы машинного обучения, чтобы использовать возможности машинного обучения для создания надежных моделей, которые могут принимать решения и превращать эти решения в действия путем их развертывания.

· Ученый по данным. Специалист по данным может быть связан со всеми этапами жизненного цикла проекта по науке о данных, такими как очистка данных, анализ данных, построение модели, развертывание модели, но это зависит от На уровне организации можно сказать, что Data Scientist представляет собой сочетание ролей и обязанностей аналитика данных и инженера по машинному обучению.

Спасибо, что читаете этот блог, если он вам нравится, поделитесь им и продолжайте поддерживать его.