Публикации по теме 'data-engineering'


Внедрение приложения для управления задачами — Часть №1
В этой серии статей я буду реализовывать приложение для управления задачами на Python. Эта серия будет охватывать весь путь, начиная от сбора требований к приложению и заканчивая реализацией серверной (Python, PostgreSQL) и внешней (Flask) частей приложения. В первой статье проект будет следовать простому 5-этапному подходу к проектированию ООП-систем. Шаги: Соберите требования. Создавайте варианты использования и пользовательские истории. Определите наиболее важные объекты...

Архитектура озера данных: гибкий и масштабируемый подход к современному управлению данными
Введение В эпоху больших данных предприятия генерируют беспрецедентный объем данных из различных источников. Традиционные системы управления данными с трудом справляются с постоянно растущим объемом, скоростью и разнообразием данных. В ответ на эти вызовы концепция озера данных стала революционным подходом к современной архитектуре данных. Озеро данных — это централизованный репозиторий, в котором хранятся огромные объемы необработанных, неструктурированных, полуструктурированных и..

Расширение возможностей управления данными с помощью Google Cloud Platform: раскрытие возможностей Data Lakehouse
Введение В современном мире, управляемом данными, организации сталкиваются с проблемой управления и анализа больших объемов данных из разных источников. Чтобы преодолеть эту проблему, концепция хранилища данных стала мощным решением. В этой статье мы рассмотрим, как мы использовали технологии Google Cloud Platform (GCP) для создания надежного хранилища данных. Наша архитектура включает сервисы GCP, такие как Datastream, GCS, BigQuery (Biglake), Cloud Composer, Dataproc, Dataplex и Data..