Публикации по теме 'artificial-intelligence'
Изучение потоковой передачи PySpark: преобразования и приложения для обработки данных в реальном времени
PySpark Streaming: преобразование потоковых данных для анализа в реальном времени
вступление
В PySpark DStreams (дискретизированные потоки) — это фундаментальная абстракция, предоставляемая Spark Streaming для обработки потоков данных в реальном времени. DStreams представляет собой последовательность RDD (устойчивых распределенных наборов данных), где каждый RDD содержит данные за определенный интервал времени.
В PySpark доступны различные преобразования для DStream, которые..