Вопросы по теме 'rdd'

Spark scala RDD обход
Как я могу пройти по RDD, используя Spark scala. Я хочу напечатать каждое значение, присутствующее в Seq, с соответствующим ключом res1: org.apache.spark.rdd.RDD[(java.lang.String, Seq[java.lang.String])] = MapPartitionsRDD[6] at groupByKey at...
1219 просмотров
schedule 05.05.2024

Сделать RDD из списка в scala&spark
Исходные данные ID, NAME, SEQ, NUMBER A, John, 1, 3 A, Bob, 2, 5 A, Sam, 3, 1 B, Kim, 1, 4 B, John, 2, 3 B, Ria, 3, 5 Чтобы составить список групп ID, я сделал ниже val MapRDD = originDF.map { x => (x.getAs[String](colMap.ID), List(x))...
1192 просмотров
schedule 18.03.2024

Добавить запись в RDD с помощью цикла
Я пытаюсь добавить запись в существующий RDD на каждой итерации цикла. Мой код до сих пор: var newY = sc.emptyRDD[MatrixEntry] for (j <- 0 until 8000) { var arrTmp = Array(MatrixEntry(j, j, 1)) var rddTmp = sc.parallelize(arrTmp) newY =...
744 просмотров
schedule 30.04.2024