久久r热视频,国产午夜精品一区二区三区视频,亚洲精品自拍偷拍,欧美日韩精品二区

您的位置:首頁技術(shù)文章
文章詳情頁

JAVA spark創(chuàng)建DataFrame的方法

瀏覽:5日期:2022-08-25 17:52:40

述說正傳,接下來開始說正事。

以前用Python和Scala操作Spark的時候比較多,畢竟Python和Scala代碼寫起來要簡潔很多。

今天一起來看看Java版本怎么創(chuàng)建DataFrame,代碼寫起來其實差不多,畢竟公用同一套API。測試數(shù)據(jù)可以參考我之前的文章。

先來總結(jié)下Spark的一般流程:

1,先創(chuàng)建Spark基礎(chǔ)變量,spark,sc

2,加載數(shù)據(jù),rdd.textFile,spark.read.csv/json等

3,數(shù)據(jù)處理,mapPartition, map,filter,reduce等一系列transformation操作

4,數(shù)據(jù)保存,saveAstextFile,或者其他DataFrame方法

祭出代碼

package dev.java;import dev.utils.Utils;import org.apache.spark.api.java.JavaRDD;import org.apache.spark.api.java.JavaSparkContext;import org.apache.spark.sql.Dataset;import org.apache.spark.sql.Row;import org.apache.spark.sql.RowFactory;import org.apache.spark.sql.SparkSession;import org.apache.spark.sql.types.StructType;import scala.Tuple2;import java.util.List;public class Spark1 { private static final String fileData = 'seed'; private static final String fileSave = 'result'; private static SparkSession spark = SparkSession.builder().appName('Java-Spark').master('local[*]').config('spark.default.parallelism', 100).config('spark.sql.shuffle.partitions', 100).config('spark.driver.maxResultSize', '3g').getOrCreate(); private static JavaSparkContext sc = JavaSparkContext.fromSparkContext(spark.sparkContext()); public static void main(String[] args) { Utils.delete(fileSave); // t1(); } private static void t1() { JavaRDD<Row> rdd = sc.textFile(fileData).map(v -> { String[] parts = v.split('t'); return RowFactory.create(parts[0], Long.parseLong(parts[1]));}).filter(v -> v.getLong(1) >= 10000).sortBy(v -> v.getLong(1), false, 100).coalesce(2); Dataset<Row> df = spark.createDataFrame(rdd, StructType.fromDDL('title string, qty long')); df.write().csv(fileSave); spark.stop(); }}

以上就是JAVA操作spark創(chuàng)建DataFrame的方法的詳細(xì)內(nèi)容,更多關(guān)于JAVA Spark 創(chuàng)建DataFrame的資料請關(guān)注好吧啦網(wǎng)其它相關(guān)文章!

標(biāo)簽: Java
相關(guān)文章:
主站蜘蛛池模板: 呈贡县| 高密市| 醴陵市| 达拉特旗| 乐至县| 东莞市| 咸宁市| 五河县| 游戏| 宣恩县| 五大连池市| 连平县| 江城| 隆昌县| 敖汉旗| 修武县| 石屏县| 通化市| 廉江市| 吉隆县| 和田县| 柳河县| 桐庐县| 内黄县| 桑日县| 军事| 正定县| 读书| 布尔津县| 阳曲县| 大石桥市| 商都县| 万荣县| 西吉县| 定西市| 阳谷县| 阿拉善右旗| 伊春市| 乌鲁木齐市| 绥宁县| 邢台市|