Spark|Spark Structured Streaming java example SparkStructuredStreamingjavaexample

场景实时数据存储在kafka，时间顺序不一定，计算需使用到其他静态资源（rest API或数据库中）
要求按天计算，计算时有时间顺序要求，每小时计算一次，结果输出到kafka
关键点 window 参考：spark window on event time
checkpointLocation 主要用于记录一些metadata，offset和算子计算的中间结果，用于故障恢复和重启
参考：spark-checkpointing
startingOffsets 初始读取kafka的偏移量，当checkpointLocation不存在时使用，或者当算子更新checkpointLocation失效时
参考：http://spark.apache.org/docs/latest/structured-streaming-kafka-integration.html
方案1:窗口计算使用structured streaming 窗口计算，窗口长度24小时，步长24小时，设置watermark为48小时。

Dataset lines = sparkSession.readStream() .format("kafka") .option("kafka.bootstrap.servers", "_") .option("subscribe", "topic") .option("startingOffsets", "{\"topic\":{\"0\":_offset_}}") .load(); Dataset

Spark|Spark Structured Streaming java example

推荐阅读

永嘉风光永嘉哪里好玩

劳动是意思相近的词吗快乐是意思相近的词语吗

没开封茶叶会不会过期

迷你世界手机版怎么去竹桃林桃林地形码迷你世界分享

画图工具怎么手绘一款简笔画蛋糕？画图工具手绘简笔画蛋糕的方法

win10epic遭遇了网络连接问题解决方法

荷包蛋面条怎么做荷包蛋面条怎么做视频

4s店样品车可以买吗现在 4s店样品车可以买吗

汽车新四化是什么谈谈汽车新四化

聪明的梅花鹿告诉了我们什么道理一只梅花鹿告诉我们什么道理

周公解梦梦见骨灰盒是什么意思梦见骨灰盒好不好

皮肤瘙痒冷敷多久最好

毛衣可以和其他衣服一起用洗衣机洗吗

十一岁的男孩怎么教育

win101909声卡没声音解决方法

3dmax怎么做雪景关于3DMAX制作雪景的详细操作

品牌规划的流程

手机里库乐队删了怎么办手机库乐队没了怎么办

准备从事棋牌游戏人员必读

审议不通过怎么写会议纪要如何写会议纪要