spark SQL执行task数骤增日常工作问题记录

因为SQL中的一个表写入方式不严谨,造成小文件过多,导致task数骤增.
没有合并小文件时,文件数27000+,启动任务后task数11w+,合并后文件数70多,task数3000多.
小文件较多的表同其他表join时,猜测会每个文件同其他表的文件做关联.这两形成了文件维度的笛卡尔积.
【spark SQL执行task数骤增】后续追一下源码看看启动task的部分.

spark SQL执行task数骤增

推荐阅读

只狼武器系统+故事剧情介绍只狼影逝二度好玩吗

东营市财政局金融科东营市财政局

4月28日24时国内油价调整最新消息：油价降幅“持续走高”

相机镜头|iPhone14ProMax渲染图：蓝宝石机身5000万相机，打孔屏让果粉迷恋

国产跑鞋有哪些品牌比较好？

蜘蛛怎么折蜘蛛怎么折好看

鸽子蛋要煮几分钟会熟

鹅毛被和鹅绒被的区别鹅毛被和鹅绒被有哪些区别

如何使用免费的云服务器？免费云服务器是怎么用

并非人人睡前喝牛奶都有好处

闰土是什么意思网络用语？闰土是什么意思?

郑民生名字打分115分

番禺第二师范怎么样广东第二师范学院值得去吗

松下壁挂式空调关机时有哒哒声

安卓雷霆战机刷钻石,雷霆战机不限钻石攻略:先别急着收集!

空调除湿开多少度

中秋节祝福语群公告

8k纸和a4纸一样大么 8k纸和a4纸是不是一样大

hdmi高清线什么牌子好高性价比hdmi高清线介绍

科研论文具有哪些特点