具体请参考:https://blog.csdn.net/aijiudu/article/details/78616064

 

补充:如果以上方式并不能大幅缩短时间,可确认下是否ORC文件个数过多,如果太多的话建议通过合并处理减少ORC文件个数,这样能大幅减少等待时间(可能跟spark读取ORC头文件信息有关,如果个数太多,时间肯定会长)

 

 

 

Logo

腾讯云面向开发者汇聚海量精品云计算使用和开发经验,营造开放的云计算技术生态圈。

更多推荐