1、问题
在做spark数据对账时,对于部分orc格式的hive表,会有spark sql读取表数据为空的情况
排查过程中发现是因为使用了tez作为hive的执行引擎,然后执行insert select union all 时,对应的hdfs数据路径,不是直接存放…
官方原文如下,本文附加了较多通俗解释:Evolving Draft for ORC Specification v2https://orc.apache.org/specification/ORCv2/
在OLAP场景中,用户经常只查询部分列的数据,例如:
select Material from TABLE where T…