Hi, 不仅在 hive 中,在 Flink 中也是一样的,两个系统的SQL解析优化框架都是参考了Calcite, hive的SQL解析是自己的,flink的SQL解析和优化都是基于Calcite,
对于null值是否过滤,SQL中 一个 bool表达式(如 a > b) 的返回值 是有三个的,true,false,unknown,unknown 主要出现在有null值得情况下,比如 null > ‘hello’ 的返回值就是unknown, unknown的返回值可以在calcite中配置,Flink 默认的配置是 unknown as mode,就是 null > ‘hello’ 返回false,看你条件是过滤false的话,那么null值就会被过滤掉. 社区之前有个issue[1]在跟进这个问题, 在此之前建议处理 null 时,都用 IS NULL , IS NOT NULL 先做下过滤再做逻辑判断,一般SQL里面也是这样处理的。 祝好, Leonard Xu [1] https://issues.apache.org/jira/browse/FLINK-18164 <https://issues.apache.org/jira/browse/FLINK-18164> > 在 2020年6月25日,23:31,忝忝向仧 <[email protected]> 写道: > > Hi,all: > > > Flink sql 在使用<>或者!=做过滤时候,null也会像在hive里面样被过滤掉么? > hive里面感觉这有点坑,每次还要小心处理下. > 谢谢.
