您好:
Hash值是否会出现重复呢?

谢谢!

发件人: Weatherpop [mailto:[email protected]]
发送时间: 2016年6月21日 15:11
收件人: [email protected]; [email protected]
主题: 回复:DISTINCT_COUNT精确计算问题

可以自己做一张映射表,把值hash成int后就可以用精确的count distinct了
我们这边目前实践暂时是这样的

------------------ 原始邮件 ------------------
发件人: "仇同心";<[email protected]<mailto:[email protected]>>;
发送时间: 2016年6月21日(星期二) 下午3:08
收件人: 
"[email protected]<mailto:[email protected]>"<[email protected]<mailto:[email protected]>>;
 
"[email protected]<mailto:[email protected]>"<[email protected]<mailto:[email protected]>>;
主题: DISTINCT_COUNT精确计算问题

大家好:
     Hive字段类型为varchar,字段内容也包含英文字母和中文,对这样的字段能否做DISTINCT_COUNT精确计算?如果不能,有什么好的建议吗?

谢谢!

Reply via email to