Hash 可能会存在重复数值.我们建立映射表的方法是使用 Dense_Rank() 函数.然后去统计.

而且目前kyiin count(distinct xx)  函数统计好像只支持 int类型的统计.

希望可以帮到你.

Roy




在 2016-06-21 15:08:46,"仇同心" <[email protected]> 写道:
>大家好:
>     Hive字段类型为varchar,字段内容也包含英文字母和中文,对这样的字段能否做DISTINCT_COUNT精确计算?如果不能,有什么好的建议吗?
>
>谢谢!

Reply via email to