Hash 可能会存在重复数值.我们建立映射表的方法是使用 Dense_Rank() 函数.然后去统计.
而且目前kyiin count(distinct xx) 函数统计好像只支持 int类型的统计. 希望可以帮到你. Roy 在 2016-06-21 15:08:46,"仇同心" <[email protected]> 写道: >大家好: > Hive字段类型为varchar,字段内容也包含英文字母和中文,对这样的字段能否做DISTINCT_COUNT精确计算?如果不能,有什么好的建议吗? > >谢谢!
