For the precise distinct count on all data types feature, Yerui Sun is working on that; you should look at: https://issues.apache.org/jira/browse/KYLIN-1379
在 2016年6月21日 下午3:53,Roy <[email protected]>写道: > Hash 可能会存在重复数值.我们建立映射表的方法是使用 Dense_Rank() 函数.然后去统计. > > 而且目前kyiin count(distinct xx) 函数统计好像只支持 int类型的统计. > > 希望可以帮到你. > > Roy > > > > > 在 2016-06-21 15:08:46,"仇同心" <[email protected]> 写道: > >大家好: > > > Hive字段类型为varchar,字段内容也包含英文字母和中文,对这样的字段能否做DISTINCT_COUNT精确计算?如果不能,有什么好的建议吗? > > > >谢谢! > -- Best regards, Shaofeng Shi
