For the precise distinct count on all data types feature, Yerui Sun is
working on that; you should look at:
https://issues.apache.org/jira/browse/KYLIN-1379


在 2016年6月21日 下午3:53,Roy <[email protected]>写道:

> Hash 可能会存在重复数值.我们建立映射表的方法是使用 Dense_Rank() 函数.然后去统计.
>
> 而且目前kyiin count(distinct xx)  函数统计好像只支持 int类型的统计.
>
> 希望可以帮到你.
>
> Roy
>
>
>
>
> 在 2016-06-21 15:08:46,"仇同心" <[email protected]> 写道:
> >大家好:
> >
>  Hive字段类型为varchar,字段内容也包含英文字母和中文,对这样的字段能否做DISTINCT_COUNT精确计算?如果不能,有什么好的建议吗?
> >
> >谢谢!
>



-- 
Best regards,

Shaofeng Shi

Reply via email to