Re: Build Dimension Dictionary timeout For Count-Distinct columns

曾耀武 Wed, 29 Mar 2017 23:46:14 -0700


     嗨，少峰：
我使用kylin 1.6 版本，在测试  count-distinct  时有一个比较困扰的问题：
在用户级别达到4亿多的时候，我在计算uv 的时候kylin需要 对用户id 进行构建字典操作，官方说做全局字典的时候基数能达到20亿，
但是第四步在创建字典的时候好像是在本地执行的构建任务，特别消耗系统资源，cup 和内存几乎爆满。kylin 页面也没法访问，服务器的配置为推荐配置如下：
KYLIN_JVM_SETTINGS="-Xms16g -Xmx16g -XX:MaxPermSize=512m -XX:NewSize=3g 
-XX:MaxNewSize=3g -XX:SurvivorRatio=4 -XX:+CMSClassUnloadingEnabled   -  
XX:+CMSParallelRemarkEnabled -XX:+UseConcMarkSweepGC -XX:+CMSIncrementalMode 
-XX:CMSInitiatingOccupancyFraction=70 -XX:+DisableExplicitGC 
-XX:+HeapDumpOnOutOfMemoryError"


然而uv 计算在公司业务中是比较频繁的计算。
请教一下在这一步有没有什么好的优化建议或者对系统配置要求有什么可以提升的地方。

regards

Re: Build Dimension Dictionary timeout For Count-Distinct columns

Reply via email to