非常感谢博闻发起的关于hive的讨论,hive在离线数据仓库处理这块占了我们80%的离线处理使用。
*各位在使用哪个版本的Hive?有计划升级Hive吗?我们目前生产使用的是cdh5.12.1集成的hive1.1.0的版本。 *各位计划切换Hive引擎吗?有时间点吗?主要是追求稳定输出,版本升级需要对应一系列测试,我们暂时还不打算升级。 *各位使用Flink-Hive的动机是什么?想只是用一套Flink技术栈,批流合一,方便维护和学习。 *各位如何使用Hive?数据量有多大?读写都有,一天2T左右。 *有多少Hive UDF?都是什么类型? 主要GPS行程数据相关的与geo相关的比较多。 *对项目有什么问题或者建议?flink on hive优先稳定和兼容性。 前进
