补充一下这个场景: 有事实表orders,以创建时间作为分区,有已支付订单数,已开票订单数两个指标,都以订单创建时间作为统计分区。
order1这条数据,20190801和20190901分别对时间分区为20190701的数据支付时间和开票时间做了更新。 那么20190701这个时间分区的已支付订单数和已开票订单数两个指标都需要更新。 在这个场景中,我们如何进行cube的更新呢 > 在 2019年9月3日,11:44,王刚 <[email protected]> 写道: > > Hi All > > 我是苏宁财务平台的研发,我们在财务指标平台升级计划中正在考虑平台选型,kylin作为考察目标之一。 > > 在目前的测试步骤中,遇到了事实表历史数据更新的问题,请教一下各位developer。 > > 举例hive事实表orders,以创建时间作为时间分区 > > 订单号 > > 创建时间 > > 支付时间 > > 开票时间 > > Order1 > > 20190701 > > 20190801 > > 20190901 > > Order2 > > 20190901 > > 20190901 > > 20190901 > > > > > 表中order2的时间分区一致且不更新,比较容易计算cube。在order1这条数据中,20190801和20190901分别对时间分区为20190701的数据支付时间和开票时间做了更新,因此支付和开票相关的统计指标也需要更新。 > > 请问如何配置cube和增量更新方式,能够最高效实现事实表历史数据的指标更新呢? > > kylin新手,诚心请教,烦请各位不吝赐家,多谢。
