是的,我觉得需要自己实现一个sink,检测到新增的表时需要通过catalog去hive里创建一下。有点像hive的dynamic partitioning,只不过写的是多张表而不是多个partition。
On Fri, Aug 28, 2020 at 2:08 PM Qishang <[email protected]> wrote: > Hi Rui Li. > > > 我理解也是如果多路输出需要能动态适配新表的话只能用DataStream自己实现了 > 这个实现有啥思路,能稍微详细说一下嘛? 是不是需要自己开发一个 Sink 来适配? > > Rui Li <[email protected]> 于2020年8月28日周五 下午1:47写道: > > > Hi, > > > > 我理解也是如果多路输出需要能动态适配新表的话只能用DataStream自己实现了,具体写表的时候可以试试看能不能复用hive > > connector里现有的sink。 > > > > On Fri, Aug 28, 2020 at 12:15 PM Leonard Xu <[email protected]> wrote: > > > > > Hi > > > > > > > 多路输出是个动态的,因为是整库的binlog ,不确定库中是否有新增表,作业要触发hive里面去创建表的动作。hive catalog > > > create > > > > table 是否可以在运行中来调用吗? > > > > 程序启动之后生成的jobgraph运行中是不是不可以调整的?如果可以的话,是否有类似的案例可以参考。 > > > > > > 用dataStream是会更灵活些,思路也差不多,在运行中可以调用的建表动作的,但是运行的拓扑是不可以动态调整的,不管DataStream > 还是 > > > SQL 的拓扑。 > > > > > > 祝好 > > > Leonard > > > > > > > > > > -- > > Best regards! > > Rui Li > > > -- Best regards! Rui Li
