1.  为了保证数据正确性 stream 写文件依赖了 checkpoint 机制,你可以将你的间隔时间和 checkpoint 时间保持一致
2. 按逗号分隔是说 CSV format ?

Best,
Danny Chan
在 2020年8月31日 +0800 PM8:53,酷酷的浑蛋 <[email protected]>,写道:
> 1. Create hive表(...)with(...)
> 我发现写入hive只能根据checkpoint去提交分区?可以按照文件大小或者间隔时间来生成吗?
>
>
> 2. Create table (connector=filesystem,format=json) with(…)
> 这种方式format只能等于json? 我怎么按照分隔符写入hdfs?

回复