请问,Flink StreamingFileSink使用批量写Hadoop SequenceFile format,能自定义滚动策略吗?我想指定文件大小、文件最长未更新时间和checponit来进行滚动,可以通过实现RollingPolicy接口来定制吗?谢谢!
看文档<https://ci.apache.org/projects/flink/flink-docs-release-1.11/dev/connectors/streamfile_sink.html>备注,批量编码默认情况下仅仅有OnCheckpointRollingPolicy,在每次checkpoint时候进行切分。如果设置checkpoint时间不合理,这样会产生蛮多小文件的。
