ertanden opened a new issue, #9130:
URL: https://github.com/apache/hudi/issues/9130
**Describe the problem you faced**
We have an append mode COW table, where we sink messages incoming from a
Kafka topic. Table is partitioned by day.
Clustering is enabled and we also have cleaner configured with
KEEP_LATEST_FILE_VERSIONS for retaining only 1 file version.
The problem is whenever clustering is triggered, although the previous day
partitions already has just a single file and no new commits in those old
partitions, there's still a `replacecommit` periodically applied. So it seems
like it copies the single file unnecessarily to a new one and then the cleaner
gets rid of the old file. I tried setting the clustering filter mode to
RECENT_DAYS, but it still does the same thing for the partition of yesterday.
You can see down below the timeline for the partition from yesterday
`2023-07-04`.
Am I missing something? Is there some configuration I need to make to
prevent this? Or is this a bug?
Thanks!
**Expected behavior**
I don't expect a `replacecommit` when there's only a single file anyways in
the partition without any new commits.
**Environment Description**
* Hudi version : 0.13.1
* Flink version : 1.16.2
* Storage (HDFS/S3/GCS..) : S3
* Running on Docker? (yes/no) : yes, kubernetes
**Additional context**
```
╔═══════════════╤═══════════════════╤════════════╤═════════════════════════════════════════╤═════════════════╤════════════╤═════════════╤═════════════╤═══════════════════╤══════════════╤══════════════════╤═════════════════════════╤═══════════════════════╤═══════════════════╤═════════════════════════════════╤═════════════════════╗
║ Action │ Instant │ Partition │ FileId
│ Previous Commit │ Num Writes │ Num Inserts │ Num Deletes │ Num
Update Writes │ Total Errors │ Total Log Blocks │ Total Corrupt LogBlocks │
Total Rollback Blocks │ Total Log Records │ Total Updated Records Compacted │
Total Bytes Written ║
╠═══════════════╪═══════════════════╪════════════╪═════════════════════════════════════════╪═════════════════╪════════════╪═════════════╪═════════════╪═══════════════════╪══════════════╪══════════════════╪═════════════════════════╪═══════════════════════╪═══════════════════╪═════════════════════════════════╪═════════════════════╣
║ replacecommit │ 20230705152558040 │ 2023-07-04 │
8a61fa78-edb6-4921-b339-a3e1d1a3124d-0 │ null │ 6705 │ 6705
│ 0 │ 0 │ 0 │ 0 │ 0
│ 0 │ 0 │ 0
│ 674,2 KB ║
╟───────────────┼───────────────────┼────────────┼─────────────────────────────────────────┼─────────────────┼────────────┼─────────────┼─────────────┼───────────────────┼──────────────┼──────────────────┼─────────────────────────┼───────────────────────┼───────────────────┼─────────────────────────────────┼─────────────────────╢
║ replacecommit │ 20230705152158072 │ 2023-07-04 │
027e0d7a-4be8-4661-9399-b80e3eedd24c-0 │ null │ 6705 │ 6705
│ 0 │ 0 │ 0 │ 0 │ 0
│ 0 │ 0 │ 0
│ 674,2 KB ║
╟───────────────┼───────────────────┼────────────┼─────────────────────────────────────────┼─────────────────┼────────────┼─────────────┼─────────────┼───────────────────┼──────────────┼──────────────────┼─────────────────────────┼───────────────────────┼───────────────────┼─────────────────────────────────┼─────────────────────╢
║ replacecommit │ 20230705151758257 │ 2023-07-04 │
62cc0a2b-4b3a-473d-a18c-091ee8e4846b-0 │ null │ 6705 │ 6705
│ 0 │ 0 │ 0 │ 0 │ 0
│ 0 │ 0 │ 0
│ 674,2 KB ║
╟───────────────┼───────────────────┼────────────┼─────────────────────────────────────────┼─────────────────┼────────────┼─────────────┼─────────────┼───────────────────┼──────────────┼──────────────────┼─────────────────────────┼───────────────────────┼───────────────────┼─────────────────────────────────┼─────────────────────╢
║ replacecommit │ 20230705151357744 │ 2023-07-04 │
bc0974ba-3f2a-4885-accd-05133f44366b-0 │ null │ 6705 │ 6705
│ 0 │ 0 │ 0 │ 0 │ 0
│ 0 │ 0 │ 0
│ 674,2 KB ║
╟───────────────┼───────────────────┼────────────┼─────────────────────────────────────────┼─────────────────┼────────────┼─────────────┼─────────────┼───────────────────┼──────────────┼──────────────────┼─────────────────────────┼───────────────────────┼───────────────────┼─────────────────────────────────┼─────────────────────╢
║ replacecommit │ 20230705150958014 │ 2023-07-04 │
9a8e88e1-8109-4554-840d-df188eb097cd-0 │ null │ 6705 │ 6705
│ 0 │ 0 │ 0 │ 0 │ 0
│ 0 │ 0 │ 0
│ 674,2 KB ║
╟───────────────┼───────────────────┼────────────┼─────────────────────────────────────────┼─────────────────┼────────────┼─────────────┼─────────────┼───────────────────┼──────────────┼──────────────────┼─────────────────────────┼───────────────────────┼───────────────────┼─────────────────────────────────┼─────────────────────╢
║ replacecommit │ 20230705150558125 │ 2023-07-04 │
9ec0aaa8-4abd-4f31-826f-1e7dcd7fe985-0 │ null │ 6705 │ 6705
│ 0 │ 0 │ 0 │ 0 │ 0
│ 0 │ 0 │ 0
│ 674,2 KB ║
╟───────────────┼───────────────────┼────────────┼─────────────────────────────────────────┼─────────────────┼────────────┼─────────────┼─────────────┼───────────────────┼──────────────┼──────────────────┼─────────────────────────┼───────────────────────┼───────────────────┼─────────────────────────────────┼─────────────────────╢
║ replacecommit │ 20230705150158159 │ 2023-07-04 │
e1acfa81-cd29-41b8-bc76-8ce83330ce10-0 │ null │ 6705 │ 6705
│ 0 │ 0 │ 0 │ 0 │ 0
│ 0 │ 0 │ 0
│ 674,2 KB ║
╟───────────────┼───────────────────┼────────────┼─────────────────────────────────────────┼─────────────────┼────────────┼─────────────┼─────────────┼───────────────────┼──────────────┼──────────────────┼─────────────────────────┼───────────────────────┼───────────────────┼─────────────────────────────────┼─────────────────────╢
║ commit │ 20230705150022378 │ 2023-07-04 │
3a6bdbd2-15f4-492a-a46d-66e88a4c9a2f-28 │ null │ 117 │ 117
│ 0 │ 0 │ 0 │ 0 │ 0
│ 0 │ 0 │ 0
│ 432,9 KB ║
╟───────────────┼───────────────────┼────────────┼─────────────────────────────────────────┼─────────────────┼────────────┼─────────────┼─────────────┼───────────────────┼──────────────┼──────────────────┼─────────────────────────┼───────────────────────┼───────────────────┼─────────────────────────────────┼─────────────────────╢
║ commit │ 20230705145923082 │ 2023-07-04 │
62eb405a-7cbf-46cb-b7b8-2577bb65184f-37 │ null │ 100 │ 100
│ 0 │ 0 │ 0 │ 0 │ 0
│ 0 │ 0 │ 0
│ 431,7 KB ║
╟───────────────┼───────────────────┼────────────┼─────────────────────────────────────────┼─────────────────┼────────────┼─────────────┼─────────────┼───────────────────┼──────────────┼──────────────────┼─────────────────────────┼───────────────────────┼───────────────────┼─────────────────────────────────┼─────────────────────╢
║ commit │ 20230705145923082 │ 2023-07-04 │
ec3a9beb-71c7-4750-b81c-7367f37c85fb-36 │ null │ 11 │ 11
│ 0 │ 0 │ 0 │ 0 │ 0
│ 0 │ 0 │ 0
│ 428,3 KB ║
╟───────────────┼───────────────────┼────────────┼─────────────────────────────────────────┼─────────────────┼────────────┼─────────────┼─────────────┼───────────────────┼──────────────┼──────────────────┼─────────────────────────┼───────────────────────┼───────────────────┼─────────────────────────────────┼─────────────────────╢
║ commit │ 20230705145830077 │ 2023-07-04 │
9a000aad-aacb-471f-bc38-30123a654607-8 │ null │ 2166 │ 2166
│ 0 │ 0 │ 0 │ 0 │ 0
│ 0 │ 0 │ 0
│ 514,2 KB ║
╟───────────────┼───────────────────┼────────────┼─────────────────────────────────────────┼─────────────────┼────────────┼─────────────┼─────────────┼───────────────────┼──────────────┼──────────────────┼─────────────────────────┼───────────────────────┼───────────────────┼─────────────────────────────────┼─────────────────────╢
║ commit │ 20230705145830077 │ 2023-07-04 │
3673fdd1-22b9-4007-ba3c-57d12140a4aa-3 │ null │ 1573 │ 1573
│ 0 │ 0 │ 0 │ 0 │ 0
│ 0 │ 0 │ 0
│ 488,5 KB ║
╟───────────────┼───────────────────┼────────────┼─────────────────────────────────────────┼─────────────────┼────────────┼─────────────┼─────────────┼───────────────────┼──────────────┼──────────────────┼─────────────────────────┼───────────────────────┼───────────────────┼─────────────────────────────────┼─────────────────────╢
║ commit │ 20230705145830077 │ 2023-07-04 │
cb7f38c3-a396-4f7e-93a6-98f17d969793-2 │ null │ 407 │ 407
│ 0 │ 0 │ 0 │ 0 │ 0
│ 0 │ 0 │ 0
│ 442,0 KB ║
╟───────────────┼───────────────────┼────────────┼─────────────────────────────────────────┼─────────────────┼────────────┼─────────────┼─────────────┼───────────────────┼──────────────┼──────────────────┼─────────────────────────┼───────────────────────┼───────────────────┼─────────────────────────────────┼─────────────────────╢
║ commit │ 20230705145830077 │ 2023-07-04 │
7a1f01a3-9b97-410b-9046-e9b48cd4e8d0-24 │ null │ 1588 │ 1588
│ 0 │ 0 │ 0 │ 0 │ 0
│ 0 │ 0 │ 0
│ 489,2 KB ║
╟───────────────┼───────────────────┼────────────┼─────────────────────────────────────────┼─────────────────┼────────────┼─────────────┼─────────────┼───────────────────┼──────────────┼──────────────────┼─────────────────────────┼───────────────────────┼───────────────────┼─────────────────────────────────┼─────────────────────╢
║ replacecommit │ 20230705145827741 │ 2023-07-04 │
8a4217a1-13cb-4f7d-a1bd-259cdaa6d246-0 │ null │ 743 │ 743
│ 0 │ 0 │ 0 │ 0 │ 0
│ 0 │ 0 │ 0
│ 458,7 KB ║
╟───────────────┼───────────────────┼────────────┼─────────────────────────────────────────┼─────────────────┼────────────┼─────────────┼─────────────┼───────────────────┼──────────────┼──────────────────┼─────────────────────────┼───────────────────────┼───────────────────┼─────────────────────────────────┼─────────────────────╢
║ commit │ 20230705145730210 │ 2023-07-04 │
33744ee3-9c78-47d5-ae64-4655e071dc80-38 │ null │ 51 │ 51
│ 0 │ 0 │ 0 │ 0 │ 0
│ 0 │ 0 │ 0
│ 429,6 KB ║
╟───────────────┼───────────────────┼────────────┼─────────────────────────────────────────┼─────────────────┼────────────┼─────────────┼─────────────┼───────────────────┼──────────────┼──────────────────┼─────────────────────────┼───────────────────────┼───────────────────┼─────────────────────────────────┼─────────────────────╢
║ commit │ 20230705145730210 │ 2023-07-04 │
8de58cf1-9cc6-4cfb-a2ae-2baa846a62f9-33 │ null │ 319 │ 319
│ 0 │ 0 │ 0 │ 0 │ 0
│ 0 │ 0 │ 0
│ 439,5 KB ║
╟───────────────┼───────────────────┼────────────┼─────────────────────────────────────────┼─────────────────┼────────────┼─────────────┼─────────────┼───────────────────┼──────────────┼──────────────────┼─────────────────────────┼───────────────────────┼───────────────────┼─────────────────────────────────┼─────────────────────╢
║ commit │ 20230705145730210 │ 2023-07-04 │
aa7321dc-a64a-412e-8131-3977e53b720e-44 │ null │ 373 │ 373
│ 0 │ 0 │ 0 │ 0 │ 0
│ 0 │ 0 │ 0
│ 442,5 KB ║
╚═══════════════╧═══════════════════╧════════════╧═════════════════════════════════════════╧═════════════════╧════════════╧═════════════╧═════════════╧═══════════════════╧══════════════╧══════════════════╧═════════════════════════╧═══════════════════════╧═══════════════════╧═════════════════════════════════╧═════════════════════╝
```
--
This is an automated message from the Apache Git Service.
To respond to the message, please log on to GitHub and use the
URL above to go to the specific comment.
To unsubscribe, e-mail: [email protected]
For queries about this service, please contact Infrastructure at:
[email protected]