xiearthur opened a new issue, #12523:
URL: https://github.com/apache/hudi/issues/12523

   **_Tips before filing an issue_**
   
   - Have you gone through our [FAQs](https://hudi.apache.org/learn/faq/)?
   
   - Join the mailing list to engage in conversations and get faster support at 
[email protected].
   
   - If you have triaged this as a bug, then file an 
[issue](https://issues.apache.org/jira/projects/HUDI/issues) directly.
   
   **Describe the problem you faced**
   
   A clear and concise description of the problem.
   
   **To Reproduce**
   
   Steps to reproduce the behavior:
   
   1. Currently conducting integration testing using Fling1.13.2 and Hudi 0.14, 
we need to verify the issues of Kafka duplicate consumption and Flink 
checkpoint loss in extreme cases
   2.  Flink restarted normally multiple times, but Kafka was filled with 
duplicate data multiple times, but there were still no duplicates in Hudi
   3.  When simulating the scenario of Kafka reset or checkpoint deletion for 
the fourth time, data duplication occurred
   
   We have attempted to adjust parameters such as timeline server, index, write 
mode, parallelism, merge, and cleanup, but have not been able to resolve the 
issue
   
   Summary:
   The first three writes were completely normal:
   First write: 102823 data entries
   Second write: 198218 data entries
   Third write: 198218 data entries
   The fourth time (deleting checkpoint/resetting Kafka offset) encountered an 
exception:
   Actual data: 198218 records
   Write result: 348918 records (150700 additional duplicate data)
   Key log analysis:
   The fourth write resulted in two parallel file groups:
   CopyfileId1: 65e2e9f7-ed93-49e6-9067-163e02c89f63 (original)
   FileId2: e1ebc3c2-65d9-406a-9f9b-0d803c07e25a (new)
   Writing process:
   Copy first batch of writes: 338957 (69072 updates) ->use new fileId
   Second batch of writes: 198218 entries (all updated) ->using old fileId
   
   **Additionally, data with the same primary key comes from two questions or 
file groups**
   ```
   We have attempted to adjust parameters such as timeline server, index, write 
mode, parallelism, merge, and cleanup, but have not been able to resolve the 
issue
   
   public static void writeHudiDataStream(ParameterTool params, 
DataStream<RowData> dataStream, Map<String, String> schema, Logger logger) {
       // Get basic parameters
       String basePath = params.get("basepath");
       String tableName = params.get("tablename");
       String primaryKey = params.get("primarykey");
       String hoodieTableType = params.get("hoodie_table_type");
       String precombing = params.get("precombing");
       String partition = params.get("partition");
   
       // Add Hudi table options
       Map<String, String> options = new HashMap<>();
       options.put(FlinkOptions.PATH.key(), basePath + tableName);
       String name = hoodieTableType.equals("cow") ? 
           HoodieTableType.COPY_ON_WRITE.name() : 
HoodieTableType.MERGE_ON_READ.name();
       options.put(FlinkOptions.TABLE_TYPE.key(), name);
       
       // Write options
       options.put("hoodie.upsert.shuffle.parallelism", "200");
       options.put("hoodie.insert.shuffle.parallelism", "200");
       options.put(FlinkOptions.OPERATION.key(), 
WriteOperationType.UPSERT.value());
       options.put(FlinkOptions.PRECOMBINE_FIELD.key(), precombing);
       options.put(FlinkOptions.PRE_COMBINE.key(), "true");
   
       // Index options
       options.put(FlinkOptions.INDEX_GLOBAL_ENABLED.key(), "true");
       options.put("index.type", "GLOBAL_BLOOM");
   
       // Clean strategy
       options.put("hoodie.clean.automatic", "true");
       options.put("hoodie.cleaner.policy", "KEEP_LATEST_COMMITS");
       options.put("hoodie.cleaner.commits.retained", "10");
       options.put("hoodie.clean.async", "true");
       options.put("hoodie.clean.parallelism", "200");
   
       // Archive strategy
       options.put("hoodie.archive.min.commits", "20");
       options.put("hoodie.archive.max.commits", "30");
       options.put("hoodie.archive.parallelism", "200");
   
       // Compaction options
       options.put("hoodie.compact.inline", "false");
       options.put("hoodie.compact.inline.max.delta.commits", "1");
       options.put("hoodie.compact.schedule.inline", "true");
       options.put("hoodie.compact.max.delta.commits", "1");
       options.put(FlinkOptions.COMPACTION_ASYNC_ENABLED.key(), "true");
       options.put(FlinkOptions.COMPACTION_TRIGGER_STRATEGY.key(), 
"num_commits");
       options.put(FlinkOptions.COMPACTION_DELTA_COMMITS.key(), "5");
       options.put(FlinkOptions.COMPACTION_MAX_MEMORY.key(), "1024");
   
       // Concurrency control
       options.put("hoodie.write.concurrency.mode", "SINGLE_WRITER");
       options.put("hoodie.write.lock.provider", 
"org.apache.hudi.client.transaction.lock.InProcessLockProvider");
       options.put("hoodie.merge.allow.duplicate.on.inserts", "false");
       options.put("hoodie.combine.before.insert", "true");
       options.put("hoodie.combine.before.upsert", "true");
   
       // Write performance tuning
       options.put("hoodie.write.markers.type", "DIRECT");
       options.put("hoodie.write.status.storage.level", "MEMORY_AND_DISK_SER");
       options.put(FlinkOptions.WRITE_BATCH_SIZE.key(), "50000");
       options.put(FlinkOptions.WRITE_TASK_MAX_SIZE.key(), "1024");
       options.put(FlinkOptions.WRITE_RATE_LIMIT.key(), "10000");
       options.put(FlinkOptions.WRITE_COMMIT_ACK_TIMEOUT.key(), "120s");
   
       // Timeline service
       options.put("hoodie.embed.timeline.server", "true");
       options.put("hoodie.filesystem.view.type", "EMBEDDED_KV_STORE");
       options.put("hoodie.filesystem.view.remote.timeout.secs", "600");
       options.put("hoodie.filesystem.view.incr.timeline.sync.enable", "true");
       options.put("hoodie.filesystem.view.secondary.type", "SPILLABLE_DISK");
       options.put("hoodie.filesystem.view.spillable.mem", "409715200");
   
       // Build and execute
       HoodiePipeline.Builder builder = HoodiePipeline.builder(tableName);
       schema.forEach((key, value) -> builder.column(key + " " + value));
       builder.pk(primaryKey)
              .options(options)
              .sink(dataStream, false);
   }
   ```
   
   hoodie.properties:
   #Updated at 2024-12-18T09:32:46.185Z
   #Wed Dec 18 17:32:46 CST 2024
   
hoodie.table.keygenerator.class=org.apache.hudi.keygen.NonpartitionedAvroKeyGenerator
   hoodie.table.precombine.field=process_time
   hoodie.table.version=6
   hoodie.database.name=default_database
   hoodie.datasource.write.hive_style_partitioning=false
   hoodie.table.metadata.partitions.inflight=
   hoodie.table.checksum=219834916
   hoodie.table.cdc.enabled=false
   hoodie.archivelog.folder=archived
   hoodie.table.name=irce_credit_info_mor_test_03
   
hoodie.compaction.payload.class=org.apache.hudi.common.model.EventTimeAvroPayload
   hoodie.compaction.record.merger.strategy=eeb8d96f-b1e4-49fd-bbf8-28ac514178e5
   hoodie.table.type=MERGE_ON_READ
   hoodie.datasource.write.partitionpath.urlencode=false
   hoodie.datasource.write.drop.partition.columns=false
   hoodie.table.metadata.partitions=
   hoodie.timeline.layout.version=1
   hoodie.table.recordkey.fields=id
   
   hudi cli :
   
   ##The first time
   Run Flink task
   Spark query count (*) has reached 198218 data points
   Query Hive data for 102823 records
   
   
   
   commits show
   
╔═══════════════════╤═════════════════════╤═══════════════════╤═════════════════════╤══════════════════════════╤═══════════════════════╤══════════════════════════════╤══════════════╗
   ║ CommitTime        │ Total Bytes Written │ Total Files Added │ Total Files 
Updated │ Total Partitions Written │ Total Records Written │ Total Update 
Records Written │ Total Errors ║
   
╠═══════════════════╪═════════════════════╪═══════════════════╪═════════════════════╪══════════════════════════╪═══════════════════════╪══════════════════════════════╪══════════════╣
   ║ 20241218161120812 │ 142.9 MB            │ 0                 │ 1            
       │ 1                        │ 95395                 │ 95395               
         │ 0            ║
   
╟───────────────────┼─────────────────────┼───────────────────┼─────────────────────┼──────────────────────────┼───────────────────────┼──────────────────────────────┼──────────────╢
   ║ 20241218161120239 │ 22.8 MB             │ 1                 │ 0            
       │ 1                        │ 102823                │ 0                   
         │ 0            ║
   
╟───────────────────┼─────────────────────┼───────────────────┼─────────────────────┼──────────────────────────┼───────────────────────┼──────────────────────────────┼──────────────╢
   ║ 20241218161024176 │ 150.8 MB            │ 0                 │ 1            
       │ 1                        │ 102823                │ 0                   
         │ 0            ║
   
╚═══════════════════╧═════════════════════╧═══════════════════╧═════════════════════╧══════════════════════════╧═══════════════════════╧══════════════════════════════╧══════════════╝
   cleans show
   
╔═══════════╤═════════════════════════╤═════════════════════╤══════════════════╗
   ║ CleanTime │ EarliestCommandRetained │ Total Files Deleted │ Total Time 
Taken ║
   
╠═══════════╧═════════════════════════╧═════════════════════╧══════════════════╣
   ║ (empty)                                                                    
  ║
   
╚══════════════════════════════════════════════════════════════════════════════╝
   
   compactions show all
   ╔═════════════════════════╤═══════════╤═══════════════════════════════╗
   ║ Compaction Instant Time │ State     │ Total FileIds to be Compacted ║
   ╠═════════════════════════╪═══════════╪═══════════════════════════════╣
   ║ 20241218161120239       │ COMPLETED │ 1                             ║
   ╚═════════════════════════╧═══════════╧═══════════════════════════════╝
   
   ##The second time
   
   The time may be 16:11 
   Write the. txt data to the topic again
   Querying Hive data for 198218 records
   Search for hudi cli related information
   
   commits show
   
╔═══════════════════╤═════════════════════╤═══════════════════╤═════════════════════╤══════════════════════════╤═══════════════════════╤══════════════════════════════╤══════════════╗
   ║ CommitTime        │ Total Bytes Written │ Total Files Added │ Total Files 
Updated │ Total Partitions Written │ Total Records Written │ Total Update 
Records Written │ Total Errors ║
   
╠═══════════════════╪═════════════════════╪═══════════════════╪═════════════════════╪══════════════════════════╪═══════════════════════╪══════════════════════════════╪══════════════╣
   ║ 20241218163616318 │ 43.6 MB             │ 0                 │ 1            
       │ 1                        │ 198218                │ 179543              
         │ 0            ║
   
╟───────────────────┼─────────────────────┼───────────────────┼─────────────────────┼──────────────────────────┼───────────────────────┼──────────────────────────────┼──────────────╢
   ║ 20241218163514630 │ 17.8 MB             │ 0                 │ 1            
       │ 1                        │ 12182                 │ 12182               
         │ 0            ║
   
╟───────────────────┼─────────────────────┼───────────────────┼─────────────────────┼──────────────────────────┼───────────────────────┼──────────────────────────────┼──────────────╢
   ║ 20241218163404017 │ 249.2 MB            │ 0                 │ 1            
       │ 1                        │ 167361                │ 167361              
         │ 0            ║
   
╟───────────────────┼─────────────────────┼───────────────────┼─────────────────────┼──────────────────────────┼───────────────────────┼──────────────────────────────┼──────────────╢
   ║ 20241218163403100 │ 43.5 MB             │ 0                 │ 1            
       │ 1                        │ 198218                │ 18675               
         │ 0            ║
   
╟───────────────────┼─────────────────────┼───────────────────┼─────────────────────┼──────────────────────────┼───────────────────────┼──────────────────────────────┼──────────────╢
   ║ 20241218161227103 │ 26.7 MB             │ 0                 │ 1            
       │ 1                        │ 18675                 │ 18675               
         │ 0            ║
   
╟───────────────────┼─────────────────────┼───────────────────┼─────────────────────┼──────────────────────────┼───────────────────────┼──────────────────────────────┼──────────────╢
   ║ 20241218161120812 │ 142.9 MB            │ 0                 │ 1            
       │ 1                        │ 95395                 │ 95395               
         │ 0            ║
   
╟───────────────────┼─────────────────────┼───────────────────┼─────────────────────┼──────────────────────────┼───────────────────────┼──────────────────────────────┼──────────────╢
   ║ 20241218161120239 │ 22.8 MB             │ 1                 │ 0            
       │ 1                        │ 102823                │ 0                   
         │ 0            ║
   
╟───────────────────┼─────────────────────┼───────────────────┼─────────────────────┼──────────────────────────┼───────────────────────┼──────────────────────────────┼──────────────╢
   ║ 20241218161024176 │ 150.8 MB            │ 0                 │ 1            
       │ 1                        │ 102823                │ 0                   
         │ 0            ║
   
╚═══════════════════╧═════════════════════╧═══════════════════╧═════════════════════╧══════════════════════════╧═══════════════════════╧══════════════════════════════╧══════════════╝
   
   cleans show
   
╔═══════════╤═════════════════════════╤═════════════════════╤══════════════════╗
   ║ CleanTime │ EarliestCommandRetained │ Total Files Deleted │ Total Time 
Taken ║
   
╠═══════════╧═════════════════════════╧═════════════════════╧══════════════════╣
   ║ (empty)                                                                    
  ║
   
╚══════════════════════════════════════════════════════════════════════════════╝
   
   compactions show all
   ╔═════════════════════════╤═══════════╤═══════════════════════════════╗
   ║ Compaction Instant Time │ State     │ Total FileIds to be Compacted ║
   ╠═════════════════════════╪═══════════╪═══════════════════════════════╣
   ║ 20241218163616318       │ COMPLETED │ 1                             ║
   ╟─────────────────────────┼───────────┼───────────────────────────────╢
   ║ 20241218163403100       │ COMPLETED │ 1                             ║
   ╟─────────────────────────┼───────────┼───────────────────────────────╢
   ║ 20241218161120239       │ COMPLETED │ 1                             ║
   ╚═════════════════════════╧═══════════╧═══════════════════════════════╝
   
   
   ##The third time
   The time is 16:50
        
   [root@bobcfc-sdcdh-un01 ~]# hdfs dfs -ls 
hdfs://nameservice1/user/hive/warehouse/ods.db/xxxxx
   Found 11 items
   -rw-r--r--   3 hive hive  158089330 2024-12-18 16:11 
hdfs://nameservice1/user/hive/warehouse/ods.db/xxxxx/.65e2e9f7-ed93-49e6-9067-163e02c89f63_20241218161024176.log.1_0-1-0
   -rw-r--r--   3 hive hive  177831541 2024-12-18 16:34 
hdfs://nameservice1/user/hive/warehouse/ods.db/xxxxx/.65e2e9f7-ed93-49e6-9067-163e02c89f63_20241218161120239.log.1_0-1-0
   -rw-r--r--   3 hive hive  280037870 2024-12-18 16:36 
hdfs://nameservice1/user/hive/warehouse/ods.db/xxxxx/.65e2e9f7-ed93-49e6-9067-163e02c89f63_20241218163403100.log.1_0-1-0
   -rw-r--r--   3 hive hive  264809860 2024-12-18 16:53 
hdfs://nameservice1/user/hive/warehouse/ods.db/xxxxx/.65e2e9f7-ed93-49e6-9067-163e02c89f63_20241218163616318.log.1_0-1-0
   -rw-r--r--   3 hive hive   43221873 2024-12-18 16:54 
hdfs://nameservice1/user/hive/warehouse/ods.db/xxxxx/.65e2e9f7-ed93-49e6-9067-163e02c89f63_20241218165336103.log.1_0-1-0
   drwxr-xr-x   - hive hive          0 2024-12-18 16:55 
hdfs://nameservice1/user/hive/warehouse/ods.db/xxxxx/.hoodie
   -rw-r--r--   3 hive hive         96 2024-12-18 16:11 
hdfs://nameservice1/user/hive/warehouse/ods.db/xxxxx/.hoodie_partition_metadata
   -rw-r--r--   3 hive hive   23933255 2024-12-18 16:12 
hdfs://nameservice1/user/hive/warehouse/ods.db/xxxxx/65e2e9f7-ed93-49e6-9067-163e02c89f63_0-1-0_20241218161120239.parquet
   -rw-r--r--   3 hive hive   45645067 2024-12-18 16:35 
hdfs://nameservice1/user/hive/warehouse/ods.db/xxxxx/65e2e9f7-ed93-49e6-9067-163e02c89f63_0-1-0_20241218163403100.parquet
   -rw-r--r--   3 hive hive   45676402 2024-12-18 16:37 
hdfs://nameservice1/user/hive/warehouse/ods.db/xxxxx/65e2e9f7-ed93-49e6-9067-163e02c89f63_0-1-0_20241218163616318.parquet
   -rw-r--r--   3 hive hive   45654029 2024-12-18 16:55 
hdfs://nameservice1/user/hive/warehouse/ods.db/xxxxx/65e2e9f7-ed93-49e6-9067-163e02c89f63_0-1-0_20241218165336103.parquet
        
   
   
   commits show
   
╔═══════════════════╤═════════════════════╤═══════════════════╤═════════════════════╤══════════════════════════╤═══════════════════════╤══════════════════════════════╤══════════════╗
   ║ CommitTime        │ Total Bytes Written │ Total Files Added │ Total Files 
Updated │ Total Partitions Written │ Total Records Written │ Total Update 
Records Written │ Total Errors ║
   
╠═══════════════════╪═════════════════════╪═══════════════════╪═════════════════════╪══════════════════════════╪═══════════════════════╪══════════════════════════════╪══════════════╣
   ║ 20241218165336300 │ 41.2 MB             │ 0                 │ 1            
       │ 1                        │ 27052                 │ 27052               
         │ 0            ║
   
╟───────────────────┼─────────────────────┼───────────────────┼─────────────────────┼──────────────────────────┼───────────────────────┼──────────────────────────────┼──────────────╢
   ║ 20241218165336103 │ 43.5 MB             │ 0                 │ 1            
       │ 1                        │ 198218                │ 171166              
         │ 0            ║
   
╟───────────────────┼─────────────────────┼───────────────────┼─────────────────────┼──────────────────────────┼───────────────────────┼──────────────────────────────┼──────────────╢
   ║ 20241218163616516 │ 252.5 MB            │ 0                 │ 1            
       │ 1                        │ 171166                │ 171166              
         │ 0            ║
   
╟───────────────────┼─────────────────────┼───────────────────┼─────────────────────┼──────────────────────────┼───────────────────────┼──────────────────────────────┼──────────────╢
   ║ 20241218163616318 │ 43.6 MB             │ 0                 │ 1            
       │ 1                        │ 198218                │ 179543              
         │ 0            ║
   
╟───────────────────┼─────────────────────┼───────────────────┼─────────────────────┼──────────────────────────┼───────────────────────┼──────────────────────────────┼──────────────╢
   ║ 20241218163514630 │ 17.8 MB             │ 0                 │ 1            
       │ 1                        │ 12182                 │ 12182               
         │ 0            ║
   
╟───────────────────┼─────────────────────┼───────────────────┼─────────────────────┼──────────────────────────┼───────────────────────┼──────────────────────────────┼──────────────╢
   ║ 20241218163404017 │ 249.2 MB            │ 0                 │ 1            
       │ 1                        │ 167361                │ 167361              
         │ 0            ║
   
╟───────────────────┼─────────────────────┼───────────────────┼─────────────────────┼──────────────────────────┼───────────────────────┼──────────────────────────────┼──────────────╢
   ║ 20241218163403100 │ 43.5 MB             │ 0                 │ 1            
       │ 1                        │ 198218                │ 18675               
         │ 0            ║
   
╟───────────────────┼─────────────────────┼───────────────────┼─────────────────────┼──────────────────────────┼───────────────────────┼──────────────────────────────┼──────────────╢
   ║ 20241218161227103 │ 26.7 MB             │ 0                 │ 1            
       │ 1                        │ 18675                 │ 18675               
         │ 0            ║
   
╟───────────────────┼─────────────────────┼───────────────────┼─────────────────────┼──────────────────────────┼───────────────────────┼──────────────────────────────┼──────────────╢
   ║ 20241218161120812 │ 142.9 MB            │ 0                 │ 1            
       │ 1                        │ 95395                 │ 95395               
         │ 0            ║
   
╟───────────────────┼─────────────────────┼───────────────────┼─────────────────────┼──────────────────────────┼───────────────────────┼──────────────────────────────┼──────────────╢
   ║ 20241218161120239 │ 22.8 MB             │ 1                 │ 0            
       │ 1                        │ 102823                │ 0                   
         │ 0            ║
   
╟───────────────────┼─────────────────────┼───────────────────┼─────────────────────┼──────────────────────────┼───────────────────────┼──────────────────────────────┼──────────────╢
   ║ 20241218161024176 │ 150.8 MB            │ 0                 │ 1            
       │ 1                        │ 102823                │ 0                   
         │ 0            ║
   
╚═══════════════════╧═════════════════════╧═══════════════════╧═════════════════════╧══════════════════════════╧═══════════════════════╧══════════════════════════════╧══════════════╝
   
   
   cleans show
   
╔═══════════╤═════════════════════════╤═════════════════════╤══════════════════╗
   ║ CleanTime │ EarliestCommandRetained │ Total Files Deleted │ Total Time 
Taken ║
   
╠═══════════╧═════════════════════════╧═════════════════════╧══════════════════╣
   ║ (empty)                                                                    
  ║
   
╚══════════════════════════════════════════════════════════════════════════════╝
   
   compactions show all
   ╔═════════════════════════╤═══════════╤═══════════════════════════════╗
   ║ Compaction Instant Time │ State     │ Total FileIds to be Compacted ║
   ╠═════════════════════════╪═══════════╪═══════════════════════════════╣
   ║ 20241218165336103       │ COMPLETED │ 1                             ║
   ╟─────────────────────────┼───────────┼───────────────────────────────╢
   ║ 20241218163616318       │ COMPLETED │ 1                             ║
   ╟─────────────────────────┼───────────┼───────────────────────────────╢
   ║ 20241218163403100       │ COMPLETED │ 1                             ║
   ╟─────────────────────────┼───────────┼───────────────────────────────╢
   ║ 20241218161120239       │ COMPLETED │ 1                             ║
   ╚═════════════════════════╧═══════════╧═══════════════════════════════╝
   
   
   
   ## Fourth time (including duplicate data)     0033      17:11
   
   Delete checkpoint/modify groupID and restart Flink task
   The inquiry for Hive data shows 348918 data points, with 150700 duplicate 
data points
   Search for hudi cli related information
        
   commits show
   
   
╔═══════════════════╤═════════════════════╤═══════════════════╤═════════════════════╤══════════════════════════╤═══════════════════════╤══════════════════════════════╤══════════════╗
   ║ CommitTime        │ Total Bytes Written │ Total Files Added │ Total Files 
Updated │ Total Partitions Written │ Total Records Written │ Total Update 
Records Written │ Total Errors ║
   
╠═══════════════════╪═════════════════════╪═══════════════════╪═════════════════════╪══════════════════════════╪═══════════════════════╪══════════════════════════════╪══════════════╣
   ║ 20241218171546059 │ 77.4 MB             │ 0                 │ 2            
       │ 1                        │ 348918                │ 188257              
         │ 0            ║
   
╟───────────────────┼─────────────────────┼───────────────────┼─────────────────────┼──────────────────────────┼───────────────────────┼──────────────────────────────┼──────────────╢
   ║ 20241218171437259 │ 231.4 MB            │ 0                 │ 2            
       │ 1                        │ 155032                │ 155032              
         │ 0            ║
   
╟───────────────────┼─────────────────────┼───────────────────┼─────────────────────┼──────────────────────────┼───────────────────────┼──────────────────────────────┼──────────────╢
   ║ 20241218171328561 │ 293.8 MB            │ 0                 │ 2            
       │ 1                        │ 198218                │ 198218              
         │ 0            ║
   
╟───────────────────┼─────────────────────┼───────────────────┼─────────────────────┼──────────────────────────┼───────────────────────┼──────────────────────────────┼──────────────╢
   ║ 20241218171327532 │ 75.3 MB             │ 1                 │ 1            
       │ 1                        │ 338957                │ 69072               
         │ 0            ║
   
╟───────────────────┼─────────────────────┼───────────────────┼─────────────────────┼──────────────────────────┼───────────────────────┼──────────────────────────────┼──────────────╢
   ║ 20241218171219664 │ 271.2 MB            │ 0                 │ 2            
       │ 1                        │ 182759                │ 42020               
         │ 0            ║
   
╟───────────────────┼─────────────────────┼───────────────────┼─────────────────────┼──────────────────────────┼───────────────────────┼──────────────────────────────┼──────────────╢
   ║ 20241218165336300 │ 41.2 MB             │ 0                 │ 1            
       │ 1                        │ 27052                 │ 27052               
         │ 0            ║
   
╟───────────────────┼─────────────────────┼───────────────────┼─────────────────────┼──────────────────────────┼───────────────────────┼──────────────────────────────┼──────────────╢
   ║ 20241218165336103 │ 43.5 MB             │ 0                 │ 1            
       │ 1                        │ 198218                │ 171166              
         │ 0            ║
   
╟───────────────────┼─────────────────────┼───────────────────┼─────────────────────┼──────────────────────────┼───────────────────────┼──────────────────────────────┼──────────────╢
   ║ 20241218163616516 │ 252.5 MB            │ 0                 │ 1            
       │ 1                        │ 171166                │ 171166              
         │ 0            ║
   
╟───────────────────┼─────────────────────┼───────────────────┼─────────────────────┼──────────────────────────┼───────────────────────┼──────────────────────────────┼──────────────╢
   ║ 20241218163616318 │ 43.6 MB             │ 0                 │ 1            
       │ 1                        │ 198218                │ 179543              
         │ 0            ║
   
╟───────────────────┼─────────────────────┼───────────────────┼─────────────────────┼──────────────────────────┼───────────────────────┼──────────────────────────────┼──────────────╢
   ║ 20241218163514630 │ 17.8 MB             │ 0                 │ 1            
       │ 1                        │ 12182                 │ 12182               
         │ 0            ║
   
╟───────────────────┼─────────────────────┼───────────────────┼─────────────────────┼──────────────────────────┼───────────────────────┼──────────────────────────────┼──────────────╢
   ║ 20241218163404017 │ 249.2 MB            │ 0                 │ 1            
       │ 1                        │ 167361                │ 167361              
         │ 0            ║
   
╟───────────────────┼─────────────────────┼───────────────────┼─────────────────────┼──────────────────────────┼───────────────────────┼──────────────────────────────┼──────────────╢
   ║ 20241218163403100 │ 43.5 MB             │ 0                 │ 1            
       │ 1                        │ 198218                │ 18675               
         │ 0            ║
   
╟───────────────────┼─────────────────────┼───────────────────┼─────────────────────┼──────────────────────────┼───────────────────────┼──────────────────────────────┼──────────────╢
   ║ 20241218161227103 │ 26.7 MB             │ 0                 │ 1            
       │ 1                        │ 18675                 │ 18675               
         │ 0            ║
   
╟───────────────────┼─────────────────────┼───────────────────┼─────────────────────┼──────────────────────────┼───────────────────────┼──────────────────────────────┼──────────────╢
   ║ 20241218161120812 │ 142.9 MB            │ 0                 │ 1            
       │ 1                        │ 95395                 │ 95395               
         │ 0            ║
   
╟───────────────────┼─────────────────────┼───────────────────┼─────────────────────┼──────────────────────────┼───────────────────────┼──────────────────────────────┼──────────────╢
   ║ 20241218161120239 │ 22.8 MB             │ 1                 │ 0            
       │ 1                        │ 102823                │ 0                   
         │ 0            ║
   
╟───────────────────┼─────────────────────┼───────────────────┼─────────────────────┼──────────────────────────┼───────────────────────┼──────────────────────────────┼──────────────╢
   ║ 20241218161024176 │ 150.8 MB            │ 0                 │ 1            
       │ 1                        │ 102823                │ 0                   
         │ 0            ║
   
╚═══════════════════╧═════════════════════╧═══════════════════╧═════════════════════╧══════════════════════════╧═══════════════════════╧══════════════════════════════╧══════════════╝
   
   
   cleans show
   
╔═══════════════════╤═════════════════════════╤═════════════════════╤══════════════════╗
   ║ CleanTime         │ EarliestCommandRetained │ Total Files Deleted │ Total 
Time Taken ║
   
╠═══════════════════╪═════════════════════════╪═════════════════════╪══════════════════╣
   ║ 20241218171645948 │ 20241218163404017       │ 2                   │ 109    
          ║
   
╟───────────────────┼─────────────────────────┼─────────────────────┼──────────────────╢
   ║ 20241218171426737 │ 20241218161120812       │ 1                   │ 74     
          ║
   
╚═══════════════════╧═════════════════════════╧═════════════════════╧══════════════════╝
   
   compactions show all
   ╔═════════════════════════╤═══════════╤═══════════════════════════════╗
   ║ Compaction Instant Time │ State     │ Total FileIds to be Compacted ║
   ╠═════════════════════════╪═══════════╪═══════════════════════════════╣
   ║ 20241218171546059       │ COMPLETED │ 2                             ║
   ╟─────────────────────────┼───────────┼───────────────────────────────╢
   ║ 20241218171327532       │ COMPLETED │ 2                             ║
   ╟─────────────────────────┼───────────┼───────────────────────────────╢
   ║ 20241218165336103       │ COMPLETED │ 1                             ║
   ╟─────────────────────────┼───────────┼───────────────────────────────╢
   ║ 20241218163616318       │ COMPLETED │ 1                             ║
   ╟─────────────────────────┼───────────┼───────────────────────────────╢
   ║ 20241218163403100       │ COMPLETED │ 1                             ║
   ╟─────────────────────────┼───────────┼───────────────────────────────╢
   ║ 20241218161120239       │ COMPLETED │ 1                             ║
   ╚═════════════════════════╧═══════════╧═══════════════════════════════╝
   
   
   all hdfs file 
   
   [root@bobcfc-sdcdh-un01 ~]# hdfs dfs -du -s -h 
hdfs://nameservice1/user/hive/warehouse/ods.db/xxxxx/*
   267.1 M  801.2 M  
hdfs://nameservice1/user/hive/warehouse/ods.db/xxxxx/.65e2e9f7-ed93-49e6-9067-163e02c89f63_20241218163403100.log.1_0-1-0
   252.5 M  757.6 M  
hdfs://nameservice1/user/hive/warehouse/ods.db/xxxxx/.65e2e9f7-ed93-49e6-9067-163e02c89f63_20241218163616318.log.1_0-1-0
   102.0 M  305.9 M  
hdfs://nameservice1/user/hive/warehouse/ods.db/xxxxx/.65e2e9f7-ed93-49e6-9067-163e02c89f63_20241218165336103.log.1_0-1-0
   76.8 M   230.5 M  
hdfs://nameservice1/user/hive/warehouse/ods.db/xxxxx/.65e2e9f7-ed93-49e6-9067-163e02c89f63_20241218171327532.log.1_0-1-0
   210.5 M  631.5 M  
hdfs://nameservice1/user/hive/warehouse/ods.db/xxxxx/.e1ebc3c2-65d9-406a-9f9b-0d803c07e25a_20241218171219664.log.1_0-1-0
   448.3 M  1.3 G    
hdfs://nameservice1/user/hive/warehouse/ods.db/xxxxx/.e1ebc3c2-65d9-406a-9f9b-0d803c07e25a_20241218171327532.log.1_0-1-0
   168.8 K  506.3 K  
hdfs://nameservice1/user/hive/warehouse/ods.db/xxxxx/.hoodie
   96       288      
hdfs://nameservice1/user/hive/warehouse/ods.db/xxxxx/.hoodie_partition_metadata
   43.5 M   130.6 M  
hdfs://nameservice1/user/hive/warehouse/ods.db/xxxxx/65e2e9f7-ed93-49e6-9067-163e02c89f63_0-1-0_20241218163403100.parquet
   43.6 M   130.7 M  
hdfs://nameservice1/user/hive/warehouse/ods.db/xxxxx/65e2e9f7-ed93-49e6-9067-163e02c89f63_0-1-0_20241218163616318.parquet
   43.5 M   130.6 M  
hdfs://nameservice1/user/hive/warehouse/ods.db/xxxxx/65e2e9f7-ed93-49e6-9067-163e02c89f63_0-1-0_20241218165336103.parquet
   43.5 M   130.6 M  
hdfs://nameservice1/user/hive/warehouse/ods.db/xxxxx/65e2e9f7-ed93-49e6-9067-163e02c89f63_0-1-0_20241218171327532.parquet
   43.5 M   130.6 M  
hdfs://nameservice1/user/hive/warehouse/ods.db/xxxxx/65e2e9f7-ed93-49e6-9067-163e02c89f63_0-1-0_20241218171546059.parquet
   31.8 M   95.4 M   
hdfs://nameservice1/user/hive/warehouse/ods.db/xxxxx/e1ebc3c2-65d9-406a-9f9b-0d803c07e25a_0-1-0_20241218171327532.parquet
   33.8 M   101.5 M  
hdfs://nameservice1/user/hive/warehouse/ods.db/xxxxx/e1ebc3c2-65d9-406a-9f9b-0d803c07e25a_0-1-0_20241218171546059.parquet
   
   
   
   
   
   **Expected behavior**
   
   A clear and concise description of what you expected to happen.
   
   **Environment Description**
   
   * Hudi version : 0.14
   
   * flink version :  1.13
   
   * Hive version : 3.1.1 
   
   * Hadoop version : 3.1
   
   * Storage (HDFS/S3/GCS..) :
   
   * Running on Docker? (yes/no) : no
   
   **Additional context**
   
   Add any other context about the problem here.
   
   **Stacktrace**
   
   ```Add the stacktrace of the error.```
   
   


-- 
This is an automated message from the Apache Git Service.
To respond to the message, please log on to GitHub and use the
URL above to go to the specific comment.

To unsubscribe, e-mail: [email protected]

For queries about this service, please contact Infrastructure at:
[email protected]

Reply via email to