[jira] [Work logged] (HDFS-16598) All datanodes [DatanodeInfoWithStorage[127.0.0.1:57448,DS-1b5f7e33-a2bf-4edc-9122-a74c995a99f5,DISK]] are bad. Aborting...

ASF GitHub Bot (Jira) Tue, 31 May 2022 23:49:23 -0700


     [ 
https://issues.apache.org/jira/browse/HDFS-16598?focusedWorklogId=776684&page=com.atlassian.jira.plugin.system.issuetabpanels:worklog-tabpanel#worklog-776684
 ]


ASF GitHub Bot logged work on HDFS-16598:
-----------------------------------------

                Author: ASF GitHub Bot
            Created on: 01/Jun/22 06:48
            Start Date: 01/Jun/22 06:48
    Worklog Time Spent: 10m 
      Work Description: ZanderXu commented on PR #4366:
URL: https://github.com/apache/hadoop/pull/4366#issuecomment-1143182980

   In the original PipelineRecovery process, if the pipeline recovery failed, 
the block GS maybe inconsistency. So during Pipeline Recovery, GS inconsistency 
is expected. 
   
   [HDFS-16534](https://issues.apache.org/jira/browse/HDFS-16534) has a bug in 
handling inconsistent GS,  and caused **All datanodes XXX are bad. 
Aborting...** 
   




Issue Time Tracking
-------------------

    Worklog Id:     (was: 776684)
    Time Spent: 50m  (was: 40m)

> All datanodes 
> [DatanodeInfoWithStorage[127.0.0.1:57448,DS-1b5f7e33-a2bf-4edc-9122-a74c995a99f5,DISK]]
>  are bad. Aborting...
> --------------------------------------------------------------------------------------------------------------------------
>
>                 Key: HDFS-16598
>                 URL: https://issues.apache.org/jira/browse/HDFS-16598
>             Project: Hadoop HDFS
>          Issue Type: Bug
>            Reporter: ZanderXu
>            Assignee: ZanderXu
>            Priority: Major
>              Labels: pull-request-available
>          Time Spent: 50m
>  Remaining Estimate: 0h
>
> org.apache.hadoop.hdfs.testPipelineRecoveryOnRestartFailure failed with the 
> stack like:
> {code:java}
> java.io.IOException: All datanodes 
> [DatanodeInfoWithStorage[127.0.0.1:57448,DS-1b5f7e33-a2bf-4edc-9122-a74c995a99f5,DISK]]
>  are bad. Aborting...
>       at 
> org.apache.hadoop.hdfs.DataStreamer.handleBadDatanode(DataStreamer.java:1667)
>       at 
> org.apache.hadoop.hdfs.DataStreamer.setupPipelineInternal(DataStreamer.java:1601)
>       at 
> org.apache.hadoop.hdfs.DataStreamer.setupPipelineForAppendOrRecovery(DataStreamer.java:1587)
>       at 
> org.apache.hadoop.hdfs.DataStreamer.processDatanodeOrExternalError(DataStreamer.java:1371)
>       at org.apache.hadoop.hdfs.DataStreamer.run(DataStreamer.java:674)
> {code}
> After tracing the root cause, this bug was introduced by 
> [HDFS-16534|https://issues.apache.org/jira/browse/HDFS-16534]. Because the 
> block GS of client may be smaller than DN when pipeline recovery failed.



--
This message was sent by Atlassian Jira
(v8.20.7#820007)

---------------------------------------------------------------------
To unsubscribe, e-mail: [email protected]
For additional commands, e-mail: [email protected]

[jira] [Work logged] (HDFS-16598) All datanodes [DatanodeInfoWithStorage[127.0.0.1:57448,DS-1b5f7e33-a2bf-4edc-9122-a74c995a99f5,DISK]] are bad. Aborting...

Reply via email to