subject:"\[jira\] \[Commented\] \(YARN\-3222\) RMNodeImpl#ReconnectNodeTransition should send scheduler events in sequential order"


[ 
https://issues.apache.org/jira/browse/YARN-3222?page=com.atlassian.jira.plugin.system.issuetabpanels:comment-tabpanel=14726498#comment-14726498
 ] 

Hudson commented on YARN-3222:
--

FAILURE: Integrated in Hadoop-Mapreduce-trunk #2279 (See 
[https://builds.apache.org/job/Hadoop-Mapreduce-trunk/2279/])
YARN-3222. Added the missing CHANGES.txt entry. (vinodkv: rev 
4620767156ecc43424bc6c7c4d50519e2563cc69)
* hadoop-yarn-project/CHANGES.txt


> RMNodeImpl#ReconnectNodeTransition should send scheduler events in sequential 
> order
> ---
>
> Key: YARN-3222
> URL: https://issues.apache.org/jira/browse/YARN-3222
> Project: Hadoop YARN
>  Issue Type: Bug
>  Components: resourcemanager
>Affects Versions: 2.6.0
>Reporter: Rohith Sharma K S
>Assignee: Rohith Sharma K S
>Priority: Critical
>  Labels: 2.6.1-candidate
> Fix For: 2.7.0, 2.6.1
>
> Attachments: 0001-YARN-3222.patch, 0002-YARN-3222.patch, 
> 0003-YARN-3222.patch, 0004-YARN-3222.patch, 0005-YARN-3222.patch
>
>
> When a node is reconnected,RMNodeImpl#ReconnectNodeTransition notifies the 
> scheduler in a events node_added,node_removed or node_resource_update. These 
> events should be notified in an sequential order i.e node_added event and 
> next node_resource_update events.
> But if the node is reconnected with different http port, the oder of 
> scheduler events are node_removed --> node_resource_update --> node_added 
> which causes scheduler does not find the node and throw NPE and RM exit.
> Node_Resource_update event should be always should be triggered via 
> RMNodeEventType.RESOURCE_UPDATE



--
This message was sent by Atlassian JIRA
(v6.3.4#6332)

[jira] [Commented] (YARN-3222) RMNodeImpl#ReconnectNodeTransition should send scheduler events in sequential order


[ 
https://issues.apache.org/jira/browse/YARN-3222?page=com.atlassian.jira.plugin.system.issuetabpanels:comment-tabpanel=14726376#comment-14726376
 ] 

Hudson commented on YARN-3222:
--

FAILURE: Integrated in Hadoop-Hdfs-trunk #2260 (See 
[https://builds.apache.org/job/Hadoop-Hdfs-trunk/2260/])
YARN-3222. Added the missing CHANGES.txt entry. (vinodkv: rev 
4620767156ecc43424bc6c7c4d50519e2563cc69)
* hadoop-yarn-project/CHANGES.txt


> RMNodeImpl#ReconnectNodeTransition should send scheduler events in sequential 
> order
> ---
>
> Key: YARN-3222
> URL: https://issues.apache.org/jira/browse/YARN-3222
> Project: Hadoop YARN
>  Issue Type: Bug
>  Components: resourcemanager
>Affects Versions: 2.6.0
>Reporter: Rohith Sharma K S
>Assignee: Rohith Sharma K S
>Priority: Critical
>  Labels: 2.6.1-candidate
> Fix For: 2.7.0, 2.6.1
>
> Attachments: 0001-YARN-3222.patch, 0002-YARN-3222.patch, 
> 0003-YARN-3222.patch, 0004-YARN-3222.patch, 0005-YARN-3222.patch
>
>
> When a node is reconnected,RMNodeImpl#ReconnectNodeTransition notifies the 
> scheduler in a events node_added,node_removed or node_resource_update. These 
> events should be notified in an sequential order i.e node_added event and 
> next node_resource_update events.
> But if the node is reconnected with different http port, the oder of 
> scheduler events are node_removed --> node_resource_update --> node_added 
> which causes scheduler does not find the node and throw NPE and RM exit.
> Node_Resource_update event should be always should be triggered via 
> RMNodeEventType.RESOURCE_UPDATE



--
This message was sent by Atlassian JIRA
(v6.3.4#6332)

[jira] [Commented] (YARN-3222) RMNodeImpl#ReconnectNodeTransition should send scheduler events in sequential order


[ 
https://issues.apache.org/jira/browse/YARN-3222?page=com.atlassian.jira.plugin.system.issuetabpanels:comment-tabpanel=14726378#comment-14726378
 ] 

Hudson commented on YARN-3222:
--

FAILURE: Integrated in Hadoop-Yarn-trunk-Java8 #338 (See 
[https://builds.apache.org/job/Hadoop-Yarn-trunk-Java8/338/])
YARN-3222. Added the missing CHANGES.txt entry. (vinodkv: rev 
4620767156ecc43424bc6c7c4d50519e2563cc69)
* hadoop-yarn-project/CHANGES.txt


> RMNodeImpl#ReconnectNodeTransition should send scheduler events in sequential 
> order
> ---
>
> Key: YARN-3222
> URL: https://issues.apache.org/jira/browse/YARN-3222
> Project: Hadoop YARN
>  Issue Type: Bug
>  Components: resourcemanager
>Affects Versions: 2.6.0
>Reporter: Rohith Sharma K S
>Assignee: Rohith Sharma K S
>Priority: Critical
>  Labels: 2.6.1-candidate
> Fix For: 2.7.0, 2.6.1
>
> Attachments: 0001-YARN-3222.patch, 0002-YARN-3222.patch, 
> 0003-YARN-3222.patch, 0004-YARN-3222.patch, 0005-YARN-3222.patch
>
>
> When a node is reconnected,RMNodeImpl#ReconnectNodeTransition notifies the 
> scheduler in a events node_added,node_removed or node_resource_update. These 
> events should be notified in an sequential order i.e node_added event and 
> next node_resource_update events.
> But if the node is reconnected with different http port, the oder of 
> scheduler events are node_removed --> node_resource_update --> node_added 
> which causes scheduler does not find the node and throw NPE and RM exit.
> Node_Resource_update event should be always should be triggered via 
> RMNodeEventType.RESOURCE_UPDATE



--
This message was sent by Atlassian JIRA
(v6.3.4#6332)

[jira] [Commented] (YARN-3222) RMNodeImpl#ReconnectNodeTransition should send scheduler events in sequential order


[ 
https://issues.apache.org/jira/browse/YARN-3222?page=com.atlassian.jira.plugin.system.issuetabpanels:comment-tabpanel=14726371#comment-14726371
 ] 

Hudson commented on YARN-3222:
--

FAILURE: Integrated in Hadoop-Yarn-trunk #1065 (See 
[https://builds.apache.org/job/Hadoop-Yarn-trunk/1065/])
YARN-3222. Added the missing CHANGES.txt entry. (vinodkv: rev 
4620767156ecc43424bc6c7c4d50519e2563cc69)
* hadoop-yarn-project/CHANGES.txt


> RMNodeImpl#ReconnectNodeTransition should send scheduler events in sequential 
> order
> ---
>
> Key: YARN-3222
> URL: https://issues.apache.org/jira/browse/YARN-3222
> Project: Hadoop YARN
>  Issue Type: Bug
>  Components: resourcemanager
>Affects Versions: 2.6.0
>Reporter: Rohith Sharma K S
>Assignee: Rohith Sharma K S
>Priority: Critical
>  Labels: 2.6.1-candidate
> Fix For: 2.7.0, 2.6.1
>
> Attachments: 0001-YARN-3222.patch, 0002-YARN-3222.patch, 
> 0003-YARN-3222.patch, 0004-YARN-3222.patch, 0005-YARN-3222.patch
>
>
> When a node is reconnected,RMNodeImpl#ReconnectNodeTransition notifies the 
> scheduler in a events node_added,node_removed or node_resource_update. These 
> events should be notified in an sequential order i.e node_added event and 
> next node_resource_update events.
> But if the node is reconnected with different http port, the oder of 
> scheduler events are node_removed --> node_resource_update --> node_added 
> which causes scheduler does not find the node and throw NPE and RM exit.
> Node_Resource_update event should be always should be triggered via 
> RMNodeEventType.RESOURCE_UPDATE



--
This message was sent by Atlassian JIRA
(v6.3.4#6332)

[jira] [Commented] (YARN-3222) RMNodeImpl#ReconnectNodeTransition should send scheduler events in sequential order


[ 
https://issues.apache.org/jira/browse/YARN-3222?page=com.atlassian.jira.plugin.system.issuetabpanels:comment-tabpanel=14726373#comment-14726373
 ] 

Hudson commented on YARN-3222:
--

FAILURE: Integrated in Hadoop-Hdfs-trunk-Java8 #321 (See 
[https://builds.apache.org/job/Hadoop-Hdfs-trunk-Java8/321/])
YARN-3222. Added the missing CHANGES.txt entry. (vinodkv: rev 
4620767156ecc43424bc6c7c4d50519e2563cc69)
* hadoop-yarn-project/CHANGES.txt


> RMNodeImpl#ReconnectNodeTransition should send scheduler events in sequential 
> order
> ---
>
> Key: YARN-3222
> URL: https://issues.apache.org/jira/browse/YARN-3222
> Project: Hadoop YARN
>  Issue Type: Bug
>  Components: resourcemanager
>Affects Versions: 2.6.0
>Reporter: Rohith Sharma K S
>Assignee: Rohith Sharma K S
>Priority: Critical
>  Labels: 2.6.1-candidate
> Fix For: 2.7.0, 2.6.1
>
> Attachments: 0001-YARN-3222.patch, 0002-YARN-3222.patch, 
> 0003-YARN-3222.patch, 0004-YARN-3222.patch, 0005-YARN-3222.patch
>
>
> When a node is reconnected,RMNodeImpl#ReconnectNodeTransition notifies the 
> scheduler in a events node_added,node_removed or node_resource_update. These 
> events should be notified in an sequential order i.e node_added event and 
> next node_resource_update events.
> But if the node is reconnected with different http port, the oder of 
> scheduler events are node_removed --> node_resource_update --> node_added 
> which causes scheduler does not find the node and throw NPE and RM exit.
> Node_Resource_update event should be always should be triggered via 
> RMNodeEventType.RESOURCE_UPDATE



--
This message was sent by Atlassian JIRA
(v6.3.4#6332)

[jira] [Commented] (YARN-3222) RMNodeImpl#ReconnectNodeTransition should send scheduler events in sequential order


[ 
https://issues.apache.org/jira/browse/YARN-3222?page=com.atlassian.jira.plugin.system.issuetabpanels:comment-tabpanel=14726377#comment-14726377
 ] 

Hudson commented on YARN-3222:
--

FAILURE: Integrated in Hadoop-Mapreduce-trunk-Java8 #330 (See 
[https://builds.apache.org/job/Hadoop-Mapreduce-trunk-Java8/330/])
YARN-3222. Added the missing CHANGES.txt entry. (vinodkv: rev 
4620767156ecc43424bc6c7c4d50519e2563cc69)
* hadoop-yarn-project/CHANGES.txt


> RMNodeImpl#ReconnectNodeTransition should send scheduler events in sequential 
> order
> ---
>
> Key: YARN-3222
> URL: https://issues.apache.org/jira/browse/YARN-3222
> Project: Hadoop YARN
>  Issue Type: Bug
>  Components: resourcemanager
>Affects Versions: 2.6.0
>Reporter: Rohith Sharma K S
>Assignee: Rohith Sharma K S
>Priority: Critical
>  Labels: 2.6.1-candidate
> Fix For: 2.7.0, 2.6.1
>
> Attachments: 0001-YARN-3222.patch, 0002-YARN-3222.patch, 
> 0003-YARN-3222.patch, 0004-YARN-3222.patch, 0005-YARN-3222.patch
>
>
> When a node is reconnected,RMNodeImpl#ReconnectNodeTransition notifies the 
> scheduler in a events node_added,node_removed or node_resource_update. These 
> events should be notified in an sequential order i.e node_added event and 
> next node_resource_update events.
> But if the node is reconnected with different http port, the oder of 
> scheduler events are node_removed --> node_resource_update --> node_added 
> which causes scheduler does not find the node and throw NPE and RM exit.
> Node_Resource_update event should be always should be triggered via 
> RMNodeEventType.RESOURCE_UPDATE



--
This message was sent by Atlassian JIRA
(v6.3.4#6332)

[jira] [Commented] (YARN-3222) RMNodeImpl#ReconnectNodeTransition should send scheduler events in sequential order


[ 
https://issues.apache.org/jira/browse/YARN-3222?page=com.atlassian.jira.plugin.system.issuetabpanels:comment-tabpanel=14726216#comment-14726216
 ] 

Hudson commented on YARN-3222:
--

FAILURE: Integrated in Hadoop-trunk-Commit #8382 (See 
[https://builds.apache.org/job/Hadoop-trunk-Commit/8382/])
YARN-3222. Added the missing CHANGES.txt entry. (vinodkv: rev 
4620767156ecc43424bc6c7c4d50519e2563cc69)
* hadoop-yarn-project/CHANGES.txt


> RMNodeImpl#ReconnectNodeTransition should send scheduler events in sequential 
> order
> ---
>
> Key: YARN-3222
> URL: https://issues.apache.org/jira/browse/YARN-3222
> Project: Hadoop YARN
>  Issue Type: Bug
>  Components: resourcemanager
>Affects Versions: 2.6.0
>Reporter: Rohith Sharma K S
>Assignee: Rohith Sharma K S
>Priority: Critical
>  Labels: 2.6.1-candidate
> Fix For: 2.7.0, 2.6.1
>
> Attachments: 0001-YARN-3222.patch, 0002-YARN-3222.patch, 
> 0003-YARN-3222.patch, 0004-YARN-3222.patch, 0005-YARN-3222.patch
>
>
> When a node is reconnected,RMNodeImpl#ReconnectNodeTransition notifies the 
> scheduler in a events node_added,node_removed or node_resource_update. These 
> events should be notified in an sequential order i.e node_added event and 
> next node_resource_update events.
> But if the node is reconnected with different http port, the oder of 
> scheduler events are node_removed --> node_resource_update --> node_added 
> which causes scheduler does not find the node and throw NPE and RM exit.
> Node_Resource_update event should be always should be triggered via 
> RMNodeEventType.RESOURCE_UPDATE



--
This message was sent by Atlassian JIRA
(v6.3.4#6332)

[jira] [Commented] (YARN-3222) RMNodeImpl#ReconnectNodeTransition should send scheduler events in sequential order

2015-07-27 Thread Sangjin Lee (JIRA)


[ 
https://issues.apache.org/jira/browse/YARN-3222?page=com.atlassian.jira.plugin.system.issuetabpanels:comment-tabpanelfocusedCommentId=14642813#comment-14642813
 ] 

Sangjin Lee commented on YARN-3222:
---

The merge to 2.6.0 is straightforward.

 RMNodeImpl#ReconnectNodeTransition should send scheduler events in sequential 
 order
 ---

 Key: YARN-3222
 URL: https://issues.apache.org/jira/browse/YARN-3222
 Project: Hadoop YARN
  Issue Type: Bug
  Components: resourcemanager
Affects Versions: 2.6.0
Reporter: Rohith Sharma K S
Assignee: Rohith Sharma K S
Priority: Critical
  Labels: 2.6.1-candidate
 Fix For: 2.7.0

 Attachments: 0001-YARN-3222.patch, 0002-YARN-3222.patch, 
 0003-YARN-3222.patch, 0004-YARN-3222.patch, 0005-YARN-3222.patch


 When a node is reconnected,RMNodeImpl#ReconnectNodeTransition notifies the 
 scheduler in a events node_added,node_removed or node_resource_update. These 
 events should be notified in an sequential order i.e node_added event and 
 next node_resource_update events.
 But if the node is reconnected with different http port, the oder of 
 scheduler events are node_removed -- node_resource_update -- node_added 
 which causes scheduler does not find the node and throw NPE and RM exit.
 Node_Resource_update event should be always should be triggered via 
 RMNodeEventType.RESOURCE_UPDATE



--
This message was sent by Atlassian JIRA
(v6.3.4#6332)

[jira] [Commented] (YARN-3222) RMNodeImpl#ReconnectNodeTransition should send scheduler events in sequential order


[ 
https://issues.apache.org/jira/browse/YARN-3222?page=com.atlassian.jira.plugin.system.issuetabpanels:comment-tabpanelfocusedCommentId=14347037#comment-14347037
 ] 

Hudson commented on YARN-3222:
--

SUCCESS: Integrated in Hadoop-Mapreduce-trunk #2072 (See 
[https://builds.apache.org/job/Hadoop-Mapreduce-trunk/2072/])
YARN-3222. Fixed NPE on RMNodeImpl#ReconnectNodeTransition when a node is 
reconnected with a different port. Contributed by Rohith Sharmaks (jianhe: rev 
b2f1ec312ee431aef762cfb49cb29cd6f4661e86)
* 
hadoop-yarn-project/hadoop-yarn/hadoop-yarn-server/hadoop-yarn-server-resourcemanager/src/test/java/org/apache/hadoop/yarn/server/resourcemanager/TestResourceTrackerService.java
* 
hadoop-yarn-project/hadoop-yarn/hadoop-yarn-server/hadoop-yarn-server-resourcemanager/src/main/java/org/apache/hadoop/yarn/server/resourcemanager/rmnode/RMNodeImpl.java
* 
hadoop-yarn-project/hadoop-yarn/hadoop-yarn-server/hadoop-yarn-server-resourcemanager/src/test/java/org/apache/hadoop/yarn/server/resourcemanager/MockNM.java


 RMNodeImpl#ReconnectNodeTransition should send scheduler events in sequential 
 order
 ---

 Key: YARN-3222
 URL: https://issues.apache.org/jira/browse/YARN-3222
 Project: Hadoop YARN
  Issue Type: Bug
  Components: resourcemanager
Affects Versions: 2.6.0
Reporter: Rohith
Assignee: Rohith
Priority: Critical
 Fix For: 2.7.0

 Attachments: 0001-YARN-3222.patch, 0002-YARN-3222.patch, 
 0003-YARN-3222.patch, 0004-YARN-3222.patch, 0005-YARN-3222.patch


 When a node is reconnected,RMNodeImpl#ReconnectNodeTransition notifies the 
 scheduler in a events node_added,node_removed or node_resource_update. These 
 events should be notified in an sequential order i.e node_added event and 
 next node_resource_update events.
 But if the node is reconnected with different http port, the oder of 
 scheduler events are node_removed -- node_resource_update -- node_added 
 which causes scheduler does not find the node and throw NPE and RM exit.
 Node_Resource_update event should be always should be triggered via 
 RMNodeEventType.RESOURCE_UPDATE



--
This message was sent by Atlassian JIRA
(v6.3.4#6332)

[jira] [Commented] (YARN-3222) RMNodeImpl#ReconnectNodeTransition should send scheduler events in sequential order


[ 
https://issues.apache.org/jira/browse/YARN-3222?page=com.atlassian.jira.plugin.system.issuetabpanels:comment-tabpanelfocusedCommentId=14346710#comment-14346710
 ] 

Hudson commented on YARN-3222:
--

FAILURE: Integrated in Hadoop-Yarn-trunk-Java8 #122 (See 
[https://builds.apache.org/job/Hadoop-Yarn-trunk-Java8/122/])
YARN-3222. Fixed NPE on RMNodeImpl#ReconnectNodeTransition when a node is 
reconnected with a different port. Contributed by Rohith Sharmaks (jianhe: rev 
b2f1ec312ee431aef762cfb49cb29cd6f4661e86)
* 
hadoop-yarn-project/hadoop-yarn/hadoop-yarn-server/hadoop-yarn-server-resourcemanager/src/main/java/org/apache/hadoop/yarn/server/resourcemanager/rmnode/RMNodeImpl.java
* 
hadoop-yarn-project/hadoop-yarn/hadoop-yarn-server/hadoop-yarn-server-resourcemanager/src/test/java/org/apache/hadoop/yarn/server/resourcemanager/TestResourceTrackerService.java
* 
hadoop-yarn-project/hadoop-yarn/hadoop-yarn-server/hadoop-yarn-server-resourcemanager/src/test/java/org/apache/hadoop/yarn/server/resourcemanager/MockNM.java


 RMNodeImpl#ReconnectNodeTransition should send scheduler events in sequential 
 order
 ---

 Key: YARN-3222
 URL: https://issues.apache.org/jira/browse/YARN-3222
 Project: Hadoop YARN
  Issue Type: Bug
  Components: resourcemanager
Affects Versions: 2.6.0
Reporter: Rohith
Assignee: Rohith
Priority: Critical
 Fix For: 2.7.0

 Attachments: 0001-YARN-3222.patch, 0002-YARN-3222.patch, 
 0003-YARN-3222.patch, 0004-YARN-3222.patch, 0005-YARN-3222.patch


 When a node is reconnected,RMNodeImpl#ReconnectNodeTransition notifies the 
 scheduler in a events node_added,node_removed or node_resource_update. These 
 events should be notified in an sequential order i.e node_added event and 
 next node_resource_update events.
 But if the node is reconnected with different http port, the oder of 
 scheduler events are node_removed -- node_resource_update -- node_added 
 which causes scheduler does not find the node and throw NPE and RM exit.
 Node_Resource_update event should be always should be triggered via 
 RMNodeEventType.RESOURCE_UPDATE



--
This message was sent by Atlassian JIRA
(v6.3.4#6332)

[jira] [Commented] (YARN-3222) RMNodeImpl#ReconnectNodeTransition should send scheduler events in sequential order


[ 
https://issues.apache.org/jira/browse/YARN-3222?page=com.atlassian.jira.plugin.system.issuetabpanels:comment-tabpanelfocusedCommentId=14346720#comment-14346720
 ] 

Hudson commented on YARN-3222:
--

FAILURE: Integrated in Hadoop-Yarn-trunk #856 (See 
[https://builds.apache.org/job/Hadoop-Yarn-trunk/856/])
YARN-3222. Fixed NPE on RMNodeImpl#ReconnectNodeTransition when a node is 
reconnected with a different port. Contributed by Rohith Sharmaks (jianhe: rev 
b2f1ec312ee431aef762cfb49cb29cd6f4661e86)
* 
hadoop-yarn-project/hadoop-yarn/hadoop-yarn-server/hadoop-yarn-server-resourcemanager/src/main/java/org/apache/hadoop/yarn/server/resourcemanager/rmnode/RMNodeImpl.java
* 
hadoop-yarn-project/hadoop-yarn/hadoop-yarn-server/hadoop-yarn-server-resourcemanager/src/test/java/org/apache/hadoop/yarn/server/resourcemanager/TestResourceTrackerService.java
* 
hadoop-yarn-project/hadoop-yarn/hadoop-yarn-server/hadoop-yarn-server-resourcemanager/src/test/java/org/apache/hadoop/yarn/server/resourcemanager/MockNM.java


 RMNodeImpl#ReconnectNodeTransition should send scheduler events in sequential 
 order
 ---

 Key: YARN-3222
 URL: https://issues.apache.org/jira/browse/YARN-3222
 Project: Hadoop YARN
  Issue Type: Bug
  Components: resourcemanager
Affects Versions: 2.6.0
Reporter: Rohith
Assignee: Rohith
Priority: Critical
 Fix For: 2.7.0

 Attachments: 0001-YARN-3222.patch, 0002-YARN-3222.patch, 
 0003-YARN-3222.patch, 0004-YARN-3222.patch, 0005-YARN-3222.patch


 When a node is reconnected,RMNodeImpl#ReconnectNodeTransition notifies the 
 scheduler in a events node_added,node_removed or node_resource_update. These 
 events should be notified in an sequential order i.e node_added event and 
 next node_resource_update events.
 But if the node is reconnected with different http port, the oder of 
 scheduler events are node_removed -- node_resource_update -- node_added 
 which causes scheduler does not find the node and throw NPE and RM exit.
 Node_Resource_update event should be always should be triggered via 
 RMNodeEventType.RESOURCE_UPDATE



--
This message was sent by Atlassian JIRA
(v6.3.4#6332)

[jira] [Commented] (YARN-3222) RMNodeImpl#ReconnectNodeTransition should send scheduler events in sequential order


[ 
https://issues.apache.org/jira/browse/YARN-3222?page=com.atlassian.jira.plugin.system.issuetabpanels:comment-tabpanelfocusedCommentId=14346925#comment-14346925
 ] 

Hudson commented on YARN-3222:
--

FAILURE: Integrated in Hadoop-Hdfs-trunk #2054 (See 
[https://builds.apache.org/job/Hadoop-Hdfs-trunk/2054/])
YARN-3222. Fixed NPE on RMNodeImpl#ReconnectNodeTransition when a node is 
reconnected with a different port. Contributed by Rohith Sharmaks (jianhe: rev 
b2f1ec312ee431aef762cfb49cb29cd6f4661e86)
* 
hadoop-yarn-project/hadoop-yarn/hadoop-yarn-server/hadoop-yarn-server-resourcemanager/src/main/java/org/apache/hadoop/yarn/server/resourcemanager/rmnode/RMNodeImpl.java
* 
hadoop-yarn-project/hadoop-yarn/hadoop-yarn-server/hadoop-yarn-server-resourcemanager/src/test/java/org/apache/hadoop/yarn/server/resourcemanager/TestResourceTrackerService.java
* 
hadoop-yarn-project/hadoop-yarn/hadoop-yarn-server/hadoop-yarn-server-resourcemanager/src/test/java/org/apache/hadoop/yarn/server/resourcemanager/MockNM.java


 RMNodeImpl#ReconnectNodeTransition should send scheduler events in sequential 
 order
 ---

 Key: YARN-3222
 URL: https://issues.apache.org/jira/browse/YARN-3222
 Project: Hadoop YARN
  Issue Type: Bug
  Components: resourcemanager
Affects Versions: 2.6.0
Reporter: Rohith
Assignee: Rohith
Priority: Critical
 Fix For: 2.7.0

 Attachments: 0001-YARN-3222.patch, 0002-YARN-3222.patch, 
 0003-YARN-3222.patch, 0004-YARN-3222.patch, 0005-YARN-3222.patch


 When a node is reconnected,RMNodeImpl#ReconnectNodeTransition notifies the 
 scheduler in a events node_added,node_removed or node_resource_update. These 
 events should be notified in an sequential order i.e node_added event and 
 next node_resource_update events.
 But if the node is reconnected with different http port, the oder of 
 scheduler events are node_removed -- node_resource_update -- node_added 
 which causes scheduler does not find the node and throw NPE and RM exit.
 Node_Resource_update event should be always should be triggered via 
 RMNodeEventType.RESOURCE_UPDATE



--
This message was sent by Atlassian JIRA
(v6.3.4#6332)

[jira] [Commented] (YARN-3222) RMNodeImpl#ReconnectNodeTransition should send scheduler events in sequential order


[ 
https://issues.apache.org/jira/browse/YARN-3222?page=com.atlassian.jira.plugin.system.issuetabpanels:comment-tabpanelfocusedCommentId=14346934#comment-14346934
 ] 

Hudson commented on YARN-3222:
--

FAILURE: Integrated in Hadoop-Hdfs-trunk-Java8 #113 (See 
[https://builds.apache.org/job/Hadoop-Hdfs-trunk-Java8/113/])
YARN-3222. Fixed NPE on RMNodeImpl#ReconnectNodeTransition when a node is 
reconnected with a different port. Contributed by Rohith Sharmaks (jianhe: rev 
b2f1ec312ee431aef762cfb49cb29cd6f4661e86)
* 
hadoop-yarn-project/hadoop-yarn/hadoop-yarn-server/hadoop-yarn-server-resourcemanager/src/test/java/org/apache/hadoop/yarn/server/resourcemanager/TestResourceTrackerService.java
* 
hadoop-yarn-project/hadoop-yarn/hadoop-yarn-server/hadoop-yarn-server-resourcemanager/src/main/java/org/apache/hadoop/yarn/server/resourcemanager/rmnode/RMNodeImpl.java
* 
hadoop-yarn-project/hadoop-yarn/hadoop-yarn-server/hadoop-yarn-server-resourcemanager/src/test/java/org/apache/hadoop/yarn/server/resourcemanager/MockNM.java


 RMNodeImpl#ReconnectNodeTransition should send scheduler events in sequential 
 order
 ---

 Key: YARN-3222
 URL: https://issues.apache.org/jira/browse/YARN-3222
 Project: Hadoop YARN
  Issue Type: Bug
  Components: resourcemanager
Affects Versions: 2.6.0
Reporter: Rohith
Assignee: Rohith
Priority: Critical
 Fix For: 2.7.0

 Attachments: 0001-YARN-3222.patch, 0002-YARN-3222.patch, 
 0003-YARN-3222.patch, 0004-YARN-3222.patch, 0005-YARN-3222.patch


 When a node is reconnected,RMNodeImpl#ReconnectNodeTransition notifies the 
 scheduler in a events node_added,node_removed or node_resource_update. These 
 events should be notified in an sequential order i.e node_added event and 
 next node_resource_update events.
 But if the node is reconnected with different http port, the oder of 
 scheduler events are node_removed -- node_resource_update -- node_added 
 which causes scheduler does not find the node and throw NPE and RM exit.
 Node_Resource_update event should be always should be triggered via 
 RMNodeEventType.RESOURCE_UPDATE



--
This message was sent by Atlassian JIRA
(v6.3.4#6332)

[jira] [Commented] (YARN-3222) RMNodeImpl#ReconnectNodeTransition should send scheduler events in sequential order


[ 
https://issues.apache.org/jira/browse/YARN-3222?page=com.atlassian.jira.plugin.system.issuetabpanels:comment-tabpanelfocusedCommentId=14347000#comment-14347000
 ] 

Hudson commented on YARN-3222:
--

FAILURE: Integrated in Hadoop-Mapreduce-trunk-Java8 #122 (See 
[https://builds.apache.org/job/Hadoop-Mapreduce-trunk-Java8/122/])
YARN-3222. Fixed NPE on RMNodeImpl#ReconnectNodeTransition when a node is 
reconnected with a different port. Contributed by Rohith Sharmaks (jianhe: rev 
b2f1ec312ee431aef762cfb49cb29cd6f4661e86)
* 
hadoop-yarn-project/hadoop-yarn/hadoop-yarn-server/hadoop-yarn-server-resourcemanager/src/main/java/org/apache/hadoop/yarn/server/resourcemanager/rmnode/RMNodeImpl.java
* 
hadoop-yarn-project/hadoop-yarn/hadoop-yarn-server/hadoop-yarn-server-resourcemanager/src/test/java/org/apache/hadoop/yarn/server/resourcemanager/MockNM.java
* 
hadoop-yarn-project/hadoop-yarn/hadoop-yarn-server/hadoop-yarn-server-resourcemanager/src/test/java/org/apache/hadoop/yarn/server/resourcemanager/TestResourceTrackerService.java


 RMNodeImpl#ReconnectNodeTransition should send scheduler events in sequential 
 order
 ---

 Key: YARN-3222
 URL: https://issues.apache.org/jira/browse/YARN-3222
 Project: Hadoop YARN
  Issue Type: Bug
  Components: resourcemanager
Affects Versions: 2.6.0
Reporter: Rohith
Assignee: Rohith
Priority: Critical
 Fix For: 2.7.0

 Attachments: 0001-YARN-3222.patch, 0002-YARN-3222.patch, 
 0003-YARN-3222.patch, 0004-YARN-3222.patch, 0005-YARN-3222.patch


 When a node is reconnected,RMNodeImpl#ReconnectNodeTransition notifies the 
 scheduler in a events node_added,node_removed or node_resource_update. These 
 events should be notified in an sequential order i.e node_added event and 
 next node_resource_update events.
 But if the node is reconnected with different http port, the oder of 
 scheduler events are node_removed -- node_resource_update -- node_added 
 which causes scheduler does not find the node and throw NPE and RM exit.
 Node_Resource_update event should be always should be triggered via 
 RMNodeEventType.RESOURCE_UPDATE



--
This message was sent by Atlassian JIRA
(v6.3.4#6332)

[jira] [Commented] (YARN-3222) RMNodeImpl#ReconnectNodeTransition should send scheduler events in sequential order


[ 
https://issues.apache.org/jira/browse/YARN-3222?page=com.atlassian.jira.plugin.system.issuetabpanels:comment-tabpanelfocusedCommentId=14344802#comment-14344802
 ] 

Rohith commented on YARN-3222:
--

Kindly review the update patch that fixes 1 2 in as mentioned in earlier 
comment.

 RMNodeImpl#ReconnectNodeTransition should send scheduler events in sequential 
 order
 ---

 Key: YARN-3222
 URL: https://issues.apache.org/jira/browse/YARN-3222
 Project: Hadoop YARN
  Issue Type: Bug
  Components: resourcemanager
Affects Versions: 2.6.0
Reporter: Rohith
Assignee: Rohith
Priority: Critical
 Attachments: 0001-YARN-3222.patch, 0002-YARN-3222.patch, 
 0003-YARN-3222.patch, 0004-YARN-3222.patch


 When a node is reconnected,RMNodeImpl#ReconnectNodeTransition notifies the 
 scheduler in a events node_added,node_removed or node_resource_update. These 
 events should be notified in an sequential order i.e node_added event and 
 next node_resource_update events.
 But if the node is reconnected with different http port, the oder of 
 scheduler events are node_removed -- node_resource_update -- node_added 
 which causes scheduler does not find the node and throw NPE and RM exit.
 Node_Resource_update event should be always should be triggered via 
 RMNodeEventType.RESOURCE_UPDATE



--
This message was sent by Atlassian JIRA
(v6.3.4#6332)

[jira] [Commented] (YARN-3222) RMNodeImpl#ReconnectNodeTransition should send scheduler events in sequential order

2015-03-03 Thread Jian He (JIRA)


[ 
https://issues.apache.org/jira/browse/YARN-3222?page=com.atlassian.jira.plugin.system.issuetabpanels:comment-tabpanelfocusedCommentId=14345513#comment-14345513
 ] 

Jian He commented on YARN-3222:
---

thanks Rohith !   
I think the condition check you added earlier about sending NodeResourceUpdate 
event only if the node resource is different is useful, that saves some 
traffic. would you mind adding that too ? 
{code}
if (rmNode.getState().equals(NodeState.RUNNING)) {
  // Update scheduler node's capacity for reconnect node.
  rmNode.context
  .getDispatcher()
  .getEventHandler()
  .handle(
  new NodeResourceUpdateSchedulerEvent(rmNode, ResourceOption
  .newInstance(newNode.getTotalCapability(), -1)));
}
{code}

 RMNodeImpl#ReconnectNodeTransition should send scheduler events in sequential 
 order
 ---

 Key: YARN-3222
 URL: https://issues.apache.org/jira/browse/YARN-3222
 Project: Hadoop YARN
  Issue Type: Bug
  Components: resourcemanager
Affects Versions: 2.6.0
Reporter: Rohith
Assignee: Rohith
Priority: Critical
 Attachments: 0001-YARN-3222.patch, 0002-YARN-3222.patch, 
 0003-YARN-3222.patch, 0004-YARN-3222.patch


 When a node is reconnected,RMNodeImpl#ReconnectNodeTransition notifies the 
 scheduler in a events node_added,node_removed or node_resource_update. These 
 events should be notified in an sequential order i.e node_added event and 
 next node_resource_update events.
 But if the node is reconnected with different http port, the oder of 
 scheduler events are node_removed -- node_resource_update -- node_added 
 which causes scheduler does not find the node and throw NPE and RM exit.
 Node_Resource_update event should be always should be triggered via 
 RMNodeEventType.RESOURCE_UPDATE



--
This message was sent by Atlassian JIRA
(v6.3.4#6332)

[jira] [Commented] (YARN-3222) RMNodeImpl#ReconnectNodeTransition should send scheduler events in sequential order

2015-03-03 Thread Jian He (JIRA)


[ 
https://issues.apache.org/jira/browse/YARN-3222?page=com.atlassian.jira.plugin.system.issuetabpanels:comment-tabpanelfocusedCommentId=14346069#comment-14346069
 ] 

Jian He commented on YARN-3222:
---

thanks !  committing

 RMNodeImpl#ReconnectNodeTransition should send scheduler events in sequential 
 order
 ---

 Key: YARN-3222
 URL: https://issues.apache.org/jira/browse/YARN-3222
 Project: Hadoop YARN
  Issue Type: Bug
  Components: resourcemanager
Affects Versions: 2.6.0
Reporter: Rohith
Assignee: Rohith
Priority: Critical
 Attachments: 0001-YARN-3222.patch, 0002-YARN-3222.patch, 
 0003-YARN-3222.patch, 0004-YARN-3222.patch, 0005-YARN-3222.patch


 When a node is reconnected,RMNodeImpl#ReconnectNodeTransition notifies the 
 scheduler in a events node_added,node_removed or node_resource_update. These 
 events should be notified in an sequential order i.e node_added event and 
 next node_resource_update events.
 But if the node is reconnected with different http port, the oder of 
 scheduler events are node_removed -- node_resource_update -- node_added 
 which causes scheduler does not find the node and throw NPE and RM exit.
 Node_Resource_update event should be always should be triggered via 
 RMNodeEventType.RESOURCE_UPDATE



--
This message was sent by Atlassian JIRA
(v6.3.4#6332)

[jira] [Commented] (YARN-3222) RMNodeImpl#ReconnectNodeTransition should send scheduler events in sequential order

2015-03-03 Thread Hadoop QA (JIRA)


[ 
https://issues.apache.org/jira/browse/YARN-3222?page=com.atlassian.jira.plugin.system.issuetabpanels:comment-tabpanelfocusedCommentId=14345987#comment-14345987
 ] 

Hadoop QA commented on YARN-3222:
-

{color:red}-1 overall{color}.  Here are the results of testing the latest 
attachment 
  http://issues.apache.org/jira/secure/attachment/12702276/0005-YARN-3222.patch
  against trunk revision e17e5ba.

{color:green}+1 @author{color}.  The patch does not contain any @author 
tags.

{color:green}+1 tests included{color}.  The patch appears to include 2 new 
or modified test files.

  {color:red}-1 javac{color}.  The applied patch generated 1151 javac 
compiler warnings (more than the trunk's current 185 warnings).

{color:red}-1 javadoc{color}.  The javadoc tool appears to have generated 
43 warning messages.
See 
https://builds.apache.org/job/PreCommit-YARN-Build/6828//artifact/patchprocess/diffJavadocWarnings.txt
 for details.

{color:green}+1 eclipse:eclipse{color}.  The patch built with 
eclipse:eclipse.

{color:green}+1 findbugs{color}.  The patch does not introduce any new 
Findbugs (version 2.0.3) warnings.

{color:green}+1 release audit{color}.  The applied patch does not increase 
the total number of release audit warnings.

{color:green}+1 core tests{color}.  The patch passed unit tests in 
hadoop-tools/hadoop-distcp.

Test results: 
https://builds.apache.org/job/PreCommit-YARN-Build/6828//testReport/
Javac warnings: 
https://builds.apache.org/job/PreCommit-YARN-Build/6828//artifact/patchprocess/diffJavacWarnings.txt
Console output: https://builds.apache.org/job/PreCommit-YARN-Build/6828//console

This message is automatically generated.

 RMNodeImpl#ReconnectNodeTransition should send scheduler events in sequential 
 order
 ---

 Key: YARN-3222
 URL: https://issues.apache.org/jira/browse/YARN-3222
 Project: Hadoop YARN
  Issue Type: Bug
  Components: resourcemanager
Affects Versions: 2.6.0
Reporter: Rohith
Assignee: Rohith
Priority: Critical
 Attachments: 0001-YARN-3222.patch, 0002-YARN-3222.patch, 
 0003-YARN-3222.patch, 0004-YARN-3222.patch, 0005-YARN-3222.patch


 When a node is reconnected,RMNodeImpl#ReconnectNodeTransition notifies the 
 scheduler in a events node_added,node_removed or node_resource_update. These 
 events should be notified in an sequential order i.e node_added event and 
 next node_resource_update events.
 But if the node is reconnected with different http port, the oder of 
 scheduler events are node_removed -- node_resource_update -- node_added 
 which causes scheduler does not find the node and throw NPE and RM exit.
 Node_Resource_update event should be always should be triggered via 
 RMNodeEventType.RESOURCE_UPDATE



--
This message was sent by Atlassian JIRA
(v6.3.4#6332)

[jira] [Commented] (YARN-3222) RMNodeImpl#ReconnectNodeTransition should send scheduler events in sequential order


[ 
https://issues.apache.org/jira/browse/YARN-3222?page=com.atlassian.jira.plugin.system.issuetabpanels:comment-tabpanelfocusedCommentId=14345909#comment-14345909
 ] 

Rohith commented on YARN-3222:
--

bq. check you added earlier about sending NodeResourceUpdate event only if the 
node resource is different
Agree

Updated the patch addressing above comment. Kindly review it.

 RMNodeImpl#ReconnectNodeTransition should send scheduler events in sequential 
 order
 ---

 Key: YARN-3222
 URL: https://issues.apache.org/jira/browse/YARN-3222
 Project: Hadoop YARN
  Issue Type: Bug
  Components: resourcemanager
Affects Versions: 2.6.0
Reporter: Rohith
Assignee: Rohith
Priority: Critical
 Attachments: 0001-YARN-3222.patch, 0002-YARN-3222.patch, 
 0003-YARN-3222.patch, 0004-YARN-3222.patch, 0005-YARN-3222.patch


 When a node is reconnected,RMNodeImpl#ReconnectNodeTransition notifies the 
 scheduler in a events node_added,node_removed or node_resource_update. These 
 events should be notified in an sequential order i.e node_added event and 
 next node_resource_update events.
 But if the node is reconnected with different http port, the oder of 
 scheduler events are node_removed -- node_resource_update -- node_added 
 which causes scheduler does not find the node and throw NPE and RM exit.
 Node_Resource_update event should be always should be triggered via 
 RMNodeEventType.RESOURCE_UPDATE



--
This message was sent by Atlassian JIRA
(v6.3.4#6332)

[jira] [Commented] (YARN-3222) RMNodeImpl#ReconnectNodeTransition should send scheduler events in sequential order

2015-03-03 Thread Hudson (JIRA)


[ 
https://issues.apache.org/jira/browse/YARN-3222?page=com.atlassian.jira.plugin.system.issuetabpanels:comment-tabpanelfocusedCommentId=14346104#comment-14346104
 ] 

Hudson commented on YARN-3222:
--

FAILURE: Integrated in Hadoop-trunk-Commit #7248 (See 
[https://builds.apache.org/job/Hadoop-trunk-Commit/7248/])
YARN-3222. Fixed NPE on RMNodeImpl#ReconnectNodeTransition when a node is 
reconnected with a different port. Contributed by Rohith Sharmaks (jianhe: rev 
b2f1ec312ee431aef762cfb49cb29cd6f4661e86)
* 
hadoop-yarn-project/hadoop-yarn/hadoop-yarn-server/hadoop-yarn-server-resourcemanager/src/test/java/org/apache/hadoop/yarn/server/resourcemanager/TestResourceTrackerService.java
* 
hadoop-yarn-project/hadoop-yarn/hadoop-yarn-server/hadoop-yarn-server-resourcemanager/src/test/java/org/apache/hadoop/yarn/server/resourcemanager/MockNM.java
* 
hadoop-yarn-project/hadoop-yarn/hadoop-yarn-server/hadoop-yarn-server-resourcemanager/src/main/java/org/apache/hadoop/yarn/server/resourcemanager/rmnode/RMNodeImpl.java


 RMNodeImpl#ReconnectNodeTransition should send scheduler events in sequential 
 order
 ---

 Key: YARN-3222
 URL: https://issues.apache.org/jira/browse/YARN-3222
 Project: Hadoop YARN
  Issue Type: Bug
  Components: resourcemanager
Affects Versions: 2.6.0
Reporter: Rohith
Assignee: Rohith
Priority: Critical
 Fix For: 2.7.0

 Attachments: 0001-YARN-3222.patch, 0002-YARN-3222.patch, 
 0003-YARN-3222.patch, 0004-YARN-3222.patch, 0005-YARN-3222.patch


 When a node is reconnected,RMNodeImpl#ReconnectNodeTransition notifies the 
 scheduler in a events node_added,node_removed or node_resource_update. These 
 events should be notified in an sequential order i.e node_added event and 
 next node_resource_update events.
 But if the node is reconnected with different http port, the oder of 
 scheduler events are node_removed -- node_resource_update -- node_added 
 which causes scheduler does not find the node and throw NPE and RM exit.
 Node_Resource_update event should be always should be triggered via 
 RMNodeEventType.RESOURCE_UPDATE



--
This message was sent by Atlassian JIRA
(v6.3.4#6332)

[jira] [Commented] (YARN-3222) RMNodeImpl#ReconnectNodeTransition should send scheduler events in sequential order

[
https://issues.apache.org/jira/browse/YARN-3222?page=com.atlassian.jira.plugin.system.issuetabpanels:comment-tabpanelfocusedCommentId=14344739#comment-14344739
]

Rohith commented on YARN-3222:
--

Had a mail chat with [~jianhe] regarding the issue's observed in this jira
discussions and decided to split up the jira into 2 separate jira. The observed
issues in ReconnectNodeTransition are
# As per defect description, order of node_resource_update and node_added
events sending to schedulers. If Node_added events is being sent to schedulers
then no need of sending node_resource_update event from RMNode again to
scheduler which is not necessarily required.
# If the RMNode state is RUNNING then Node_usable event not necessarily to be
sent.
# If a node is reconnceted with different capability, then
RMNode#totalCapability remains with old capability. This has to be updated with
new capability.

1 and 2 are going to handle in this jira. 3 issue will be done in separate jira.

RMNodeImpl#ReconnectNodeTransition should send scheduler events in sequential
order
---

Key: YARN-3222
URL: https://issues.apache.org/jira/browse/YARN-3222
Project: Hadoop YARN
Issue Type: Bug
Components: resourcemanager
Affects Versions: 2.6.0
Reporter: Rohith
Assignee: Rohith
Priority: Critical
Attachments: 0001-YARN-3222.patch, 0002-YARN-3222.patch,
0003-YARN-3222.patch

When a node is reconnected,RMNodeImpl#ReconnectNodeTransition notifies the
scheduler in a events node_added,node_removed or node_resource_update. These
events should be notified in an sequential order i.e node_added event and
next node_resource_update events.
But if the node is reconnected with different http port, the oder of
scheduler events are node_removed -- node_resource_update -- node_added
which causes scheduler does not find the node and throw NPE and RM exit.
Node_Resource_update event should be always should be triggered via
RMNodeEventType.RESOURCE_UPDATE

--
This message was sent by Atlassian JIRA
(v6.3.4#6332)

[jira] [Commented] (YARN-3222) RMNodeImpl#ReconnectNodeTransition should send scheduler events in sequential order