subject:"\[gem5\-dev\] Change in gem5\/gem5\[develop\]\: gpu\-compute\: enable kernel\-end WB functionality"

[gem5-dev] Change in gem5/gem5[develop]: gpu-compute: enable kernel-end WB functionality

2020-07-13 Thread Anthony Gutierrez (Gerrit) via gem5-dev

Anthony Gutierrez has submitted this change. (  
https://gem5-review.googlesource.com/c/public/gem5/+/29938 )


Change subject: gpu-compute: enable kernel-end WB functionality
..

gpu-compute: enable kernel-end WB functionality

Change-Id: Ib17e1d700586d1aa04d408e7b924270f0de82efe
Reviewed-on: https://gem5-review.googlesource.com/c/public/gem5/+/29938
Maintainer: Anthony Gutierrez 
Tested-by: kokoro 
Reviewed-by: Xianwei Zhang 
---
M src/gpu-compute/compute_unit.cc
M src/gpu-compute/shader.cc
M src/mem/request.hh
3 files changed, 27 insertions(+), 18 deletions(-)

Approvals:
  Xianwei Zhang: Looks good to me, approved
  Anthony Gutierrez: Looks good to me, approved
  kokoro: Regressions pass



diff --git a/src/gpu-compute/compute_unit.cc  
b/src/gpu-compute/compute_unit.cc

index b0616d6..178fd6e 100644
--- a/src/gpu-compute/compute_unit.cc
+++ b/src/gpu-compute/compute_unit.cc
@@ -1218,23 +1218,25 @@

 schedule(mem_req_event, curTick() + req_tick_latency);
 } else {
-assert(gpuDynInst->isEndOfKernel());
+  // kernel end release must be enabled
+  assert(shader->impl_kern_end_rel);
+  assert(gpuDynInst->isEndOfKernel());

-req->setCacheCoherenceFlags(Request::RELEASE);
-req->setReqInstSeqNum(gpuDynInst->seqNum());
-req->setFlags(Request::KERNEL);
-pkt = new Packet(req, MemCmd::MemSyncReq);
-pkt->pushSenderState(
-   new ComputeUnit::DataPort::SenderState(gpuDynInst, 0,  
nullptr));

+  req->setCacheCoherenceFlags(Request::WB_L2);
+  req->setReqInstSeqNum(gpuDynInst->seqNum());
+  req->setFlags(Request::KERNEL);
+  pkt = new Packet(req, MemCmd::MemSyncReq);
+  pkt->pushSenderState(
+ new ComputeUnit::DataPort::SenderState(gpuDynInst, 0,  
nullptr));


-EventFunctionWrapper *mem_req_event =
-  memPort[0]->createMemReqEvent(pkt);
+  EventFunctionWrapper *mem_req_event =
+memPort[0]->createMemReqEvent(pkt);

-DPRINTF(GPUPort, "CU%d: WF[%d][%d]: index %d, addr %#x  
scheduling "

-"a release\n", cu_id, gpuDynInst->simdId,
-gpuDynInst->wfSlotId, 0, pkt->req->getPaddr());
+  DPRINTF(GPUPort, "CU%d: WF[%d][%d]: index %d, addr %#x  
scheduling "

+  "a release\n", cu_id, gpuDynInst->simdId,
+  gpuDynInst->wfSlotId, 0, pkt->req->getPaddr());

-schedule(mem_req_event, curTick() + req_tick_latency);
+  schedule(mem_req_event, curTick() + req_tick_latency);
 }
 } else {
 gpuDynInst->setRequestFlags(req);
diff --git a/src/gpu-compute/shader.cc b/src/gpu-compute/shader.cc
index f5e9444..59ce239 100644
--- a/src/gpu-compute/shader.cc
+++ b/src/gpu-compute/shader.cc
@@ -223,11 +223,11 @@
 // flush has never been started, performed only once at kernel end
 assert(_dispatcher.getOutstandingWbs(kernId) == 0);

-// iterate all cus, managed by the shader, to perform flush.
-for (int i_cu = 0; i_cu < n_cu; ++i_cu) {
-_dispatcher.updateWbCounter(kernId, +1);
-cuList[i_cu]->doFlush(gpuDynInst);
-}
+// the first cu, managed by the shader, performs flush operation,
+// assuming that L2 cache is shared by all cus in the shader
+int i_cu = 0;
+_dispatcher.updateWbCounter(kernId, +1);
+cuList[i_cu]->doFlush(gpuDynInst);
 }

 bool
diff --git a/src/mem/request.hh b/src/mem/request.hh
index 4e0ba97..718d5fa 100644
--- a/src/mem/request.hh
+++ b/src/mem/request.hh
@@ -225,6 +225,9 @@
  * See the AMD GCN3 ISA Architecture Manual for more
  * details.
  *
+ * INV_L1: L1 cache invalidation
+ * WB_L2: L2 cache writeback
+ *
  * SLC: System Level Coherent. Accesses are forced to miss in
  *  the L2 cache and are coherent with system memory.
  *
@@ -237,6 +240,10 @@
  * between atomic return/no-return operations.
  */
 enum : CacheCoherenceFlagsType {
+/** mem_sync_op flags */
+INV_L1  = 0x0001,
+WB_L2   = 0x0020,
+/** user-policy flags */
 /** user-policy flags */
 SLC_BIT = 0x0080,
 GLC_BIT = 0x0100,

--
To view, visit https://gem5-review.googlesource.com/c/public/gem5/+/29938
To unsubscribe, or for help writing mail filters, visit  
https://gem5-review.googlesource.com/settings


Gerrit-Project: public/gem5
Gerrit-Branch: develop
Gerrit-Change-Id: Ib17e1d700586d1aa04d408e7b924270f0de82efe
Gerrit-Change-Number: 29938
Gerrit-PatchSet: 9
Gerrit-Owner: Anthony Gutierrez 
Gerrit-Reviewer: Anthony Gutierrez 
Gerrit-Reviewer: Tony Gutierrez 
Gerrit-Reviewer: Tuan Ta 
Gerrit-Reviewer: Xianwei Zhang 
Gerrit-Reviewer: kokoro 
Gerrit-MessageType: merged

[gem5-dev] Change in gem5/gem5[develop]: gpu-compute: enable kernel-end WB functionality

2020-06-03 Thread Anthony Gutierrez (Gerrit) via gem5-dev


Hello Tony Gutierrez, Xianwei Zhang,

I'd like you to do a code review. Please visit

https://gem5-review.googlesource.com/c/public/gem5/+/29938

to review the following change.


Change subject: gpu-compute: enable kernel-end WB functionality
..

gpu-compute: enable kernel-end WB functionality

Change-Id: Ib17e1d700586d1aa04d408e7b924270f0de82efe
---
M src/gpu-compute/compute_unit.cc
M src/gpu-compute/shader.cc
M src/mem/request.hh
3 files changed, 27 insertions(+), 18 deletions(-)



diff --git a/src/gpu-compute/compute_unit.cc  
b/src/gpu-compute/compute_unit.cc

index b0616d6..178fd6e 100644
--- a/src/gpu-compute/compute_unit.cc
+++ b/src/gpu-compute/compute_unit.cc
@@ -1218,23 +1218,25 @@

 schedule(mem_req_event, curTick() + req_tick_latency);
 } else {
-assert(gpuDynInst->isEndOfKernel());
+  // kernel end release must be enabled
+  assert(shader->impl_kern_end_rel);
+  assert(gpuDynInst->isEndOfKernel());

-req->setCacheCoherenceFlags(Request::RELEASE);
-req->setReqInstSeqNum(gpuDynInst->seqNum());
-req->setFlags(Request::KERNEL);
-pkt = new Packet(req, MemCmd::MemSyncReq);
-pkt->pushSenderState(
-   new ComputeUnit::DataPort::SenderState(gpuDynInst, 0,  
nullptr));

+  req->setCacheCoherenceFlags(Request::WB_L2);
+  req->setReqInstSeqNum(gpuDynInst->seqNum());
+  req->setFlags(Request::KERNEL);
+  pkt = new Packet(req, MemCmd::MemSyncReq);
+  pkt->pushSenderState(
+ new ComputeUnit::DataPort::SenderState(gpuDynInst, 0,  
nullptr));


-EventFunctionWrapper *mem_req_event =
-  memPort[0]->createMemReqEvent(pkt);
+  EventFunctionWrapper *mem_req_event =
+memPort[0]->createMemReqEvent(pkt);

-DPRINTF(GPUPort, "CU%d: WF[%d][%d]: index %d, addr %#x  
scheduling "

-"a release\n", cu_id, gpuDynInst->simdId,
-gpuDynInst->wfSlotId, 0, pkt->req->getPaddr());
+  DPRINTF(GPUPort, "CU%d: WF[%d][%d]: index %d, addr %#x  
scheduling "

+  "a release\n", cu_id, gpuDynInst->simdId,
+  gpuDynInst->wfSlotId, 0, pkt->req->getPaddr());

-schedule(mem_req_event, curTick() + req_tick_latency);
+  schedule(mem_req_event, curTick() + req_tick_latency);
 }
 } else {
 gpuDynInst->setRequestFlags(req);
diff --git a/src/gpu-compute/shader.cc b/src/gpu-compute/shader.cc
index f5e9444..59ce239 100644
--- a/src/gpu-compute/shader.cc
+++ b/src/gpu-compute/shader.cc
@@ -223,11 +223,11 @@
 // flush has never been started, performed only once at kernel end
 assert(_dispatcher.getOutstandingWbs(kernId) == 0);

-// iterate all cus, managed by the shader, to perform flush.
-for (int i_cu = 0; i_cu < n_cu; ++i_cu) {
-_dispatcher.updateWbCounter(kernId, +1);
-cuList[i_cu]->doFlush(gpuDynInst);
-}
+// the first cu, managed by the shader, performs flush operation,
+// assuming that L2 cache is shared by all cus in the shader
+int i_cu = 0;
+_dispatcher.updateWbCounter(kernId, +1);
+cuList[i_cu]->doFlush(gpuDynInst);
 }

 bool
diff --git a/src/mem/request.hh b/src/mem/request.hh
index 4e0ba97..718d5fa 100644
--- a/src/mem/request.hh
+++ b/src/mem/request.hh
@@ -225,6 +225,9 @@
  * See the AMD GCN3 ISA Architecture Manual for more
  * details.
  *
+ * INV_L1: L1 cache invalidation
+ * WB_L2: L2 cache writeback
+ *
  * SLC: System Level Coherent. Accesses are forced to miss in
  *  the L2 cache and are coherent with system memory.
  *
@@ -237,6 +240,10 @@
  * between atomic return/no-return operations.
  */
 enum : CacheCoherenceFlagsType {
+/** mem_sync_op flags */
+INV_L1  = 0x0001,
+WB_L2   = 0x0020,
+/** user-policy flags */
 /** user-policy flags */
 SLC_BIT = 0x0080,
 GLC_BIT = 0x0100,

--
To view, visit https://gem5-review.googlesource.com/c/public/gem5/+/29938
To unsubscribe, or for help writing mail filters, visit  
https://gem5-review.googlesource.com/settings


Gerrit-Project: public/gem5
Gerrit-Branch: develop
Gerrit-Change-Id: Ib17e1d700586d1aa04d408e7b924270f0de82efe
Gerrit-Change-Number: 29938
Gerrit-PatchSet: 1
Gerrit-Owner: Anthony Gutierrez 
Gerrit-Reviewer: Tony Gutierrez 
Gerrit-Reviewer: Xianwei Zhang 
Gerrit-MessageType: newchange
___
gem5-dev mailing list -- gem5-dev@gem5.org
To unsubscribe send an email to gem5-dev-le...@gem5.org
%(web_page_url)slistinfo%(cgiext)s/%(_internal_name)s

[gem5-dev] Change in gem5/gem5[develop]: gpu-compute: enable kernel-end WB functionality

[gem5-dev] Change in gem5/gem5[develop]: gpu-compute: enable kernel-end WB functionality

2 matches

Site Navigation

Mail list logo

Footer information