[gem5-dev] Change in gem5/gem5[develop]: arch-x86: Make pick, signedPick and merge take indexes directly.

Gabe Black (Gerrit) via gem5-dev Sat, 08 May 2021 18:04:15 -0700

Gabe Black has submitted this change. (https://gem5-review.googlesource.com/c/public/gem5/+/42356 )

Change subject: arch-x86: Make pick, signedPick and merge take indexesdirectly.

......................................................................


arch-x86: Make pick, signedPick and merge take indexes directly.

These methods had looked up the register index using an index into the
src or dest index arrays. This level of indirection is less efficient
than using the index itself (which we know already), and also requires
that the array is layed out like how we think it is.

Before:
array idx => reg idx => folded?
After:
reg idx => folded?

Change-Id: Ice2262250ff77582ba5530fc52e6738ba1bebe18
Reviewed-on: https://gem5-review.googlesource.com/c/public/gem5/+/42356
Reviewed-by: Gabe Black <[email protected]>
Maintainer: Gabe Black <[email protected]>
Tested-by: kokoro <[email protected]>
---
M src/arch/x86/insts/static_inst.hh
M src/arch/x86/isa/microops/fpop.isa
M src/arch/x86/isa/microops/ldstop.isa
M src/arch/x86/isa/microops/limmop.isa
M src/arch/x86/isa/microops/mediaop.isa
M src/arch/x86/isa/microops/regop.isa
6 files changed, 63 insertions(+), 62 deletions(-)

Approvals:
  Gabe Black: Looks good to me, approved; Looks good to me, approved
  kokoro: Regressions pass

diff --git a/src/arch/x86/insts/static_inst.hhb/src/arch/x86/insts/static_inst.hh

index 7dde4db..f5e5f39 100644
--- a/src/arch/x86/insts/static_inst.hh
+++ b/src/arch/x86/insts/static_inst.hh
@@ -121,11 +121,11 @@
     void printSrcReg(std::ostream &os, int reg, int size) const;
     void printDestReg(std::ostream &os, int reg, int size) const;

-    inline uint64_t
-    merge(uint64_t into, uint64_t val, int size) const
+    static inline uint64_t
+    merge(uint64_t into, RegIndex index, uint64_t val, int size)
     {
         X86IntReg reg = into;
-        if (destRegIdx(0).index() & IntFoldBit) {
+        if (index & IntFoldBit) {
             reg.H = val;
             return reg;
         }
@@ -150,12 +150,12 @@
         return reg;
     }

-    inline uint64_t
-    pick(uint64_t from, int idx, int size) const
+    static inline uint64_t
+    pick(uint64_t from, RegIndex index, int size)
     {
         X86IntReg reg = from;
         DPRINTF(X86, "Picking with size %d\n", size);
-        if (srcRegIdx(idx).index() & IntFoldBit)
+        if (index & IntFoldBit)
             return reg.H;
         switch(size) {
           case 1:
@@ -171,12 +171,12 @@
         }
     }

-    inline int64_t
-    signedPick(uint64_t from, int idx, int size) const
+    static inline int64_t
+    signedPick(uint64_t from, RegIndex index, int size)
     {
         X86IntReg reg = from;
         DPRINTF(X86, "Picking with size %d\n", size);
-        if (srcRegIdx(idx).index() & IntFoldBit)
+        if (index & IntFoldBit)
             return reg.SH;
         switch(size) {
           case 1:

diff --git a/src/arch/x86/isa/microops/fpop.isab/src/arch/x86/isa/microops/fpop.isa

index 209b0e2..b46f630 100644
--- a/src/arch/x86/isa/microops/fpop.isa
+++ b/src/arch/x86/isa/microops/fpop.isa
@@ -315,7 +315,7 @@
         operands = (int_dest_op, fp_src1_op)
         code = '''
             int64_t intSrcReg1 = static_cast<int64_t>(FpSrcReg1);
-            DestReg = merge(DestReg, intSrcReg1, dataSize);
+            DestReg = merge(DestReg, dest, intSrcReg1, dataSize);
             '''

     # Convert two integers registers representing an 80-bit floating

diff --git a/src/arch/x86/isa/microops/ldstop.isab/src/arch/x86/isa/microops/ldstop.isa

index 2dd92e1..0bda652 100644
--- a/src/arch/x86/isa/microops/ldstop.isa
+++ b/src/arch/x86/isa/microops/ldstop.isa
@@ -511,15 +511,15 @@

         microopClasses[name] = LoadOp

-    defineMicroLoadOp('Ld', 'Data = merge(Data, Mem, dataSize);',
+    defineMicroLoadOp('Ld', 'Data = merge(Data, data, Mem, dataSize);',
                             'Data = Mem & mask(dataSize * 8);')
-    defineMicroLoadOp('Ldis', 'Data = merge(Data, Mem, dataSize);',
+    defineMicroLoadOp('Ldis', 'Data = merge(Data, data, Mem, dataSize);',
                               'Data = Mem & mask(dataSize * 8);',
                                implicitStack=True)
-    defineMicroLoadOp('Ldst', 'Data = merge(Data, Mem, dataSize);',
+    defineMicroLoadOp('Ldst', 'Data = merge(Data, data, Mem, dataSize);',
                               'Data = Mem & mask(dataSize * 8);',
                       '(StoreCheck << FlagShift)')
-    defineMicroLoadOp('Ldstl', 'Data = merge(Data, Mem, dataSize);',
+    defineMicroLoadOp('Ldstl', 'Data = merge(Data, data, Mem, dataSize);',
                                'Data = Mem & mask(dataSize * 8);',
                       '(StoreCheck << FlagShift) | Request::LOCKED_RMW',
                       nonSpec=True)
@@ -662,10 +662,10 @@

         microopClasses[name] = StoreOp

-    defineMicroStoreOp('St', 'Mem = pick(Data, 2, dataSize);')
-    defineMicroStoreOp('Stis', 'Mem = pick(Data, 2, dataSize);',
+    defineMicroStoreOp('St', 'Mem = pick(Data, data, dataSize);')
+    defineMicroStoreOp('Stis', 'Mem = pick(Data, data, dataSize);',
                        implicitStack=True)
-    defineMicroStoreOp('Stul', 'Mem = pick(Data, 2, dataSize);',
+    defineMicroStoreOp('Stul', 'Mem = pick(Data, data, dataSize);',
             mem_flags="Request::LOCKED_RMW")

     defineMicroStoreOp('Stfp', code='Mem = FpData_uqw;', is_float=True)
@@ -739,7 +739,7 @@
                             mem_flags='Request::LOCKED_RMW')

     iop = InstObjParams("lea", "Lea", 'X86ISA::LdStOp',
-                        { "code": "Data = merge(Data, EA, dataSize);",

+ { "code": "Data = merge(Data, data, EA,dataSize);",

                           "ea_code": "EA = " + segmentEAExpr,
                           "memDataSize": "dataSize" })
     header_output += MicroLeaDeclare.subst(iop)

diff --git a/src/arch/x86/isa/microops/limmop.isab/src/arch/x86/isa/microops/limmop.isa

index 3a7f026..b0444b8 100644
--- a/src/arch/x86/isa/microops/limmop.isa
+++ b/src/arch/x86/isa/microops/limmop.isa
@@ -134,7 +134,7 @@
     base = 'X86ISA::RegOpT<X86ISA::FoldedDestOp, X86ISA::Imm64Op>'
     # Build up the all register version of this micro op
     iops = [InstObjParams("limm", "Limm", base,
-            {"code" : "DestReg = merge(DestReg, imm64, dataSize);"}),
+            {"code" : "DestReg = merge(DestReg, dest, imm64, dataSize);"}),
             InstObjParams("limm", "LimmBig", base,
             {"code" : "DestReg = imm64 & mask(dataSize * 8);"})]
     for iop in iops:

diff --git a/src/arch/x86/isa/microops/mediaop.isab/src/arch/x86/isa/microops/mediaop.isa

index 5c1fc17..f5f3761 100644
--- a/src/arch/x86/isa/microops/mediaop.isa
+++ b/src/arch/x86/isa/microops/mediaop.isa
@@ -234,7 +234,7 @@
                     bits(FpSrcReg1_uqw,
                             (offset + 1) * srcSize * 8 - 1,
                             (offset + 0) * srcSize * 8);
-                DestReg = merge(0, fpSrcReg1, destSize);
+                DestReg = merge(0, dest, fpSrcReg1, destSize);
             } else {
                 DestReg = DestReg;
             }
@@ -251,7 +251,7 @@
             if (bits(dest, 0) && (ext & 0x1))
                 offset -= items;
             if (offset >= 0 && offset < items) {
-                uint64_t srcReg1 = pick(SrcReg1, 0, srcSize);
+                uint64_t srcReg1 = pick(SrcReg1, src1, srcSize);
                 FpDestReg_uqw =
                     insertBits(FpDestReg_uqw,
                             (offset + 1) * destSize * 8 - 1,

diff --git a/src/arch/x86/isa/microops/regop.isab/src/arch/x86/isa/microops/regop.isa

index df603dc..fb0bea1 100644
--- a/src/arch/x86/isa/microops/regop.isa
+++ b/src/arch/x86/isa/microops/regop.isa
@@ -294,15 +294,15 @@
                 prefix = ""
                 for (rex, decl) in (
                         ("(?<!\w)psrc1(?!\w)",
-                         "uint64_t psrc1 = pick(SrcReg1, 0, dataSize);"),

+ "uint64_t psrc1 = pick(SrcReg1, src1,dataSize);"),

                         ("(?<!\w)psrc2(?!\w)",
-                         "uint64_t psrc2 = pick(SrcReg2, 1, dataSize);"),

+ "uint64_t psrc2 = pick(SrcReg2, src2,dataSize);"),

                         ("(?<!\w)spsrc1(?!\w)",
                          "int64_t spsrc1 = "
-                         "signedPick(SrcReg1, 0, dataSize);"),
+                         "signedPick(SrcReg1, src1, dataSize);"),
                         ("(?<!\w)spsrc2(?!\w)",
                          "int64_t spsrc2 = "
-                         "signedPick(SrcReg2, 1, dataSize);"),
+                         "signedPick(SrcReg2, src2, dataSize);"),
                         ("(?<!\w)simm8(?!\w)",
                          "int8_t simm8 = imm8;")):
                     matcher = re.compile(rex)
@@ -528,14 +528,14 @@
     class Add(FlagRegOp):
         code = '''
             result = psrc1 + op2;
-            DestReg = merge(DestReg, result, dataSize);
+            DestReg = merge(DestReg, dest, result, dataSize);
         '''
         big_code = 'DestReg = result = (psrc1 + op2) & mask(dataSize * 8);'

     class Or(LogicRegOp):
         code = '''
             result = psrc1 | op2;
-            DestReg = merge(DestReg, result, dataSize);
+            DestReg = merge(DestReg, dest, result, dataSize);
         '''
         big_code = 'DestReg = result = (psrc1 | op2) & mask(dataSize * 8);'

@@ -543,7 +543,7 @@
         code = '''
             CCFlagBits flags = cfofBits;
             result = psrc1 + op2 + flags.cf;
-            DestReg = merge(DestReg, result, dataSize);
+            DestReg = merge(DestReg, dest, result, dataSize);
             '''
         big_code = '''
             CCFlagBits flags = cfofBits;
@@ -554,7 +554,7 @@
         code = '''
             CCFlagBits flags = cfofBits;
             result = psrc1 - op2 - flags.cf;
-            DestReg = merge(DestReg, result, dataSize);
+            DestReg = merge(DestReg, dest, result, dataSize);
             '''
         big_code = '''
             CCFlagBits flags = cfofBits;
@@ -564,21 +564,21 @@
     class And(LogicRegOp):
         code = '''
             result = psrc1 & op2;
-            DestReg = merge(DestReg, result, dataSize)
+            DestReg = merge(DestReg, dest, result, dataSize)
         '''
         big_code = 'DestReg = result = (psrc1 & op2) & mask(dataSize * 8)'

     class Sub(SubRegOp):
         code = '''
             result = psrc1 - op2;
-            DestReg = merge(DestReg, result, dataSize)
+            DestReg = merge(DestReg, dest, result, dataSize)
         '''
         big_code = 'DestReg = result = (psrc1 - op2) & mask(dataSize * 8)'

     class Xor(LogicRegOp):
         code = '''
             result = psrc1 ^ op2;
-            DestReg = merge(DestReg, result, dataSize)
+            DestReg = merge(DestReg, dest, result, dataSize)
         '''
         big_code = 'DestReg = result = (psrc1 ^ op2) & mask(dataSize * 8)'

@@ -676,7 +676,7 @@
         '''

     class Mulel(RdRegOp):
-        code = 'DestReg = merge(SrcReg1, ProdLow, dataSize);'
+        code = 'DestReg = merge(SrcReg1, dest, ProdLow, dataSize);'
         big_code = 'DestReg = ProdLow & mask(dataSize * 8);'

     class Muleh(RdRegOp):
@@ -685,7 +685,7 @@
             if not src1:
                 src1 = dest
             super(RdRegOp, self).__init__(dest, src1, dataSize=dataSize)
-        code = 'DestReg = merge(SrcReg1, ProdHi, dataSize);'
+        code = 'DestReg = merge(SrcReg1, dest, ProdHi, dataSize);'
         big_code = 'DestReg = ProdHi & mask(dataSize * 8);'

     # One or two bit divide
@@ -770,7 +770,7 @@
             Remainder = remainder;
             Quotient = quotient;
         '''
-        code = divCode % "DestReg = merge(DestReg, remaining, dataSize);"

+ code = divCode % "DestReg = merge(DestReg, dest, remaining,dataSize);"

         big_code = divCode % "DestReg = remaining & mask(dataSize * 8);"
         flag_code = '''
             if (remaining == 0)
@@ -780,15 +780,15 @@
         '''

     class Divq(RdRegOp):
-        code = 'DestReg = merge(SrcReg1, Quotient, dataSize);'
+        code = 'DestReg = merge(SrcReg1, dest, Quotient, dataSize);'
         big_code = 'DestReg = Quotient & mask(dataSize * 8);'

     class Divr(RdRegOp):
-        code = 'DestReg = merge(SrcReg1, Remainder, dataSize);'
+        code = 'DestReg = merge(SrcReg1, dest, Remainder, dataSize);'
         big_code = 'DestReg = Remainder & mask(dataSize * 8);'

     class Mov(BasicRegOp, CondRegOp):
-        code = 'DestReg = merge(SrcReg1, op2, dataSize)'
+        code = 'DestReg = merge(SrcReg1, dest, op2, dataSize)'
         else_code = 'DestReg = DestReg;'

     # Shift instructions
@@ -796,7 +796,7 @@
     class Sll(BasicRegOp):
         code = '''

uint8_t shiftAmt = (op2 & ((dataSize == 8) ? mask(6) :mask(5)));

-            DestReg = merge(DestReg, psrc1 << shiftAmt, dataSize);
+            DestReg = merge(DestReg, dest, psrc1 << shiftAmt, dataSize);
             '''
         big_code = '''

uint8_t shiftAmt = (op2 & ((dataSize == 8) ? mask(6) :mask(5)));

@@ -847,7 +847,7 @@
         code = '''

uint8_t shiftAmt = (op2 & ((dataSize == 8) ? mask(6) :mask(5)));

             uint64_t logicalMask = mask(dataSize * 8 - shiftAmt);
-            DestReg = merge(DestReg, (psrc1 >> shiftAmt) & logicalMask,

+ DestReg = merge(DestReg, dest, (psrc1 >> shiftAmt) &logicalMask,

                     dataSize);
             '''
         big_code = '''
@@ -894,7 +894,7 @@

uint8_t shiftAmt = (op2 & ((dataSize == 8) ? mask(6) :mask(5)));

             uint64_t arithMask = (shiftAmt == 0) ? 0 :

-bits(psrc1, dataSize * 8 - 1) << (dataSize * 8 -shiftAmt);

-            DestReg = merge(DestReg,
+            DestReg = merge(DestReg, dest,
                     (psrc1 >> shiftAmt) | arithMask, dataSize);
             '''
         big_code = '''
@@ -939,9 +939,9 @@
             if (realShiftAmt) {
                 uint64_t top = psrc1 << (dataSize * 8 - realShiftAmt);
                 uint64_t bottom = bits(psrc1, dataSize * 8, realShiftAmt);
-                DestReg = merge(DestReg, top | bottom, dataSize);
+                DestReg = merge(DestReg, dest, top | bottom, dataSize);
             } else
-                DestReg = merge(DestReg, DestReg, dataSize);
+                DestReg = merge(DestReg, dest, DestReg, dataSize);
             '''
         flag_code = '''
             // If the shift amount is zero, no flags should be modified.
@@ -986,9 +986,9 @@
                 if (realShiftAmt > 1)
                     top |= psrc1 << (dataSize * 8 - realShiftAmt + 1);

uint64_t bottom = bits(psrc1, dataSize * 8 - 1,realShiftAmt);

-                DestReg = merge(DestReg, top | bottom, dataSize);
+                DestReg = merge(DestReg, dest, top | bottom, dataSize);
             } else
-                DestReg = merge(DestReg, DestReg, dataSize);
+                DestReg = merge(DestReg, dest, DestReg, dataSize);
             '''
         flag_code = '''
             // If the shift amount is zero, no flags should be modified.
@@ -1032,9 +1032,9 @@
                 uint64_t top = psrc1 << realShiftAmt;
                 uint64_t bottom =

bits(psrc1, dataSize * 8 - 1, dataSize * 8 -realShiftAmt);

-                DestReg = merge(DestReg, top | bottom, dataSize);
+                DestReg = merge(DestReg, dest, top | bottom, dataSize);
             } else
-                DestReg = merge(DestReg, DestReg, dataSize);
+                DestReg = merge(DestReg, dest, DestReg, dataSize);
             '''
         flag_code = '''
             // If the shift amount is zero, no flags should be modified.
@@ -1081,9 +1081,9 @@
                     bottom |=
                         bits(psrc1, dataSize * 8 - 1,
                                    dataSize * 8 - realShiftAmt + 1);
-                DestReg = merge(DestReg, top | bottom, dataSize);
+                DestReg = merge(DestReg, dest, top | bottom, dataSize);
             } else
-                DestReg = merge(DestReg, DestReg, dataSize);
+                DestReg = merge(DestReg, dest, DestReg, dataSize);
             '''
         flag_code = '''
             // If the shift amount is zero, no flags should be modified.
@@ -1135,7 +1135,7 @@
             }
             %s
             '''
-        code = sldCode % "DestReg = merge(DestReg, result, dataSize);"

+ code = sldCode % "DestReg = merge(DestReg, dest, result,dataSize);"

         big_code = sldCode % "DestReg = result & mask(dataSize * 8);"
         flag_code = '''
             // If the shift amount is zero, no flags should be modified.
@@ -1201,7 +1201,7 @@
             }
             %s
             '''
-        code = srdCode % "DestReg = merge(DestReg, result, dataSize);"

+ code = srdCode % "DestReg = merge(DestReg, dest, result,dataSize);"

         big_code = srdCode % "DestReg = result & mask(dataSize * 8);"
         flag_code = '''
             // If the shift amount is zero, no flags should be modified.
@@ -1293,7 +1293,7 @@
         code = '''
             int flag = bits(ccFlagBits | cfofBits | dfBit |
                             ecfBit | ezfBit, imm8);
-            DestReg = merge(DestReg, flag, dataSize);
+            DestReg = merge(DestReg, dest, flag, dataSize);
             ezfBit = (flag == 0) ? EZFBit : 0;
             '''

@@ -1317,7 +1317,7 @@
                              ecfBit | ezfBit) & flagMask;

             int flag = bits(flags, imm8);
-            DestReg = merge(DestReg, flag, dataSize);
+            DestReg = merge(DestReg, dest, flag, dataSize);
             ezfBit = (flag == 0) ? EZFBit : 0;
             '''

@@ -1344,7 +1344,7 @@
             int sign_bit = bits(val, bitPos, bitPos);
             uint64_t maskVal = mask(bitPos+1);
             val = sign_bit ? (val | ~maskVal) : (val & maskVal);
-            DestReg = merge(DestReg, val, dataSize);
+            DestReg = merge(DestReg, dest, val, dataSize);
             '''

         big_code = '''
@@ -1372,7 +1372,7 @@
             '''

     class Zext(BasicRegOp):
-        code = 'DestReg = merge(DestReg, bits(psrc1, op2, 0), dataSize);'

+ code = 'DestReg = merge(DestReg, dest, bits(psrc1, op2, 0),dataSize);'

         big_code = 'DestReg = bits(psrc1, op2, 0) & mask(dataSize * 8);'

     class Rddr(RegOp):
@@ -1391,7 +1391,7 @@
                 %s
             }
         '''
-        code = rdrCode % "DestReg = merge(DestReg, DebugSrc1, dataSize);"

+ code = rdrCode % "DestReg = merge(DestReg, dest, DebugSrc1,dataSize);"

         big_code = rdrCode % "DestReg = DebugSrc1 & mask(dataSize * 8);"

     class Wrdr(RegOp):
@@ -1426,7 +1426,8 @@
                 %s
             }
         '''

- code = rdcrCode % "DestReg = merge(DestReg, ControlSrc1,dataSize);"

+        code = rdcrCode % \
+                "DestReg = merge(DestReg, dest, ControlSrc1, dataSize);"
         big_code = rdcrCode % "DestReg = ControlSrc1 & mask(dataSize * 8);"

     class Wrcr(RegOp):
@@ -1518,19 +1519,19 @@
         operands = (dest_op, seg_src1_op)

     class Rdbase(RdSegOp):
-        code = 'DestReg = merge(DestReg, SegBaseSrc1, dataSize);'
+        code = 'DestReg = merge(DestReg, dest, SegBaseSrc1, dataSize);'
         big_code = 'DestReg = SegBaseSrc1 & mask(dataSize * 8);'

     class Rdlimit(RdSegOp):
-        code = 'DestReg = merge(DestReg, SegLimitSrc1, dataSize);'
+        code = 'DestReg = merge(DestReg, dest, SegLimitSrc1, dataSize);'
         big_code = 'DestReg = SegLimitSrc1 & mask(dataSize * 8);'

     class RdAttr(RdSegOp):
-        code = 'DestReg = merge(DestReg, SegAttrSrc1, dataSize);'
+        code = 'DestReg = merge(DestReg, dest, SegAttrSrc1, dataSize);'
         big_code = 'DestReg = SegAttrSrc1 & mask(dataSize * 8);'

     class Rdsel(RdSegOp):
-        code = 'DestReg = merge(DestReg, SegSelSrc1, dataSize);'
+        code = 'DestReg = merge(DestReg, dest, SegSelSrc1, dataSize);'
         big_code = 'DestReg = SegSelSrc1 & mask(dataSize * 8);'

     class Rdval(RegOp):
@@ -1787,7 +1788,7 @@
         '''

     class Popcnt(BasicRegOp):
-        code = 'DestReg = merge(DestReg, popCount(psrc1), dataSize);'
+        code = 'DestReg = merge(DestReg, dest, popCount(psrc1), dataSize);'
         flag_code = '''
             ccFlagBits = ccFlagBits & ~(X86ISA::SFBit | X86ISA::AFBit |
                     X86ISA::ZFBit | X86ISA::PFBit);

--
To view, visit https://gem5-review.googlesource.com/c/public/gem5/+/42356

To unsubscribe, or for help writing mail filters, visithttps://gem5-review.googlesource.com/settings


Gerrit-Project: public/gem5
Gerrit-Branch: develop
Gerrit-Change-Id: Ice2262250ff77582ba5530fc52e6738ba1bebe18
Gerrit-Change-Number: 42356
Gerrit-PatchSet: 10
Gerrit-Owner: Gabe Black <[email protected]>
Gerrit-Reviewer: Andreas Sandberg <[email protected]>
Gerrit-Reviewer: Gabe Black <[email protected]>
Gerrit-Reviewer: Giacomo Travaglini <[email protected]>
Gerrit-Reviewer: Tong Shen <[email protected]>
Gerrit-Reviewer: kokoro <[email protected]>
Gerrit-MessageType: merged

_______________________________________________
gem5-dev mailing list -- [email protected]
To unsubscribe send an email to [email protected]
%(web_page_url)slistinfo%(cgiext)s/%(_internal_name)s

[gem5-dev] Change in gem5/gem5[develop]: arch-x86: Make pick, signedPick and merge take indexes directly.

Reply via email to