alamb commented on PR #11627:
URL: https://github.com/apache/datafusion/pull/11627#issuecomment-2250125991

   Here are my benchmark results - they look quite good. Other than ClickBench 
Q32 and TPCH Q17 they all looks faster ๐Ÿ˜ 
   
   <details><summary>Details</summary>
   <p>
   
   
   
   ```
   --------------------
   Benchmark clickbench_1.json
   --------------------
   โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”ณโ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”ณโ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”ณโ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”“
   โ”ƒ Query        โ”ƒ  main_base โ”ƒ skip-partial-aggregation โ”ƒ        Change โ”ƒ
   โ”กโ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ•‡โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ•‡โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ•‡โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”ฉ
   โ”‚ QQuery 0     โ”‚     0.84ms โ”‚                   0.86ms โ”‚     no change โ”‚
   โ”‚ QQuery 1     โ”‚    95.11ms โ”‚                  96.03ms โ”‚     no change โ”‚
   โ”‚ QQuery 2     โ”‚   200.81ms โ”‚                 209.94ms โ”‚     no change โ”‚
   โ”‚ QQuery 3     โ”‚   208.67ms โ”‚                 207.07ms โ”‚     no change โ”‚
   โ”‚ QQuery 4     โ”‚  2233.18ms โ”‚                2095.56ms โ”‚ +1.07x faster โ”‚
   โ”‚ QQuery 5     โ”‚  2059.66ms โ”‚                2015.05ms โ”‚     no change โ”‚
   โ”‚ QQuery 6     โ”‚    83.99ms โ”‚                  86.96ms โ”‚     no change โ”‚
   โ”‚ QQuery 7     โ”‚    99.67ms โ”‚                 101.10ms โ”‚     no change โ”‚
   โ”‚ QQuery 8     โ”‚  3235.66ms โ”‚                3017.30ms โ”‚ +1.07x faster โ”‚
   โ”‚ QQuery 9     โ”‚  2419.16ms โ”‚                2350.53ms โ”‚     no change โ”‚
   โ”‚ QQuery 10    โ”‚   848.81ms โ”‚                 857.76ms โ”‚     no change โ”‚
   โ”‚ QQuery 11    โ”‚   926.94ms โ”‚                 933.87ms โ”‚     no change โ”‚
   โ”‚ QQuery 12    โ”‚  2176.13ms โ”‚                2087.42ms โ”‚     no change โ”‚
   โ”‚ QQuery 13    โ”‚  4677.48ms โ”‚                3770.29ms โ”‚ +1.24x faster โ”‚
   โ”‚ QQuery 14    โ”‚  2938.45ms โ”‚                2845.23ms โ”‚     no change โ”‚
   โ”‚ QQuery 15    โ”‚  2504.24ms โ”‚                2371.75ms โ”‚ +1.06x faster โ”‚
   โ”‚ QQuery 16    โ”‚  6069.34ms โ”‚                5811.38ms โ”‚     no change โ”‚
   โ”‚ QQuery 17    โ”‚  5991.68ms โ”‚                5856.53ms โ”‚     no change โ”‚
   โ”‚ QQuery 18    โ”‚ 12199.74ms โ”‚               11468.73ms โ”‚ +1.06x faster โ”‚
   โ”‚ QQuery 19    โ”‚   171.89ms โ”‚                 171.08ms โ”‚     no change โ”‚
   โ”‚ QQuery 20    โ”‚  2693.33ms โ”‚                2795.76ms โ”‚     no change โ”‚
   โ”‚ QQuery 21    โ”‚  3491.08ms โ”‚                3566.37ms โ”‚     no change โ”‚
   โ”‚ QQuery 22    โ”‚  9438.41ms โ”‚                9598.53ms โ”‚     no change โ”‚
   โ”‚ QQuery 23    โ”‚ 22160.51ms โ”‚               22473.59ms โ”‚     no change โ”‚
   โ”‚ QQuery 24    โ”‚  1344.81ms โ”‚                1409.66ms โ”‚     no change โ”‚
   โ”‚ QQuery 25    โ”‚  1167.37ms โ”‚                1182.06ms โ”‚     no change โ”‚
   โ”‚ QQuery 26    โ”‚  1482.09ms โ”‚                1518.54ms โ”‚     no change โ”‚
   โ”‚ QQuery 27    โ”‚  4044.47ms โ”‚                4035.97ms โ”‚     no change โ”‚
   โ”‚ QQuery 28    โ”‚ 29023.37ms โ”‚               30566.78ms โ”‚  1.05x slower โ”‚
   โ”‚ QQuery 29    โ”‚  1064.52ms โ”‚                1076.49ms โ”‚     no change โ”‚
   โ”‚ QQuery 30    โ”‚  2553.83ms โ”‚                2598.63ms โ”‚     no change โ”‚
   โ”‚ QQuery 31    โ”‚  3274.52ms โ”‚                3309.47ms โ”‚     no change โ”‚
   โ”‚ QQuery 32    โ”‚ 17306.62ms โ”‚               18361.28ms โ”‚  1.06x slower โ”‚
   โ”‚ QQuery 33    โ”‚  9624.79ms โ”‚                9860.60ms โ”‚     no change โ”‚
   โ”‚ QQuery 34    โ”‚  9610.64ms โ”‚                9676.40ms โ”‚     no change โ”‚
   โ”‚ QQuery 35    โ”‚  3800.23ms โ”‚                3819.15ms โ”‚     no change โ”‚
   โ”‚ QQuery 36    โ”‚   352.06ms โ”‚                 351.07ms โ”‚     no change โ”‚
   โ”‚ QQuery 37    โ”‚   238.56ms โ”‚                 238.28ms โ”‚     no change โ”‚
   โ”‚ QQuery 38    โ”‚   196.30ms โ”‚                 204.93ms โ”‚     no change โ”‚
   โ”‚ QQuery 39    โ”‚  1122.84ms โ”‚                1152.25ms โ”‚     no change โ”‚
   โ”‚ QQuery 40    โ”‚   101.24ms โ”‚                  96.72ms โ”‚     no change โ”‚
   โ”‚ QQuery 41    โ”‚    85.59ms โ”‚                  84.80ms โ”‚     no change โ”‚
   โ”‚ QQuery 42    โ”‚   104.55ms โ”‚                 104.32ms โ”‚     no change โ”‚
   โ””โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”ดโ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”ดโ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”ดโ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”˜
   โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”ณโ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”“
   โ”ƒ Benchmark Summary                       โ”ƒ             โ”ƒ
   โ”กโ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ•‡โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”ฉ
   โ”‚ Total Time (main_base)                  โ”‚ 173423.19ms โ”‚
   โ”‚ Total Time (skip-partial-aggregation)   โ”‚ 174436.08ms โ”‚
   โ”‚ Average Time (main_base)                โ”‚   4033.10ms โ”‚
   โ”‚ Average Time (skip-partial-aggregation) โ”‚   4056.65ms โ”‚
   โ”‚ Queries Faster                          โ”‚           5 โ”‚
   โ”‚ Queries Slower                          โ”‚           2 โ”‚
   โ”‚ Queries with No Change                  โ”‚          36 โ”‚
   โ””โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”ดโ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”˜
   --------------------
   Benchmark clickbench_extended.json
   --------------------
   โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”ณโ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”ณโ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”ณโ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”“
   โ”ƒ Query        โ”ƒ main_base โ”ƒ skip-partial-aggregation โ”ƒ        Change โ”ƒ
   โ”กโ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ•‡โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ•‡โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ•‡โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”ฉ
   โ”‚ QQuery 0     โ”‚ 3850.08ms โ”‚                3858.37ms โ”‚     no change โ”‚
   โ”‚ QQuery 1     โ”‚ 1558.99ms โ”‚                1493.93ms โ”‚     no change โ”‚
   โ”‚ QQuery 2     โ”‚ 3150.28ms โ”‚                2935.05ms โ”‚ +1.07x faster โ”‚
   โ””โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”ดโ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”ดโ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”ดโ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”˜
   โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”ณโ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”“
   โ”ƒ Benchmark Summary                       โ”ƒ           โ”ƒ
   โ”กโ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ•‡โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”ฉ
   โ”‚ Total Time (main_base)                  โ”‚ 8559.35ms โ”‚
   โ”‚ Total Time (skip-partial-aggregation)   โ”‚ 8287.35ms โ”‚
   โ”‚ Average Time (main_base)                โ”‚ 2853.12ms โ”‚
   โ”‚ Average Time (skip-partial-aggregation) โ”‚ 2762.45ms โ”‚
   โ”‚ Queries Faster                          โ”‚         1 โ”‚
   โ”‚ Queries Slower                          โ”‚         0 โ”‚
   โ”‚ Queries with No Change                  โ”‚         2 โ”‚
   โ””โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”ดโ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”˜
   ```
   
   ```
   --------------------
   Benchmark tpch_mem_sf1.json
   --------------------
   โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”ณโ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”ณโ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”ณโ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”“
   โ”ƒ Query        โ”ƒ main_base โ”ƒ skip-partial-aggregation โ”ƒ        Change โ”ƒ
   โ”กโ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ•‡โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ•‡โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ•‡โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”โ”ฉ
   โ”‚ QQuery 1     โ”‚  203.55ms โ”‚                 194.22ms โ”‚     no change โ”‚
   โ”‚ QQuery 2     โ”‚   38.30ms โ”‚                  35.41ms โ”‚ +1.08x faster โ”‚
   โ”‚ QQuery 3     โ”‚   61.24ms โ”‚                  59.49ms โ”‚     no change โ”‚
   โ”‚ QQuery 4     โ”‚   65.67ms โ”‚                  60.42ms โ”‚ +1.09x faster โ”‚
   โ”‚ QQuery 5     โ”‚  102.54ms โ”‚                  92.60ms โ”‚ +1.11x faster โ”‚
   โ”‚ QQuery 6     โ”‚   15.35ms โ”‚                  13.56ms โ”‚ +1.13x faster โ”‚
   โ”‚ QQuery 7     โ”‚  210.69ms โ”‚                 202.60ms โ”‚     no change โ”‚
   โ”‚ QQuery 8     โ”‚   39.94ms โ”‚                  39.42ms โ”‚     no change โ”‚
   โ”‚ QQuery 9     โ”‚  115.73ms โ”‚                 107.84ms โ”‚ +1.07x faster โ”‚
   โ”‚ QQuery 10    โ”‚  103.60ms โ”‚                 101.10ms โ”‚     no change โ”‚
   โ”‚ QQuery 11    โ”‚   73.46ms โ”‚                  71.29ms โ”‚     no change โ”‚
   โ”‚ QQuery 12    โ”‚   47.43ms โ”‚                  44.81ms โ”‚ +1.06x faster โ”‚
   โ”‚ QQuery 13    โ”‚   80.77ms โ”‚                  74.77ms โ”‚ +1.08x faster โ”‚
   โ”‚ QQuery 14    โ”‚   18.05ms โ”‚                  18.70ms โ”‚     no change โ”‚
   โ”‚ QQuery 15    โ”‚   32.48ms โ”‚                  29.60ms โ”‚ +1.10x faster โ”‚
   โ”‚ QQuery 16    โ”‚   42.73ms โ”‚                  37.71ms โ”‚ +1.13x faster โ”‚
   โ”‚ QQuery 17    โ”‚  160.06ms โ”‚                 159.77ms โ”‚     no change โ”‚
   โ”‚ QQuery 18    โ”‚  463.05ms โ”‚                 428.43ms โ”‚ +1.08x faster โ”‚
   โ”‚ QQuery 19    โ”‚   48.21ms โ”‚                  46.87ms โ”‚     no change โ”‚
   โ”‚ QQuery 20    โ”‚  102.42ms โ”‚                  80.20ms โ”‚ +1.28x faster โ”‚
   โ”‚ QQuery 21    โ”‚  295.09ms โ”‚                 266.05ms โ”‚ +1.11x faster โ”‚
   โ”‚ QQuery 22    โ”‚   23.35ms โ”‚                  21.86ms โ”‚ +1.07x faster โ”‚
   โ””โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”ดโ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”ดโ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”ดโ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”˜
   ```
   
   
   
   </p>
   </details> 
   
   
   I am going to rerun the numbers to make sure they are reproducable and then 
give this PR a closer look


-- 
This is an automated message from the Apache Git Service.
To respond to the message, please log on to GitHub and use the
URL above to go to the specific comment.

To unsubscribe, e-mail: github-unsubscr...@datafusion.apache.org

For queries about this service, please contact Infrastructure at:
us...@infra.apache.org


---------------------------------------------------------------------
To unsubscribe, e-mail: github-unsubscr...@datafusion.apache.org
For additional commands, e-mail: github-h...@datafusion.apache.org

Reply via email to