mbutrovich commented on PR #21600: URL: https://github.com/apache/datafusion/pull/21600#issuecomment-4245588697
> ๐ค Benchmark completed (GKE) | [trigger](https://github.com/apache/datafusion/pull/21600#issuecomment-4245342572) > > **Instance:** `c4a-highmem-16` (12 vCPU / 65 GiB) > > CPU Details (lscpu) > Details > ``` > Comparing HEAD and sort_redesign > -------------------- > Benchmark tpch_sf10.json > -------------------- > โโโโโโโโโโโโโณโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโณโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโณโโโโโโโโโโโโโโโโ > โ Query โ HEAD โ sort_redesign โ Change โ > โกโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโฉ > โ QQuery 1 โ 370.78 / 372.71 ยฑ1.53 / 375.02 ms โ 367.32 / 369.51 ยฑ1.62 / 371.85 ms โ no change โ > โ QQuery 2 โ 479.03 / 498.26 ยฑ12.67 / 512.09 ms โ 441.93 / 449.16 ยฑ4.75 / 456.30 ms โ +1.11x faster โ > โ QQuery 3 โ 550.68 / 651.96 ยฑ51.73 / 692.64 ms โ 504.72 / 514.53 ยฑ5.69 / 521.96 ms โ +1.27x faster โ > โ QQuery 4 โ 382.30 / 478.86 ยฑ50.61 / 522.66 ms โ 341.16 / 343.59 ยฑ2.52 / 346.66 ms โ +1.39x faster โ > โ QQuery 5 โ 1094.76 / 1119.98 ยฑ14.85 / 1136.27 ms โ 989.92 / 1035.74 ยฑ30.16 / 1083.34 ms โ +1.08x faster โ > โ QQuery 6 โ 134.61 / 137.54 ยฑ3.24 / 143.63 ms โ 132.58 / 135.76 ยฑ4.78 / 145.26 ms โ no change โ > โ QQuery 7 โ 1529.12 / 1544.02 ยฑ8.52 / 1554.66 ms โ 1352.09 / 1364.35 ยฑ13.84 / 1390.36 ms โ +1.13x faster โ > โ QQuery 8 โ 1495.43 / 1983.26 ยฑ252.68 / 2161.10 ms โ 1178.60 / 1195.20 ยฑ16.42 / 1219.19 ms โ +1.66x faster โ > โ QQuery 9 โ 1985.32 / 2251.76 ยฑ135.70 / 2348.90 ms โ 1769.17 / 1861.72 ยฑ83.52 / 1962.04 ms โ +1.21x faster โ > โ QQuery 10 โ 530.10 / 533.74 ยฑ4.88 / 543.33 ms โ 496.72 / 511.79 ยฑ15.67 / 531.85 ms โ no change โ > โ QQuery 11 โ 455.90 / 464.13 ยฑ5.22 / 470.06 ms โ 416.63 / 426.94 ยฑ9.64 / 440.31 ms โ +1.09x faster โ > โ QQuery 12 โ 288.98 / 292.38 ยฑ2.53 / 295.72 ms โ 277.24 / 280.50 ยฑ3.22 / 285.47 ms โ no change โ > โ QQuery 13 โ 366.95 / 373.42 ยฑ4.66 / 379.47 ms โ 346.27 / 354.40 ยฑ4.90 / 358.95 ms โ +1.05x faster โ > โ QQuery 14 โ 195.18 / 198.85 ยฑ2.46 / 202.91 ms โ 192.87 / 197.00 ยฑ2.91 / 200.35 ms โ no change โ > โ QQuery 15 โ 323.95 / 331.40 ยฑ6.53 / 342.87 ms โ 319.56 / 326.97 ยฑ6.54 / 339.16 ms โ no change โ > โ QQuery 16 โ 121.75 / 123.85 ยฑ2.25 / 127.96 ms โ 114.45 / 116.88 ยฑ2.91 / 122.43 ms โ +1.06x faster โ > โ QQuery 17 โ 1574.15 / 1819.60 ยฑ123.13 / 1892.65 ms โ 1372.85 / 1388.43 ยฑ10.80 / 1402.63 ms โ +1.31x faster โ > โ QQuery 18 โ 1535.10 / 1560.14 ยฑ19.95 / 1594.45 ms โ 1407.54 / 1451.07 ยฑ36.80 / 1513.73 ms โ +1.08x faster โ > โ QQuery 19 โ 276.90 / 290.88 ยฑ17.67 / 325.49 ms โ 277.65 / 291.86 ยฑ25.11 / 342.04 ms โ no change โ > โ QQuery 20 โ 451.87 / 457.31 ยฑ4.64 / 464.09 ms โ 417.57 / 429.48 ยฑ12.70 / 453.17 ms โ +1.06x faster โ > โ QQuery 21 โ 2981.79 / 3226.93 ยฑ156.76 / 3396.23 ms โ 2602.88 / 2639.31 ยฑ24.65 / 2668.51 ms โ +1.22x faster โ > โ QQuery 22 โ 190.75 / 194.35 ยฑ5.46 / 205.18 ms โ 153.72 / 160.32 ยฑ4.83 / 168.41 ms โ +1.21x faster โ > โโโโโโโโโโโโโดโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโดโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโดโโโโโโโโโโโโโโโโ > โโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโณโโโโโโโโโโโโโ > โ Benchmark Summary โ โ > โกโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโฉ > โ Total Time (HEAD) โ 18905.31ms โ > โ Total Time (sort_redesign) โ 15844.52ms โ > โ Average Time (HEAD) โ 859.33ms โ > โ Average Time (sort_redesign) โ 720.21ms โ > โ Queries Faster โ 15 โ > โ Queries Slower โ 0 โ > โ Queries with No Change โ 7 โ > โ Queries with Failure โ 0 โ > โโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโดโโโโโโโโโโโโโ > ``` > > Resource Usage > **tpch10 โ base (merge-base)** > > Metric Value > Wall time 94.9s > Peak memory 12.8 GiB > Avg memory 8.6 GiB > CPU user 868.4s > CPU sys 74.1s > Peak spill 0 B > **tpch10 โ branch** > > Metric Value > Wall time 79.5s > Peak memory 10.8 GiB > Avg memory 8.0 GiB > CPU user 782.1s > CPU sys 67.4s > Peak spill 0 B > [File an issue](https://github.com/adriangb/datafusion-benchmarking/issues) against this benchmark runner So this is showing the improvement afforded by both the ExternalSorter rewrite (which helps lexsort by reducing fan-in) and radix sorting. I will push a commit that defaults radix sort off, run the benchmarks again to get a baseline understanding of the ExternalSorter changes. -- This is an automated message from the Apache Git Service. To respond to the message, please log on to GitHub and use the URL above to go to the specific comment. To unsubscribe, e-mail: [email protected] For queries about this service, please contact Infrastructure at: [email protected] --------------------------------------------------------------------- To unsubscribe, e-mail: [email protected] For additional commands, e-mail: [email protected]
