https://www.yuque.com/docs/share/8625d14b-d465-48a3-8dc1-0be32b138f34?#lUX6
《tpcds-各引擎耗时》
链接有效期至 2022-04-22 10:31:05

LuNing Wong <gfen...@gmail.com> 于2022年4月18日周一 09:44写道:

> 补充,用的Hive 3.1.2 Hadoop 3.1.0做的数据源。
>
> LuNing Wong <gfen...@gmail.com> 于2022年4月18日周一 09:42写道:
>
> > Flink版本是1.14.4, Trino是359版本,tm.memory.process.size和CPU资源我都和Trino对齐了。都是32G
> > 16核 16线程,2台计算节点。
> >
> > Zhilong Hong <zhlongh...@gmail.com> 于2022年4月15日周五 18:21写道:
> >
> >> Hello, Luning!
> >>
> >>
> >>
> 我们目前也正在关注Flink在OLAP场景的性能表现,请问你测试的Flink和Trino版本分别是什么呢?另外我看到flink-sql-benchmark中所使用的集群配置和你的不太一样,可能需要根据集群资源对flink-conf.yaml中taskmanager.memory.process.size等资源配置进行调整。
> >>
> >> Best,
> >> Zhilong
> >>
> >> On Fri, Apr 15, 2022 at 2:38 PM LuNing Wang <wang4lun...@gmail.com>
> >> wrote:
> >>
> >> > 跑了100个 TPC-DS SQL
> >> > 10 GB 数据、2个Worker(TM)、每个32G内存,16个核心。
> >> > Flink平均用时 18秒
> >> > Trino平均用时 7秒
> >> >
> >> > 我看字节跳动和阿里的老师测试,Flink和presto
> >> OLAP性能接近,但是我测的差距很大。想进一步和老师交流下,是不是我Flink设置的有问题。
> >> > 我基本上是按照下面这个项目里模板配置的Flink相关参数。
> >> > https://github.com/ververica/flink-sql-benchmark
> >> >
> >> >
> >> > LuNing Wang <wang4lun...@gmail.com> 于2022年4月15日周五 14:34写道:
> >> >
> >> > > 跑了100个SQL
> >> > >
> >> >
> >>
> >
>

回复