This is an automated email from the ASF dual-hosted git repository.
kassiez pushed a commit to branch master
in repository https://gitbox.apache.org/repos/asf/doris-website.git
The following commit(s) were added to refs/heads/master by this push:
new 41e3173edda Update optimizing-table-schema.md (#1354)
41e3173edda is described below
commit 41e3173edda61e965354042f13e431a9d6fe9d6c
Author: xzj7019 <[email protected]>
AuthorDate: Thu Nov 14 20:17:20 2024 +0800
Update optimizing-table-schema.md (#1354)
# Versions
- [ ] dev
- [ ] 3.0
- [x] 2.1
- [ ] 2.0
# Languages
- [x] Chinese
- [ ] English
---
.../tuning/tuning-plan/optimizing-table-schema.md | 6 ++----
1 file changed, 2 insertions(+), 4 deletions(-)
diff --git
a/i18n/zh-CN/docusaurus-plugin-content-docs/version-2.1/query-acceleration/tuning/tuning-plan/optimizing-table-schema.md
b/i18n/zh-CN/docusaurus-plugin-content-docs/version-2.1/query-acceleration/tuning/tuning-plan/optimizing-table-schema.md
index f076329496e..946da5086d7 100644
---
a/i18n/zh-CN/docusaurus-plugin-content-docs/version-2.1/query-acceleration/tuning/tuning-plan/optimizing-table-schema.md
+++
b/i18n/zh-CN/docusaurus-plugin-content-docs/version-2.1/query-acceleration/tuning/tuning-plan/optimizing-table-schema.md
@@ -24,7 +24,7 @@ specific language governing permissions and limitations
under the License.
-->
-Schema 设计和调优中,表的 Schema 设计是其中重要的一部分,包括表引擎选择、分区分桶列选择、分区分桶大小设置、key 列和字段类型优化等。缺乏
Schema 设计的系统,有可能会导致数据倾斜等问题,不能充分利用系统并行和排序特性,从而影响 Doris 系统在业务系统中发挥真实的性能优势。
+Schema 设计和调优中,表的 Schema 设计是其中重要的一部分,包括表引擎选择、分区分桶列选择、分区分桶大小设置、key 列和字段类型优化等。缺乏
Schema 设计的系统,有可能会导致数据倾斜等问题,不能充分利用系统并行和排序特性,从而影响 Doris 在业务系统中发挥真实的性能优势。
详细的设计原则可以参考[数据表设计](../../../table-design/overview)章节了解详细信息。本章将从实际案例的角度,展示几种典型场景下因
Schema 设计问题导致的性能瓶颈,并给出优化建议,供业务调优参考。
@@ -113,7 +113,7 @@ PROPERTIES (
1. 在满足业务系统表达和计算需求的前提下,应优先选择定长类型,避免使用变长类型;
-2. 同时,尽量采用低精类型,而非高精类型。具体实践包括:使用 BIGINT 替代 VARCHAR 或 STRING 类型的字段,以及用 FLOAT /
INT / BIGINT 替换 DECIMAL 类型的字段等。此类字段类型的合理设计和优化,将极大地提升业务的计算效率,从而增强系统性能。
+2. 尽量采用低精类型,避免高精类型。具体实践包括:使用 BIGINT 替代 VARCHAR 或 STRING 类型的字段,以及用 FLOAT / INT
/ BIGINT 替换 DECIMAL 类型的字段等。此类字段类型的合理设计和优化,将极大地提升业务的计算效率,从而增强系统性能。
:::tip 优化建议
在定义 Schema 类型时,应遵循定长和低精优先的原则。
@@ -122,5 +122,3 @@ PROPERTIES (
## 总结
综上所述,一个精心设计的 Schema 能够最大化地利用 Doris 的特性,进而显著提升业务性能。反观未经过调优的 Schema
设计则可能对业务造成全局性的负面影响,例如数据倾斜等问题。因此,前期的 Schema 设计优化工作显得尤为重要。
-
-针对性能调优方面,你还可以参考使用 [Colocate Group 优化
Join](../../../query-data/join#colocate-join),该文档将详细介绍如何充分利用 Doris
的特性来进行性能优化,为你的业务性能提升提供有力支持。
\ No newline at end of file
---------------------------------------------------------------------
To unsubscribe, e-mail: [email protected]
For additional commands, e-mail: [email protected]