Copilot commented on code in PR #58983: URL: https://github.com/apache/doris/pull/58983#discussion_r2612438002
########## docs/zh-TW/README.md: ########## @@ -0,0 +1,314 @@ +<!-- +Licensed to the Apache Software Foundation (ASF) under one +or more contributor license agreements. See the NOTICE file +distributed with this work for additional information +regarding copyright ownership. The ASF licenses this file +to you under the Apache License, Version 2.0 (the +"License"); you may not use this file except in compliance +with the License. You may obtain a copy of the License at + + http://www.apache.org/licenses/LICENSE-2.0 + +Unless required by applicable law or agreed to in writing, +software distributed under the License is distributed on an +"AS IS" BASIS, WITHOUT WARRANTIES OR CONDITIONS OF ANY +KIND, either express or implied. See the License for the +specific language governing permissions and limitations +under the License. +--> + +## 🌍 閱讀其他語言版本 + +[العربية](../ar-SA/README.md) • [বাংলা](../bn-BD/README.md) • [Deutsch](../de-DE/README.md) • [English](../../README.md) • [Español](../es-ES/README.md) • [فارسی](../fa-IR/README.md) • [Français](../fr-FR/README.md) • [हिन्दी](../hi-IN/README.md) • [Bahasa Indonesia](../id-ID/README.md) • [Italiano](../it-IT/README.md) • [日本語](../ja-JP/README.md) • [한국어](../ko-KR/README.md) • [Polski](../pl-PL/README.md) • [Português](../pt-BR/README.md) • [Română](../ro-RO/README.md) • [Русский](../ru-RU/README.md) • [Slovenščina](../sl-SI/README.md) • [ไทย](../th-TH/README.md) • [Türkçe](../tr-TR/README.md) • [Українська](../uk-UA/README.md) • [Tiếng Việt](../vi-VN/README.md) • [简体中文](../zh-CN/README.md) • [繁體中文](README.md) + +<div align="center"> + +# Apache Doris + +[](https://www.apache.org/licenses/LICENSE-2.0.html) +[](https://github.com/apache/doris/releases) +[](https://ossrank.com/p/516) +[](https://github.com/apache/doris/commits/master/) +[](https://doris.apache.org/docs/gettingStarted/what-is-apache-doris) +[](https://doris.apache.org/zh-CN/docs/gettingStarted/what-is-apache-doris) + +<div> + +[?style=for-the-badge>)](https://doris.apache.org/) +[?style=for-the-badge>)](https://doris.apache.org/download) + + +</div> + + +<div> + <a href="https://twitter.com/doris_apache"><img src="https://img.shields.io/badge/- @Doris_Apache -424549?style=social&logo=x" height=25></a> + + <a href="https://github.com/apache/doris/discussions"><img src="https://img.shields.io/badge/- Discussion -red?style=social&logo=discourse" height=25></a> + + <a href="https://join.slack.com/t/apachedoriscommunity/shared_invite/zt-35mzao67o-BrpU70FNKPyB6UlgpXf8_w" height=25></a> + + <a href="https://medium.com/@ApacheDoris"><img src="https://img.shields.io/badge/-Medium-red?style=social&logo=medium" height=25></a> + +</div> + +</div> + +--- + + + + + +<p align="center"> + + <a href="https://trendshift.io/repositories/1156" target="_blank"><img src="https://trendshift.io/api/badge/repositories/1156" alt="apache%2Fdoris | Trendshift" style="width: 250px; height: 55px;" width="250" height="55"/></a> + +</p> + + + + +基於 MPP 架構的易用、高效能、即時的分析型資料庫,以其極速和易用性而聞名。它僅需亞秒級響應時間即可返回海量資料下的查詢結果,不僅可以支援高併發的點查詢場景,也能支援高吞吐的複雜分析場景。 + +所有這些特性使得 Apache Doris 成為報表分析、即席查詢、統一數倉構建、資料湖查詢加速等場景的理想工具。在 Apache Doris 上,使用者可以構建各種應用,如使用者行為分析、AB 測試平台、日誌檢索分析、使用者畫像分析、訂單分析等。 + +🎉 查看 🔗[所有版本](https://doris.apache.org/docs/releasenotes/all-release),您將找到過去一年發布的 Apache Doris 版本的按時間順序總結。 + +👀 探索 🔗[官方網站](https://doris.apache.org/),詳細了解 Apache Doris 的核心功能、部落格和使用者案例。 + +## 📈 使用場景 + +如下圖所示,經過各種資料整合和處理後,資料來源通常儲存在即時資料倉庫 Apache Doris 和離線資料湖或資料倉庫(在 Apache Hive、Apache Iceberg 或 Apache Hudi 中)中。 + +<br /> + +<img src="https://cdn.selectdb.com/static/What_is_Apache_Doris_3_a61692c2ce.png" /> + +<br /> + + +Apache Doris 廣泛應用於以下場景: + +- **即時資料分析**: + + - **即時報表和決策**:Doris 為內部和外部企業使用提供即時更新的報表和儀表板,支援自動化流程中的即時決策。 + + - **即席分析**:Doris 提供多維資料分析能力,支援快速商業智慧分析和即席查詢,幫助使用者快速從複雜資料中挖掘洞察。 + + - **使用者畫像和行為分析**:Doris 可以分析使用者行為,如參與度、留存率和轉化率,同時支援人群洞察和人群選擇等行為分析場景。 + +- **資料湖分析**: + + - **資料湖查詢加速**:Doris 通過其高效的查詢引擎加速資料湖資料查詢。 + + - **聯邦分析**:Doris 支援跨多個資料來源的聯邦查詢,簡化架構並消除資料孤島。 + + - **即時資料處理**:Doris 結合即時資料流和批次處理能力,滿足高併發和低延遲複雜業務需求。 + +- **基於 SQL 的可觀測性**: + + - **日誌和事件分析**:Doris 支援對分散式系統中的日誌和事件進行即時或批次分析,幫助識別問題並優化效能。 + + +## 整體架構 + +Apache Doris 使用 MySQL 協定,與 MySQL 語法高度相容,並支援標準 SQL。使用者可以通過各種客戶端工具存取 Apache Doris,並且它可以與 BI 工具無縫整合。 + +### 存算一體架構 + +Apache Doris 的存算一體架構簡潔且易於維護。如下圖所示,它僅由兩種類型的程序組成: + +- **Frontend (FE):** 主要負責處理使用者請求、查詢解析和規劃、元資料管理和節點管理任務。 + +- **Backend (BE):** 主要負責資料儲存和查詢執行。資料被分割為分片,並在 BE 節點之間以多個副本儲存。 + + + +<br /> + +在生產環境中,可以部署多個 FE 節點以實現容災。每個 FE 節點維護元資料的完整副本。FE 節點分為三種角色: + +| 角色 | 功能 | +| --------- | ------------------------------------------------------------ | +| Master | FE Master 節點負責元資料的讀寫操作。當 Master 節點發生元資料變更時,它們通過 BDB JE 協定同步到 Follower 或 Observer 節點。 | +| Follower | Follower 節點負責讀取元資料。如果 Master 節點失敗,可以選擇 Follower 節點作為新的 Master。 | +| Observer | Observer 節點負責讀取元資料,主要用於增加查詢併發。它不參與叢集領導選舉。 | + +FE 和 BE 程序都可以水平擴展,使單個叢集能夠支援數百台機器和數十 PB 的儲存容量。FE 和 BE 程序使用一致性協定來確保服務的高可用性和資料的高可靠性。存算一體架構高度整合,顯著降低了分散式系統的運維複雜度。 + + +## Apache Doris 的核心特性 + +- **高可用性**:在 Apache Doris 中,元資料和資料都以多個副本儲存,通過 quorum 協定同步資料日誌。一旦大多數副本完成寫入,資料寫入即被視為成功,確保即使少數節點失敗,叢集仍然可用。Apache Doris 支援同城和跨地域容災,支援雙叢集主從模式。當某些節點出現故障時,叢集可以自動隔離故障節點,防止整體叢集可用性受到影響。 + +- **高相容性**:Apache Doris 與 MySQL 協定高度相容,支援標準 SQL 語法,涵蓋大多數 MySQL 和 Hive 函數。這種高相容性使使用者能夠無縫遷移和整合現有應用程式和工具。Apache Doris 支援 MySQL 生態系統,使使用者能夠使用 MySQL 客戶端工具連接 Doris,實現更便捷的運維。它還支援 BI 報表工具和資料傳輸工具的 MySQL 協定相容性,確保資料分析和資料傳輸過程的效率和穩定性。 + +- **即時資料倉庫**:基於 Apache Doris,可以構建即時資料倉庫服務。Apache Doris 提供秒級資料擷取能力,在幾秒鐘內將上游線上事務資料庫的增量變更捕獲到 Doris 中。利用向量化引擎、MPP 架構和 Pipeline 執行引擎,Doris 提供亞秒級資料查詢能力,從而構建高效能、低延遲的即時資料倉庫平台。 + +- **統一資料湖**:Apache Doris 可以基於外部資料來源(如資料湖或關聯式資料庫)構建統一資料湖架構。Doris 統一資料湖解決方案實現了資料湖和資料倉庫之間的無縫整合和自由資料流動,幫助使用者直接利用資料倉庫能力解決資料湖中的資料分析問題,同時充分利用資料湖資料管理能力來增強資料價值。 + +- **靈活建模**:Apache Doris 提供各種建模方法,如寬表模型、預聚合模型、星型/雪花型模式等。在資料匯入期間,資料可以扁平化為寬表,並通過 Flink 或 Spark 等計算引擎寫入 Doris,或者資料可以直接匯入到 Doris,通過視圖、物化視圖或即時多表連接執行資料建模操作。 + +## 技術概述 + +Doris 提供高效的 SQL 介面,完全相容 MySQL 協定。其查詢引擎基於 MPP(大規模並行處理)架構,能夠高效執行複雜的分析查詢並實現低延遲即時查詢。通過用於資料編碼和壓縮的列式儲存技術,它顯著優化了查詢效能和儲存壓縮比。 + +### 介面 + +Apache Doris 採用 MySQL 協定,支援標準 SQL,並與 MySQL 語法高度相容。使用者可以通過各種客戶端工具存取 Apache Doris,並與 BI 工具無縫整合,包括但不限於 Smartbi、DataEase、FineBI、Tableau、Power BI 和 Apache Superset。Apache Doris 可以作為任何支援 MySQL 協定的 BI 工具的資料來源。 + +### 儲存引擎 + +Apache Doris 具有列式儲存引擎,按列對資料進行編碼、壓縮和讀取。這使得資料壓縮比非常高,並大大減少了不必要的資料掃描,從而更有效地利用 IO 和 CPU 資源。 + +Apache Doris 支援各種索引結構以最小化資料掃描: + +- **排序複合鍵索引**:使用者最多可以指定三列形成複合排序鍵。這可以有效地剪枝資料,更好地支援高併發報表場景。 + +- **Min/Max 索引**:這在數值類型的等價和範圍查詢中實現有效的資料過濾。 + +- **BloomFilter 索引**:這在等價過濾和高基數列的剪枝中非常有效。 + +- **倒排索引**:這實現了對任何欄位的快速搜尋。 + +Apache Doris 支援多種資料模型,並針對不同場景進行了優化: + +- **明細模型(Duplicate Key Model):** 一種明細資料模型,旨在滿足事實表的詳細儲存需求。 + +- **主鍵模型(Unique Key Model):** 確保唯一鍵;具有相同鍵的資料會被覆蓋,實現列級資料更新。 Review Comment: There's an inconsistency in the zh-CN README at line 179. It says "行级数据更新" (row-level data updates) while the zh-TW version at the same location says "列級資料更新" (column-level data updates). Based on the English version which says "row-level data updates", the zh-CN version is correct and zh-TW should be updated. ```suggestion - **主鍵模型(Unique Key Model):** 確保唯一鍵;具有相同鍵的資料會被覆蓋,實現行級資料更新。 ``` ########## docs/vi-VN/README.md: ########## @@ -0,0 +1,314 @@ +<!-- +Licensed to the Apache Software Foundation (ASF) under one +or more contributor license agreements. See the NOTICE file +distributed with this work for additional information +regarding copyright ownership. The ASF licenses this file +to you under the Apache License, Version 2.0 (the +"License"); you may not use this file except in compliance +with the License. You may obtain a copy of the License at + + http://www.apache.org/licenses/LICENSE-2.0 + +Unless required by applicable law or agreed to in writing, +software distributed under the License is distributed on an +"AS IS" BASIS, WITHOUT WARRANTIES OR CONDITIONS OF ANY +KIND, either express or implied. See the License for the +specific language governing permissions and limitations +under the License. +--> + +## 🌍 Đọc bằng các ngôn ngữ khác + +[العربية](../ar-SA/README.md) • [বাংলা](../bn-BD/README.md) • [Deutsch](../de-DE/README.md) • [English](../../README.md) • [Español](../es-ES/README.md) • [فارسی](../fa-IR/README.md) • [Français](../fr-FR/README.md) • [हिन्दी](../hi-IN/README.md) • [Bahasa Indonesia](../id-ID/README.md) • [Italiano](../it-IT/README.md) • [日本語](../ja-JP/README.md) • [한국어](../ko-KR/README.md) • [Polski](../pl-PL/README.md) • [Português](../pt-BR/README.md) • [Română](../ro-RO/README.md) • [Русский](../ru-RU/README.md) • [Slovenščina](../sl-SI/README.md) • [ไทย](../th-TH/README.md) • [Türkçe](../tr-TR/README.md) • [Українська](../uk-UA/README.md) • [Tiếng Việt](README.md) • [简体中文](../zh-CN/README.md) • [繁體中文](../zh-TW/README.md) + +<div align="center"> + +# Apache Doris + +[](https://www.apache.org/licenses/LICENSE-2.0.html) +[](https://github.com/apache/doris/releases) +[](https://ossrank.com/p/516) +[](https://github.com/apache/doris/commits/master/) +[](https://doris.apache.org/docs/gettingStarted/what-is-apache-doris) +[](https://doris.apache.org/zh-CN/docs/gettingStarted/what-is-apache-doris) + +<div> + +[?style=for-the-badge>)](https://doris.apache.org/) +[?style=for-the-badge>)](https://doris.apache.org/download) + + +</div> + + +<div> + <a href="https://twitter.com/doris_apache"><img src="https://img.shields.io/badge/- @Doris_Apache -424549?style=social&logo=x" height=25></a> + + <a href="https://github.com/apache/doris/discussions"><img src="https://img.shields.io/badge/- Discussion -red?style=social&logo=discourse" height=25></a> + + <a href="https://join.slack.com/t/apachedoriscommunity/shared_invite/zt-35mzao67o-BrpU70FNKPyB6UlgpXf8_w" height=25></a> + + <a href="https://medium.com/@ApacheDoris"><img src="https://img.shields.io/badge/-Medium-red?style=social&logo=medium" height=25></a> + +</div> + +</div> + +--- + + + + +<p align="center"> + + <a href="https://trendshift.io/repositories/1156" target="_blank"><img src="https://trendshift.io/api/badge/repositories/1156" alt="apache%2Fdoris | Trendshift" style="width: 250px; height: 55px;" width="250" height="55"/></a> + +</p> + + + + + is an easy-to-use, high-performance and real-time analytical database based on MPP architecture, known for its extreme speed and ease of use. It only requires a sub-second response time to return query results under massive data and can support not only high-concurrency point query scenarios but also high-throughput complex analysis scenarios. Review Comment: Several translation files (vi-VN, uk-UA, tr-TR, th-TH, sl-SI, ru-RU, ro-RO, pt-BR, pl-PL, ko-KR, it-IT, id-ID, hi-IN) contain English content starting from line 71 instead of translated content. The main description paragraph "is an easy-to-use, high-performance..." should be translated to the respective language. Only the Chinese (zh-CN, zh-TW) and Japanese (ja-JP) files appear to have proper translations. ########## docs/zh-CN/README.md: ########## @@ -0,0 +1,314 @@ +<!-- +Licensed to the Apache Software Foundation (ASF) under one +or more contributor license agreements. See the NOTICE file +distributed with this work for additional information +regarding copyright ownership. The ASF licenses this file +to you under the Apache License, Version 2.0 (the +"License"); you may not use this file except in compliance +with the License. You may obtain a copy of the License at + + http://www.apache.org/licenses/LICENSE-2.0 + +Unless required by applicable law or agreed to in writing, +software distributed under the License is distributed on an +"AS IS" BASIS, WITHOUT WARRANTIES OR CONDITIONS OF ANY +KIND, either express or implied. See the License for the +specific language governing permissions and limitations +under the License. +--> + +## 🌍 阅读其他语言版本 + +[العربية](../ar-SA/README.md) • [বাংলা](../bn-BD/README.md) • [Deutsch](../de-DE/README.md) • [English](../../README.md) • [Español](../es-ES/README.md) • [فارسی](../fa-IR/README.md) • [Français](../fr-FR/README.md) • [हिन्दी](../hi-IN/README.md) • [Bahasa Indonesia](../id-ID/README.md) • [Italiano](../it-IT/README.md) • [日本語](../ja-JP/README.md) • [한국어](../ko-KR/README.md) • [Polski](../pl-PL/README.md) • [Português](../pt-BR/README.md) • [Română](../ro-RO/README.md) • [Русский](../ru-RU/README.md) • [Slovenščina](../sl-SI/README.md) • [ไทย](../th-TH/README.md) • [Türkçe](../tr-TR/README.md) • [Українська](../uk-UA/README.md) • [Tiếng Việt](../vi-VN/README.md) • [简体中文](README.md) • [繁體中文](../zh-TW/README.md) + +<div align="center"> + +# Apache Doris + +[](https://www.apache.org/licenses/LICENSE-2.0.html) +[](https://github.com/apache/doris/releases) +[](https://ossrank.com/p/516) +[](https://github.com/apache/doris/commits/master/) +[](https://doris.apache.org/docs/gettingStarted/what-is-apache-doris) +[](https://doris.apache.org/zh-CN/docs/gettingStarted/what-is-apache-doris) + +<div> + +[?style=for-the-badge>)](https://doris.apache.org/) +[?style=for-the-badge>)](https://doris.apache.org/download) + + +</div> + + +<div> + <a href="https://twitter.com/doris_apache"><img src="https://img.shields.io/badge/- @Doris_Apache -424549?style=social&logo=x" height=25></a> + + <a href="https://github.com/apache/doris/discussions"><img src="https://img.shields.io/badge/- Discussion -red?style=social&logo=discourse" height=25></a> + + <a href="https://join.slack.com/t/apachedoriscommunity/shared_invite/zt-35mzao67o-BrpU70FNKPyB6UlgpXf8_w" height=25></a> Review Comment: The Slack link on line 49 is missing the img tag content, resulting in an incomplete anchor element. This affects multiple translation files and should display a badge similar to the Twitter and Medium links. ```suggestion <a href="https://join.slack.com/t/apachedoriscommunity/shared_invite/zt-35mzao67o-BrpU70FNKPyB6UlgpXf8_w"><img src="https://img.shields.io/badge/-Slack-4A154B?style=social&logo=slack" height=25 alt="Slack"></a> ``` -- This is an automated message from the Apache Git Service. To respond to the message, please log on to GitHub and use the URL above to go to the specific comment. To unsubscribe, e-mail: [email protected] For queries about this service, please contact Infrastructure at: [email protected] --------------------------------------------------------------------- To unsubscribe, e-mail: [email protected] For additional commands, e-mail: [email protected]
