This is an automated email from the ASF dual-hosted git repository.

vinoth pushed a commit to branch asf-site
in repository https://gitbox.apache.org/repos/asf/incubator-hudi.git


The following commit(s) were added to refs/heads/asf-site by this push:
     new 4254e60  Travis CI build asf-site
4254e60 is described below

commit 4254e606504a6b0351176f8bb59f9a830d4b66e6
Author: CI <[email protected]>
AuthorDate: Wed Apr 22 15:53:20 2020 +0000

    Travis CI build asf-site
---
 content/assets/js/lunr/lunr-store.js | 2 +-
 content/cn/docs/writing_data.html    | 2 +-
 2 files changed, 2 insertions(+), 2 deletions(-)

diff --git a/content/assets/js/lunr/lunr-store.js 
b/content/assets/js/lunr/lunr-store.js
index 70f1edb..1d0335b 100644
--- a/content/assets/js/lunr/lunr-store.js
+++ b/content/assets/js/lunr/lunr-store.js
@@ -600,7 +600,7 @@ var store = [{
         "url": "https://hudi.apache.org/docs/concepts.html";,
         "teaser":"https://hudi.apache.org/assets/images/500x300.png"},{
         "title": "写入 Hudi 数据集",
-        "excerpt":"这一节我们将介绍使用DeltaStreamer工具从外部源甚至其他Hudi数据集摄取新更改的方法, 
以及通过使用Hudi数据源的upserts加快大型Spark作业的方法。 对于此类数据集,我们可以使用各种查询引擎查询它们。 写操作 
在此之前,了解Hudi数据源及delta streamer工具提供的三种不同的写操作以及如何最佳利用它们可能会有所帮助。 
这些操作可以在针对数据集发出的每个提交/增量提交中进行选择/更改。 UPSERT(插入更新) 
:这是默认操作,在该操作中,通过查找索引,首先将输入记录标记为插入或更新。 
在运行启发式方法以确定如何最好地将这些记录放到存储上,如优化文件大小之类后,这些记录最终会被写入。 
对于诸如数据库更改捕获之类的用例,建议该操作,因为输入几乎肯定包含更新。 INSERT(插入) :就使用启发式方法确定文件大小�
 �言,此操作与插入更新(UPSERT)非常相似,但此操作完全跳过了索引查找步骤。 
因此,对于日志重复数据删除等用例(结合下面提到的过滤重复项的选项),它可以比插入更新快得多。 插入也适用于这种用 [...]
+        "excerpt":"这一节我们将介绍使用DeltaStreamer工具从外部源甚至其他Hudi数据集摄取新更改的方法, 
以及通过使用Hudi数据源的upserts加快大型Spark作业的方法。 对于此类数据集,我们可以使用各种查询引擎查询它们。 写操作 
在此之前,了解Hudi数据源及delta streamer工具提供的三种不同的写操作以及如何最佳利用它们可能会有所帮助。 
这些操作可以在针对数据集发出的每个提交/增量提交中进行选择/更改。 UPSERT(插入更新) 
:这是默认操作,在该操作中,通过查找索引,首先将输入记录标记为插入或更新。 
在运行启发式方法以确定如何最好地将这些记录放到存储上,如优化文件大小之后,这些记录最终会被写入。 
对于诸如数据库更改捕获之类的用例,建议该操作,因为输入几乎肯定包含更新。 INSERT(插入) :就使用启发式方法确定文件大小而�
 �,此操作与插入更新(UPSERT)非常相似,但此操作完全跳过了索引查找步骤。 
因此,对于日志重复数据删除等用例(结合下面提到的过滤重复项的选项),它可以比插入更新快得多。 插入也适用于这种用例 [...]
         "tags": [],
         "url": "https://hudi.apache.org/cn/docs/writing_data.html";,
         "teaser":"https://hudi.apache.org/assets/images/500x300.png"},{
diff --git a/content/cn/docs/writing_data.html 
b/content/cn/docs/writing_data.html
index 24ed3d0..c7f7903 100644
--- a/content/cn/docs/writing_data.html
+++ b/content/cn/docs/writing_data.html
@@ -356,7 +356,7 @@
 
 <ul>
   <li><strong>UPSERT(插入更新)</strong> :这是默认操作,在该操作中,通过查找索引,首先将输入记录标记为插入或更新。
- 在运行启发式方法以确定如何最好地将这些记录放到存储上,如优化文件大小之类后,这些记录最终会被写入。
+ 在运行启发式方法以确定如何最好地将这些记录放到存储上,如优化文件大小之后,这些记录最终会被写入。
  对于诸如数据库更改捕获之类的用例,建议该操作,因为输入几乎肯定包含更新。</li>
   <li><strong>INSERT(插入)</strong> 
:就使用启发式方法确定文件大小而言,此操作与插入更新(UPSERT)非常相似,但此操作完全跳过了索引查找步骤。
  因此,对于日志重复数据删除等用例(结合下面提到的过滤重复项的选项),它可以比插入更新快得多。

Reply via email to