haifxu commented on code in PR #905: URL: https://github.com/apache/inlong-website/pull/905#discussion_r1430827403
########## i18n/zh-CN/docusaurus-plugin-content-docs/current/quick_start/data_sync/mysql_iceberg_example.md: ########## @@ -0,0 +1,111 @@ +--- +title: MySQL 到 Iceberg 示例 +sidebar_position: 3 +--- + +在下面的内容中,我们将通过一个完整的示例介绍如何使用 Apache InLong 创建 MySQL -> Iceberg 整库数据同步。 + +## 环境部署 +### 安装 InLong + +在开始之前,我们需要安装 InLong 的全部组件,这里提供两种方式: +- [Docker 部署](deployment/docker.md)(推荐) +- [Bare Metal 部署](deployment/bare_metal.md) + +### 添加 Connectors +下载 Flink 1.13 对应版本的 [connectors](https://inlong.apache.org/zh-CN/downloads),解压后将 `sort-connector-iceberg-[vsersion]-SNAPSHOT.jar` 放在 `/inlong-sort/connectors/` 目录下。 + +### 安装 Iceberg +请参考 Apache Iceberg 官网的[安装教程](https://iceberg.apache.org/hive-quickstart) + +## 集群初始化 +容器启动成功后,访问 InLong Dashboard 地址 http://localhost,并使用以下默认账号登录: +``` +User: admin +Password: inlong +``` + +### 创建集群标签 +页面点击 【集群管理】->【标签管理】->【新建】,指定集群标签名称和负责人: + + +**注:default_cluster 是各个组件默认上报集群标签,请勿使用其它名称。** + +### 注册 Pulsar 集群 +页面点击 [集群管理] -> [集群管理] -> [新建集群],注册 Pulsar 集群: + + +:::note +集群标签选择刚创建的 `default_cluster`,配置 Docker 部署的 Pulsar 集群: + +Service URL 为 `pulsar://pulsar:6650`, Admin URL 为 `http://pulsar:8080`. +::: + +### 注册 Iceberg 数据节点 +页面点击 [数据节点] -> [创建] ,新增 Iceberg 数据节点. + + +## 任务创建 +### 新建数据流组 +页面点击[数据同步] → [创建],输入 Group ID、Steam ID 和 是否整库迁移: + + +### 创建数据源 +数据源中点击 [新建] → [MySQL] 配置数据源名称、地址、库表信息等。 + + +:::note +- 这里读取模式选择了 `全量+增量`,表中的存量数据也会被采集,`仅增量` 模式则不会。 +- 表名白名单格式为 `<dbName>.<tableName>`,支持正则表达。 +::: + +### 创建数据目标 +数据目标中点击 [新建] → [Iceberg],设置数据目标名称并选择创建好的 Iceberg 数据节点, +库表名称我们可以选择与数据源一直,或者自定义。 Review Comment: Done. -- This is an automated message from the Apache Git Service. To respond to the message, please log on to GitHub and use the URL above to go to the specific comment. To unsubscribe, e-mail: [email protected] For queries about this service, please contact Infrastructure at: [email protected]
