AI Translate 04-transform to Simplified-Chinese (#2659)

github-actions[bot] · Chasen-Zhang · web-flow · commit 547fd963e7f8 · 2025-08-07T20:01:08.000+08:00
* [INIT] Start translation to Simplified-Chinese

* 🌐 Translate 00-querying-parquet.md to Simplified-Chinese

* 🌐 Translate 00-querying-parquet.md to Simplified-Chinese

* 🌐 Translate 00-querying-parquet.md to Simplified-Chinese

* 🌐 Translate 00-querying-parquet.md to Simplified-Chinese

* 🌐 Translate 00-querying-parquet.md to Simplified-Chinese

* 🌐 Translate 00-querying-parquet.md to Simplified-Chinese

* 🌐 Translate 00-querying-parquet.md to Simplified-Chinese

* 🌐 Translate 00-querying-parquet.md to Simplified-Chinese

---------

Co-authored-by: github-actions[bot] &lt;github-actions[bot]@users.noreply.github.com&gt;
Co-authored-by: z &lt;787025321@qq.com&gt;
diff --git a/.translation-init b/.translation-init
@@ -1 +1 @@
-Translation initialization: 2025-08-07T10:11:49.993149
+Translation initialization: 2025-08-07T11:49:53.390350
diff --git a/docs/cn/guides/40-load-data/04-transform/00-querying-parquet.md b/docs/cn/guides/40-load-data/04-transform/00-querying-parquet.md
@@ -1,5 +1,5 @@
 ---
-title: 查询暂存区中的 Parquet 文件
+title: 查询暂存区（Stage）中的 Parquet 文件
 sidebar_label: Parquet
 ---
 
@@ -12,9 +12,9 @@ sidebar_label: Parquet
 
 ## 教程
 
-### 步骤 1：创建外部暂存区（Stage）
+### 第 1 步：创建外部暂存区（Stage）
 
-使用您自己的 S3 存储桶和凭据创建一个外部暂存区（Stage），用于存放 Parquet 文件。
+使用你自己的 S3 存储桶和凭据创建一个外部暂存区（Stage），你的 Parquet 文件就存储在该存储桶中。
 ```sql
 CREATE STAGE parquet_query_stage 
 URL = 's3://load/parquet/' 
@@ -24,14 +24,14 @@ CONNECTION = (
 );
 ```
 
-### 步骤 2：创建自定义 Parquet 文件格式
+### 第 2 步：创建自定义 Parquet 文件格式
 
 ```sql
 CREATE FILE FORMAT parquet_query_format TYPE = PARQUET;
 ```
 - 更多 Parquet 文件格式选项，请参阅 [Parquet 文件格式选项](/sql/sql-reference/file-format-options#parquet-options)
 
-### 步骤 3：查询 Parquet 文件
+### 第 3 步：查询 Parquet 文件
 
 按列名查询：
 
@@ -57,9 +57,9 @@ FROM @parquet_query_stage
 ```
 
 
-### 查询元数据（Metadata）
+### 查询元数据
 
-直接从暂存区（Stage）查询 Parquet 文件，并包含 `METADATA$FILENAME` 和 `METADATA$FILE_ROW_NUMBER` 等元数据（Metadata）列：
+直接从暂存区（Stage）查询 Parquet 文件，包括 `METADATA$FILENAME` 和 `METADATA$FILE_ROW_NUMBER` 等元数据列：
 
 ```sql
 SELECT
diff --git a/docs/cn/guides/40-load-data/04-transform/01-querying-csv.md b/docs/cn/guides/40-load-data/04-transform/01-querying-csv.md
@@ -1,5 +1,5 @@
 ---
-title: 查询暂存区中的 CSV 文件
+title: 查询暂存区（Stage）中的 CSV 文件
 sidebar_label: CSV
 ---
 
@@ -10,9 +10,9 @@ sidebar_label: CSV
 
 ## 教程
 
-### 步骤 1：创建外部暂存区
+### 步骤一：创建外部暂存区（Stage）
 
-创建一个外部暂存区（Stage），并配置你的 S3 存储桶和凭证，CSV 文件存储在该位置。
+创建一个外部暂存区（Stage），并配置您自己的 S3 存储桶和凭证，CSV 文件就存储在该存储桶中。
 ```sql
 CREATE STAGE csv_query_stage 
 URL = 's3://load/csv/' 
@@ -22,7 +22,7 @@ CONNECTION = (
 );
 ```
 
-### 步骤 2：创建自定义 CSV 文件格式
+### 步骤二：创建自定义 CSV 文件格式
 
 ```sql
 CREATE FILE FORMAT csv_query_format 
@@ -33,9 +33,9 @@ CREATE FILE FORMAT csv_query_format
     SKIP_HEADER = 1;        -- 如果 CSV 文件包含表头，查询时跳过第一行
 ```
 
-- 更多 CSV 文件格式选项，请参考 [CSV 文件格式选项](/sql/sql-reference/file-format-options#csv-options)
+- 更多 CSV 文件格式选项，请参阅 [CSV 文件格式选项](/sql/sql-reference/file-format-options#csv-options)
 
-### 步骤 3：查询 CSV 文件
+### 步骤三：查询 CSV 文件
 
 ```sql
 SELECT $1, $2, $3
@@ -46,7 +46,7 @@ FROM @csv_query_stage
 );
 ```
 
-如果 CSV 文件使用 gzip 压缩，我们可以使用以下查询：
+如果 CSV 文件使用 gzip 压缩，可使用以下查询：
 
 ```sql
 SELECT $1, $2, $3
@@ -56,9 +56,9 @@ FROM @csv_query_stage
     PATTERN => '.*[.]csv[.]gz'
 );
 ```
-### 查询元数据
+### 查询并包含元数据
 
-直接从暂存区（Stage）查询 CSV 文件，包括 `METADATA$FILENAME` 和 `METADATA$FILE_ROW_NUMBER` 等元数据列：
+直接从暂存区（Stage）查询 CSV 文件，并包含 `METADATA$FILENAME` 和 `METADATA$FILE_ROW_NUMBER` 等元数据列：
 
 ```sql
 SELECT
diff --git a/docs/cn/guides/40-load-data/04-transform/02-querying-tsv.md b/docs/cn/guides/40-load-data/04-transform/02-querying-tsv.md
@@ -11,9 +11,9 @@ sidebar_label: TSV
 
 ## 教程
 
-### 步骤 1：创建外部暂存区
+### 第 1 步：创建外部暂存区
 
-使用您自己的 S3 存储桶和凭据创建一个外部暂存区（Stage），其中存放了您的 TSV 文件。
+创建一个外部暂存区（Stage），并配置你的 S3 存储桶和凭据，你的 TSV 文件存储在该位置。
 ```sql
 CREATE STAGE tsv_query_stage 
 URL = 's3://load/tsv/' 
@@ -23,7 +23,7 @@ CONNECTION = (
 );
 ```
 
-### 步骤 2：创建自定义 TSV 文件格式
+### 第 2 步：创建自定义 TSV 文件格式
 
 ```sql
 CREATE FILE FORMAT tsv_query_format 
@@ -35,7 +35,7 @@ CREATE FILE FORMAT tsv_query_format
 
 - 更多 TSV 文件格式选项，请参阅 [TSV 文件格式选项](/sql/sql-reference/file-format-options#tsv-options)
 
-### 步骤 3：查询 TSV 文件
+### 第 3 步：查询 TSV 文件
 
 ```sql
 SELECT $1, $2, $3
@@ -46,7 +46,7 @@ FROM @tsv_query_stage
 );
 ```
 
-如果 TSV 文件使用 gzip 压缩，可以使用以下查询：
+如果 TSV 文件使用 gzip 压缩，我们可以使用以下查询：
 
 ```sql
 SELECT $1, $2, $3
@@ -58,7 +58,7 @@ FROM @tsv_query_stage
 ```
 ### 查询元数据
 
-直接从暂存区（Stage）查询 TSV 文件，并包含 `METADATA$FILENAME` 和 `METADATA$FILE_ROW_NUMBER` 等元数据列：
+直接从暂存区（Stage）查询 TSV 文件，包括 `METADATA$FILENAME` 和 `METADATA$FILE_ROW_NUMBER` 等元数据列：
 
 ```sql
 SELECT
diff --git a/docs/cn/guides/40-load-data/04-transform/03-querying-ndjson.md b/docs/cn/guides/40-load-data/04-transform/03-querying-ndjson.md
@@ -1,13 +1,13 @@
 ---
-title: 查询暂存区（Stage）中的 NDJSON 文件
+title: 查询暂存区中的 NDJSON 文件
 sidebar_label: NDJSON
 ---
 
-在 Databend 中，你可以直接查询存储在暂存区（Stage）中的 NDJSON 文件，而无需先将数据加载到表中。这种方法对于数据探索、ETL 处理和即席分析场景特别有用。
+在 Databend 中，你可以直接查询存储在暂存区（Stage）中的 NDJSON 文件，而无需先将数据加载到表中。这种方法在数据探索、ETL 处理及即席分析等场景尤为实用。
 
 ## 什么是 NDJSON？
 
-NDJSON（Newline Delimited JSON，换行符分隔的 JSON）是一种基于 JSON 的文件格式，其中每一行都包含一个完整且有效的 JSON 对象。这种格式特别适合流式数据处理和大数据分析。
+NDJSON（Newline Delimited JSON，换行分隔 JSON）是一种基于 JSON 的文件格式，其中每一行都是一个完整且有效的 JSON 对象。该格式特别适合流式数据处理与大数据分析。
 
 **NDJSON 文件内容示例：**
 ```json
@@ -17,9 +17,9 @@ NDJSON（Newline Delimited JSON，换行符分隔的 JSON）是一种基于 JSON
 ```
 
 **NDJSON 的优势：**
-- **流式友好**：可以逐行解析，无需将整个文件加载到内存中。
-- **兼容大数据**：广泛用于日志文件、数据导出和 ETL Pipeline。
-- **易于处理**：每一行都是一个独立的 JSON 对象，支持并行处理。
+- **流式友好**：可逐行解析，无需将整个文件加载到内存。
+- **兼容大数据**：广泛用于日志文件、数据导出及 ETL 流水线。
+- **易于处理**：每行均为独立 JSON 对象，支持并行处理。
 
 ## 语法
 
@@ -28,9 +28,9 @@ NDJSON（Newline Delimited JSON，换行符分隔的 JSON）是一种基于 JSON
 
 ## 教程
 
-### 步骤 1. 创建外部暂存区（Stage）
+### 步骤 1. 创建外部暂存区
 
-使用你自己的 S3 存储桶和凭据创建一个外部暂存区（Stage），你的 NDJSON 文件存储在该位置。
+使用你自己的 S3 存储桶和凭据创建外部暂存区，用于存放 NDJSON 文件。
 ```sql
 CREATE STAGE ndjson_query_stage 
 URL = 's3://load/ndjson/' 
@@ -48,11 +48,11 @@ CREATE FILE FORMAT ndjson_query_format
     COMPRESSION = AUTO;
 ```
 
-- 更多 NDJSON 文件格式选项，请参考 [NDJSON 文件格式选项](/sql/sql-reference/file-format-options#ndjson-options)
+- 更多 NDJSON 文件格式选项请参考 [NDJSON 文件格式选项](/sql/sql-reference/file-format-options#ndjson-options)
 
 ### 步骤 3. 查询 NDJSON 文件
 
-现在，你可以直接从暂存区（Stage）查询 NDJSON 文件。此示例从每个 JSON 对象中提取 `title` 和 `author` 字段：
+现在可直接从暂存区查询 NDJSON 文件。以下示例从每个 JSON 对象中提取 `title` 和 `author` 字段：
 
 ```sql
 SELECT $1:title, $1:author
@@ -63,15 +63,15 @@ FROM @ndjson_query_stage
 );
 ```
 
-**说明：**
-- `$1:title` 和 `$1:author`：从 JSON 对象中提取特定字段。`$1` 代表整个 JSON 对象（作为 Variant 类型），`:field_name` 用于访问单个字段。
-- `@ndjson_query_stage`：引用在步骤 1 中创建的外部暂存区（Stage）。
-- `FILE_FORMAT => 'ndjson_query_format'`：使用在步骤 2 中定义的自定义文件格式。
-- `PATTERN => '.*[.]ndjson'`：匹配所有以 `.ndjson` 结尾的文件的正则表达式（Regex）模式。
+**解释：**
+- `$1:title` 与 `$1:author`：从 JSON 对象中提取特定字段。`$1` 表示整个 JSON 对象（Variant 类型），`:field_name` 用于访问单个字段。
+- `@ndjson_query_stage`：引用步骤 1 中创建的外部暂存区。
+- `FILE_FORMAT => 'ndjson_query_format'`：使用步骤 2 中定义的自定义文件格式。
+- `PATTERN => '.*[.]ndjson'`：正则表达式，匹配所有以 `.ndjson` 结尾的文件。
 
 ### 查询压缩文件
 
-如果 NDJSON 文件使用 gzip 进行了压缩，请修改模式以匹配压缩文件：
+若 NDJSON 文件使用 gzip 压缩，请将模式修改为匹配压缩文件：
 
 ```sql
 SELECT $1:title, $1:author
@@ -82,10 +82,10 @@ FROM @ndjson_query_stage
 );
 ```
 
-**主要区别：** 模式 `.*[.]ndjson[.]gz` 匹配以 `.ndjson.gz` 结尾的文件。由于文件格式中设置了 `COMPRESSION = AUTO`，Databend 会在查询执行期间自动解压 gzip 文件。
+**关键区别：** 模式 `.*[.]ndjson[.]gz` 匹配以 `.ndjson.gz` 结尾的文件。由于文件格式中设置了 `COMPRESSION = AUTO`，Databend 会在查询执行期间自动解压 gzip 文件。
 
 ## 相关文档
 
 - [加载 NDJSON 文件](../03-load-semistructured/03-load-ndjson.md) - 如何将 NDJSON 数据加载到表中
 - [NDJSON 文件格式选项](/sql/sql-reference/file-format-options#ndjson-options) - 完整的 NDJSON 格式配置
-- [CREATE STAGE](/sql/sql-commands/ddl/stage/ddl-create-stage) - 管理外部和内部暂存区（Stage）
+- [CREATE STAGE](/sql/sql-commands/ddl/stage/ddl-create-stage) - 管理外部和内部暂存区
diff --git a/docs/cn/guides/40-load-data/04-transform/04-querying-avro.md b/docs/cn/guides/40-load-data/04-transform/04-querying-avro.md
@@ -1,5 +1,5 @@
 ---
-title: 查询暂存区中的 Avro 文件
+title: 在 Stage 中查询 Avro 文件
 sidebar_label: Avro
 ---
 
@@ -10,19 +10,19 @@ sidebar_label: Avro
 
 ## Avro 查询功能概述
 
-Databend 全面支持直接从暂存区（Stage）查询 Avro 文件，无需先将数据加载到表中，即可灵活地进行数据探索与转换。
+Databend 全面支持直接从 Stage 查询 Avro 文件，无需先将数据加载到表中即可灵活地进行数据探索与转换。
 
-*   **Variant 表示**：Avro 文件中的每一行都被视为一个 Variant（Variant），通过 `$1` 引用，可灵活访问 Avro 数据中的嵌套结构。
+*   **Variant 表示**：Avro 文件中的每一行都被视为一个 Variant（变体类型），通过 `$1` 引用，从而灵活访问 Avro 数据中的嵌套结构。
 *   **类型映射**：每个 Avro 类型都会映射到 Databend 中对应的 Variant 类型。
 *   **元数据访问**：可访问 `METADATA$FILENAME` 和 `METADATA$FILE_ROW_NUMBER` 等元数据列，获取源文件及行的额外上下文信息。
 
 ## 教程
 
-本教程演示如何查询存储在暂存区中的 Avro 文件。
+本教程演示如何查询存储在 Stage 中的 Avro 文件。
 
-### 第 1 步：准备 Avro 文件
+### 步骤 1. 准备 Avro 文件
 
-假设有一个名为 `user` 的 Avro 文件，其模式如下：
+假设有一个名为 `user` 的 Avro 文件，其 Schema 如下：
 
 ```json
 {
@@ -41,9 +41,9 @@ Databend 全面支持直接从暂存区（Stage）查询 Avro 文件，无需先
 }
 ```
 
-### 第 2 步：创建外部暂存区
+### 步骤 2. 创建外部 Stage
 
-使用你自己的 S3 存储桶和凭据创建外部暂存区（External Stage），用于存放 Avro 文件。
+使用您自己的 S3 存储桶和凭证创建外部 Stage，用于存放 Avro 文件。
 
 ```sql
 CREATE STAGE avro_query_stage
@@ -54,11 +54,11 @@ CONNECTION = (
 );
 ```
 
-### 第 3 步：查询 Avro 文件
+### 步骤 3. 查询 Avro 文件
 
 #### 基础查询
 
-直接从暂存区查询 Avro 文件：
+直接从 Stage 查询 Avro 文件：
 
 ```sql
 SELECT
@@ -73,7 +73,7 @@ FROM @avro_query_stage
 
 ### 带元数据的查询
 
-直接从暂存区查询 Avro 文件，并包含 `METADATA$FILENAME` 和 `METADATA$FILE_ROW_NUMBER` 等元数据列：
+直接从 Stage 查询 Avro 文件，并包含 `METADATA$FILENAME` 和 `METADATA$FILE_ROW_NUMBER` 等元数据列：
 
 ```sql
 SELECT
@@ -90,8 +90,8 @@ FROM @avro_query_stage
 
 ## 类型映射到 Variant
 
-Databend 中的 Variant 以 JSONB 形式存储。大多数 Avro 类型可直接映射，但需注意以下特殊情况：
+Databend 中的 Variant 以 JSONB 存储。大多数 Avro 类型可直接映射，但需注意以下特殊情况：
 
-*   **时间类型**：`TimeMillis` 和 `TimeMicros` 映射为 `INT64`，因为 JSONB 没有原生时间类型；处理这些值时请注意其原始类型。
+*   **时间类型**：`TimeMillis` 和 `TimeMicros` 映射为 `INT64`，因为 JSONB 没有原生时间类型，处理时需留意原始类型。
 *   **Decimal 类型**：Decimal 加载为 `DECIMAL128` 或 `DECIMAL256`；若精度超出支持范围，将报错。
-*   **Enum 类型**：Avro `ENUM` 类型在 Databend 中映射为 `STRING` 值。
+*   **枚举类型**：Avro 的 `ENUM` 类型在 Databend 中映射为 `STRING` 值。
diff --git a/docs/cn/guides/40-load-data/04-transform/05-querying-orc.md b/docs/cn/guides/40-load-data/04-transform/05-querying-orc.md
@@ -2,7 +2,6 @@
 title: 查询暂存区（Stage）中的 ORC 文件
 sidebar_label: ORC
 ---
-
 import StepsWrap from '@site/src/components/StepsWrap';
 import StepContent from '@site/src/components/Steps/step-content';
 
@@ -14,7 +13,7 @@ import StepContent from '@site/src/components/Steps/step-content';
 
 ## 教程
 
-在本教程中，我们将带你完成以下步骤：下载 ORC 格式的 Iris 数据集、将其上传到 Amazon S3 存储桶、创建外部暂存区（Stage），并直接从 ORC 文件查询数据。
+在本教程中，我们将带你完成以下步骤：下载 ORC 格式的 Iris 数据集，上传到 Amazon S3 存储桶，创建外部暂存区（Stage），并直接从 ORC 文件查询数据。
 
 <StepsWrap>
 <StepContent number="1">
@@ -23,14 +22,14 @@ import StepContent from '@site/src/components/Steps/step-content';
 
 从 https://github.com/tensorflow/io/raw/master/tests/test_orc/iris.orc 下载 iris 数据集，然后上传到你的 Amazon S3 存储桶。
 
-iris 数据集包含 3 个类别，每个类别 50 条记录，每个类别对应一种鸢尾花。数据集共有 4 个属性：（1）花萼长度，（2）花萼宽度，（3）花瓣长度，（4）花瓣宽度；最后一列为类别标签。
+iris 数据集包含 3 个类别，每类 50 条记录，分别对应一种鸢尾花。共有 4 个属性：（1）花萼长度，（2）花萼宽度，（3）花瓣长度，（4）花瓣宽度，最后一列为类别标签。
 
 </StepContent>
 <StepContent number="2">
 
 ### 创建外部暂存区（Stage）
 
-使用存放 iris 数据集文件的 Amazon S3 存储桶创建外部暂存区（Stage）。
+使用存储 iris 数据集的 Amazon S3 存储桶创建外部暂存区（Stage）。
 
 ```sql
 CREATE STAGE orc_query_stage
@@ -57,7 +56,7 @@ FROM @orc_query_stage
 );
 
 ┌──────────────────────────────────────────────────────────────────────────────────────────────────┐
-│    sepal_length   │    sepal_width    │    petal_length   │    petal_width    │      species     │
+│    花萼长度       │    花萼宽度       │    花瓣长度       │    花瓣宽度       │      种类        │
 ├───────────────────┼───────────────────┼───────────────────┼───────────────────┼──────────────────┤
 │               5.1 │               3.5 │               1.4 │               0.2 │ setosa           │
 │                 · │                 · │                 · │                 · │ ·                │
@@ -73,11 +72,10 @@ FROM @orc_query_stage
 (
     FILE_FORMAT => 'orc',
     PATTERN => '.*[.]orc'
-    
 );
 ```
 
-你也可以直接查询远程 ORC 文件：
+也可以直接查询远程 ORC 文件：
 
 ```sql
 SELECT
diff --git a/docs/cn/guides/40-load-data/04-transform/06-data-load-transform.md b/docs/cn/guides/40-load-data/04-transform/06-data-load-transform.md
diff --git a/docs/cn/guides/40-load-data/04-transform/index.md b/docs/cn/guides/40-load-data/04-transform/index.md

Original file line number	Diff line number	Diff line change
`@@ -1 +1 @@`
`1`		`-Translation initialization: 2025-08-07T10:11:49.993149`
	`1`	`+Translation initialization: 2025-08-07T11:49:53.390350`