XML 文件输入(StAX)
组件介绍
组件作用
“XML 文件输入(StAX)”组件用于使用 XPath 规范读取 XML 文件中的数据。
输入输出描述
- 输入:需要读取的 XML 文件
- 输出:读取的 XML 文件的内容
组件图标
页面介绍
“XML 输入(StAX)”组件的页面包含如下选项
参数选项
选项 | 说明 | 样例值 |
---|---|---|
文件名 | 输入 XML 文件的文件名。 | |
从前置通道传过来的字段 | 勾选此选项表示从一个先前组件的字段接收数据。 | |
源字段名称 | 从先前组件中选择一个字段作为 XML 数据。 | |
将字段名添加到结果中 | 将处理后的 XML 文件名添加到此 pipeline 的结果中 | |
忽略(Elements/Attributes) | 应跳过的元素或属性的数量。 | |
限制(Elements/Attributes) | 限制要处理的元素或属性的数量。 | |
默认字符串长度 | XML 数据名称和值字段的默认字符串长度。 | |
编码 | 以指定的编码编码 XML 文件数据。 | |
添加命名空间信息 | 将 XML 数据类型 NAMESPACE 添加到流中。 | |
裁剪字符串 | 修剪所有名称/值元素和属性。它消除字符串开头和结尾的空格、制表符、换行符和回车符。 | |
输出文件名 | 将处理后的文件名添加到指定的字段名。 | xml_filename |
输出记录数 | 将处理后的行号(从 1 开始)添加到指定的字段名。 | xml_row_number |
输出 XML 数据类型(整型表示) | 将处理后的数据类型以数值格式添加到指定的字段名。 | xml_data_type_numeric |
输出 XML 数据类型(描述) | 将处理后的数据类型以文本格式添加到指定的字段名。 | xml_data_type_description |
XML location line in output | 将处理后的源XML位置行添加到指定的字段名。 | xml_location_line |
输出行序号 | 将处理后的源XML位置列添加到指定的字段名。 | xml_location_column |
输出 XML element ID | 将处理的元素编号(从 0 开始)添加到指定的字段名。与添加行号不同,这个字段编号由每个新元素的计数增加,而不是行号。 | xml_element_id |
输出 XML 父 element ID | 将父元素编号添加到指定的字段名。 | xml_parent_element_id |
输出 XML element 层次 | 将处理的 元素级别添加到指定的字段名,从 0 开始,表示根元素的 START_ 和 END_DOCUMENT。 | xml_element_level |
输出 XML 路径 | 将处理的 XML 路径添加到指定的字段名。 | xml_path |
输出 XML 父路径 | 将处理的 XML 父路径添加到指定的字段名。 | xml_parent_path |
输出 XML 数据名称 | 将处理的元素、属性和可选命名空间前缀的数据名称添加到指定的字段名。 | xml_data_name |
输出 XML 数据值 | 将处理的元素、属性和可选命名空间 URI 的数据值添加到指定的字段名。 | xml_data_value |
案例示例
该案例解析用户上传的 xml 文件的信息,总体流程如下图所示:
案例数据
该文件保存了 3 个学生的信息,包括姓名以及成绩。