覆盖主要内容
版本: 6.1.0

XML 文件输入(StAX)

组件介绍

组件作用

XML 文件输入(StAX)”组件用于使用 XPath 规范读取 XML 文件中的数据。

输入输出描述


  • 输入:需要读取的 XML 文件
  • 输出:读取的 XML 文件的内容

组件图标

页面介绍

XML 输入(StAX)”组件的页面包含如下选项

参数选项

选项说明样例值
文件名输入 XML 文件的文件名。
从前置通道传过来的字段勾选此选项表示从一个先前组件的字段接收数据。
源字段名称从先前组件中选择一个字段作为 XML 数据。
将字段名添加到结果中将处理后的 XML 文件名添加到此 pipeline 的结果中
忽略(Elements/Attributes)应跳过的元素或属性的数量。
限制(Elements/Attributes)限制要处理的元素或属性的数量。 
默认字符串长度XML 数据名称和值字段的默认字符串长度。 
编码以指定的编码编码 XML 文件数据。 
添加命名空间信息将 XML 数据类型 NAMESPACE 添加到流中。 
裁剪字符串修剪所有名称/值元素和属性。它消除字符串开头和结尾的空格、制表符、换行符和回车符。 
输出文件名将处理后的文件名添加到指定的字段名。 xml_filename
输出记录数将处理后的行号(从 1 开始)添加到指定的字段名。 xml_row_number
输出 XML 数据类型(整型表示)将处理后的数据类型以数值格式添加到指定的字段名。 xml_data_type_numeric
输出 XML 数据类型(描述)将处理后的数据类型以文本格式添加到指定的字段名。 xml_data_type_description
XML location line in output将处理后的源XML位置行添加到指定的字段名。 xml_location_line
输出行序号将处理后的源XML位置列添加到指定的字段名。 xml_location_column
输出 XML element ID将处理的元素编号(从 0 开始)添加到指定的字段名。与添加行号不同,这个字段编号由每个新元素的计数增加,而不是行号。 xml_element_id
输出 XML 父 element ID将父元素编号添加到指定的字段名。xml_parent_element_id
输出 XML element 层次将处理的元素级别添加到指定的字段名,从 0 开始,表示根元素的 START_ 和 END_DOCUMENT。 xml_element_level
输出 XML 路径将处理的 XML 路径添加到指定的字段名。 xml_path
输出 XML 父路径将处理的 XML 父路径添加到指定的字段名。 xml_parent_path
输出 XML 数据名称将处理的元素、属性和可选命名空间前缀的数据名称添加到指定的字段名。 xml_data_name
输出 XML 数据值将处理的元素、属性和可选命名空间 URI 的数据值添加到指定的字段名。 xml_data_value

案例示例

该案例解析用户上传的 xml 文件的信息,总体流程如下图所示:

案例数据

该文件保存了 3 个学生的信息,包括姓名以及成绩。

案例操作

文件上传

该步骤将本地的 xml 文件上传至 UDI 文件库中,为【XML 文件输入(StAX)】组件提供数据输入来源。

文件上传操作详情请见 文件上传

需要上传的数据文件:student.xml

上传成功的 xml 文件可在 UDI 文件库中看到。

XML 文件输入(StAX)

解析 UDI 中的 xml 文件的信息。

该组件配置主要分为 2 步:

第一步:选择需要加载的文件;

第二步:配置输出的字段名(表示解析 XML 所获得的信息);

结果预览

UDI 最终解析的 student.xml 文件信息如下图所示: