覆盖主要内容

Excel 文件输入

组件介绍

组件“Excel 输入”用于读取 Excel 或 OpenOffice 类型的文件数据。 


  • 输入:需要读取的 Excel 文件
  • 输出:读取的 Excel 文件的内容

页面介绍

文件标签

在“文件”标签卡中,可以定义要从中读取的 Excel 文件的位置。

参数选项

Excel 输入”组件的文件标签页面包含如下选项:

选项说明样例值
步骤名称在画布上指定“Excel 输入”步骤的唯一名称,可以自定义名称或保留默认名称。Excel 输入
表格类型(引擎)此字段允许您指定电子表格类型。当前支持以下各项:
  • -Excel 97-2003 XLS:默认。
  • -Excel 2007 XLSX(Apache POI):如果选择此电子表格类型,则可以读取所有已知的 Excel 文件类型。该功能是 Apache POI 项目提供的功能。
  • -Excel 2007 XLSX(Apache POI 流式传输):此电子表格类型允许读取大型 Excel 文件。
  • -Open Office ODS:通过选择此类型,您可以使用 ODFDOM 引擎读取 OpenOffice 电子表格。 | | | 文件或目录 | 指定输入文本文件的位置和/或名称。 | | | 正则表达式 | 在上一个选项中指定的目录中指定要用于选择文件的正则表达式。例如,您要处理所有扩展名为 .txt的文件。  | | | 正则表达式(排除) | 排除满足此正则表达式指定的条件的所有文件(在给定位置)。 | | | 选中的文件 | 包含所选文件(或通配符选择)的列表以及一个指定是否需要文件的属性。如果需要文件但找不到文件,则会生成错误;否则,将跳过文件名。 | |

字段表

组件底部表格为字段表,在配置好参数后,点击“增加”按钮即可根据上述配置信息自动填充字段表。该表包含以下列:

列名说明样例值
文件/目录文件或者目录的名称
通配符号与参数中的正则表达式部分相同
通配符号(排除)与参数中的正则表达式(排除)部分相同
要求是否必须
包含子目录是否匹配子目录

工作表标签

可以指定 Excel 工作簿中要读取的工作表的名称。对于每个工作表名称,您可以指定要从其开始的行和列。行号和列号基于零(0)。(从0开始编号)。

字段表

该表可以通过点击获取工作表名称得到相关 excel 文件中每张表的表名。该表包含以下列:

列名说明样例值
工作表名称sheet 的名称。
起始行读取 excel 的起始行。
起始列读取 excel 的起始列。

内容标签

参数选项

Excel 输入”组件的内容标签页面包含如下选项:

选项说明样例值
如果指定的图表包含要跳过的标题行,则启用。
非空记录如果您不希望此步骤的输出中有空行,请启用。
停在非空记录遇到空行时,使步骤停止读取文件的当前工作表。
限制将行数限制为该数目(零(0)表示所有行)。
编码指定要使用的文本文件编码。保留空白以使用系统上的默认编码。要使用 Unicode,请指定 UTF-8 或 UTF-16 。首次使用时,Uniplore 会在系统中搜索可用的编码。
添加文件名是否将文件名添加到流中

错误处理标签

参数选项

Excel 输入”组件的错误处理标签页面包含如下选项:

选项说明样例值
严格类型?如果选中,Uniplore 将报告输入中的数据类型错误。
忽略错误?如果要在解析期间忽略错误,则启用。
跳过错误?如果选中,Uniplore 将跳过包含错误的行。通过在下面的“ 失败行号文件目录”字段中指定路径,可以将这些行转储到单独的文件中。如果未选中此选项,则有错误的行将在输出中显示为NULL值。
警告文件目录 & 扩展名生成警告时,会将它们放置在此目录中。该文件的名称为 <警告目录> /文件名.<日期时间>.<警告扩展名>
错误文件目录 & 扩展名发生错误时,它们将放置在此目录中。<错误文件目录> /文件名.<日期时间>.<警告扩展名>
失败的记录数文件目录 & 扩展名当某行发生解析错误时,该行号将放置在此目录中。<错误行目录> /文件名.<日期时间>.<扩展名>

字段标签

字段标签用于指定必须从 Excel 文件读取的字段。

字段表

该表包含以下列:

列名说明样例值
名称字段名。
类型字段类型(String、Date、Number 等)
长度对于 Number:有效数的数量;对于 String:字符的长度;对于 Date:打印输出字符的长度(例如 4 代表返回年份)
精度对于 Number:浮点数的数量;对于 String, Date, Boolean:未使用
去除空字符串的方式处理之前先去空(左、右、两边)。如字符  a (两边都有空格),如果裁剪方式为“左”,那么左边的空格将会被去掉
重复如果在当前行中对应的值为空,则重复最后一次不为空的值
格式数字的格式。请参考 java 的 Number Formatting
货币符号用来解释如$10,000.00 的数字
小数小数点可以是”.”(10;000.00)或者”,”(5.000,00)
分组分组可以是”.”(10;000.00)或者”,”(5.000,00)

其他输出字段

此标签选项卡检索自定义元数据字段以添加到步骤的输出中。每个字段的用途都在其名称中定义,但是您可以将这些字段用于任何用途。每个项目都定义一个输出字段,其中将包含以下信息。

参数选项

Excel 输入”组件的其他输出字段标签页面包含如下选项:

选项说明样例值
文件名称目录完整的文件名加上扩展名
工作表名称字段您正在使用的工作表名称
表单的行号列作表行号
行号列当前工作表列号
文件名字段包含文件名的字段名,不带路径信息,但带有扩展名
扩展名字段包含文件名扩展名的字段名称
路径字段包含操作系统格式的路径的字段名称
文件大小字段包含文件大小的字段名称,以字节为单位
是否为隐藏文件字段包含文件是否隐藏的字段名称(布尔值)
最后修改时间字段之后修改时间字段的字段名称
Uri字段仅包含URI根部分的字段名称

使用案例

案例介绍如何读取 Excel 文件。

1、拖动步骤“Excel输入”到工作区,并选定工作表文件。以 progress_b_bouchard.xls 数据作为示例。置如下图所示(若没有对应图,则使用默认配置)。

2、在“工作表”标签中设置工作表的名称,起始行列均设置为 0,如下图所示。

3、配置要读取的字段。如下图所示。

4、右击组件并选择预览,结果如下图所示。