覆盖主要内容

固定宽度文件输入

组件介绍

固定宽度文件输入”组件可以用于从固定宽度的文本文件中读取数据。在固定宽度文件中,数据由列的宽度决定。列的宽度以字符为单位进行度量。例如,文件中的数据包含第一列正好有 12 个字符,第二列正好有 10 个字符,第三列正好有 7 个字符,以此类推。每一行包含一个信息记录;每个记录可以包含多个数据(字段),每个数据字段(列)有特定数量的字符。


  • 输入:需要读取的固定宽度的文本文件
  • 输出:读取的固定宽度的文本文件的数据

页面介绍

打开“固定宽度文件输入”组件得到下图所示的界面。

参数选项

固定宽度文件输入”组件页面包含如下选项:

选项说明样例值
步骤名称在画布上指定“固定宽度文件输入”步骤的唯一名称,可以自定义名称或保留默认名称。固定宽度文件输入
文件名指定输入固定宽度文件的名称,或通过单击“浏览文件”导航到输入文件。
以字节数表示的行宽度指定目标文件中每个记录的宽度。该宽度不包括回车或换行字段。80
保留换行符?检查目标文件是否包含换行符。
NIO缓存大小指定读取缓冲区的大小,即一次从源读取的字节数。50000
简易转换?指定是否可以使用惰性转换算法来提高性能。如果勾选,简易转换算法会尝试避免不必要的数据类型转换。它可以显著提高性能,典型示例是从文本文件读取并写回文本文件。
保留头信息指示源文件是否包含标题行。
并发运行?如果要运行此步骤的多个实例(步骤副本),并且希望每个实例读取文件的单独部分,请选中此框。
换行符类型文件中换行符是哪一种
文件编码指定源文件的编码。GBK2312
添加文件到列表将读取的文件名添加到此转换的结果中。在内存中保存一个惟一的列表,可以在作业中的下一个作业条目中使用,例如在另一个转换中。

字段表

组件底部表格为字段表,右击选择“获取字段”,组件可根据当前指定设置从源文件获取相应内容填充字段表。该表包含以下列:

列名说明样例值
名称字段名。
类型字段类型,可以是String、Date或Number等类型。
格式用于转换原始字段格式的可选掩码。
宽度该字段字符的固定长度
长度字段的长度取决于以下字段类型:Number:数字中有效数字的总数。String:字符串的总长度。Date:字符串的打印输出长度。
精度数字类型字段的浮点位数。
货币类型用于表示货币的符号(例如¥或$)。
小数点符号小数点可以是“.”或“,”(例如5,000.0或5.000,0)。
分组符号分组可以使“.”或“,”(例如5,000.0或5.000,0)。
去除空格符号应用于字符串中空格的修剪方法。

使用案例

拖拽“固定宽度文件输入”组件至画布中,双击组件,点击“浏览文件”,选择需要上传文件的目录,这里我们使用了 Textfile input - fixed length sample data.txt ,文件做为示范。然后在下方字段表处按照下图进行配置:

最终如下所示:

点击“确定”,再点击左上角“运行这个转换”,组件右上角将出现绿色正确符号,表示转换执行成功,右击该组件选择“预览数据”,得到结果如下图所示,表格中的数据就是 Textfile input - fixed length sample data.txt 文件的内容。