覆盖主要内容
版本: 6.1.0

Greenplum Load

组件介绍

Greenplum Load步骤包装了Greenplum 。GPLoad数据加载用于通过Greenplum的外部表并行加载功能进行大规模并行数据加载。


  • 输入:大量数据。
  • 输出:GP数据库的数据表。
  • 参数:无

双击运行图:


页面介绍:

数据库连接选项卡

选项描述
数据库连接选择连接的数据库。(如何建立连接见数据库连接介绍)
目标模式表中要写入数据的模式的名称
目标表选择数据输出的目标要写入数据的目标表的名称。选择目标表后,目的模式会根据表的信息自动填充
加载方式定义是在生成配置文件和数据文件之后实际调用gpload(自动)还是在文件创建后停止执行(手动),以便以后可以手动运行gpload
使用后擦除cfg / dat文件配置是否要在执行转换后删除生成的控件和数据文件

字段选项卡

选项描述
加载动作定义您希望执行的加载类型:INSERT-将数据加载到目标表中。UPDATE   -更新目标表的UPDATE_COLUMNS其中行具有MATCH_COLUMNS属性值等于所述输入数据的,并且可用更新条件选项配置。MERGE -插入新行并更新现有行。  
表字段映射到“流字段”的“目标表”中的列的名称
流字段映射到“流字段”的“目标表”中的列的名称
日期掩码要使用“流字段”的日期掩码是日期类型
匹配布尔值。设置为“ Y”表示该列将在更新的连接条件的“匹配条件”中使用。如果要执行UPDATE或MERGE“加载操作”,则必须至少将列指定为“匹配条件”
更新布尔值。如果设置为“” Y,则将为满足“匹配条件”的行更新该列。
更新条件可选的。指定布尔条件,类似于您在SQL WHERE子句中声明的条件,对于MERGE,必须满足该条件才能更新或插入目标表中的行。

加载主机选项卡

选项描述
端口号连接的端口号
主机运行gpload 的计算机的主机名或IP地址

GP配置选项卡

选项描述
gpload的路径GPload数据库路径
控制文件定义将要生成的GPload控制文件的名称
错误表定义将要写入错误记录的目标表。如果该表存在,则在加载之前不会被截断。如果该表不存在,将创建该表。
日志文件指定GPload写入日志信息的位置。如果在命令行执行gpload,则此信息将显示在终端或窗口中。
最大错误定义在中止装入操作之前允许的最大错误数。错误将记录到指定的“错误表”。
定界符分隔写入“数据文件”的字段。然后在生成的控制文件中指定该定界符。
编码方式指定数据文件的字符集编码。支持的编码为: UTP、GBK等。

案例使用

组件还需改善。