Greenplum Load
组件介绍
Greenplum Load步骤包装了Greenplum 。GPLoad数据加载用于通过Greenplum的外部表并行加载功能进行大规模并行数据加载。
- 输入:大量数据。
- 输出:GP数据库的数据表。
- 参数:无
双击运行图:
页面介绍:
数据库连接选项卡
选项 | 描述 |
---|---|
数据库连接 | 选择连接的数据库。(如何建立连接见数据库连接介绍) |
目标 模式 | 表中要写入数据的模式的名称 |
目标表 | 选择数据输出的目标要写入数据的目标表的名称。选择目标表后,目的模式会根据表的信息自动填充 |
加载方式 | 定义是在生成配置文件和数据文件之后实际调用gpload(自动)还是在文件创建后停止执行(手动),以便以后可以手动运行gpload |
使用后擦除cfg / dat文件 | 配置是否要在执行转换后删除生成的控件和数据文件 |
字段选项卡
选项 | 描述 |
---|---|
加载动作 | 定义您希望执行的加载类型:INSERT-将数据加载到目标表中。UPDATE -更新目标表的UPDATE_COLUMNS其中行具有MATCH_COLUMNS属性值等于所述输入数据的,并且可用更新条件选项配置。MERGE -插入新行并更新现有行。 |
表字段 | 映射到“流字段”的“目标表”中的列的名称 |
流字段 | 映射到“流字段”的“目标表”中的列的名称 |
日期掩码 | 要使用“流字段”的日期掩码是日期类型 |
匹配 | 布尔值。设置为“ Y”表示该列将在更新的连接条件的“匹配条件”中使用。如果要执行UPDATE或MERGE“加载操作”,则必须至少将列指定为“匹配条件” |
更新 | 布尔值。如果设置为“” Y,则将为满足“匹配条件”的行更新该列。 |
更新条件 | 可选的。指定布尔条件,类似于您在SQL WHERE子句中声明的条件,对于MERGE,必须满足该条件才能更新或插入目标表中的行。 |
加载主机选项卡
选项 | 描述 |
---|---|
端口号 | 连接的端口号 |
主机 | 运行gpload 的计算机的主机名或IP地址 |
GP配置选项卡
选项 | 描述 |
---|---|
gpload的路径 | GPload数据库路径 |
控制文件 | 定义将要生成的GPload控制文件的名称 |
错误表 | 定义将要写入错误记录的目标表。如果该表存在,则在加载之前不会被截断。如果该表不存在,将创建该表。 |
日志文件 | 指定GPload写入日志信息的位置。如果在命令行执行gpload,则此信息将显示在终端或窗口中。 |
最大错误 | 定义在中止装入操作之前允许的最大错误数。错误将记录到指定的“错误表”。 |
定界符 | 分隔写入“数据文件”的字段。然后在生成的控制文件中指定该定界符。 |
编码方式 | 指定数据文件的字符集编码。支持的编码为: UTP、GBK等。 |
案例使用
组件还需改善。