Multiway Merge Join
组件介绍
Multiway Merge Join允许从多个流联接,并支持内外部联接和完全外部联接。
- 输入:有字段值的数据
- 输出:无
页面介绍
双击打开Multiway Merge Join组件得到下图所示的界面:
参数选项
Multiway Merge Join组件页面包含如下选项:
选项 | 说明 | 样例值 |
---|---|---|
步骤名称 | 在画布上指定Multiway Merge Join步骤的唯一名称,可以自定义名称或保留默认名称。 | Multiway Merge Join |
连接方式 | 选择连接的方式,可以选择内连接和全连接 |
使用案例
工作流如上图所示,连接两个表,在组件中可以选择内连接,外连接两种,首先使用内连接。先预览两个数据集的数据。表输入的数据如下图所示。
表输入2中的数据如下图所示。
在两个表输入的组件可以看到两个表的数据,有着相同的字段“Line_ID”,但是字段的数据不是完全匹配的。内连接和全连接会有打不同。 打开组件,按照如下图所示进行编辑:
内连接表示匹配两个连接的关键字段的相交的部分。在选择输出表之前,先来预览最后的通过组件输出的字段 。如下图所示,最后通过组件多输出了两个字段,因为字段“Line_ID”重复了,所以组件是默认了在出现重复字段的时候在字段后增加“_1”,如果是两个相同,那么就是“_2”,以此类推。
在输出数据表中新建一个和对应的字段相同的数据表,并在表输出组件中选中。点击运行,出现如下图所示则表示运行成功。
在数据表中查看结果,如下图所示。
可以看到内连接吧原来的表中“Line_ID”数据对应的连接到了一起。 接下来选择“全连接”,如下图所示。
点击运行,查看结果可以看到在关键字段中没有对应的数据也依然被追加了进来,如下图所示。