MongoDB 输入
组件介绍
步骤“MongoDB 输入”用于读取 MongoDB 的一个集合中的文档或记录。
- 输入:MongoDB 集合
- 输出:MongoDB 集合中的文档或记录
- 参数:MongoDB 的连接信息
注意要点: 如果数据中有汉字的数据,那么就要在选项中增加的命名参数,值和数据库中的编码值相同。
页面介绍
输入选项标签
MongoDB 输入参数如下图:
参数选项
“MongoDB 输入”组件输入选项标签页面包含如下选项:
选项 | 说明 | 样例值 |
---|---|---|
步骤名称 | 步骤的名称 | MongoDB 输入 |
MongoDB 连接 | 从中读取数据的 MongoDB 连接 | |
集合 | 要检索数据的集合的名称。点击获取集合,在下拉菜单中填入数据库中的集合列表。 |
MongoDB 连接
数据源编辑页面如下图所示
参数选项
页面包含如下选项:
选项 | 说明 | 样例值 |
---|---|---|
连接名 | 表示这次连接的唯一性,输入的名称自己要明白代表什么含义 | |
主机名 | 指定 MongoDB 实例或实例的网络名称或地址。可以用冒号分隔主机名和端口号,为每个主机名指定一个不同的端口号。也可以输入多个主机名或IP地址,用逗号分隔。 | |
端口号 | 指定 MongoDB 实例或实例的端口号,默认是27017 | |
数据库名 | 点击下方“获取数据库”按钮,然后下拉选择数据库名 | |
Authentication 数据库 | 指定认证数据库 | |
用户名 | 指定访问数据库所需的用户名,当使用Kerberos认证时,输入Kerberos principal。 | |
密码 | 指定与该用户名相关的密码。如果使用Kerberos认证,不需要输入密码。 | |
Authentication 机制 | 选择用于验证用户身份的方法。 | |
Use Kerberos? | 选择指定使用Kerberos认证。当选择时,输入Kerberos负责人作为用户名。 | |
Connection timeout | 指定(以毫秒为单位)在终止连接尝试前等待数据库的连接的时间。留空表示永远不终止连接。 | |
Socket timeout | 指明(以毫秒为单位),在终止操作前要等待多长时间的写操作。留空表示永远不终止操作。 | |
Read preference | 指定先读取哪个节点。主要、主要优先、次要、次要优先,或最近的。 | |
Use all replica set members | 当在 "主机名"字段中指定多个主机时,选择使用所有复制集。如果一个副本集包含一个以上的主机,Java驱动会自动发现所有主机。如果所选的副本集不可用,驱动程序会连接到列表中的下一个副本集。 | |
Specify the read preference tag sets | 描述 MongoDB 客户端如何路由读操作到复制集成员 | |
Use an SSL socket factory | 指定连接到一个配置了SSL的MongoDB服务器。 | |
Write concern | 描述了 MongoDB 写入到 MongoDB 单实例,副本集,以及分片集群时何时应答给客户端 | |
Replication Timeout | 复制超时时长 | |
Journaled | 是否启用Journal,用于故障恢复和持久化 |
查询标签
参数选项
“MongoDB 输入”组件查询标签页面包含如下选项:
选项 | 说明 | 样例值 |
---|---|---|
查询表达式(JSON) | 在这个字段中输入一个查询表达式,以限制输出。 | |
使用聚合管道查询(JSON) | 选择“使用聚合管道查询”,然后输入一个管道表达式来执行聚合或选择。 | |
使用聚合管道查询 | 选择该选项以使用聚合管道框架。 | |
执行每一行 | 选择此选项,对每一行数据进行查询。 | |
字段表达式 | 输入一个参数,控制查询返回字段。如果为空,将返回所有字段。这个字段只适用于查询表达式(JSON)。 |
字段标签
参数选项
“MongoDB 输入”组件字段标签页面包含如下选项:
选项 | 说明 | 样例值 |
---|---|---|
输出单个 JSON 字段 | 指定查询结果为一个单一的JSON字段,数据类型为String(默认)。 | |
JSON 输出字段的名称 | 指定包含来自服务器的JSON输出的字段名。 |
字段表
列名 | 说明 | 样例值 |
---|---|---|
名称 | 字段名。 | |
路径 | 该字段所在的路径 | |
类型 | 字段类型(String、Date、Number 等) | |
索引值 | 为字符串字段指定一个以逗号分隔的合法值列表。如果没有指定值,则应用字符串数据类型。通常情况下,只有当你对当前字段使用Weka元数据时,你才需要修改这个字段。 | |
样例:array min:max | 表示抽样文件中索引的最小值和最大值。 | |
样例:#occur/#docs | 表示该字段出现的频率和处理的文件数量。 | |
样例:disparate types | 表示不同的数据类型是否在被抽样的文档中填充了相同的字段。当几个文档被采样,并且同一字段包含不同的数据类型时,Sample: disparate types字段被填充为Y,Type字段显示为String数据类型。 |
使用案例
案例介绍如何从MongoDB的集合中读取数据。
1、拖动组件“ MongoDB 输入 ”到工作区,双击进入配置页面。点击中的“新建”按钮,弹出一个数据库信息编辑的窗口 ,并做如下配置:1)填写数据库连接名; 2) 点击下方“获取数据库”按钮 ; 3)在“数据库名”处,下拉选择对应数据库
2、点击“测试”按钮,弹出以下窗口表示连接成功,如下图所示。
3、点击“确定”返回数据库连接编辑窗口,点击“确定”保存数据库连接的信息。返回“输入选项”标签,点击“获取集合”,下拉选择集合信息,如下图所示。
4、点击预览,可以看到输出的数据,如下图所示。
5、在查询表达式(JSON)设置{name:'test'}
后,再预览,结果如下图所示。