HTTP
组件介绍
该步骤使用 HTTP 协议从 Web 服务器检索文件。此作业输入可用于访问指定 Web 站点上的数据。
- 输入:URL 地址
- 输出:无
- 参数:无
页面介绍
打开 HTTP 组得到一般标签的界面。
头部标签的界面。
一般标签
参数选项
选项 | 说明 | 样例 |
---|---|---|
作业项名称 | 作业条目的名称。此名称在单个作业中必须是唯一的。 | HTTP |
URL | 要检索的文件的 HTTP URL,或存储下载文件的目录名。 | http://kettle.pentaho.org |
每个结果运行一遍 | 选中该选项将为前一个转换生成的每一行运行此作业步骤。 | |
包含了 URL 的输入字段 | 如果选择了“每个结果运行一遍”选项,则此处指定的字段将确定每一行的文件的 URL。 | |
包含上传文件名的输入字段 | 如果选择了“每个结果运行一遍”选项,这里的字段将指定要上传到与“包含 URL 的输入字段”字段相关联的 URL 的本地文件。 | |
包含目标文件的输入字段 | 如果选择了“每个结果运行一遍”选项,这里指定的字段将确定从与“包含 URL 的输入字段”字段相关联的 URL 下载结果的本地文件。 | |
用户名 | 指定用户名。 | |
密码 | 用户名对应的密码。 | |
上传代理服务器 | 指定代理服务器的 URL 地址。 | |
代理端口 | 代理服务器的端口号。 | |
对于下列主机忽略代理服务器 | 用于代理重定向的异常的正则表达式列表。 | |
上传的文件 | 指定上传文件的目录及文件名。 | |
目标文件 | 如果要下载一个文件,这指定该文件在本地文件系统上的名称。 | |
追加到指定的目标文件 | 如果选中,并且目标文件已经存在,UDI 将把所有新数据附加到文件的末尾。 | |
追加时间 和日期到文件名后 | 如果选中,HTTP 请求的日期和时间(yyyMMdd_HHmmss 格式)将添加到目标文件名中。 | |
目标文件扩展名 | 如果选择前一个选项,则此字段指定目标文件名的扩展名(点后的字母)。 | |
添加文件名到结果文件名 | 任何被复制的文件都将作为这个步骤的结果出现,显示在此步骤中复制的文件的列表中。 |
头部标签
字段表
选项 | 说明 | 样例 |
---|---|---|
名称 | 此 HTTP 头部的名称。 | |
值 | 要传递的实际头部值。 |
使用案例
创建一个简单的工作流程,如下图所示。
双击 HTTP 组件组件,输入下载所需的 URL 与目标文件名。以下载 kettle 为例,URL 为http://mirror.bit.edu.cn/pentaho/Data%20Integration/7.1/pdi-ce-7.1.0.0-12.zip,目标文件为pdi-ce-7.1.0.0-12.zip,点击运行,即可将文件下载到 uniplore 文件库中。