维度查询/更新
组件介绍
维度查询/更新组件主要涉及数据仓库中的缓慢变化维的概念。缓慢变化维,是由于维度在实际业务场景中并不是静态的,会随着时间发生缓慢的变化,相比于事实表或者业务表,主要区别在于维度表变化慢,频率低,特定场景下需要记录数据变化的过程。维度查找/更新步骤允许您实现 Ralph Kimball 两种类型缓慢变化的维度:类型 I(更新)和类型 II(插入)以及一些附加功能。您不仅可以使用此步骤来更新维度表,还可用于查找维度中的值。
- 输入:数据库中的所有数据
- 输出:数据库中经过查找/更新操作后的所有数据
页面介绍
运行维度查询/更新组件得到下图所示的界面:
参数选项
维度查询/更新组件页面包含如下选项:
选项 | 说明 | 样例值 |
---|---|---|
步骤名称 | 在画布上指定维度查询/更新步骤的唯一名称,可以自定义名称或保留默认名称。 | 维度查询/更新 |
更新维度吗? | 如果勾选,则进行插入/更新操作;如果未勾选,则该组件仅作查询用途,查询条件:a、关键字页面中的的对比字段;b、查询/更新字段页面中的时间流查询条件,开始日期<=stream日期字段<=截止日期字段 | |
数据库连接 | 维度表所在的数据库连接的名称。 | |
目的模式 | 允许指定模式名称 | |
使用缓存 | 使用缓存目的为了提升插入或更新的效率,该选项和“缓存行数”同步使用 | |
预加载缓存 | 在执行查找之前,可以通过读取维度表的完整内容来提高性能。通过消除到数据库的往返行程和排序列表查找算法来提高性能 | |
行中的缓存大小 | 将持有的存储中的行数的缓存大小,通过减少到数据库的往返次数来加快查找速度 | |
关键字字段 | 查询条件 | |
查询/更新字段 | 更新插入区域 | |
代理关键字段 | 由于会记录数据变化的历史过程信息,因此需在表设计初期定义代理键 | |
新的名称 | 自定义名称 | |
创建代理键 | 使用提供的三种方式中任意一种方式创建代理键:A:使用表最记录数+1 B:使用自增字段 C:使用sequence | A:使用表最记录数+1 |
version字段 | 每次keys相同的记录发生新增时,version字段自动+1,最大的verison为最新的记录 | version |
stream日期字段 | 记录数据流的日期范围,通常为设置为开始日期字段值即可 | |
开始日期字段 | 数据流导入的开始日期 | date_from |
最小的年份 | 可填写年份下限 | 1900 |
使用另外一个可用的开始日期 | 可选择提供的System date、Start date of transformation、Empty (null) value、A column value四个中任意一个 | |
结束日期字段 | 数据流导入结束日期 | date_to |
最大的年份 | 可填写年份上限 | 2199 |