基本概念
本文介绍 Uniplore Data Studio 平台的基本概念。
系统设置
租户:在平台中,租户为最高级权限隔离的命名空间,一个租户下可以有若干账号,不同账号可以分配不用的角色,数据可以在租户内共享,不同租户之间数据完全隔离。
工作组:平台中用于数据隔离的命名空间,通常为一个用户组、一个项目或一个应用。工作组下包含数据源、工作组成员。工作组内的数据通常为工作组内全部成员可见。
数据同步
数据源:是指数据库应用程序所使用的数据库或者数据库服务器,在平台的数据同步中可以将配置好的数据源端数据同步到目标端。
多源异构数据:指的是多种不同结构的数据源。
Oracle CDC:实时数据同步模式,对源表进行INSERT、UPDATE或DELETE等操作的同时可以提取数据,变化的数据被保存在数据库的变化表中,通过订阅变化数据的方式实现数据的秒级同步。
MySQL Binlog:实时数据同步模式,通过同步并解析记录所有数据库表结构变更(例如CREATE、ALTER TABLE…)以及表数据修改(INSERT、UPDATE、DELETE…)的二进制日志,实现数据的秒级同步。
SQLServer CDC:实时数据同步模式,开启CDC的源表在插入、更新和删除活动时会插入数据到日志表中。CDC通过捕获进程将变更数据捕获到变更表中,通过CDC提供的查询函数,实现数据的秒级同步。
数据标准
数据标准:是对含义相同但字段名称不同的数据进行统一规范管理的数据准则,数据标准可定义字段的取值范围、度量单位等内容。
数据元:表示一个数据的最小信息项,包含基本的描述、值域范围和约束规则。
生命周期:指的是表的生命周期,指表(分区)数据从最后一次更新的时间算起,在经过指定的时间后没有变动,则此表(分区)将被数据库自动回收。这个指定的时间就是生命周期,生命周期的单位一般是天。