商城网站建设定制天津做网站的公司
文章摘自:数仓之全量表、增量表、快照表、切片表、拉链表-腾讯云开发者社区-腾讯云
一、全量表
记录每天所有最新状态的数据,有无变化都要上报,每次往全量表里面写数据都会覆盖之前的数据
缺点:不能记录数据的历史变化,只能截止到当前最新、全量的数据
二、增量表
记录每天的新增数据和改变的数据
三、快照表
按日分区,记录截止数据日期的全量数据(每个分区都是记录截止当前分区日期的全量数据)
优点:可以反应历史的变化
缺点:在数据量打的情况下,每个分区存储的都是全量数据,数据冗余和浪费存储空间。
四、切片表
切片表根据基础表,往往只反映某一个维度的相应数据。其表结构与基础表结构相同,但数据往往只有某一维度,或者某一个事实条件的数据。
五、拉链表
记录一个事务从开始,一直到当前状态的所有变化的信息(极限存储)
优先:能够解决快照表数据冗余问题,还能维护数据历史状态和最新状态,记录截止数据日期的全量数据。