当前位置: 首页 > news >正文

数据仓库——维度表特性

企业信息化工厂

  • 数据集市中的一致性,由于企业信息化工厂的数据集市是从集成仓库中获得信息的,因此至少从维度建模的角度来看,一致性维护的问题减少了。尽管合并不同数据源的问题依然在,但是负担主要在设计者身上。尽管压力降低了,但是数据集市的设计者仍然应该计划并用文档说明一致性。
  • 跨数据集市的一致性,因为数据集市是为部门级用户组织分析型数据库,跨数据集市的一致性要求也被放宽了。如果有过程维度不一致情况下,需要开发另外的数据集市。在企业信息化工厂体系结构中,数据集市内的一致性是非常重要的,没有必要规划跨数据集市的一致性,尽管这样做能够消除因支持跨功能分析而进行的额外的开发。

独立型数据集市

  • 与不一致性共存,通常商业目标需要考虑利益问题,但没有足够的资金开发企业级的一致性战略,或者有没支持战略规划阶段的政策都是常见的。
  • 一致性实践,如果团队能够确定具有企业范围的维度,全面考虑满足的企业需求和需要它们的操作源,开发的维度效果就比较好,这些维度能在区分其他的区域需求被具体化,而不是将他们设计限制于开发的解决方案。
  • 维度改装,将已经存在的数据仓库基础设施可通过改装维度成为一致性维度。设计模式为,将不一致的维度中的每一行映射到对应企业维度模型的表中。添加企业维度模型中缺少的附加属性。在独立型数据集市中,采用映射的方法重新分配事实表外键以便能够引用一致性维度。表面合理,但是简短的说明并没有考虑到数据的不一致性,并且完全忽略了对查询独立型数据集市的前端应用程序的影响问题。在数据方面,在两个不一致维度表行间建立一对一匹配是不可能的。同样严峻的考验来自于对前端报表和应用程序的影响。内容的变化也可能受影响

维度表的功能内容

维度表的集合是星型模型的关联部分

  • 维度表键
  • 维度表很宽
  • 文本属性
  • 维度表中的某些属性经常不会与其中的其他属性直接相关
  • 非规范化,维度表是扁平的,不是规范化的
  • 上钻与下钻,维度表中的属性提供了获取从高层次汇总的信息到低层次细节信息的能力
  • 多层次结构
  • 更少的记录

维度表的数据内容

提供丰富和全面的维度属性集合,每个新增的数据都将会显著地提高分析的可能性。

  • 公共组合,在操作型系统中,经常采用的方法是将数据元素尽可能分解为构成其内容的U盾哦个组件。采用这种方法,可以将不同组件按照需要加以合并,例如客户姓名可以分解并以first_name、middle_initial、last_name的方式存储。与操作型模式不同,维度模式还应包含这些组件的各种组合。
  • 代码与描述符,在操作型系统中,通常将某一领域中的可列值以代码的形式表示,同时使用另外的表来描述这些代码。这样做的目的是方便对可列值得维度并提高存储效率。从分析 和应用的角度考虑,代码和描述都是可用的维度。
  • 标志以及标志值,在操作性系统中,如果列的值为布尔类型,通常将它作为标志。在维度设计时,这些标志可用于过滤查询,或者分组事实,通过采用描述型的值存储标志,可以方便地使用标志。
  • 多列组合字段,操作型系统通常包含由多个部分组合而成的字段列,每个部分各自具有不同的含义。在维度设计时,全部的属性江北存储,用于分割该数据的多个子属性也将被存储,如果这些子属性是代码,那么还要增加对应的描述值。
  • 带有数字值的维度,如果一个属性通常用于聚集或者汇总,那么它就是事实,如果通常被用于提供聚集或者汇总的环境,那么它就是维度。
  • 行为维度与混合属性,利用行为模式分析事实是一种强有力的分析技术。基于事实计算得到的维度称为行为维度。行为分组作为维度。若对行为分组的更新不太频繁,采用这样的方法将会起到很好的效果。如果行为分组在每次使用时都需要更新,该方法可能更加合理。但是问题在于需要耗费更多的时间,因为在每次执行报表时都需要计算分组情况。

行为维度

行为问题是一种基于队过去维度成员行为进行分组或过滤事实的方法,行为维度将事实转换为维度,以确保获得请打的分析能力,不需要使用复杂查询或者详细处理的分析。
在查询期间将事实转换为维度

  1. 识别问题中设计的每个维度成员的过去行为
  2. 将这些信息作为研究当前行为的查询的一部分
    由于处理的需要,采用此种方式的查询不能很好的执行。为解决此问题,通常需要在批量处理窗口起家指定行为表报,以便在用户请求时,该报表已经被缓存并为查看做好准备。当然这种方式破坏了正常循环获得答案。差生了新问题。但是注意,中断用户不能将行为报表组合到一起。
设计并使用行为维度
  1. 与另一个维度的过去关联,行为属性可用于获取维度行信息的历史关联,这些信息通常存储在另外一个表中。如果没有行为维度,过去的关联只能通过查询事实表获得,通常关联的维度是日期,并被添加到维度表中表示过去的重大事件。
  2. 历史事实,行为属性也能捕获维度表中关于有效存放事件具有历史意义的事实,就想在属性名称上所体现,历史事实可以用来过滤,聚合,或者是获得订单查询结果。
  3. 分类事实,尽管历史事实在查询限制方面是有效的,如果需要用来推进分组,它就变得不那么有效。
行为维度设计要素

必须仔细考虑维护的含义。维度具有缓慢变化特征将导致表大小快速增长,而且他们频繁地更新将给ETL带来巨大的压力。
行为属性的更新频率使ETL负担过重,需要最新信息的情况极少发生,可以通过查询事实来生成报表。

维度表中的组合维度

维度属性分组到维度中,用于表示引用信息的主要分类。杂项维度将那些本身没有相似性的属性收集起来,如果将规范化理论应用到维度表中,结果称为雪花模式。即使不采用规范化理论,雪花模式也仍然可以作为特定软件工具使用。维度设计完全接纳对信息的冗余存储。

  • 基于相似性的组合维度,维度表包含组合维度属性以表示引用信息的主要分类,这些分类往往带有强烈的业务特征。
  • 无相似性的杂项维度,在某些情况下,创建一个不存在实际关系的维度表时有用的,采用该技术有益于需要控制快速变化维度表的生长速度的情况。
  • 雪花模式及其支架表,维度表中存在大量冗余,使用实体关系建模时,采用规范化理论从关系设计中消除此类冗余。不要采用规范化理论知道维度表的设计工作。需要采用雪花模式和支架表的情况是一种特例而不能当做规则来使用
  • 冗余带来的好处,性能、可用性和一致性。在进行维度设计时应该容忍冗余的存在,详尽地存储每一个维度属性,将大大提高系统性能,增强可用性,确保在多个应用中保持一致。规范化理论更适合于操作型系统而不是分析型系统

维度表特性

与实体关系模型不同,维度模型不能揭示相互关联的属性之间的关系,上下文关系易于传递给事实表,而天然存在的相关性则由维度表中共存的属性表示。

关联维度属性的两种方法

  • 描述环境的明确的关系,每个事实表都有一个引用维度表的外键,这些引用为事实表提供了维度环境,这些链接也可以看做提供了维度表之间存在的关系
  • 描述亲和性的隐含关系,维度模型还包含不能通过连接而明确的关系。维度属性之间的关系可能隐含在他们的共存的表中,这些关系只在单独的环境中存在,表示自然亲和性不是基于过程活动的关系。

如何确定连个维度是否属于同一维度

最好的方法是考虑属性在何处相关,在何处使用。例如考虑是否具有自然的亲和性,或者在不同环境中是否有关系,或者那些趋向于共享稳定关系的属性可能被储存在一起,或者那些仅存在事件、事务或条件等情况下相关的属性,可以将他们归入不同的事实表中,存在疑惑不定时,可以考虑不同设计方法的可浏览性。
基于亲和性分组维度,通常根据自然亲和性将维度分组为不同的表,另一方面,一些属性只能基于事务或活动发生关联。当连个维度属性共享一个自然亲和性关系,并且同时出现在一种环境中,他们属于同一个维度表。当他们的关系由事务或活动来决定,并且存在于不同的环境中,应该将他们放置在不同的维度表中。
可浏览性测试,如果难以确定连个属性是否属于同一维度表,可以考虑他们的被使用的情况。

相关文章:

数据仓库——维度表特性

企业信息化工厂 数据集市中的一致性,由于企业信息化工厂的数据集市是从集成仓库中获得信息的,因此至少从维度建模的角度来看,一致性维护的问题减少了。尽管合并不同数据源的问题依然在,但是负担主要在设计者身上。尽管压力降低了…...

从电荷角度理解开关电容中的电荷守恒

目录 一些铺垫电容的电荷量的解释电荷流入流出对节点电压的影响 从电荷角度理解开关电容加法器中的电荷守恒以开关电容积分器为例说明什么样的节点是电荷守恒 一些铺垫 电容的电荷量的解释 对于一个1F的电容,当它的压差为1V时,它所携带的电荷量是QCU1库…...

1.7.1 python 作业 15道

1、求出1 / 1 1 / 3 1 / 5……1 / 99的和 (1分之一1分之三1分支5....) sum0 for i in range(1,100,2): sum 1/i sum; print(sum) 2、用循环语句,计算2 - 10之间整数的循环相乘的值 (2*3*4*5....10) sum 1 for i in range(2,11): sum sum *…...

synchronized 和 ReentrantLock 的区别是什么

该文章专注于面试,面试只要回答关键点即可,不需要对框架有非常深入的回答,如果你想应付面试,是足够了,抓住关键点 面试官:synchronized 和 ReentrantLock 的区别是什么 1. 获取锁的方式 synchronized:synchronized的锁获取是隐式的。当线程进入synchronized修饰的代码…...

大话设计模式之迪米特法则

迪米特法则,也称为最少知识原则(Law of Demeter),是面向对象设计中的一个重要原则,其核心思想是降低耦合度、减少对象之间的依赖关系,从而使系统更加灵活、易于维护和扩展。 根据迪米特法则,一…...

KSD测试系统使用方法和注意事项

①下载链接在最顶部; ②安装方法:应该先将测试设备绑定在假人身上,测试设备不能过度往下拉,传感器绑在脖子上,切记最后才开传感器开关!!!开传感器后3秒内不要碰测试设备衣服&#x…...

IT服务营销管理案例分析题

习题一 企业随着业务的蓬勃发展,所投入的基础设施资源不断增加。企业员工数倍数增长,办公场地、办公环境等要求也越来越高。 可是该企业的IT部门人员短缺,对IT管理还处于被动的“救火”阶段,每天至少15个突发故障,故障…...

NRF52832修改OTA升级时的bootloader蓝牙MAC

NRF52832在OTA升级时,修改了APP的蓝牙MAC会导致无法升级,原因是OTA程序的蓝牙MAC没有被修改所以手机扫描蓝牙时无法连接 解决办法 在bootloader的程序里面加入修改蓝牙mac地址的代码实现原理: 在bootloader蓝牙广播开启之前修改蓝牙mac 通…...

# Python 编程入门教程

欢迎来到 Python 编程入门教程!Python 是一种简单易学、功能强大的编程语言,适用于各种应用场景,从简单的脚本到大型软件开发项目。无论你是初学者还是有一定编程经验的开发者,本教程都将为你提供全面的学习路径,帮助你掌握 Python 编程的基础知识和技能。 ## 目录 1. 简…...

Sqoop【实践 02】Sqoop1最新版 全库导入 + 数据过滤 + 字段类型支持 说明及举例代码(query参数及字段类型强制转换)

Sqoop1最新版举例 1.环境说明2.import-all-tables3.query4.字段类型支持 1.环境说明 还是之前的环境: # 不必要信息不再贴出 # JDK [roottcloud ~]# java -version java version "1.8.0_251" # MySQL [roottcloud ~]# mysql -V mysql Ver 14.14 Distrib…...

第十四届蓝桥杯JavaA组省赛真题 - 特殊日期

解题思路&#xff1a; 暴力秒了 public class Main {public static void main(String[] args) {int cnt 0;for (int i 1900; i < 9999; i) {for (int j 1; j < 12; j) {for (int k 1; k < days(i, j); k) {if (sum(i) sum(j) sum(k)) cnt;}}}System.out.print…...

《VulnHub》Lampião:1

title: 《VulnHub》Lampio&#xff1a;1 date: 2024-03-28 21:37:49 updated: 2024-03-28 21:37:50 categories: WriteUp&#xff1a;Cyber-Range excerpt: 关键技术&#xff1a;主机发现&#xff0c;端口扫描、服务探测、操作系统探测&#xff0c;对开放的端口探测漏洞&#x…...

RabbitMq高可用

消息队列高级 服务异步通信-高级篇1.消息可靠性1.1.生产者消息确认1.2.消息持久化1.3.消费者消息确认1.4.消费失败重试机制1.5.总结 2.死信交换机2.1.初识死信交换机2.2.TTL2.3.延迟队列 3.惰性队列3.1.消息堆积问题3.2.惰性队列 4.MQ集群4.1.集群分类4.2.普通集群4.3.镜像集群…...

降本增效的车间管理大屏,车间主任看了拍手称快,速来领取。

我们老板觉得车间生产效率太低了&#xff0c;还想让我整一套车间管理的&#xff01; 制造业管理的核心在于降本增效&#xff0c;车间管理可以通过【大数据可视化】来提高管理效率&#xff0c;大屏就可以做到生产管理一「屏」了然&#xff0c;这是【车间管理大屏方案】。 一、…...

Open AI要给GPT应用开发者“发钱” 黄金的宏观关系被打破了吗?

内容摘要 为避免GPTs彻底凉凉&#xff0c;Open AI紧急启动了一项“货币化”计划&#xff0c;直接给那些在GPT Store上的应用开发人员发钱。 正文部分 当地时间周四凌晨&#xff0c;OpenAI在社交媒体上发帖称&#xff0c;正在与小部分美国开发者合作&#xff0c;基于用户使用…...

【Docker】Docker安全与最佳实践:保护你的容器化应用程序

欢迎来到英杰社区&#xff1a; https://bbs.csdn.net/topics/617804998 欢迎来到阿Q社区&#xff1a; https://bbs.csdn.net/topics/617897397 &#x1f4d5;作者简介&#xff1a;热爱跑步的恒川&#xff0c;致力于C/C、Java、Python等多编程语言&#xff0c;热爱跑步&#xff…...

QT 信号(Signal)与槽(Slot)机制

上学后,人们问我长大了要做什么,我写下“快乐”。他们告诉我,我理解错了题目,我告诉他们,他们理解错了人生。 ——约翰列侬 一、信号(signal)与槽(slot) 在QT中,信号(signal)与槽(slot)机制是一种用于对象间通信的重要机制。它允许一个对象发出信号,而其他对象…...

音频干扰检测(频域方法)

测试音响系统的通路上是否有外部干扰时&#xff0c;可以通过播放1000赫兹的正弦波信号&#xff0c;在输出端采集数字信号&#xff08;I2S&#xff0c;TDD&#xff0c;A2B&#xff09;并保存为.wav文件。 然后通过以下Python代码检测。 import numpy as np import librosa im…...

Rust引用借用 vs 原始指针

let v: i32 10; let v1 &v; let a: *const i32 &v; println!("a{:p}", a); let b a as *mut i32; //无法从&v直接转换成*mut i32&#xff0c;需要从*const i32过度 println!("b{:p}", b); unsafe {*b1; } println!("v{} v1{}"…...

抖音视频关键词无水印下载软件|手机网页视频批量提取工具

全新视频关键词无水印下载软件&#xff0c;助您快速获取所需视频&#xff01; 随着时代的发展&#xff0c;视频内容已成为人们获取信息和娱乐的重要途径。为了方便用户获取所需视频&#xff0c;推出了一款功能强大的视频关键词无水印下载软件。该软件主要功能包括关键词批量提取…...

关于Devc++调试的问题以及解决STL变量无法查看

目前Devc的调试主要有以下几点&#xff1a; 1.调试不能直接查看stl变量&#xff0c;会卡死不动 2.目前单步进入只能用鼠标键按 3.若想按下一步进入函数体内&#xff0c;要在函数体内打上断点才行 4.调试到return 0 ;上一句就停了&#xff0c;不会结束程序 5.目前F2跳至断点…...

MATLAB:优化与规划问题

一、线性规划 % 线性规划&#xff08;Linear programming, 简称LP&#xff09; fcoff -[75 120 90 105]; % 目标函数系数向量 A [9 4 7 54 5 6 105 10 8 53 8 9 77 6 4 8]; % 约束不等式系数矩阵 b [3600 2900 3000 2800 2200]; % 约束不等式右端向量 Aeq []; % 约束等式系…...

Oracal执行计划解析

概述 | Id | Operation | Name | Rows | Bytes | TempSpc | Cost (%CPU) | Time | ----------------------------------------------------------------------------------- | 0 | SELECT STATEMENT | | 1…...

对form表单对象中数组中的字段进行校验的方法

当对form表单中&#xff0c;数组readings中的字段进行校验时&#xff0c;prop和rules绑定要写成动态的&#xff0c;如下代码 <div v-for"(item,index) in form.readings"><el-form-item label"上次读数" > <!--prop"scds"-->…...

一、JAVA集成海康SDK

JAVA集成海康SDK 文章目录 JAVA集成海康SDK前言一、项目依赖 jar1. examples.jar2. 项目依赖 jna.jar,可以通过 maven依赖到。二、集成SDK1.HcNetSdkUtil 海康 SDK封装类2.HCNetSDK3.Linux系统集成SDK三、总结前言 提示:首先去海康官网下载 https://open.hikvision.com/dow…...

PAT 乙级 1031 查验身份证 c语言实现

一个合法的身份证号码由17位地区、日期编号和顺序编号加1位校验码组成。校验码的计算规则如下&#xff1a; 首先对前17位数字加权求和&#xff0c;权重分配为&#xff1a;{7&#xff0c;9&#xff0c;10&#xff0c;5&#xff0c;8&#xff0c;4&#xff0c;2&#xff0c;1&am…...

LeetCode 345. 反转字符串中的元音字母

给你一个字符串 s &#xff0c;仅反转字符串中的所有元音字母&#xff0c;并返回结果字符串。 元音字母包括 ‘a’、‘e’、‘i’、‘o’、‘u’&#xff0c;且可能以大小写两种形式出现不止一次。 示例 1&#xff1a; 输入&#xff1a;s “hello” 输出&#xff1a;“holl…...

go中函数与方法的区别与go中关于面向对象理解

声明方法的区别 函数是一段可以独立调用的代码块&#xff0c;它可以有参数和返回值。函数的声明不依赖于任何类型&#xff0c;可以直接通过函数名进行调用。 函数的声明格式如下&#xff1a; func functionName(parameters) returnType {// 函数体 }示例&#xff1a; func A…...

SQL Server 实验二:数据库视图的创建和使用

目录 第一关 相关知识 什么是表 操作数据表 创建数据表 插入数据 修改表结构 删除数据表 编程要求 第一关实验代码&#xff1a; 第二关 相关知识 视图是什么 视图的优缺点 视图的优点 视图的缺点 操作视图 创建视图 通过视图向基本表中插入数据 通过视图修改基本表的…...

树结构导入

Testpublic void testExcel1() {// 写法1&#xff1a;JDK8 ,不用额外写一个DemoDataListener// since: 3.0.0-beta1EasyExcelFactory.read(new File("C:\\Users\\Admin\\Desktop\\树导入.xlsx"), null, new ReadListener<Map>() {public static final int BATC…...

网站建设管理 优帮云/企业网络推广的方式有哪些

我们将陆地区域全部染色一般&#xff0c;如果走到边界&#xff0c;那么就说明不可能被包围&#xff0c;否则就会被包围。注意在BFS不能提前返回&#xff0c;否则我们就没有完全染色。 const int dx[] {0, 1, -1, 0}; const int dy[] {1, 0, 0, -1}; class Solution { public…...

flash网站设计实例/亚洲长尾关键词挖掘

mysql均衡负载 一、利用mysql 复制分流查询操作&#xff1a; 利用mysql的主从复制可以有效的分流更新操作和查询操作&#xff0c;具体的实现是一个主服务器&#xff0c;承担更新操作&#xff0c;多台从服务器&#xff0c;承担查询操作&#xff0c;主从之间通过复制实现数据的同…...

什么是网站流量优化/软文发稿平台有哪些

文章目录1. 编码与调制编码调制1. 编码与调制 基带信号&#xff1a;将数字信号1和0直接用两种不同的电压表示&#xff0c;再送到数字信道上去传输&#xff08;基带传输) 宽带信号&#xff1a;将基带信号进行调制后形成的频分复用模拟信号&#xff0c;再传送到模拟信道上去传输…...

做进口零食批发网站/百度手机

实际环境和特殊需求往往会将简单问题复杂化&#xff0c;比如计算机IP地址&#xff0c;对于一个连接中socket&#xff0c;可以直接获得本端和对端的IP、端口信息。但在一些特殊场合我们可能需要更多的信息&#xff0c;比如系统中有几块网卡&#xff0c;他们的Mac地址是多少&…...

律师所网站建设/今天的最新消息新闻

在工作中经常需要两个主机之间传输文件&#xff0c;最常用的就是scp了&#xff0c;当然也有rsync&#xff0c;rz&#xff0c;sz之类的命令了。即时传输还是有点麻烦&#xff0c;scp随简单但是需要对方的用户和权限。Python有一句命令启动一个web服务器&#xff08;在要传输文件…...

网站如何做质保系统/semicircle

异常描述 在对HDFS格式化&#xff0c;执行hadoop namenode -format命令时&#xff0c;出现未知的主机名的问题&#xff0c;异常信息如下所示&#xff1a; Java代码[shirdrnlocalhost bin]$ hadoop namenode -format 11/06/22 07:33:31 INFO namenode.NameNode: STARTUP_MSG: …...