数据库开发与设计过程中的问题分析总结
数据库设计的过程是将数据库系统与现实世界密切地、有机地、协调一致地结合起来的过程。数据库的设计质量与设计者的知识、经验和水平密切相关。作为数据库应用系统的重要组成部分,数据库设计的成败往往直接关系到整个应用系统的成败。以数据库为基础的数据库应用系统与其他计算机应用系统相比往往具有数据量庞大、数据保存时间长、数据关联复杂、用户要求多样化等特点。
数据库设计过程一般包括:需求分析、概念设计、逻辑设计、物理设计、应用开发(系统实施)、系统维护。
数据库设计中面临的主要困难和问题有:
(1)同时具备数据库知识与应用业务知识的人很少。懂得计算机与数据库的人一般都缺乏应用业务知识和实际经验,而熟悉应用业务的人又往往不懂计算机和数据库。
(2)项目初期往往不能确定应用业务的数据库系统的目标。
(3)缺乏完善的设计工具和设计方法。
(4)需求的不确定性。用户总是在系统开发过程中不断提出新要求,甚至在数据库建立之后还要求修改数据库结构或增加新的应用。
(5)应用业务系统千差万别,很难找到一种适合所有业务的工具和方法,这就增加了研究数据库自动生成工具的难度。因此,研制适合一切应用业务的全自动数据库生成工具是不可能的。
数据库设计的关键是确保数据效率、可用性和安全性。
因此,规范化数据库对简化开发和始终如一的高性能至关重要。规范化存在很多层次,设计过程中另一个极端是极容易造成过度规范化的数据库设计。良好的规范化平衡了记录插入、更新、查询和删除的需求。采用最广泛的最佳实践是,数据库必须至少规范化到第三范式(Third Normal Form,简称 3NF)。
冗余表和字段对数据库设计人员和管理员来说是一个噩梦。它们需要占用系统资源才能保持安全、更新和备份。当我们讨论十多个记录时,冗余记录也许看起来不多。但是,在大型数据库中,冗余字段可以是数千个或数百万个,计算资源开销很大。它们不必要地增加了数据库的规模,降低了效率,增加了数据崩溃的风险。
当然,有时候冗余也许是必要的,但是,这应该是例外,而不是规则。即使允许冗余,也应当清楚地记录理由,以确保将来该理由不再有效时,数据库管理员可以删除冗余。
关系数据库的构建思想:数据库中的每个对象只代表一个事物。任何数据集所代表的事物都不应该含糊不清。通过查看主键、表名、列名和关系,我们应该可以快速解读数据集的意义。尽管如此,对于数据库设计,一种挥之不去的误解是,表越多,数据库就越混乱越复杂。
通常,把几张表压缩到一张表中就是简化设计的原理。这听上去是个好主意,但是,通常得到的是效率低下且难以操作的数据库。SQL 代码将变得很长,难以阅读,也不自然。这将把两种截然不同的东西混在一起。乍一看,域表看起来像一个抽象的文本容器。从实现的角度来看,这是正确的,但是,这不是设计数据库的最好方法。
作为规范化过程的一部分,隔离和分解数据最终形成每一行只代表一个事物。每个域表与所有其他域表都不同。
多个域表的最终结果是:
-
使用在查询中的数据变得更容易。
-
可以更自然地用外键约束来验证数据,这对单域表设计来说是不切实际的。我们可以用单域表来做,但是每张表所需的键将使维护变成雷区。
-
无论何时我们需要添加与某个对象相关的更多数据,该任务就像添加一个或多个列那样简单。
-
小型域表可以放入硬盘的单个页中,而不像大型域表需要分散在多个硬盘分区中。表存放在单个页中意味着可以用单次硬盘读来完成数据提取。
-
拥有多个域表并不妨碍我们对所有行使用一个编辑器。域表最有可能拥有相同的底层用法 / 结构。
糟糕的或不一致的命名约定可能是个灾难性的错误。数据库设计人员和开发人员常常把他们的角色完全看作是技术角色。非技术方面(如遵守命名约定)往往被推到优先级列表的较低位置,或者甚至完全被忽略。这应该引起重视。
命名也许是设计人员自行决定的,数据库设计人员应该把他们的工作看作是在他们换了雇主或角色之后还将继续存在的东西。命名约定的目的是,让没有完全参与该项目的人也能比较容易地快速理解表和列的内容。未来的管理员、开发人员或用户不应当必须看完长长的文档才能理解某个表名或列名的意义。表如何命名的具体细节并未得到业界的一致同意。
最重要的是一致性。一旦我们遵循某个特定的风格来命名对象,那么在整个数据库中要坚持使用它。表名必须尽可能是表所代表的内容的完整或简约描述,而列名应该清楚地表明其所代表的信息。对于简单数据库,这并不难。但是,一旦我们构建彼此引用的表,事情就变得复杂了。严格遵循命名约定始终是正确的方向。
这样的约定包括没有列或表名的字符长度限制,以消除使用不易理解或记忆的首字母缩略词的需要。如列名 CUST_DSCR,任何人读到这个名字都将不得不猜测该列包含的内容。CUSTOMER_DESCRIPTION 则是个更好的列名,没有迫使读者展开他们的想象力。
避免冗余:在一张名为“Students(学生)”的表中,我们不必把列命标成 StudentName、StudentAddress 或 StudentGrade,因为 Name、Address 和 Grade 已经足够了。还有,不要使用保留字。用“Index”来标记某列会让人困惑,也会成为错误的来源。可以用一个描述性的前缀,如 StudentIndex。
我们可以仔细地完成世界级数据库设计所要求的所有步骤。但是,如果我们没有对数据库进行严格的测试,那么我们将陷入黑暗之中。不幸的是,当项目延期时,测试阶段受到的影响最大。这是弄巧成拙,因为一个快速通过的数据库会立即被错误及不一致性所困扰,而这些错误应该很容易在测试阶段被识别和解决。
一个满是缺陷的数据库不会让用户和管理员喜欢,即使最终修复了错误,我们也摆脱不了不好的名声。在数据库上线前,进行深入而广泛地测试,这将大大减少部署到生产环境中后产生的故障的数量和规模。良好的测试不会找到每个错误,但是肯定有助于摆脱大多数错误。
数据库设计的实用原则是:在数据冗余和处理速度之间找到合适的平衡点。
提倡“三少”原则(一个数据库中表的个数越少越好;一个表中组合主键的字段个数越少越好; 一个表中的字段个数越少越好),数据集成的步骤是将文件系统集成为应用数据库,将应用数据库集成为主题数据库,将主题数据库集成为全局综合数据库。集成的程度越高,数据共享性就越强,信息孤岛现象就越少,整个企业信息系统的全局E—R图中实体的个数、主键的个数、属性的个数就会越少。
提倡“三少”原则的目的,是防止读者利用打补丁技术,不断地对数据库进行增删改,使企业数据库变成了随意设计数据库表的“垃圾堆”,或数据库表的“大杂院”,最后造成数据库中的基本表、代码表、中间表、临时表杂乱无章,不计其数,导致企事业单位的信息系统无法维护而瘫痪。
在给定的系统硬件和系统软件条件下,提高数据库系统的运行效率的办法是:
1) 在数据库物理设计时,降低范式,增加冗余, 少用触发器, 多用存储过程。
2) 当计算非常复杂、而且记录条数非常巨大时(例如一千万条),复杂计算要先在数据库外面,以文件系统方式用C++语言计算处理完成之后,最后才入库追加到表中去。这是电信计费系统设计的经验。
3) 发现某个表的记录太多,例如超过一千万条,则要对该表进行水平分割。水平分割的做法是,以该表主键PK的某个值为界线,将该表的记录水平分割为两个表。若发现某个表的字段太多,例如超过八十个,则垂直分割该表,将原来的一个表分解为两个表。
4) 对数据库管理系统DBMS进行系统优化,即优化各种系统参数,如缓冲区个数。
5) 在使用面向数据的SQL语言进行程序设计时,尽量采取优化算法。
总之,要提高数据库的运行效率,必须从数据库系统级优化、数据库设计级优化、程序实现级优化,这三个层次上同时下功夫。
结论:
数据库开发和设计首先需要正确理解数据的用途,规范化数据库的设计,充分考虑到数据的冗余记录,建立合理的库表索引,避免糟糕的或不一致的命名约定以及糟糕的文档说明,充分的进行数据库表的测试。
数据库开发和设计是任何数据密集型项目的核心,这些项目几乎包含了所有业务应用程序。因此,设计过程应该始终在此上下文中进行审查。本文中列出的设计错误一开始会被看作是小而不起眼的问题。然而,最终,它们会极大地降低数据库性能并且修复成本高昂。要从一开始就正确地做事,增加构建非常适合其预期目的数据库的几率。
本次就说到这里,主要要求在数据库设计中需要注意范式和反范式、基础规范、命名规范、表设计规范、索引相关的问题点,高性能数据库表设计实践办法。其他方面的以后有机会再详细讨论。
相关文章:
数据库开发与设计过程中的问题分析总结
数据库设计的过程是将数据库系统与现实世界密切地、有机地、协调一致地结合起来的过程。数据库的设计质量与设计者的知识、经验和水平密切相关。作为数据库应用系统的重要组成部分,数据库设计的成败往往直接关系到整个应用系统的成败。以数据库为基础的数据库应用系…...
《数据库开发实践》之存储过程【知识点罗列+例题演练】
一、什么是存储过程? 1.概念理解: 存储过程是一组为了完成特定功能的SQL语句集。通过组成SQL语句和控制语句,提供一种封装任务的方法。因此在创建编译好某个存储过程后,因为存储过程中有可执行操作的sql语句,用户可以…...
Linux进程地址空间
🎬慕斯主页:修仙—别有洞天 ♈️今日夜电波:HEART BEAT—YOASOBI 2:20━━━━━━️💟──────── 5:35 🔄 ◀️ ⏸ ▶️ ☰ …...
2024.1.3 关于 Redis 渐进式遍历 和 数据库管理命令
目录 引言 渐进式遍历 SCAN 命令 数据库管理命令 切换数据库 获取数据库 key 个数 删除数据库所有 key 同步删除 SYNC 异步删除 ASYNC 阅读下述文章之前建议点击下方链接熟悉 keys 命令的用法和特点 Redis 全局通用命令 渐进式遍历 keys * 命令一次性将 Redi…...
并发编程:线程同步基础:5、读写锁。ReentrantReadWriteLock
1、主要方法 .readLock().lock();获取读锁 读锁之间互不干扰。 .writeLock().lock();获取写锁 写锁可以锁定住读锁和其他写操作。 2、主程序 package xyz.jangle.thread.test.n2_5.rwlock;import java.util.concurrent.TimeUnit;/*** * 读写锁。ReentrantReadWriteLock* a…...
SpringBoot 集成 Kafka消息中间件,Docker安装Kafka环境
前述 提供kafka、zooker在docker环境下进行安装的示例,springBoot集成kafka实现producer-生产者和consumer-消费者(监听消费:single模式和batch模式)的功能实现 环境安装 # 拉取镜像 docker pull wurstmeister/zookeeper docker pull wurstmeister/kafka# 运行zooker docker …...
阿里云Alibaba Cloud Linux 3镜像版本大全特性说明
Alibaba Cloud Linux阿里云打造的Linux服务器操作系统发行版,Alibaba Cloud Linux完全兼容完全兼容CentOS/RHEL生态和操作方式,目前已经推出Alibaba Cloud Linux 3,阿里云百科aliyunbaike.com分享Alibaba Cloud Linux 3版本特性说明ÿ…...
基于SSM的滁艺咖啡在线销售系统设计与实现
末尾获取源码 开发语言:Java Java开发工具:JDK1.8 后端框架:SSM 前端:Vue 数据库:MySQL5.7和Navicat管理工具结合 服务器:Tomcat8.5 开发软件:IDEA / Eclipse 是否Maven项目:是 目录…...
【设计模式之美】理论一:怎么才算是单一原则、如何取舍单一原则
文章目录 一. 如何判断类的职责是否足够单一?二. 类的职责是否设计得越单一越好? 开始学习一些经典的设计原则,其中包括,SOLID、KISS、YAGNI、DRY、LOD 等。 本文主要学习单一职责原则的相关内容。 单一职责原则的定义:…...
MYSQL 深入探索系列六 SQL执行计划
概述 好久不见了,近期一直在忙项目的事,才有时间写博客,近期频繁出现sql问题,今天正好不忙咱们看看千万级别的表到底该如何优化sql。 案例 近期有个小伙伴生产环境收到了告警,有个6千万的日志表,查询耗时大…...
安装jupyter notebook,jupyter notebook的简单使用
借助anaconda安装jupyter notebook,先下载anaconda然后在Anaconda Prompt中输入命令: 输入"jupyter notebook",在默认浏览器中打开jupyter notebook。 输入"jupyter notebook --no-browser",启动服务器,但不打…...
宏集PC Runtime软件助推食品行业生产线数字化革新
一、前言 近年来,中国食品行业发展迅速且灵活多变,在当前经济下行的情形下,食品行业正面临着日益激烈的竞争,导致企业利润下降。 为了保持企业市场竞争力,国内某top10食品企业采用宏集SCADA解决方案—PC Runtime软件…...
python的课后练习总结3之条件语句
1,简单点,只有IF IF 后面加入条件然后冒号: 条件成立执行的代码1 条件成立执行的代码2 条件是否成立都执行的代码 身高 float(input(请输入你的身高(米):)) if 身高 > 1.3:print(f您的身高是{身高}米,请您买票) print(祝您旅途愉快) 2,IF 加个else if 条件:…...
RedisTemplate序列化
SpringBoot整合Redis,配置RedisTemplate序列化。如果使用StringRedisTemplate,那么不需要配置序列化,但是StringRedisTemplate只能存储简单的String类型数据,如图: 如果使用StringRedisTemplate存储一个常规对象&#…...
小米SU7汽车发布会; 齐碳科技C+轮融资;网易 1 月 3 日发布子曰教育大模型;百度文心一言用户数已突破 1 亿
投融资 • 3200 家 VC 投资的创业公司破产,那个投 PLG 的 VC 宣布暂停投资了• 云天励飞参与 AI 技术与解决方案提供商智慧互通 Pre-IPO 轮融资• 百度投资 AIGC 公司必优科技• MicroLED量测公司点莘技术获数千万级融资• 智慧互通获AI上市公司云天励飞Pre-IPO轮战…...
Python----matplotlib库
目录 plt库的字体: plt的操作绘图函数: plt.figure(figsizeNone, facecolorNone): plt.subplot(nrows, ncols, plot_number): plt.axes(rect): plt.subplots_adjust(): plt的读取和显示相关函数: plt库的基础图…...
PostgreSQL荣获DB-Engines 2023年度数据库
数据库流行度排名网站 DB-Engines 2024 年 1 月 2 日发布文章宣称,PostgreSQL 荣获 2023 年度数据库管理系统称号。 PostgreSQL 在过去一年中获得了比其他 417 个产品更多的流行度增长,因此获得了 2023 年度 DBMS。 DB-Engines 通过计算每种数据库 2024 …...
【每天五道题,轻松公务员】Day3:太阳常识
目录 专栏了解 ☞欢迎订阅☜ ★专栏亮点★ ◇专栏作者◇ 太阳常识 题目一 题目二 题目三 题目四 题目五 答案 补充扩展 专栏了解 ☞欢迎订阅☜ 欢迎订阅此专栏:考公务员,必订!https://blog.csdn.net/m0_73787047/category_1254…...
基于metersphere和supper-jacoco 测试覆盖率落地实践
一、背景及目标 背景 1、技术研发流程为测试 提供冒烟用例-开发根据用例自测-提测-开始测试,这一套流程,但是中间开发是否真实执行冒烟,测试并不知晓,而且测试提供冒烟用例是否符合标准也没法进行量化 2、公司产品属于saas产品&…...
LeetCode每周五题_2024/01/01~2024/01/05
文章目录 1599. 经营摩天轮的最大利润 [2024/01/01]题目题解 466. 统计重复个数 [2024/01/02]题目题解 2487. 从链表中移除节点 [2024/01/03]题目题解 1599. 经营摩天轮的最大利润 [2024/01/01] 题目 1599. 经营摩天轮的最大利润 你正在经营一座摩天轮,该摩天轮共…...
【华为OD机试真题2023CD卷 JAVAJS】抢7游戏
华为OD2023(C&D卷)机试题库全覆盖,刷题指南点这里 抢7游戏 时间限制:1s 空间限制:256MB 限定语言:不限 题目描述: A、B两个人玩抢7游戏,游戏规则为A先报一个起始数字X(10<起始数字<10000),B报下一个数字Y(X-Y<3),A再报一个数字Z(Y-Z<3),以此类推,直…...
14.7-时序反馈移位寄存器建模
时序反馈移位寄存器建模 1,阻塞赋值实现的LFSR,实际上并不具有LFSR功能1.1.1,RTL设计,阻塞赋值1.1.2,tb测试代码1.1.3,波形仿真输出,SIM输出,没实现LFSR1.2.1,RTL设计&am…...
【设计模式】二十一.行为型模式之状态模式
状态模式 一. 说明 状态模式通常描述一个类不同行为的多个状态变更,对象的行为依赖它的状态,它是一种行为型模式。 状态模式可以用来消除代码中大量的if-else结构,它明确对象是有状态的、对象的不同状态对应的行为不一样、行为之间是可以切…...
微服务实战系列之Dubbo(下)
前言 眼看着2023即将走远,心里想着似乎还有啥,需要再跟各位盆友叨叨。这不说曹操,曹操就来了。趁着上一篇Dubbo博文的余温尚在,博主兴匆匆地“赶制”了Dubbo的下集,以飨读者。 上一篇博主依然从Dubbo的内核出发&#…...
《剑指offer》数学第二题:求1+2+3+...+n
题目描述: 求123...n,要求不能使用乘除法、for、while、if、else、switch、case等关键字及条件判断语句(A?B:C)。思路: 我们可以用递归和短路运算符来进行运算,具体代码如下。 代码实现: pac…...
阿里云服务器3M固定带宽速度快吗?
阿里云服务器3M固定带宽是什么意思?速度快吗?3M固定带宽是指云服务器的公网带宽,用于在外网提供服务的,3M带宽的下载速度是384KB/秒,上传速度是1280KB/秒,对于个人博客或流量不多的企业官网速度还是挺快的&…...
美易官方:新年伊始美企狂发450多亿美元债券
新年伊始,美国企业疯狂发行了价值超过450亿美元的债券,创下了历史新高。这一数字比去年同期增长了约50%,凸显出美国企业在全球经济增长放缓的背景下,依然保持着强劲的融资需求和信心。美国企业借款人周三将发行近160亿美元高评级债…...
[云原生] Go web工作流程
web工作流程 Web服务器的工作原理可以简单地归纳为 客户机通过TCP/IP协议建立到服务器的TCP连接客户端向服务器发送HTTP协议请求包,请求服务器里的资源文档服务器向客户机发送HTTP协议应答包,如果请求的资源包含有动态语言的内容,那么服务器…...
【PostgreSQL】约束-主键
【PostgreSQL】约束链接 检查 唯一 主键 外键 排他 主键 主键(Primary Key)是数据库表中用于唯一标识每一行记录的字段。主键具有以下特点: 唯一性:每个主键值在表中是唯一的,不允许出现重复值。非空性:…...
IDEA 控制台中文乱码问题解决方法(UTF-8 编码)
设置 IDEA 编码格式 1:打开 IntelliJ IDEA>File>Setting>Editor>File Encodings,将 Global Encoding、Project Encoding、Default encodeing for properties files 这三项都设置成 UTF-8 2:将 vm option 参数改为: -…...
营销网站的成功案例/制作网站的工具
策划|小智 “Single boy,single boy,single all the way~Cant find a girl for whole day,better to be gay,hey!” 国人有一种族天赋,就是可以把各种节都过成情人节,继而为爱鼓掌。但与此同时,中国又是一个性别比例失调严重的国家…...
网站如何做优化排名/网站推广的优化
我们在工作中经常会看到xx.a和xx.so这样的文件,那么这是什么呢?又有什么作用呢?这篇我们就可以很好的认识并熟练的使用他们。点开这首音乐,我们开始进入正题。一、c语言编译流程预处理编译汇编链接我们知道c语言编译器gcc…...
seo网站建设方案/对搜索引擎优化的认识
1.公式的转化 我们都知道在latex上编写公式非常简便,他有一套自己的语言支持。 但是复杂的公式在word上编写十分麻烦,那如何将latex上的公式无缝的对接到word上呢? 一个在线转变网站 使用: $$ \mathbf{G} \left[\begin{matrix}g…...
app大全/北京网站优化多少钱
好久都没搞这个了,都快忘了,我记得可以不用直接修改,可以直接查看的 1,下载一个pe 太多种类了,不一一介绍,随便搞一个,功能都一样...
厦门网站搜索优化/如何制作网页
CoOS提供了一个事件标志的机制,用起来跟信号量差不多。 1、CoCreateFlag(),创建一个事件标志 OS_FlagID CoCreateFlag (BOOL bAutoReset,BOOL bInitialState); bAutoReset,为0表示手动复位,为1表示自动复位。 bInitialState,…...
做外贸学英语的网站/百度客户服务电话
VMware View 组件如何组成在一起最终用户启动 View Client 登录 View Connection Server。该服务器与 WindowsActive Directory 集成,通过它可以访问 VMware vSphere 环境、刀片或物理 PC 或 Windows 终端服务服务器中托管的虚拟桌面。客户端设备使用 VMware View 的…...