高级java每日一道面试题-2024年9月29日-数据库篇-索引怎么定义,分哪几种?
如果有遗漏,评论区告诉我进行补充
面试官: 索引怎么定义,分哪几种?
我回答:
在Java高级面试中,尤其是涉及数据库和数据结构的部分,索引(Index)是一个核心概念。索引的目的是提高数据库表中数据的检索速度,从而加快数据库查询、更新等操作的执行效率,特别是在处理大量数据时。不过,需要明确的是,索引通常是在数据库层面定义的,而不是直接在Java代码中定义(Java代码主要通过SQL语句来操作数据库,包括创建和管理索引)。但理解索引的原理和类型对于任何使用数据库的Java开发者都是非常重要的。
索引的定义
索引是一种数据结构,在数据库中用于帮助快速找到表中某一行的辅助数据结构。索引可以建立在数据库表的一列或多列上,它是数据库管理系统自动创建的表之外的隐藏对象。使用索引后,数据库系统不必扫描整个表,就能迅速定位到某条记录的位置。
索引的分类
索引可以根据不同的标准进行分类,主要包括以下几种:
按基本功能分类:
- 单列索引:只包含表中一个字段的索引。
- 复合索引(或多列索引):包含表中两个或两个以上字段的索引。创建复合索引时,会考虑索引中列的顺序。
- 唯一索引:保证索引列的值唯一的索引。在唯一索引中,表中任意两行在索引列上的值都不能相同。
- 主键索引:是表中的一列或多列的组合,其值能唯一地标识表中的每一行。实际上,主键索引就是一种特殊的唯一索引,且不允许有NULL值。
按字段数量分类
- 单列索引:仅包含一个列的索引。
- 复合索引(也称组合索引或多列索引):包含多个列的索引。复合索引的列顺序非常重要,因为它会影响查询性能。
按唯一性分类
- 唯一索引:确保索引列中的所有值都是唯一的。
- 非唯一索引:允许索引列中有重复的值。
按物理存储方式分类:
- B-Tree索引:最常用的索引类型之一,适用于范围查询和排序。
- Hash索引:基于哈希函数的索引,适用于等值查询。
- Bitmap索引:使用位图表示数据的存在性,适用于低基数列(即列中唯一值较少的情况)。
- R-Tree索引:适用于多维空间数据,如地理信息系统(GIS)。
- 全文索引:主要用于搜索文本中的关键字,而不是直接比较索引中的值。
按逻辑角度分类
- 聚集索引(Clustered Index):在关系型数据库中,聚集索引决定了数据行的物理存储顺序。每个表只能有一个聚集索引。
- 非聚集索引(Non-Clustered Index):不改变数据行的物理存储顺序,而是创建一个单独的数据结构来加速查询。每个表可以有多个非聚集索引。
按存储方式分类
- 内存索引:索引数据完全存储在内存中,适用于高速读取。
- 磁盘索引:索引数据存储在磁盘上,适用于大规模数据集。
详解
B-Tree索引
- 特点:
- 平衡树结构,所有叶子节点在同一层。
- 支持范围查询和排序。
- 插入、删除和查找操作的时间复杂度为O(log n)。
- 适用场景:
- 范围查询(如
WHERE column BETWEEN ... AND ...
)。 - 排序查询(如
ORDER BY column
)。
- 范围查询(如
Hash索引
- 特点:
- 基于哈希函数计算键值的位置。
- 查找速度快,平均时间复杂度为O(1)。
- 不支持范围查询和排序。
- 适用场景:
- 等值查询(如
WHERE column = 'value'
)。
- 等值查询(如
Bitmap索引
- 特点:
- 使用位图表示数据的存在性。
- 非常适合低基数列(如性别、状态等)。
- 占用空间小,查询速度快。
- 适用场景:
- 低基数列的查询。
R-Tree索引
- 特点:
- 适用于多维空间数据。
- 用于地理信息系统(GIS)中的空间查询。
- 适用场景:
- 多维空间数据查询(如地图应用中的点、线、面查询)。
复合索引
- 特点:
- 包含多个列的索引。
- 列的顺序非常重要,前导列的选择会影响查询性能。
- 适用场景:
- 经常需要同时查询多个列的情况。
唯一索引
- 特点:
- 确保索引列中的所有值都是唯一的。
- 可以作为主键的一部分。
- 适用场景:
- 需要保证列值唯一性的场景。
聚集索引与非聚集索引
- 聚集索引:
- 决定了数据行的物理存储顺序。
- 每个表只能有一个聚集索引。
- 非聚集索引:
- 不改变数据行的物理存储顺序。
- 创建一个单独的数据结构来加速查询。
- 每个表可以有多个非聚集索引。
示例
假设我们有一个 employees
表,包含以下列:id
, name
, department_id
, salary
。
CREATE TABLE employees (id INT PRIMARY KEY,name VARCHAR(100),department_id INT,salary DECIMAL(10, 2)
);
创建索引
-
单列索引:
CREATE INDEX idx_name ON employees(name);
-
复合索引:
CREATE INDEX idx_department_salary ON employees(department_id, salary);
-
唯一索引:
CREATE UNIQUE INDEX uidx_email ON employees(email);
-
聚集索引:
在MySQL中,主键默认是聚集索引。ALTER TABLE employees ADD PRIMARY KEY (id);
-
非聚集索引:
CREATE INDEX idx_salary ON employees(salary);
注意
- 索引虽然能加速数据检索,但也会消耗额外的磁盘空间,并降低写操作的性能(因为插入、删除和更新操作时需要同时修改表和索引)。
- 在设计索引时,需要综合考虑数据的查询频率、修改频率、空间使用、数据分布等因素。
总结
索引是提高数据库查询性能的重要工具。根据不同的需求和场景选择合适的索引类型至关重要。在设计索引时,需要考虑以下几点:
- 数据量大小
- 查询模式(范围查询、等值查询等)
- 更新频率
- 存储空间
通过合理地设计和使用索引,可以显著提高应用程序的性能。
相关文章:
高级java每日一道面试题-2024年9月29日-数据库篇-索引怎么定义,分哪几种?
如果有遗漏,评论区告诉我进行补充 面试官: 索引怎么定义,分哪几种? 我回答: 在Java高级面试中,尤其是涉及数据库和数据结构的部分,索引(Index)是一个核心概念。索引的目的是提高数据库表中数据的检索速度,从而加快…...

现代LLM基本技术整理
0 开始之前 作者:hadiii,北京大学 电子信息硕士在读 本文从Llama 3报告出发,基本整理一些现代LLM的技术。基本,是说对一些具体细节不会过于详尽,而是希望得到一篇相对全面,包括预训练,后训练&…...

EasyX与少儿编程:轻松上手的编程启蒙工具
EasyX:开启少儿编程的图形化启蒙之路 随着科技发展,编程逐渐成为孩子们教育中重要的一部分。如何让孩子在编程启蒙阶段更容易接受并激发他们的兴趣,成为许多家长和老师关心的问题。相比起传统的编程语言,图形化编程工具显得更直观…...

【C语言指南】数据类型详解(上)——内置类型
💓 博客主页:倔强的石头的CSDN主页 📝Gitee主页:倔强的石头的gitee主页 ⏩ 文章专栏:《C语言指南》 期待您的关注 目录 引言 1. 整型(Integer Types) 2. 浮点型(Floating-Point …...

视频汇聚/视频存储/安防视频监控EasyCVR平台RTMP推流显示离线是什么原因?
视频汇聚/视频存储/安防视频监控EasyCVR视频汇聚平台兼容性强、支持灵活拓展,平台可提供视频远程监控、录像、存储与回放、视频转码、视频快照、告警、云台控制、语音对讲、平台级联等视频能力。 EasyCVR安防监控视频综合管理平台采用先进的网络传输技术࿰…...

联想电脑怎么开启vt_联想电脑开启vt虚拟化教程(附intel和amd主板开启方法)
最近使用联想电脑的小伙伴们问我,联想电脑怎么开启vt虚拟。大多数可以在Bios中开启vt虚拟化技术,当CPU支持VT-x虚拟化技术,有些电脑会自动开启VT-x虚拟化技术功能。而大部分的电脑则需要在Bios Setup界面中,手动进行设置ÿ…...

手把手教你使用YOLOv11训练自己数据集(含环境搭建 、数据集查找、模型训练)
一、前言 本文内含YOLOv11网络结构图 训练教程 推理教程 数据集获取等有关YOLOv11的内容! 官方代码地址:https://github.com/ultralytics/ultralytics/tree/main/ultralytics/cfg/models/11 二、整体网络结构图 三、环境搭建 项目环境如下…...

LabVIEW界面输入值设为默认值
在LabVIEW中,将前面板上所有控件的当前输入值设为默认值,可以通过以下步骤实现: 使用控件属性节点:你可以创建一个属性节点来获取所有控件的引用。 右键点击控件,选择“创建” > “属性节点”。 设置属性节点为“D…...

【Android 14源码分析】Activity启动流程-1
忽然有一天,我想要做一件事:去代码中去验证那些曾经被“灌输”的理论。 – 服装…...

Java 中 synchronized 和 Thread 的使用场合介绍
在 Java 编程中,synchronized 和 Thread 是处理并发与多线程编程的关键工具。多线程编程是为了在单一程序中并行执行多个任务,Java 提供了丰富的 API 和关键字以实现这一目标,而其中 synchronized 和 Thread 是非常基础和重要的部分。 synch…...
爬虫库是什么?是ip吗
爬虫库通常指的是用于网页爬虫(Web Scraping)开发的代码库或框架,它不是IP地址。以下是关于爬虫库的详细解释: 爬虫库的定义 爬虫库是一些用于简化网络数据抓取过程的工具和框架,通常提供了一系列函数和类࿰…...

【MySQL】查询原理 —— B+树查询数据全过程
使用B树作为索引结构的原因: 一种自平衡树: B树在插入和删除的时候节点会进行分裂和合并操作,以保持树的平衡,存在冗余节点,使得删除的时候树结构变化小,更高效。 高度不会增长过快,查询磁盘I…...

系统设置 WIFI输入框被挡住解决方案
文章目录 问题点复现的场景机器横屏可复现,竖屏不存在跟density 相关的。 解决问题方案设置输入模式路径 部分源码跟踪方法 延伸思考设置输入模式设置主题 问题点 进入系统设置-网络和互联网-WLAN-点击WIFI item ,密码输入框被遮挡,输入的密码不可见.如…...

SpringCloud无法注册Nacos和配置中心
今天升级SpringCloud版本,导致服务无法注册到nacos,使用nacos作为配置中心也无法刷新配置信息,后来发现是因为只更新了SpringCloud版本,SpringCloud-Alibaba没有更新导致的问题。 升级出现问题的版本是: <dependen…...

word2vector训练数据集整理(代码实现)
import math import os import random import torch import dltools from matplotlib import pyplot as plt #读取数据集 def read_ptb():"""将PTB数据集加载到文本行的列表中"""with open(./ptb/ptb.train.txt) as f:raw_text f.read()return…...

无心上班,只想为祖国庆生?让ChatGPT帮你搞定工作!
国庆假期临近,大家的心早已飞向诗和远方了吧。 然而,现实总是无情地将我们拉回到堆积如山的工作任务上:紧急报告的截止日期就在眼前,复杂的项目策划还未动笔,客户的定制需求迫在眉睫。每年的这个时候,如何…...

【Python】YOLO牛刀小试:快速实现视频物体检测
YOLO牛刀小试:快速实现视频物体检测 在深度学习的众多应用中,物体检测是一个热门且重要的领域。YOLO(You Only Look Once)系列模型以其快速和高效的特点,成为了物体检测的首选之一。本文将介绍如何使用YOLOv8模型进行…...

Vscode超好看的渐变主题插件
样式效果: 插件使用方法: 然后重启,之后会显示vccode损坏,不用理会,因为这个插件是更改了应用内部代码,直接不再显示即可。...

OceanBase技术解析:自适应分布式下压技术
在《OceanBase 数据库源码解析》这本书中,关于SQL执行器的深入剖析相对较少,因此,希望增添一些实用且详尽的补充内容。 上一篇博客《 OceanBase技术解析: 执行器中的自适应技术》中,已初步介绍了执行器中几项典型的自适…...
Firebase和JavaScript创建Postback Link逻辑
Firebase是一个提供后端即服务(BaaS)的平台,它允许开发者快速构建应用程序而无需管理服务器。Firebase不直接提供生成Postback Link的功能,但您可以使用Firebase的功能来构建和管理URL,然后在客户端使用这些URL来实现Postback。 以下是如何使用Firebase和JavaScript来创建…...

【JavaEE】-- HTTP
1. HTTP是什么? HTTP(全称为"超文本传输协议")是一种应用非常广泛的应用层协议,HTTP是基于TCP协议的一种应用层协议。 应用层协议:是计算机网络协议栈中最高层的协议,它定义了运行在不同主机上…...
【解密LSTM、GRU如何解决传统RNN梯度消失问题】
解密LSTM与GRU:如何让RNN变得更聪明? 在深度学习的世界里,循环神经网络(RNN)以其卓越的序列数据处理能力广泛应用于自然语言处理、时间序列预测等领域。然而,传统RNN存在的一个严重问题——梯度消失&#…...

让回归模型不再被异常值“带跑偏“,MSE和Cauchy损失函数在噪声数据环境下的实战对比
在机器学习的回归分析中,损失函数的选择对模型性能具有决定性影响。均方误差(MSE)作为经典的损失函数,在处理干净数据时表现优异,但在面对包含异常值的噪声数据时,其对大误差的二次惩罚机制往往导致模型参数…...
在Ubuntu24上采用Wine打开SourceInsight
1. 安装wine sudo apt install wine 2. 安装32位库支持,SourceInsight是32位程序 sudo dpkg --add-architecture i386 sudo apt update sudo apt install wine32:i386 3. 验证安装 wine --version 4. 安装必要的字体和库(解决显示问题) sudo apt install fonts-wqy…...
嵌入式常见 CPU 架构
架构类型架构厂商芯片厂商典型芯片特点与应用场景PICRISC (8/16 位)MicrochipMicrochipPIC16F877A、PIC18F4550简化指令集,单周期执行;低功耗、CIP 独立外设;用于家电、小电机控制、安防面板等嵌入式场景8051CISC (8 位)Intel(原始…...

阿里云Ubuntu 22.04 64位搭建Flask流程(亲测)
cd /home 进入home盘 安装虚拟环境: 1、安装virtualenv pip install virtualenv 2.创建新的虚拟环境: virtualenv myenv 3、激活虚拟环境(激活环境可以在当前环境下安装包) source myenv/bin/activate 此时,终端…...
32单片机——基本定时器
STM32F103有众多的定时器,其中包括2个基本定时器(TIM6和TIM7)、4个通用定时器(TIM2~TIM5)、2个高级控制定时器(TIM1和TIM8),这些定时器彼此完全独立,不共享任何资源 1、定…...

【Java多线程从青铜到王者】单例设计模式(八)
wait和sleep的区别 我们的wait也是提供了一个还有超时时间的版本,sleep也是可以指定时间的,也就是说时间一到就会解除阻塞,继续执行 wait和sleep都能被提前唤醒(虽然时间还没有到也可以提前唤醒),wait能被notify提前唤醒…...

第2课 SiC MOSFET与 Si IGBT 静态特性对比
2.1 输出特性对比 2.2 转移特性对比 2.1 输出特性对比 器件的输出特性描述了当温度和栅源电压(栅射电压)为某一具体数值时,漏极电流(集电极电流...

多模态学习路线(2)——DL基础系列
目录 前言 一、归一化 1. Layer Normalization (LN) 2. Batch Normalization (BN) 3. Instance Normalization (IN) 4. Group Normalization (GN) 5. Root Mean Square Normalization(RMSNorm) 二、激活函数 1. Sigmoid激活函数(二分类&…...