当前位置: 首页 > news >正文

【优质精选】12节大模型系列教学课程之二:RAG 原理与应用

课程二:RAG 原理与应用

12节大模型系列教学课程之二:RAG 原理与应用

    • 课程详细内容
      • RAG 技术的基础知识
      • RAG 的工作原理
      • RAG 提高生成质量和准确性的原理
      • RAG 在问答系统中的应用
      • RAG 在文本创作中的应用
      • RAG 在其他领域的应用探索
      • RAG 技术的挑战与应对策略
      • RAG 技术的未来发展趋势
    • 更深入的RAG介绍
      • RAG 在不同领域的应用实例
      • RAG 应用中的优化策略
      • RAG 模型的构建与训练方法
      • RAG 解决幻觉问题的技术
      • RAG 应用的评估标准
      • RAG 与知识图谱的结合
      • RAG 在医疗领域的具体应用
      • 结论:
    • 相关论文

介绍:
深入剖析 RAG(Retrieval-Augmented Generation)技术,掌握其工作原理和实际应用场景。

课程名称:《探索 RAG 技术的奥秘》

课程简介:
详细解释 RAG 如何将检索和生成相结合,提高模型的生成质量和准确性。通过实际案例,如问答系统、文本创作等,展示 RAG 在不同任务中的出色表现。

课程详细内容

RAG 技术的基础知识

RAG 是一种将检索和生成相结合的技术,它不再仅仅依赖模型内部的知识进行生成,而是先从外部知识库或文档中检索相关信息,然后基于这些信息进行生成。与传统生成模型相比,RAG 能够引入更准确和丰富的知识,提高生成的质量。关键组成部分包括高效的检索模块,用于快速准确地找到相关信息,以及强大的生成模块,能够根据检索结果生成自然流畅的文本。
图片:展示一个简单的 RAG 技术框架,标注出检索模块和生成模块。

RAG 的工作原理

在检索过程中,模型会根据输入的提示或问题,利用各种检索算法和策略,从大规模的文本库中筛选出最相关的部分。例如,可以基于关键词匹配、语义相似度等进行检索。生成过程中,模型会将检索到的信息融入到生成的文本中,通过巧妙的融合方式,使得生成的内容既有基于模型学习的创造性,又有来自外部知识的准确性。
图片:用动画展示检索和生成的交互过程,突出信息的流动和转化。

RAG 提高生成质量和准确性的原理

融合外部知识使得生成的内容更具事实依据,避免了凭空想象导致的错误或不准确。同时,减少了生成的随机性和偏差,使生成更加有针对性和合理性。通过具体的实例,比如在某个特定领域的问题回答中,对比使用 RAG 和传统模型的生成结果,清晰展示质量和准确性的提升。
图片:并排展示两个生成结果,一个使用 RAG,一个不使用,标注出质量和准确性的差异。

RAG 在问答系统中的应用

在问答系统中,RAG 首先根据问题在知识库中检索相关的知识片段,然后基于这些片段生成准确且详细的回答。通过实际的问答系统案例,分析其工作流程,展示如何有效地应对各种类型的问题,并给出令人满意的回答。
图片:展示问答系统的界面,以及具体问题和生成回答的示例。

RAG 在文本创作中的应用

在文本创作中,RAG 可以为作者提供灵感、素材和参考,辅助创作出更丰富、有深度的内容。无论是故事创作中的情节构思,还是论文写作中的论据支持,RAG 都能发挥重要作用。通过实际的创作案例,展示其在不同场景下的出色表现。
图片:展示一段由 RAG 辅助生成的故事或论文段落。

RAG 在其他领域的应用探索

除了问答和文本创作,RAG 还在代码生成中可以根据需求检索相关的代码片段和模式,生成准确的代码;在摘要生成中能够提取关键信息并生成简洁明了的摘要。探讨其在这些领域的应用潜力和创新方向。
图片:展示代码生成和摘要生成的示例结果。

RAG 技术的挑战与应对策略

检索可能存在准确性和相关性不足的问题,导致生成的基础信息不准确;生成可能出现连贯性和一致性不佳的情况,影响文本的质量。针对这些挑战,可以采用优化检索算法、引入更多的上下文信息、加强模型的训练等方法来应对。
图片:用图表展示挑战的表现形式和解决策略的流程。

RAG 技术的未来发展趋势

未来,RAG 技术可能会在检索的精准度、生成的灵活性和创造性等方面不断改进。同时,与其他技术如强化学习、预训练模型的融合将为其带来更广阔的应用前景,可能会引发行业在知识管理、内容创作等方面的重大变革。
图片:展示一个充满科技感的未来场景,暗示 RAG 技术带来的影响。

更深入的RAG介绍

RAG 在不同领域的应用实例

RAG 技术在众多领域都有着广泛且深入的应用。在体育领域,它能够应对比赛数据的复杂性和多样性,通过构建关系动作图来分析运动员的表现,为教练员和运动员制定训练计划和调整比赛策略提供有力支持。例如,可以对运动员的体能数据、技术动作等进行深入分析,帮助发现潜在的优势和不足。
在医疗领域,RAG 可辅助医生进行诊断。面对海量的医疗数据,包括患者的病历、检查报告等,RAG 能够快速检索相关信息,为医生提供更准确的诊断依据。例如,在肿瘤诊断中,通过分析患者的症状、影像检查结果以及相关的医学研究文献,生成更全面的诊断报告。
在企业场景中,RAG 提升了大型语言模型的业务价值,将公司文档集成到矢量数据库中,实现针对文档的精准查询答复,提高了信息检索的效率和效果。比如在客户服务中,能够快速准确地回答客户的问题,提升客户满意度。

RAG 应用中的优化策略

RAG 应用中的优化策略多种多样。在分块方法上,需要优化块大小,确保数据段有意义且与上下文相关,避免出现信息割裂或冗余。对于嵌入模型,要选择和微调合适的模型,以改进语义表示,提升检索的准确性。
在向量搜索方法方面,要选择有效的相似度量和搜索参数,提高搜索的效率和相关性。例如,调整相似度计算的权重,使搜索结果更符合实际需求。
在提供模型的最后提示上,精心制作有效提示,以提高输出质量。通过 A/B 测试对比不同配置的性能,确定最优方案。
此外,还可以利用知识图谱进行上下文增强,解决长距离关联知识捕捉和信息稀疏的问题。同时,让大模型对召回结果进行筛选,只使用与查询相关且有效的上下文。

RAG 模型的构建与训练方法

构建和训练 RAG 模型包括多个关键步骤。首先是准备数据集,收集丰富的信息文档库,为后续的检索和生成提供基础。然后选择适合任务的检索算法,如 BM25、DPR 等,并进行训练或调优。
生成器通常是预训练的语言模型,如 BERT 或 GPT-3,要确保其能够利用检索到的相关文档和输入查询生成准确且有价值的回答。
在训练过程中,要注意数据的清洗、分块和向量化,使数据更适合模型处理。同时,不断调整模型的参数,以优化模型的性能。
例如,在构建一个智能客服的 RAG 模型时,先收集大量的客户常见问题和对应的答案作为数据集,然后选择合适的检索算法和生成器,通过反复训练和调整,使模型能够准确理解客户的问题并提供满意的回答。

RAG 解决幻觉问题的技术

为了解决大模型的幻觉问题,RAG 技术发挥了重要作用。RAG 通过从外部来源获取数据,为语言模型提供更准确和可靠的信息,从而减少生成文本中的错误和误导性内容。
在实际应用中,例如在回答一些需要专业知识的问题时,RAG 能够检索相关的权威资料和最新研究成果,避免模型仅凭自身的推测和想象给出不准确的答案。
同时,通过结合知识图谱,RAG 能够更好地理解问题的语义和背景,进一步提高回答的准确性和可信度。
此外,不断优化检索和生成的过程,如改进检索算法、增强生成器的能力等,也有助于减少幻觉问题的出现。

RAG 应用的评估标准

评估 RAG 应用的效果可以通过多种标准来衡量。首先是 Context Relevance(上下文相关性),它衡量召回的上下文能够支持查询的程度。如果得分低,说明召回了过多与问题无关的内容,可能影响最终回答的质量。
Groundedness(事实一致性)指标衡量生成的答案在给定的上下文中的事实一致性。得分低则表明回答可能不遵从召回的知识,存在幻觉的风险。
Answer Relevance(答案相关性)侧重于评估生成的答案与给定查询提示的相关性。不完整或包含冗余信息的答案会得到较低的分数。
例如,对于“法国的首都是哪里”的问题,如果回答只是简单提到“在欧洲”,那么在 Answer Relevance 上得分会较低。

RAG 与知识图谱的结合

RAG 与知识图谱的结合具有显著优势。知识图谱能够有效地组织和管理大量的实体和它们之间的关系,便于快速检索相关信息。然而,知识图谱自身不具备生成复杂自然语言响应的能力。
RAG 则通过利用大型语言模型的生成能力,能够根据给定的上下文生成丰富的自然语言文本。
二者结合后,可以从结构化的知识图谱中检索精确的信息作为上下文,提高生成内容的准确性和相关性。支持更复杂的查询,如跨多个实体和关系的查询,能够生成更全面和详细的回答。
例如在医疗问诊中,能够快速从大量的医学知识图谱中找到相关信息,并基于这些信息提供具体、准确的医学建议和诊断。

RAG 在医疗领域的具体应用

在医疗领域,RAG 有着多方面的具体应用。它能够应对医疗领域中的诸多挑战,如医疗资源分布不均、医生工作压力大等。
RAG 可以从大规模的医疗知识库中检索相关信息,为医生提供诊断辅助。例如,在面对复杂的病症时,RAG 能够整合患者的症状、病史以及最新的医学研究成果,帮助医生做出更准确的诊断。
在医疗教育方面,RAG 能够为医学生提供丰富的学习资源和案例分析,帮助他们更好地理解和掌握医学知识。
此外,RAG 还可以优化医疗流程,提高医疗效率,降低医疗成本。
RAG 在企业中的效益分析
在企业中,RAG 带来了多方面的效益。它增强了企业信息检索的效率和效果,使企业能够更快速、准确地获取所需信息。
通过将企业文档集成到矢量数据库中,RAG 能够实现对这些文档的精准查询答复,提升了企业的决策能力和信息访问效率。
同时,RAG 有助于提高企业知识管理的水平,降低知识获取的成本。例如,在客户服务中,能够快速解决客户的问题,提高客户满意度,从而增强企业的竞争力。
此外,RAG 还能够促进企业内部的知识共享和创新,为企业的发展提供有力支持。
RAG 应用的未来发展趋势
随着技术的不断进步,RAG 应用将呈现出多个未来发展趋势。高效索引和检索将成为重要方向,随着知识库规模的不断扩大,构建高效、准确的索引和检索系统将变得至关重要。
多模态数据融合将进一步扩展 RAG 的应用范围,使其能够处理图像、视频等多种数据类型。
实时知识更新将确保答案的准确性和时效性,使 RAG 能够更好地适应不断变化的信息环境。
个性化问答服务将通过引入用户画像和个性化推荐技术,为用户提供更贴合其需求的回答。
此外,RAG 与其他新兴技术的结合也将为其发展带来新的机遇和挑战。

结论:

综上所述,RAG 应用在不同领域展现出了强大的潜力和多样的应用场景。通过不断的优化、与知识图谱的结合以及在医疗和企业等领域的深入应用,RAG 为解决实际问题提供了有效的手段。未来,随着技术的持续发展,RAG 有望在更多领域发挥重要作用,为人们的生活和工作带来更大的便利和价值。然而,RAG 应用的发展也面临着一些挑战,如数据隐私保护、模型的可解释性等,需要在技术创新的同时,注重相关问题的解决,以推动 RAG 应用的健康、可持续发展。

相关论文

《LLM 之 RAG 实战(三十三)| 探索 RAG 在 Table 的应用-CSDN 博客》介绍了从非结构化文档或图像中准确提取表结构的几种方法,包括利用多模态 LLM 如 GPT-4V 来识别表格并提取信息,利用专业的表格检测模型如 Table Transformer 来辨别表格结构,使用开源框架如 unstructured 或者目标检测模型来解析整个文档并提取与表相关的内容,使用 Nougat、Donut 等端到端模型来解析整个文档并提取与表相关的内容。
《RAG 基础知识及应用_rag 应用-CSDN 博客》介绍了 RAG 的基础知识,包括工作原理、工作流程、发展进程、常见优化方法、对比大模型微调的优势等,还提到了 RAG 开源项目“茴香豆”及其特性和构建方式。
《一文搞懂大模型 RAG 应用(附实践案例)_rag 大模型-CSDN 博客》详细介绍了完整的 RAG 应用流程,包括数据准备阶段的各个环节和应用阶段的用户提问、数据检索、注入 Prompt、LLM 生成答案等,并对各环节的技术细节和注意事项进行了说明。
《大模型应用一:RAG_rag 大模型产品-CSDN 博客》提到了大模型的应用主要是理解和生成,对于 NLU 的解决方案通常是 RAG。
《RAG 应用程序的 12 种调优策略:“超参数”和策略优化提高检索性能》涵盖了 RAG 的文本用例,介绍了在推理阶段可通过查询转换、检索参数、高级检索策略等进行调优,还提到了数据索引的摄入阶段包括收集数据、数据分块、生成块的矢量嵌入、在矢量数据库中存储矢量嵌入和块等步骤。
《AI 推介-大语言模型 LLMs 之 RAG(检索增强生成)论文速览(arXiv 方向)》提供了多篇关于 RAG 的论文目录。
《【AI 大模型】检索增强生成(RAG)模型在企业中的应用-CSDN 博客》介绍了 RAG 模型的基本原理与工作机制,包括什么是 RAG 模型、工作机制、优势,还阐述了如何构建和训练 RAG 模型,包括准备数据集、选择检索器和生成器、集成两者以及检索器和生成器的训练等内容。
《值得一看的大模型 RAG 全面总结 - 智源社区》从 RAG 的整体架构说起,介绍了通用的 RAG 架构以及 RAG 的基础、类型等。
《【RAG 论文】检索信息中的噪音是如何影响大模型生成的?-CSDN 博客》介绍了两篇论文,主要讲述了检索文档如何影响大模型输出以及相关实验结果。
《LLM 之 RAG 实战(十五)| RAG 的自动源引文验证技术-CSDN 博客》介绍了 RAG 如何解决幻觉以及证据验证等内容。
《AI 大模型企业应用实战(18)-“消灭”LLM 幻觉的利器 - RAG 介绍》介绍了 RAG 在解决 LLM 幻觉方面的作用,以及 RAG 的应用构建步骤和可能遇到的问题及解决方案。
《检索增强生成(RAG)技术:实现流程、作用及应用案例-CSDN 博客》介绍了 RAG 技术的简介、实现流程、作用与价值,并提供了基于 Hugging Face Transformers 库实现的 RAG 模型基本运行示例。
《也看大模型 RAG 长文本任务中的上下文精简与构造方式…- 智源社区》介绍了 RAG 中的上下文构造问题以及长文本任务的数据构造问题。
《LLM 之 RAG 理论(二)| RAG 综述论文详解-CSDN 博客》概述了 LLMs 时代 RAG 的发展范式,总结了三种范式,并对 RAG 的三个主要组成部分及关键技术进行了讨论,还介绍了评估 RAG 模型的方法和未来研究方向。
《智谱、月之暗面、阿里、字节、vivo、达观数据等专家深入剖析》介绍了“RAG 检索与生成落地实践专题论坛”以及相关演讲嘉宾。
《从文本到多模态:北京大学揭示检索增强生成(RAG)技术的全景》系统调研了现有 RAG 技术,包括其组成部件、结合方法、优化提升技术、在不同领域和模态上的应用以及评估标准或工具,并分析了局限性和未来发展趋势。
《RAG 系统在企业中的应用:构建、优化与效益分析-CSDN 博客》介绍了认知评审员、人工智能导师等 RAG 系统的应用案例,以及构建 RAG 系统时经常出现的七个故障点。
《RAG 在医疗领域的应用:辅助诊断,提升医疗效率-CSDN 博客》介绍了医疗领域的挑战、人工智能在医疗领域的应用、RAG 模型概述以及其在医疗领域的应用前景。
《RAG 原理、综述与论文应用全解析_rag 综述-CSDN 博客》介绍了 RAG 的定义、与其他模型的比较等内容。
《LLM 之 RAG 理论(九)| 如何在 LLM 应用程序中提高 RAG 结果:从基础到高级》介绍了基本的 RAG 包括索引、检索和生成三个阶段。
《LLM 之 RAG 理论(十一)| 面向生产的 RAG 应用程序的 12 种调整策略指南》介绍了构建 RAG 管道的准备步骤,包括数据清理、分块、嵌入模型等内容。
《技术动态 | 知识图谱:通往精准 RAG 应用的秘钥-CSDN 博客》探讨了知识图谱在 RAG 应用中的关键方面,包括解决的挑战、与向量的协同作用和未来发展。
《RAG 的 10 篇核心论文》列举了多篇关于 RAG 的核心论文,并对部分论文的内容进行了简要介绍。

相关文章:

【优质精选】12节大模型系列教学课程之二:RAG 原理与应用

课程二:RAG 原理与应用 12节大模型系列教学课程之二:RAG 原理与应用 课程详细内容RAG 技术的基础知识RAG 的工作原理RAG 提高生成质量和准确性的原理RAG 在问答系统中的应用RAG 在文本创作中的应用RAG 在其他领域的应用探索RAG 技术的挑战与应对策略RAG …...

vue3前端开发-小兔鲜项目-产品详情基础数据渲染

vue3前端开发-小兔鲜项目-产品详情基础数据渲染!这一次内容比较多,我们分开写。第一步先完成详情页面的基础数据的渲染。然后再去做一下右侧的热门产品的列表内容。 第一步,还是老规矩,先准备好接口函数。方便我们的页面组件拿到对…...

Docker入门指南:Linux系统下的完整安装步骤与常见问题解答

本文以centos7演示。 Docker安装 可参考官方安装文档:Install Docker Engine on CentOS | Docker Docs 一图流: # 移除旧版本docker sudo yum remove docker \docker-client \docker-client-latest \docker-common \docker-latest \docker-latest-logro…...

Netty实现数据上下行

Netty实现数据上下行 使用LVSNGinxNetty实现数据接入 在数据上行的时候,通过使用车辆唯一标识码(vin)和连接通道绑定 Netty一些配置参数如下: #netty项目使用的端口 server.port8017 #使用启用epoll(在Linux上拥有更好的传输性…...

【React】事件绑定:深入解析高效处理用户交互的最佳实践

文章目录 一、什么是事件绑定?二、基本事件绑定三、绑定 this 上下文四、传递参数五、事件对象六、事件委托七、常见事件处理八、优化事件处理 React 是现代前端开发中最受欢迎的框架之一,其组件化和高效的状态管理能力使得构建复杂的用户界面变得更加容…...

SpringCloud:使用OpenFeign优化前面的Nacos实现高效购物车商品信息处理

在现代电商系统中,购物车的性能直接影响用户的购物体验。为了提升系统性能和用户满意度,我们可以使用Spring Cloud的OpenFeign和负载均衡器来高效地处理购物车中的商品信息。本文将详细介绍如何在Spring Cloud中集成这些组件,并实现一个高效的…...

计算机三级嵌入式笔记(二)——嵌入式处理器

目录 考点1 嵌入式处理器的结构类型 考点2 嵌入式处理器简介 考点3 ARM处理器概述 考点4 处理器和处理器核 考点5 ARM 处理器的分类 考点6 经典 ARM 处理器 考点7 ARM Cortex 嵌入式处理器 考点8 ARM Cortex实时嵌入式处理器 考点9 ARM Cortex 应用处理器 考点10 AR…...

【GoLang】Golang 快速入门(第一篇)

目录 1.简介: 2.设计初衷: 3.Go语言的 特点 4.应用领域: 5.用go语言的公司: 6. 开发工具介绍以及环境搭建 1.工具介绍: 2.VSCode的安装: 3.安装过程: 4.Windows下搭建Go开发环境--安装和配置SDK 1.搭建Go开发环境 - 安装…...

Linux中的三类读写函数

文件IO和标准IO的区别 遵循标准: 文件IO遵循POSIX标准,主要在类UNIX环境下使用。标准IO遵循ANSI标准,具有更好的可移植性,可以在不同的操作系统上重新编译后运行。可移植性: 文件IO的可移植性相对较差,因为…...

MATLAB基础应用精讲-【数模应用】二元Probit回归分析

目录 前言 知识储备 二元Logistic模型和Probit模型 Logistic模型的形式 Probit模型 优势比(OR) 准二项分布族 算法原理 数学模型 二元因变量和线性概率模型 probit和logit回归 logit和probit模型的估计和推断 稳健性检验 二元logit回归分析全流程 一、案例数…...

找工作准备刷题Day10 回溯算法 (卡尔41期训练营 7.24)

回溯算法今天这几个题目做过,晚上有面试,今天水一水。 第一题:Leetcode77. 组合 题目描述 解题思路 从题目示例来看,k个数是不能重合的,但是题目没有明确说明这一点。 使用回溯算法解决此问题,利用树形…...

如何有效的进行小程序的优化

如今小程序已经成为了许多开发者开展业务,提供服务的重要平台 。所以如何有效的优化小程序成为了开发者关注的首要问题,以下是一份详细的小程序优化方案: 一、目标设定 明确小程序优化的主要目标,例如提高用户留存率、增加用户活…...

FPGA-ROM IP核的使用(2)

前言 接着昨天的进行一个小的实验验证ROM IP核。 实验效果 读取上一期生成的IP核中的数据,并将其显示在数码管上。 具体流程 ROM IP核存放数据0~255,之后每隔0.2s,从0的地址开始读数据,并显示在数码管上;接着先后…...

Manticore Search(es轻量级替代)

概念: Manticore Search 是一个使用 C 开发的高性能搜索引擎,创建于 2017 年,其前身是 Sphinx Search 。Manticore Search 充分利用了 Sphinx,显着改进了它的功能,修复了数百个错误,几乎完全重写了代码并保…...

测试开发面试题---计算机网络

计算机网络模型 OSI模型:七层模型 物理层:定义电气特征,机械特征等功能规范,传递实际比特流数据链路层:物理地址寻址(MAC),帧的传输,错误检测和纠正网络层:…...

Wonder3D 论文学习

论文链接:https://arxiv.org/abs/2310.15008 代码链接:https://github.com/xxlong0/Wonder3D 解决了什么问题? 随着扩散模型的提出,3D 生成领域取得了长足进步。从单张图片重建出 3D 几何是计算机图形学和 3D 视觉的基础任务&am…...

【MySQL进阶之路 | 高级篇】显式事务和隐式事务

使用事务有两种方式:显式事务和隐式事务。 1. 显式事务 步骤1: START TRANSACTION或者BEGIN,作用是显式开启一个事务。 START TRANSACTION语句相较于BEGIN特别之处在于,后面能跟几个修饰符。比如: READ ONLY&…...

Ruby、Python、Java 开发者必备:Codigger之软件项目体检

在编程的广阔天地里,Ruby、Python 和 Java 开发者们各自凭借着独特的语言特性,构建着精彩纷呈的应用世界。然而,无论使用哪种语言,确保项目的高质量始终是至关重要的目标。而 Codigger 项目体检则成为了实现这一目标的得力助手&am…...

day05 Router、vuex、axios

配置 router和vuex需要在创建vue项目的时候,开始的时候选择Manually select features,于是就可以在下一个创建配置讯问中选择router和vuex。 axios则需要执行命令行: npm install axios -S 之后再在需要发送请求的view导入即可。 router…...

yolov5-7在opencv里跑自己的onnx模型

先把模型放在如下目录 运行如下代码 import cv2 import numpy as npclass Onnx_clf:def __init__(self, onnx:strdnn_model1/plane02.onnx, img_size640, classlist:list[plane]) -> None: func: 读取onnx模型,并进行目标识别para onnx:模型路径img_size:输出图片大小,和模…...

JVM 11 的优化指南:如何进行JVM调优,JVM调优参数有哪些

这篇文章将详细介绍如何进行JVM 11调优,包括JVM 11调优参数及其应用。此外,我将提供12个实用的代码示例,每个示例都会结合JVM启动参数和Java代码。 本文已收录于,我的技术网站 java-broke.site,有大厂完整面经&#x…...

nginx的配置和使用

一、nginx支持win和linux版本的下载,选择合适的版本进行安装 二、配置文件注解 重点的几个参数进行注释: 1、listen 要监听的服务的端口,符合这个端口的才会被监听 server_name要监听的服务地址,可能是ip,也可能是域名&#xf…...

mysql面试(六)

前言 本章节详细讲解了一下mysql执行计划相关的属性释义,以及不同sql所出现的不同效果 执行计划 一条查询语句经过mysql查询优化器的各种基于成本和各种规则优化之后,会生成一个所谓的 执行计划,这个执行计划展示了这条查询语句具体查询方…...

6.乳腺癌良性恶性预测(二分类、逻辑回归、PCA降维、SVD奇异值分解)

乳腺癌良性恶性预测 1. 特征工程1.1 特征筛选1.2 特征降维 PCA1.3 SVD奇异值分解 2. 代码2.1 逻辑回归、二分类问题2.2 特征降维 PCA2.3 SVD奇异值分解 1. 特征工程 专业上:30个人特征来自于临床一线专家,每个特征和都有医学内涵;数据上&…...

Vue3响应式高阶用法之markRaw()

Vue3响应式高阶用法之markRaw() 文章目录 Vue3响应式高阶用法之markRaw()一、简介二、使用场景2.1 避免性能开销2.2 防止意外修改 三、基本使用3.1 标记对象 四、功能详解4.1 markRaw与reactive的区别4.2 markRaw与ref的区别 五、最佳实践及案例5.1 使用大型第三方库对象5.2 静…...

免费SSL证书的安全性与获取指南

SSL证书是一种数字凭证,用于加密用户与网站之间的信息交换,以确保传输的数据不被第三方窃取。它像是一个数字版的密封印章,为数据的传输过程提供了一层保护膜。 免费的SSL证书通常由CA机构提供,它们同样可以提供基础数据的加密服…...

【CN】Argo 持续集成和交付(一)

1.简介 Argo 英 [ˈɑ:ɡəu] 美 [ˈɑrˌɡo] Kubernetes 原生工具,用于运行工作流程、管理集群以及正确执行 GitOps。 Argo 于 2020 年 3 月 26 日被 CNCF 接受为孵化成熟度级别,然后于 2022 年 12 月 6 日转移到毕业成熟度级别。 argoproj.github.i…...

Unity3D 自定义Debug双击溯源问题详解

前言 在Unity3D的开发过程中,经常需要处理各种交互和事件,其中双击事件是常见的需求之一。然而,由于Unity自带的双击检测机制并不完善,开发者往往需要自定义实现以满足特定需求。本文将详细介绍如何在Unity3D中自定义Debug双击溯…...

环境搭建-Docker搭建ClickHouse

Docker搭建ClickHouse 一、前言二、ClickHouse安装2.1 拉取镜像运行ClickHouse服务 三、测试安装3.1 进入clickhouse容器3.2 命令补充说明 四、测试连接五、设置CK的用户名密码 一、前言 本文使用的Docker使用Windows搭建,Linux版本的搭建方式一样。 Windows系统搭…...

深入理解CSS中的变量(概念篇)

CSS变量,也称为自定义属性,是一种在CSS中定义和重用值的方式。它们允许开发者在一个地方定义样式值,然后在整个样式表中引用这些值,从而提高代码的可维护性和可读性。 1、定义和使用CSS变量 CSS变量的定义和使用非常简单。变量名以两个连字符开头,变量值为任何有效的CSS…...

Prometheus 监控Tomcat等java应用的状态

5月应用服务出现问题,当别的小伙伴问我,有没有Tomcat等应用状态的监控的时候,我有点儿尴尬。所以赶紧抽空部署一下。 在配置之前,就当已经会安装jdk和tomcat了。 一、下载jmx_exporter #linux下 cd /usr/local/prometheus wget …...

c++中的斐波那契数列(Fibonacci Sequence)和背包问题(Knapsack Problem)

前言 hello,大家好啊,我是文宇,不是文字,是文宇哦。 斐波那契数列(Fibonacci Sequence) 斐波那契数列(Fibonacci Sequence)是一个经典的数学问题,其中每个数都是前两个…...

connect的非阻塞模式

本文参考:connect 函数在阻塞和非阻塞模式下的行为 一般情况下,在使用connect连接服务端时,需要等待一会儿才会函数才会返回,导致程序阻塞。为了降低阻塞的影响,我们可能会单独开个线程处理connect请求,例…...

jenkins面试题全集

1. 简述什么是Jenkins ? Jenkins是一个开源的持续集成的服务器,Jenkins开源帮助我们自动构建各类项目。 Jenkins强大的插件式,使得Jenkins可以集成很多软件,可以帮助我们持续集成我们的工程项目,对于我们测试来说&…...

Python中最好学和最实用的有哪些库和框架

Python拥有丰富的库和框架,这些库和框架覆盖了从数据处理、科学计算、Web开发到机器学习等多个领域。以下是一些值得学习的Python库和框架: 数据处理与科学计算 NumPy 描述:NumPy是Python中用于科学计算的一个库,它提供了一个强…...

文件解析的终极工具:Apache Tika

文件解析的终极工具:Apache Tika Apache Tika 简介 Apache Tika 是一个开源的、跨平台的库,用于检测、提取和解析各种类型文件的元数据。 它支持多种文件格式,包括文档、图片、音频和视频。 Tika是一个底层库,经常用于搜索引擎…...

Hadoop 重要监控指标

某安卓逆向课程打包下载(92节课) ​​https://pan.quark.cn/s/53cec8b8055a ​​ 某PC逆向课程(100节课打包下载) ​​https://pan.quark.cn/s/e38f2b24f36c​​ Hadoop 是一个开源的分布式存储和计算框架,广泛应用…...

oracle 查询锁表

oracle 查询锁表 SELECT o.object_name, s.sid, s.serial#, p.spid, s.username, s.program FROM v l o c k e d o b j e c t l J O I N d b a o b j e c t s o O N l . o b j e c t i d o . o b j e c t i d J O I N v locked_object l JOIN dba_objects o ON l.object_id …...

进程概念(三)----- fork 初识

目录 前言1. pid && ppid2. forka. 为什么 fork 要给子进程返回 0, 给父进程返回子进程的 pid ?b. 一个函数是如何做到两次的?c. fork 函数在干什么?d. 一个变量怎么做到拥有不同的内容的?e. 拓展:…...

huawei 路由 RIP 协议中三种定时器的工作原理

RFC2453 定义的三种 RIP 协议定时器 更新定时器(Update Timer):用于触发更新报文的发送,超时时间为 30 秒。老化定时器(Age Timer):如果在老化时间内没有收到邻居发送的响应报文,则…...

HTML常见标签——超链接a标签

一、a标签简介 二、a标签属性 href属性 target属性 三、a标签的作用 利用a标签进行页面跳转 利用a标签返回页面顶部以及跳转页面指定区域 利用a标签实现文件下载 一、a标签简介 <a>标签用于做跳转、导航&#xff0c;是双标签&#xff0c;记作<a></a>&#…...

Python 爬虫入门(一):从零开始学爬虫 「详细介绍」

Python 爬虫入门&#xff08;一&#xff09;&#xff1a;从零开始学爬虫 「详细介绍」 前言1.爬虫概念1.1 什么是爬虫&#xff1f;1.2 爬虫的工作原理 2. HTTP 简述2.1 什么是 HTTP&#xff1f;2.2 HTTP 请求2.3 HTTP 响应2.4 常见的 HTTP 方法 3. 网页的组成3.1 HTML3.2 CSS3.…...

Linux嵌入式学习——数据结构——概念和Seqlist

数据结构 相互之间存在一种或多种特定关系的数据元素的集合。 逻辑结构 集合&#xff0c;所有数据在同一个集合中&#xff0c;关系平等。 线性&#xff0c;数据和数据之间是一对一的关系。数组就是线性表的一种。 树&#xff0c; 一对多 图&#xff0c;多对多 …...

iOS ------ Block的相关问题

Block的定义 Block可以截获局部变量的匿名函数&#xff0c; 是将函数及其执行上下文封装起来的对象。 Block的实现 通过Clang将以下的OC代码转化为C代码 // Clang xcrun -sdk iphoneos clang -arch arm64 -rewrite-objc main.m//main.m #import <Foundation/Foundation.…...

conda issue

Conda 是一个跨平台、通用的二进制包管理器。它是 Anaconda 安装使用的包管理器&#xff0c;但它也可能用于其他系统。Conda 完全用 Python 编写&#xff0c;并且是 BSD 许可的开源。通用意味着大部分的包都可以用它进行管理&#xff0c;很像一个跨平台版本的apt或者yum&#x…...

为了解决地图引入鉴权失败的解决方案

在以下文件中需要添加相应代码 app/controller/CollageProduct.php app/view/designer_page/designer_editor.html app/view/designer_page/designer.html app/controller/Freight.php app\controller\Business.php app\controller\DesignerPage.php 只有这样才能保证htt…...

[ptrade交易实战] 第十八篇 期货查询类函数和期货设置类函数

前言 今天主要和大家分享的是期货查询类的函数和期货设置类的函数&#xff01; 具体的开通渠道可以看文章末尾&#xff01; 一、get_margin_rate—— 获取用户设置的保证金比例 保证金是期货交易中的一个重点&#xff0c;这个函数就是用来获取我们设置的保证金比例的&#…...

STM32智能家居控制系统教程

目录 引言环境准备智能家居控制系统基础代码实现&#xff1a;实现智能家居控制系统 4.1 数据采集模块 4.2 数据处理与分析模块 4.3 通信与网络系统实现 4.4 用户界面与数据可视化应用场景&#xff1a;家居监测与优化问题解决方案与优化收尾与总结 1. 引言 智能家居控制系统通…...

FPGA 中的 IOE与IO BANK

IO bank&#xff08;输入/输出bank&#xff09; 定义&#xff1a;IO bank 是 FPGA 中一组 IOE 的集合&#xff0c;通常共享相同的电源电压、时钟域和时序管理。每个 IO bank 包含多个 IOE&#xff0c;它们可以根据需要分配给不同的信号处理任务。作用&#xff1a;IO bank 的存…...

ADetailer模型+Stable Diffusion的inpainting功能是如何对遮罩区域进行修复生成的ADetailer

模型选则&#xff1a; face_yolov8n.pt 和 face_yolov8s.pt&#xff1a; 用途&#xff1a;用于人脸检测。特点&#xff1a;YOLOv8n 是轻量级版本&#xff0c;适合资源有限的设备&#xff1b;YOLOv8s 是标准版本&#xff0c;检测精度更高。 hand_yolov8n.pt&#xff1a; 用途&am…...