当前位置: 首页 > news >正文

网站服务器服务商/全网关键词云在哪里看

网站服务器服务商,全网关键词云在哪里看,台州路桥网站建设,域名网站可以做多个品牌产品吗引言: 问题: 当前的多模态任务(如图像、视频、音频描述生成、编辑、生成等)通常需要针对特定任务训练专门的模型,而现有的方法在跨模态泛化方面存在局限性,难以适应新任务。此外,多模态嵌入反演…

引言:

问题:

         当前的多模态任务(如图像、视频、音频描述生成、编辑、生成等)通常需要针对特定任务训练专门的模型,而现有的方法在跨模态泛化方面存在局限性,难以适应新任务。此外,多模态嵌入反演等问题通常依赖梯度优化,限制了其实用性。

解决方案:

       MILS(Multimodal Iterative LLM Solver) 是一种免训练的方法,通过迭代反馈机制,让大语言模型(LLM)作为“生成器”提出候选方案,并使用现成的多模态模型(如 CLIP)作为“评分器”对方案进行评估和反馈,最终收敛至高质量的解决方案。该方法无需额外训练,能够适用于多种多模态任务。

一:MILS是什么原理-结构?

MILS是免训练的(training-free),仅使用测试样本作为输入。它依赖于两个关键模块,称为 GENERATOR(生成器)和 SCORER(评分器)。GENERATOR 生成任务的候选解决方案,而 SCORER 对这些候选方案进行评分,并将它们反馈给 GENERATOR,以生成改进后的候选集。对于某些任务,该过程可能会通过初始候选集的评分进行引导。该优化过程会运行至收敛或达到设定的迭代次数,最终生成任务的最终解决方案。

1:GENERATOR(生成器)

GENERATOR 的目标是生成候选输出 ,以解决给定任务。它的输入包括某些文本 ,其中包含任务的描述,以及来自 SCORER 的评分 (如果有的话),用于优化过程的上一轮。GENERATOR 利用这些信息生成下一组候选方案。

GENERATOR 通常使用 LLM 来建模,因为它可以接收文本输入并进行推理。然而,它的输出不限于文本,候选生成结果也可以用于引导后续模型生成其他模态数据,例如使用文本到图像(T2I)模型(如 Emu)生成图像。一些 GENERATOR 也可以将测试样本作为输入,例如在图像编辑或风格化任务中。

2:SCORER(评分器)

SCORER 的目标是为 GENERATOR 生成的候选方案  计算标量评分 。它的输入是测试样本和候选方案 ,并对它们进行比较。SCORER 可以采用多种不同的实现方式,例如:

  • 低级图像处理函数,可以比较两张图片的纹理;

  • 经过训练的机器学习模型,例如 CLIP。

SCORER 根据评分对所有候选方案进行排序,并返回前  个候选方案及其得分。根据 GENERATOR 的能力(如上下文长度),SCORER 可以返回完整的评分列表,或采用 -贪心策略(-greedy strategy)以包含一些低分候选方案。在初步实验中,发现贪心选择前 (top-K)方案效果最佳,因此在本研究中采用该方法。评分结果会格式化为文本 ,并传递回 GENERATOR

3:优化过程

MILS 在 SCORER 的损失函数下搜索最优生成方案 C。该优化过程运行N 轮,或直到收敛。收敛可通过候选集  在连续步骤中的相似性来定义。根据不同任务,该优化过程可以通过初始候选方案集引导,并对其进行评分。例如,在图像描述生成任务中,初始候选方案可以是 GENERATOR 生成的大量图像描述。而对于文本到图像(T2I)等任务,则无需这样的初始集合。

二:实验的反馈分析

1:实验综合解析:

对 MILS 进行了实验评估,并将其与现有方法进行分析比较,涵盖其在多模态理解和生成任务中的应用。对于每个下游任务,依次介绍 GENERATORSCORER、基准测试和评估设置,然后给出关键实验结果。最后对 MILS 的各种设计选择进行消融分析。

MILS 是一种测试时优化(test-time optimization)方法,并展现出 零样本(zero-shot)能力。它不仅能泛化到新的测试数据分布,还能泛化到新的任务和模态。这与大多数现有的零样本方法形成对比,后者通常需要任务或模态特定的数据整理或训练。由于大多数先前工作属于后者类型,因此很难进行公平比较。然而,仍然与最接近的零样本方法进行比较,并证明 MILS 在许多情况下可以与专门针对特定任务或模态优化的方法相媲美,甚至更优。

2:图像描述生成

研究图像理解的基本任务——为给定图像生成文本描述。

GENERATOR本文使用 Llama 3.1 8B (Dubey et al., 2024) 作为主要的生成模块。首先,生成一个包含 30K 个提示词的初始列表,并用于引导优化过程。为了确保初始集合的多样性,使用不同的对象类别对 LLM 进行提示,并将生成的提示词组合在一起,类似于 (Gandelsman et al., 2024)。然后,在每个优化步骤中,保留 SCORER 评分最高的前 50 个生成结果,并将其转换为文本提示词。所使用的提示词描述详见附录。整个优化过程运行 10 轮

SCORER 使用图像-文本相似性模型 SigLIP 对候选描述进行评分。值得注意的是,与利用精心整理的图像-文本对进行训练的传统图像描述模型不同,SigLIP 本身并不具备描述生成能力。然而,当与 MILS 结合时,它能够充当一个有效的描述生成器

基准测试和评价指标
在 MSCOCO 描述测试集 上评估 MILS。该测试集包含从 MSCOCO 数据集 中抽取的 5,000 张图像。采用标准的描述评价指标,包括:

  • BLEU

  • METEOR

  • CIDEr

  • SPICE

特别关注 METEOR 和 SPICE 指标,因为它们更侧重于语义相似性,而非严格的词匹配,并且与人类偏好更相关。这对像 MILS 这样不依赖特定任务训练的零样本方法 尤为重要,因为它不会学习某个特定基准测试或模态中的词汇。

图像实验结果

将 MILS 与现有基线方法进行比较。一些基线方法,如 ZeroCap,也结合了语言模型和类似 CLIP 的模型,但它们提出了一种基于梯度优化的搜索方法,以在当前生成的基础上寻找最优的下一个 token。

另一些方法,如 MeaCap,则从一个记忆模块中筛选关键概念,并结合多个文本和多模态编码器,在多步过程中生成描述。相比之下,MILS 的概念更加简单,实现更为直接,同时还能取得更好的结果。下图 3 中展示了 MILS 生成的描述示例,并将其与 MeaCap 进行对比。值得注意的是,MILS 无需任何描述数据或特定于描述生成的训练,即可生成忠实且语法正确的描述。

3:视频描述生成

由于其简单性和通用性,MILS 可无缝适用于视频,无需进行重大更改。使用与前面图像描述生成相同的 GENERATOR,并采用相同的初始提示词集。对于 SCORER,使用 ViCLIP ViT-L/14 模型,该模型基于视频的 8 帧计算视频与描述之间的相似度得分。

在 MSR-VTT测试集上进行实验,该数据集包含 2,990 个视频,每个视频时长 10 到 30 秒。结果如下表 2 所示。由于大多数现有视频描述生成方法依赖于视频-描述训练数据,将 MILS 与 Nagrani 等人(2022)的模型进行比较,该模型在 HowTo100M或 VideoCC3M数据集上训练,并在 MSR-VTT 上进行评估。

采用 CIDEr和 METEOR指标进行评测,这些指标与之前的研究保持一致。结果表明,尽管 MILS 从未针对视频描述任务进行过训练,但在 CIDEr 和 METEOR 指标上均优于在 HowTo100M 训练的 Nagrani 等人(2022)模型。即使与在数据质量更高的 VideoCC3M 上训练的同一模型相比,MILS 仍然在语义敏感的 METEOR 指标上表现更佳。这种基线模型在不同训练数据上的表现差异,表明训练数据对视频描述模型的重要性。而 MILS 无需任何视频描述训练即可达到竞争水平,展现出极大的潜力。

4:音频描述生成

与视频类似,MILS 也可以无缝适用于音频描述生成。使用与前面相同的 GENERATOR,并结合 LLM 生成的 50,000 条初始音频提示词。作为 SCORER,采用 ImageBind 模型,该模型能将音频、文本等多种模态映射到同一嵌入空间。

在 Clotho数据集上评估该方法,该数据集是一个常用的音频描述数据集。评测使用自动描述生成指标。结果如下表 3 所示。MILS 在对比可比的零样本方法 ZerAuCaps时表现出色,特别是在 METEOR 和 SPICE 等语义敏感指标上表现更优。尽管已有其他音频描述生成方法被提出,但它们需要在音频-描述数据上进行训练。更多定性分析结果见附录 C。

5:高质量图像生成

如前所述,MILS 并不仅限于前述的多模态理解任务。介绍 MILS 如何用于多模态生成任务,首先是提升文本到图像(T2I)生成模型的质量。

GENERATOR。为了生成高质量图像,将 LLM 与 T2I 模型串联使用。本文实验了两种最先进的模型:隐空间扩散模型(LDM)和 FLUX.1 [schnell](Labs)。LLM 的目标是“重写”输入到 T2I 模型的提示词,使最终生成的图像质量提升,同时保持或增强对原始文本提示词的忠实度。值得注意的是,此 GENERATOR 不需要 依赖初始提示词集进行引导。

SCORER。使用 PickScore(对生成结果进行评分。PickScore 是一种类似 CLIP 的模型,它接受图像和文本提示词作为输入,并预测该图像在该提示词下被人类偏好的可能性。使用 PickScore 计算 GENERATOR 生成的每张图像与输入提示词的匹配得分,并返回每个生成结果的得分。其余流程与前述任务保持一致。

基准测试与评测指标。使用 Imagen 的 DrawBench 提示词集 进行评测,该数据集包含 200 条文本提示词。由于自动评测指标在媒体生成任务中的噪声较大,采用 Amazon Mechanical Turk(AMT)上的人工标注者进行评测,并遵循 JUICE 框架

按照媒体生成的标准评测方法,在两个维度上评估生成质量:

  • 视觉质量(美学吸引力)

  • 文本忠实度(与输入文本的一致性)

在每个评测任务中,标注者会看到两张图像,一张是基线模型生成的,另一张是经过 MILS 增强的。对于 文本忠实度 评测,标注者还会看到原始文本提示词。标注者需选择他们更偏好的图像。每张图像由三位标注者独立评估,采用 多数投票 计算各模型的胜率(win%)。完整的人工评测细节见下面:

高质量图像的结果是:

下图 4 总结了人工评测的结果。从胜率可以看出,人工标注者明显更偏好 MILS 增强后的图像,而非基线模型直接生成的图像。下图 5 展示了定性对比,MILS 在美学质量上的提升尤为明显。MILS 能够简化复杂提示词,并添加美学细节,从而提升生成图像的整体质量和忠实度。

基于 LLM 的提示词重写可以提高媒体生成的表现。然而,这些方法通常需要手动尝试多种不同的重写方案,直至找到适用于该模型的最佳提示词。MILS 能够自动化并辅助这一过程,既可以在每次生成时进行提示词优化,也可以为专家提示词工程师提供备选方案以进一步改进。

先前在其他任务中对比的方法很难具备这一能力。这些方法通常需要通过多步扩散过程计算梯度,以估计 LLM 应该生成哪些 token。而 MILS 采用无梯度优化(gradient-free optimization)方法,因此能够在一个简单框架下轻松扩展至多种不同应用场景。

6:风格迁移

除了图像生成,MILS 还可以应用于图像编辑任务。这里特别考虑风格迁移任务,其中给定测试图像和风格图像,目标是生成一张包含测试图像内容且具有风格图像风格的图像。

生成器。本文通过将 LLM 的输出链接到图像生成模型来实现生成器。与前面不同的是,由于希望生成与测试样本相同的内容,生成器还将测试样本作为输入。因此,使用图像编辑模型作为图像生成模块。它根据测试样本和来自 LLM 的编辑提示生成风格化图像。

评分器。为了衡量风格迁移的质量,使用一种简单的方法来估计生成图像与风格图像在颜色和纹理上的相似性。使用图像特征的 Gram 矩阵之间的距离,如(Gatys,2015)所提出的。在 VGG19(Simonyan & Zisserman,2015)CNN 的不同层特征上计算此距离,其中较低层确保风格忠实性,较高层确保内容忠实性。使用 MILS 来最小化风格和内容损失。

结果。下图 6 展示了一些风格迁移的示例结果。MILS 完全零样本泛化到这一新任务,并生成准确风格化的图像。请注意,它不仅无需任何训练就能实现此类编辑,而且 LLM 实际上并未看到测试样本或风格图像的任何特征!

7:跨模态计算

探索了 MILS 实现的一个有趣应用。与之前的工作将嵌入映射到连续图像空间不同,MILS 中的无梯度方法能够将此类嵌入反转到离散文本空间。这在前面的结果中也有所体现。这实现了一个有趣的跨模态计算应用。

从 ImageBind中获得灵感,它将多种不同模态映射到图像嵌入空间。利用这一共享嵌入,作者能够组合模态,并根据该组合生成或检索图像。实际上,MILS 更加灵活,因为反转到文本可以与更多模型进行交互。例如,ImageBind 通过利用类似 DALLE-2 的 T2I 模型展示了音频到图像生成的结果。这是可能的,因为 ImageBind 恰好与 CLIP 嵌入空间对齐,而 CLIP 嵌入空间与 DALLE-2 使用的相同。因此,ImageBind 与任何其他 T2I 模型(例如隐空间扩散模型)不兼容。另一方面,文本表示可以与任何 T2I 模型兼容,包括那些不将文本输入表示为嵌入空间中的点的模型。

在下图 7 中,展示了组合图像和音频模态的示例。首先将图像和音频反转到文本,使用 LLM 组合这两个输出(详见附录B),最后将提示转换为高质量图像。生成的图像结合了这两种模态的语义概念。

8:消融实验

现在对 MILS 中的一些关键设计选择进行消融实验。主要将分析重点放在图像描述任务上,并在部分消融实验中改进图像生成。为了计算方便,从 MSCOCO 中随机抽取 1000 张图像进行描述,并使用包含 200 个提示的 DrawBench 集作为图像生成的测试集。报告了包括 CLIP 相似性和 PickScore 在内的所有指标,这些指标均在这些集合上取平均值。

优化步骤的性能。在下图 9 中对这两个任务进行了评估。报告了评分器的输出(可以视为本文设置中的“训练损失”)以及下游指标。对于图像描述任务,报告了 SPICE;对于文本到图像生成任务,报告了与原始提示生成结果的人类评估对比。对于后者,还展示了 ±4 点的误差条,这是在人类评估中发现的典型随机方差范围。如图 9 所示,评分器输出和下游指标都随着优化步骤的增加而改善,并在 10 到 20 步后收敛。还注意到,优化目标(评分器输出)与下游性能密切相关。

最后,在下图 8 和图 11 中分别对描述和生成任务进行了定性可视化。在这两种情况下,输出的质量都随着步骤的增加而提高,展示了 MILS 的有效性。

生成器和评分器的规模

在下图 12 中评估了生成器(Llama 3)和评分器(MetaCLIP)的规模(以参数数量衡量)对图像描述任务的影响。较大的模型通常表现更好,其中 LLM 的扩展表现出最有潜力的增益。还在附录 C 中尝试了不同类型的生成器和评分器。

三:总结与未来工作可能性

MILS,这是一种无需任何任务特定数据策展或训练即可解决多模态任务的简单方法。MILS 展现了对各种不同任务和模态的零样本泛化能力。值得注意的是,展示了 MILS 在图像、视频和音频三种模态的描述任务上均取得了强劲的性能,表明 LLM 无需任何训练即可“看到”和“听到”!这进一步推动并实现了各种媒体生成任务的改进,例如图像生成、图像编辑(风格迁移)和跨模态计算。

尽管前景广阔,但 MILS 仍存在一些局限性,未来的工作可以尝试解决。其性能受限于生成器生成多样化候选者的能力以及评分器为生成器提供准确反馈的能力。例如,风格迁移的性能受限于 Gram 矩阵距离在检测细粒度纹理相似性时的分辨率,以及 LLM 描述潜在风格的能力。随着 LLM 和多模态模型的不断改进,MILS 也会随之改进。另一个局限性是优化过程的速度。随着核心 LLM 变得更快速、更高效,以及其上下文长度和推理能力(OpenAI)的提升,优化步骤将减少,速度也会提高。将 MILS 应用于其他模态和任务(例如空间和 3D 任务)也将是一个有趣的方向。

论文地址:https://arxiv.org/pdf/2501.18096

相关文章:

LLMs瞬间获得视觉与听觉感知,无需专门训练:Meta的创新——在图像、音频和视频任务上实现最优性能。

引言: 问题: 当前的多模态任务(如图像、视频、音频描述生成、编辑、生成等)通常需要针对特定任务训练专门的模型,而现有的方法在跨模态泛化方面存在局限性,难以适应新任务。此外,多模态嵌入反演…...

自研有限元软件与ANSYS精度对比-Bar3D2Node三维杆单元模型-央视大裤衩实例

目录 1、“央视大裤衩”自研有限元软件求解 1.1、选择单元类型 1.2、导入“央视大裤衩”工程 1.3、节点坐标定义 1.4、单元连接关系、材料定义 1.5、约束定义 1.6、外载定义 1.7、矩阵求解 1.8、变形云图展示 1.9、节点位移 1.10、单元应力 1.11、节点支反力 2、“…...

kubernetes 高可用集群搭建

在生产环境中部署 Kubernetes 集群时,确保其高可用性(High Availability, HA)是至关重要的。高可用性不仅意味着减少服务中断时间,还能提高系统的稳定性和可靠性。本文将详细介绍如何搭建一个高可用的 Kubernetes 集群&#xff0c…...

【C++】STL——vector底层实现

目录 💕 1.vector三个核心 💕2.begin函数,end函数的实现(简单略讲) 💕3.size函数,capacity函数的实现 (简单略讲) 💕4.reserve函数实现 (细节…...

数据结构初探:链表之单链表篇

本文图皆为作者手绘,所有代码基于vs2022运行测试 系列文章目录 数据结构初探:顺序表篇 文章目录 系列文章目录前言一、链表基础概念二、链表的分类简化边界条件处理使代码更清晰简洁提高程序稳定性 1.单链表(不带头不循环的单链表);1.1存储结构;1.2准备工作1.3链表增删查改的实…...

介绍一下Mybatis的底层原理(包括一二级缓存)

表面上我们的就是Sql语句和我们的java对象进行映射,然后Mapper代理然后调用方法来操作数据库 底层的话我们就涉及到Sqlsession和Configuration 首先说一下SqlSession, 它可以被视为与数据库交互的一个会话,用于执行 SQL 语句(Ex…...

Linux基础 ——tmux vim 以及基本的shell语法

Linux 基础 ACWING y总的Linux基础课,看讲义作作笔记。 tmux tmux 可以干嘛? tmux可以分屏多开窗口,可以进行多个任务,断线,不会自动杀掉正在进行的进程。 tmux – session(会话,多个) – window(多个…...

64位的谷歌浏览器Chrome/Google Chrome

64位的谷歌浏览器Chrome/Google Chrome 在百度搜索关键字:chrome,即可下载官方的“谷歌浏览器Chrome/Google Chrome”,但它可能是32位的(切记注意网址:https://www.google.cn/...., 即:google.cn&#xff…...

jetson编译torchvision出现 No such file or directory: ‘:/usr/local/cuda/bin/nvcc‘

文章目录 1. 完整报错2. 解决方法 1. 完整报错 jetson编译torchvision,执行python3 setup.py install --user遇到报错 running build_ext error: [Errno 2] No such file or directory: :/usr/local/cuda/bin/nvcc完整报错信息如下: (pytorch) nxnx-desktop:~/Do…...

多线程创建方式三:实现Callable接口

实现Callable第三种方式存在的原因 作用:可以返回线程执行完毕后的结果。 前两种线程创建方式都存在的一个问题:假如线程执行完毕后有一些数据需要返回,他们重写的run方法均不能直接返回结果。 如何实现 ● JDK 5.0提供了Callable接口和FutureTask类来…...

Linux下的编辑器 —— vim

目录 1.什么是vim 2.vim的模式 认识常用的三种模式 三种模式之间的切换 命令模式和插入模式的转化 命令模式和底行模式的转化 插入模式和底行模式的转化 3.命令模式下的命令集 光标移动相关的命令 复制粘贴相关命令 撤销删除相关命令 查找相关命令 批量化注释和去…...

Docker技术相关学习二

一、Docker简介 1.Docker之父Solomon Hykes形容docker就像传统的货运集装箱。 2.docker的特点和优势: 轻量级虚拟化:Docker容器相较于传统的虚拟机更加的轻量和高效,能够快速的启动和停止来节省系统资源。 一致性:确保应用程序在不…...

【人工智能】多模态学习在Python中的应用:结合图像与文本数据的深度探索

《Python OpenCV从菜鸟到高手》带你进入图像处理与计算机视觉的大门! 解锁Python编程的无限可能:《奇妙的Python》带你漫游代码世界 多模态学习是人工智能领域的一个重要研究方向,旨在通过结合多种类型的数据(如图像、文本、音频等)来提高模型的性能。本文将深入探讨多模…...

【MySQL】常用语句

目录 1. 数据库操作2. 表操作3. 数据操作(CRUD)4. 高级查询5. 索引管理6. 用户与权限7. 数据导入导出8. 事务控制9. 其他实用语句注意事项 如果这篇文章对你有所帮助,渴望获得你的一个点赞! 1. 数据库操作 创建数据库 CREATE DATA…...

Docker网络基础

一、Docker网络基础 1.docker安装后会自动创建3中网络,分别为bridge host none docker network ls 2.docker原生bridge网络: docker安装时会创建一个名为docker0的linux bridge,新建的容器会自动桥接到这个接口 bridge模式下没有公有ip,只有宿主机可以…...

重新刷题求职2-DAY2

977. 有序数组的平方 给你一个按 非递减顺序 排序的整数数组 nums,返回 每个数字的平方 组成的新数组,要求也按 非递减顺序 排序。 示例 1: 输入:nums [-4,-1,0,3,10] 输出:[0,1,9,16,100] 解释:平方后…...

[STM32 标准库]EXTI应用场景 功能框图 寄存器

一、EXTI 外部中断在嵌入式系统中有广泛的应用场景,如按钮开关控制,传感器触发,通信接口中断等。其原理都差不多,STM32会对外部中断引脚的边沿进行检测,若检测到相应的边沿会触发中断,在中断中做出相应的处…...

Slint的学习

Slint是什么 Slint是一个跨平台的UI工具包,支持windows,linux,android,ios,web,可以用它来构建申明式UI,后端代码支持rust,c,python,nodejs等语言。 开源地址:https://github.com/slint-ui/slint 镜像地址:https://kkgithub.com/…...

STM32 DMA+AD多通道

接线图 代码配置 ADC单次扫描DMA单次转运模式 uint16_t AD_Value[4]; //DMAAD多通道 void DMA_Config(void) {//定义结构体变量 GPIO_InitTypeDef GPIO_InitStructure;//定义GPIO结构体变量 ADC_InitTypeDef ADC_InitStructure; //定义ADC结构体变量 DMA_InitTypeDef DMA_In…...

如何构建ObjC语言编译环境?构建无比简洁的clang编译ObjC环境?Windows搭建Swift语言编译环境?

如何构建ObjC语言编译环境? 除了在线ObjC编译器,本地环境Windows/Mac/Linux均可以搭建ObjC编译环境。 Mac自然不用多说,ObjC是亲儿子。(WSL Ubuntu 22.04) Ubuntu可以安装gobjc/gnustep和gnustep-devel构建编译环境。 sudo apt-get install gobjc gnus…...

【C语言】指针详解:概念、类型与解引用

博客主页: [小ᶻ☡꙳ᵃⁱᵍᶜ꙳] 本文专栏: C语言 文章目录 💯前言💯指针的基本概念1. 什么是指针2. 指针的基本操作 💯指针的类型1. 指针的大小2. 指针类型与所指向的数据类型3. 指针类型与数据访问的关系4. 指针类型的实际意…...

VoIP中常见术语

在 VoIP(Voice over Internet Protocol,基于互联网协议的语音传输)技术中,涉及许多专业术语。以下是常见术语及其含义: 1. 核心协议相关 SIP(Session Initiation Protocol,会话发起协议&#xf…...

360嵌入式开发面试题及参考答案

解释一下 802.11ax 和 802.11ac/n 有什么区别 速度与带宽 802.11n 支持的最高理论速率为 600Mbps,802.11ac 进一步提升,单流最高可达 866.7Mbps,多流情况下能达到更高,如 1.3Gbps 等。而 802.11ax(Wi-Fi 6)引入了更多先进技术,理论最高速率可达 9.6Gbps,相比前两者有大…...

物理群晖SA6400核显直通win10虚拟机(VMM)

写在前面:请先确保你的核显驱动支持开启SR-IOV 确保你的BIOS开启了以下选项: VT-D VMX IOMMU Above 4G ResizeBAR 自行通过以下命令确认支持情况: dmesg | grep -i iommudmesg | grep DMAR分配1个虚拟vGPU:echo 1 | sudo tee /sy…...

【NLP 20、Encoding编码 和 Embedding嵌入】

目录 一、核心定义与区别 二、常见Encoding编码 (1) 独热编码(One-Hot Encoding) (2) 位置编码(Positional Encoding) (3) 标签编码(Label Encoding) (4) 注意事项 三、常见Embedding词嵌入 (1) 基础词嵌入…...

雷赛LC2000

【一,概述】 这个是中型PLC 【二,外观】 网口编号: 【2】【3】 //默认ip:192.168.1.xxx 【0】【1】 可视化授权不如禾川Q系。 【三,总线轴】 因为本次带的轴是台达A2系列伺服 A2最快总线是【1ms】的倍数…...

ESP32开发工具介绍:Thonny——初学者的MicroPython利器

文章目录 引言什么是 Thonny?为什么选择 Thonny 开发 ESP32?1. **MicroPython 的天然支持**2. **极简的配置流程**3. **适合快速原型开发**如何用 Thonny 开发 ESP32?步骤 1:准备工作步骤 2:烧录 MicroPython 固件步骤 3:在 Thonny 中连接 ESP32步骤 4:编写并运行代码Th…...

【Go语言圣经】第六节:方法

第六章:方法 6.1 方法声明 在函数声明时,在其名字之前放上一个变量,这就是声明了变量对应类型的一个方法,相当于为这种类型定义了一个独占的方法。 下例为 Point 类型声明了计算两个点之间距离的方法: package mai…...

【Leetcode刷题记录】45. 跳跃游戏 II--贪心算法

45. 跳跃游戏 II 给定一个长度为 n 的 0 索引整数数组 nums。初始位置为 nums[0]。 每个元素 nums[i] 表示从索引 i 向后跳转的最大长度。换句话说&#xff0c;如果你在 nums[i] 处&#xff0c;你可以跳转到任意 nums[i j] 处: 0 < j < nums[i]i j < n 返回到达 num…...

mysql_init和mysql_real_connect的形象化认识

解析总结 1. mysql_init 的作用 mysql_init 用于初始化一个 MYSQL 结构体&#xff0c;为后续数据库连接和操作做准备。该结构体存储连接配置及状态信息&#xff0c;是 MySQL C API 的核心句柄。 示例&#xff1a; MYSQL *conn mysql_init(NULL); // 初始化连接句柄2. mysql_…...