凡客诚品网站设计特点/上海网络推广软件
算法暑期实习机会快结束了,校招大考即将来袭。
当前就业环境已不再是那个双向奔赴时代了。求职者在变多,岗位在变少,要求还更高了。
最近,我们陆续整理了很多大厂的面试题,帮助球友解惑答疑和职业规划,分享了面试中的那些弯弯绕绕。
分享100道大模型面试八股文,喜欢记得点赞、收藏、关注:
-
你了解ReAct吗,它有什么优点?
-
解释一下langchain Agent的概念
-
langchain 有哪些替代方案?
-
langchain token计数有什么问题?如何解决?
-
LLM预训练阶段有哪几个关键步骤?
-
RLHF模型为什么会表现比SFT更好?
-
参数高效的微调(PEFT)有哪些方法?
-
LORA微调相比于微调适配器或前缀微调有什么优势?
-
你了解过什么是稀疏微调吗?
-
训练后量化(PTQ)和量化感知训练(QAT)有什么区别?
-
LLMs中,量化权重和量化激活的区别是什么?
-
AWQ量化的步骤是什么?
-
介绍一下GPipe推理框架
-
矩阵乘法如何做数量并行?
-
请简述TPPO算法流程,它跟TRPO的区别是什么?
-
什么是检索增强生成(RAG)?
-
目前主流的中文向量模型有哪些?
-
为什么LLM的知识更新很困难?
-
RAG和微调的区别是什么?
-
大模型一般评测方法及其准是什么?
-
什么是Kv cache技术,它具体是如何实现的?
-
DeepSpeed推理对算子融合做了哪些优化?
-
简述一下FlashAttention的原理
-
MHA、GQA、MQA三种注意力机制的区别是什么?
-
请介绍一下微软的ZeRO优化器
-
Paged Attention的原理是什么,解决了LLM中的什么问题?
-
什么是投机采样技术,请举例说明?
-
简述GPT和BERT的区别
-
讲一下GPT系列模型的是如何演进的?
-
为什么现在的大模型大多是decoder-only的架构?
-
讲一下生成式语言模型的工作机理
-
哪些因素会导致LLM中的偏见?
-
LLM中的因果语言建模与掩码语言建模有什么区别?
-
如何减轻LLM中的“幻觉”现象?
-
解释ChatGPT的“零样本”和“少样本”学习的概念
-
你了解大型语言模型中的哪些分词技术?
-
如何评估大语言模型(LLMs)的性能?
-
如何缓解LLMs复读机问题?
-
请简述下Transformer基本原理
-
为什么Transformer的架构需要多头注意力机制?
-
为什么transformers需要位置编码?
-
transformer中,同一个词可以有不同的注意力权重吗?
-
Wordpiece与BPE之间的区别是什么?
-
有哪些常见的优化LLMs输出的技术?
-
GPT-3拥有的1750亿参数,是怎么算出来的?
-
温度系数和top-p、top-k参数有什么区别?
-
为什么transformer块使用LayerNorm而不是BatchNorm?
-
介绍一下post layer norm和pre layer norm的区别
-
什么是思维链(CoT)提示?
-
你觉得什么样的任务或领域适合用思维链提示?
-
目前主流的开源模型体系有哪些?
-
prefix LM和causal LM区别是什么?
-
涌现能力是啥原因?
-
大模型LLM的架构介绍?
-
什么是LLMs复读机问题?
-
为什么会出现LLMs复读机问题?
-
如何缓解LLMs复读机问题?
-
llama输入句子长度理论上可以无限长吗?
-
什么情况下用Bert模型,什么情况下用LLama、ChatGLM类大模型,咋选?
-
各个专长领域是否需要各自的大模型来服务?
-
如何让大模型处理更长的文本?
-
为什么大模型推理时显存涨的那么多还一直占着?
-
大模型在gpu和cpu上推理速度如何?
-
推理速度上,int8和fp16比起来怎么样?
-
大模型有推理能力吗?
-
大模型生成时的参数怎么设置?
-
有哪些省内存的大语言模型训练/微调/推理方法?
-
如何让大模型输出台规化
-
应用模式变更
-
大模型怎么评测?
-
大模型的honest原则是如何实现的?
-
模型如何判断回答的知识是训练过的已知的知识,怎么训练这种能力?
-
奖励模型需要和基础模型一致吗?
-
RLHF在实践过程中存在哪些不足?
-
如何解决人工产生的偏好数据集成本较高,很难量产问题?
-
如何解决三个阶段的训练(SFT->RM->PPO)过程较长,更新迭代较慢问题?
-
如何解决PPO的训练过程中同时存在4个模型(2训练,2推理),对计算资源的要求较高问题?
-
如何给LLM注入领域知识?
-
如果想要快速检验各种模型,该怎么办?
-
预训练数据Token重复是否影响模型性能?
-
什么是位置编码?
-
什么是绝对位置编码?
-
什么是相对位置编码?
-
旋转位置编码RoPE思路是什么?
-
旋转位置编码RoPE有什么优点?
-
什么是长度外推问题?
-
长度外推问题的解决方法有哪些?
-
ALiBi(Attention with Linear Biases)思路是什么?
-
ALiBi(Attention with Linear Biases)的偏置矩阵是什么?有什么作用?
-
ALiBi(Attention with Linear Biases)有什么优点?
-
Layer Norm的计算公式写一下?
-
RMS Norm的计算公式写一下?
-
RMS Norm相比于Layer Norm有什么特点?
-
Deep Norm思路?
-
写一下Deep Norm代码实现?
-
Deep Norm有什么优点?
-
LN在LLMs中的不同位置有什么区别么?如果有,能介绍一下区别么?
-
LLMs各模型分别用了哪种Layer normalization?
-
介绍一下FFN块计算公式?
-
介绍一下GeLU计算公式?
-
介绍一下Swish计算公式?
-
介绍一下使用GLU线性门控单元的FFN块计算公式?
-
介绍一下使用GeLU的GLU块计算公式?
-
介绍一下使用Swish的GLU块计算公式?
面试精选
-
《大模型面试宝典》(2024版) 正式发布!
-
一文搞懂 Transformer
-
一文搞懂 Attention(注意力)机制
-
一文搞懂 Self-Attention 和 Multi-Head Attention
-
一文搞懂 BERT(基于Transformer的双向编码器)
-
一文搞懂 GPT(Generative Pre-trained Transformer)
-
一文搞懂 Embedding(嵌入)
-
一文搞懂 Encoder-Decoder(编码器-解码器)
-
一文搞懂大模型的 Prompt Engineering(提示工程)
-
一文搞懂 Fine-tuning(大模型微调)
-
一文搞懂 LangChain
-
一文搞懂 LangChain 的 Retrieval 模块
-
一文搞懂 LangChain 的智能体 Agents 模块
-
一文搞懂 LangChain 的链 Chains 模块
相关文章:

100道大模型面试八股文
算法暑期实习机会快结束了,校招大考即将来袭。 当前就业环境已不再是那个双向奔赴时代了。求职者在变多,岗位在变少,要求还更高了。 最近,我们陆续整理了很多大厂的面试题,帮助球友解惑答疑和职业规划,分…...

【ARM Cache 及 MMU 系列文章 6.2 -- ARMv8/v9 Cache 内部数据读取方法详细介绍】
请阅读【ARM Cache 及 MMU/MPU 系列文章专栏导读】 及【嵌入式开发学习必备专栏】 文章目录 Direct access to internal memoryL1 cache encodingsL1 Cache Data 寄存器Cache 数据读取代码实现Direct access to internal memory 在ARMv8架构中,缓存(Cache)是用来加速数据访…...

使用Vue.js将form表单传递到后端
一.form表单 <form submit.prevent"submitForm"></form> form表单像这样写出来,然后把需要用户填写的内容写在form表单内。 二.表单内数据绑定 <div class"input-container"><div style"margin-left: 9px;"&…...

6、架构-服务端缓存
为系统引入缓存之前,第一件事情是确认系统是否真的需要缓 存。从开发角度来说,引入缓存会提 高系统复杂度,因为你要考虑缓存的失效、更新、一致性等问题;从运维角度来说,缓存会掩盖一些缺 陷,让问题在更久的…...

服务器遭遇UDP攻击时的应对与解决方案
UDP攻击作为分布式拒绝服务(DDoS)攻击的一种常见形式,通过发送大量的UDP数据包淹没目标服务器,导致网络拥塞、服务中断。本文旨在提供一套实用的策略与技术手段,帮助您识别、缓解乃至防御UDP攻击,确保服务器稳定运行。我们将探讨监…...

美团发布2024年一季度财报:营收733亿元,同比增长25%
6月6日,美团(股票代码:3690.HK)发布2024年第一季度业绩报告。受益于经济持续回暖和消费复苏,公司各项业务继续取得稳健增长,营收733亿元(人民币,下同),同比增长25%。 财报显示,一季度,美团继续…...

sql注入-布尔盲注
布尔盲注(Boolean Blind SQL Injection)是一种SQL注入攻击技术,用于在无法直接获得查询结果的情况下推断数据库信息;它通过发送不同的SQL查询来观察应用程序的响应,进而判断查询的真假,并逐步推断出有用的信…...

docker-compose部署 kafka 3.7 集群(3台服务器)并启用账号密码认证
文章目录 1. 规划2. 服务部署2.1 kafka-012.2 kafka-022.3 kafka-032.4 启动服务 3. 测试3.1 kafkamap搭建(测试工具)3.2 测试 1. 规划 服务IPkafka-0110.10.xxx.199kafka-0210.10.xxx.198kafka-0310.10.xxx.197kafkamp10.10.xxx.199 2. 服务部署 2.1…...

LeetCode-704. 二分查找【数组 二分查找】
LeetCode-704. 二分查找【数组 二分查找】 题目描述:解题思路一:注意开区间和闭区间背诵版:解题思路三: 题目描述: 给定一个 n 个元素有序的(升序)整型数组 nums 和一个目标值 target …...

Rust 性能分析
都说Rust性能好,但是也得代码写得好,猜猜下面两个代码哪个快 . - 力扣(LeetCode) use std::collections::HashMap; use lazy_static::lazy_static;lazy_static! {static ref DIGIT: HashMap<char, usize> {let mut m HashMap::new();for c in …...

Gradle和Maven都是广泛使用的项目自动化构建工具
Gradle和Maven都是广泛使用的项目自动化构建工具,但它们在多个方面存在差异。以下是关于Gradle和Maven的详细对比: 一、构建脚本语言 Maven:使用XML作为构建脚本语言。XML的语法较为繁琐,不够灵活,对于复杂的构建逻辑…...

Seed-TTS语音编辑有多强?对比实测结果让你惊叹!
GLM-4-9B 开源系列模型 前言 就在最近,ByteDance的研究人员最近推出了一系列名为Seed-TTS的大规模自回归文本转语音(TTS)模型,能够合成几乎与人类语音无法区分的高质量语音。那么Seed-TTS的表现究竟有多强呢?让我们一起来感受下Seed-TTS带来的惊喜吧! 介绍Seed-TTS…...

Vue3——实现word,pdf上传之后,预览功能(实测有效)
vue-office/pdf - npm支持多种文件(**docx、excel、pdf**)预览的vue组件库,支持vue2/3。也支持非Vue框架的预览。. Latest version: 2.0.2, last published: a month ago. Start using vue-office/pdf in your project by running npm i vue-office/pdf. There are …...

JVM之【类的生命周期】
首先,请区分Bean的声明周期和类的声明周期。此处讲的是类的声明周期 可以同步观看另一篇文章JVM之【类加载机制】 概述 在Java中数据类型分为基本数据类型和引用数据类型 基本数据类型由虚拟机预先定义,引用数据类型则需要进行类的加载 按照]ava虚拟机…...

分库分表场景下,如何设计与实现一种高效的分布式ID生成策略
在构建大规模分布式系统时,随着数据量的爆炸式增长,单个数据库往往难以承载如此庞大的数据存储与访问需求。这时,分库分表便成为一种有效的解决方案,它通过将数据分散存储在多个数据库或表中,从而提高系统的处理能力和…...

机器人系统ros2-开发学习实践16-RViz 用户指南
RViz 是 ROS(Robot Operating System)中的一个强大的 3D 可视化工具,用于可视化机器人模型、传感器数据、路径规划等。以下是RViz用户指南,帮助你了解如何使用RViz来进行机器人开发和调试。 启动可视化工具 ros2 run rviz2 rviz2…...

安全测试 之 安全漏洞 CSRF
1. 背景 安全测试是在功能测试的基础上进行的,它验证软件的安全需求,确保产品在遭受恶意攻击时仍能正常运行,并保护用户信息不受侵犯。 2. CSRF 定义 CSRF(Cross-Site Request Forgery),中文名为“跨站请…...

交易中的预测和跟随
任何的交易决策,一定是基于某种推理关系的,这种推理关系是基于t时刻之前的状态,得到t时刻之后的结果,我们基于这种推理关系,根据当前的状态,形成了未来结果的某种预期,然后基于这种预期采取相应…...

vs2022专业版永久密钥
vs2022专业版永久密钥: vs2022专业版永久密钥: Visual Studio 2022 Enterprise:VHF9H-NXBBB-638P6-6JHCY-88JWH Visual Studio 2022 Professional:TD244-P4NB7-YQ6XK-Y8MMM-YWV2J...

MongoDB环境搭建
一.下载安装包 Download MongoDB Community Server | MongoDB 二、双击下载完成后的安装包开始安装,除了以下两个部分需要注意操作,其他直接next就行 三.可视化界面安装 下载MongoDB-compass,地址如下 MongoDB Compass Download (GUI) | M…...

数据结构【队列】
队列的的概念 队列是一种特殊的线性表,特殊之处在于它只允许在表的头部进行删除操作,而在表的尾部进行插入操作,和栈一样,队列是一种操作受限制的线性表。进行插入操作的端称为队尾,进行删除操作的端称为队头。队列中…...

微信小程序上架,AI类目审核(AI问答、AI绘画、AI换脸)
小程序对于生成式AI类目的产品上架审核较为严格,这也是近两年新增了几个类目,一旦小程序中涉及生成式AI相关的内容,如果你选择相应类目,但审核被划归为这一类,都需要准备此类目的审核,才能正常上架。 如果…...

Vue3学习记录(第一天)
Vue3学习记录_第一天 背景说明记录Vue3实现响应式前端的反射前端对象的属性赋值Vue3响应式实现过程稿前端移除对象的属性 背景 本次学习主要是看视频学习, 没有跟练, 但是很多知识点感觉又容易忘记. 所以通过笔记的方式输出一下. 说明 估计只能自己看懂, 如果能提供一些其他…...

springboot+vue+mybatis房屋租贷系统+PPT+论文+讲解+售后
本论文系统地描绘了整个网上房屋租赁系统的设计与实现,主要实现的功能有以下几点:管理员;首页、个人中心、房屋类型管理、房屋租赁管理、会员管理、订单信息管理、合同信息管理、退房评价管理、管理员管理,系统管理,前…...

Day30 登录界面设计
本章节,实现了登录界面窗口设计 一.准备登录界面图片素材(透明背景图片) 把准备好的图片放在 Images 文件夹下面,格式分别是 .png和 .icoico 图片,右键属性,生成操作选 内容 png 图片,右键属性,生成操作选 资源 选中 login.png图片鼠标右键,选择属性。生成的操作选…...

VOJ 迷阵突围 题解 次短路径 dijkstra算法
迷阵突围 题目描述 小明陷入了坐标系上的一个迷阵,迷阵上有 n 个点,编号从 1 到 n 。小明在编号为 1 的位置,他想到编号为 n 的位置上。小明当然想尽快到达目的地,但是他觉得最短的路径可能有风险,所以他会选择第二短…...

Oracle SQL详解
Oracle SQL是一种用于管理和操作Oracle数据库的编程语言。以下是一些基本的Oracle SQL语法和建表建用户的详解。 创建用户 在Oracle中,创建用户通常需要具有足够权限的用户(通常是具有DBA角色的用户)。以下是一个创建用户的例子:…...

产业,到底需要什么大模型?
[ 产业究竟需要怎样的大模型?关于这个问题,本文作者便提出了他的看法,并总结了产业大模型目前阶段的三点落地挑战。一起来看看,或许可以帮助你更好地理解大模型与行业、与产业的融合。 写下这篇的起因,是前不久的一件事…...

每日5题Day17 - LeetCode 81 - 85
每一步向前都是向自己的梦想更近一步,坚持不懈,勇往直前! 第一题:81. 搜索旋转排序数组 II - 力扣(LeetCode) class Solution {public boolean search(int[] nums, int target) {int n nums.length;if (n…...

后端开发面经系列 --中望C++面经
中望C面经,全部内容! 公众号:阿Q技术站 文章目录 中望C面经,全部内容!一面 8.15 时长45min1、介绍项目相关2、gdb怎么调试的?打断点用什么指令?3、gcc的编译过程4、cmake添加头文件搜索路径用…...