100道大模型面试八股文
算法暑期实习机会快结束了,校招大考即将来袭。
当前就业环境已不再是那个双向奔赴时代了。求职者在变多,岗位在变少,要求还更高了。
最近,我们陆续整理了很多大厂的面试题,帮助球友解惑答疑和职业规划,分享了面试中的那些弯弯绕绕。
分享100道大模型面试八股文,喜欢记得点赞、收藏、关注:
-
你了解ReAct吗,它有什么优点?
-
解释一下langchain Agent的概念
-
langchain 有哪些替代方案?
-
langchain token计数有什么问题?如何解决?
-
LLM预训练阶段有哪几个关键步骤?
-
RLHF模型为什么会表现比SFT更好?
-
参数高效的微调(PEFT)有哪些方法?
-
LORA微调相比于微调适配器或前缀微调有什么优势?
-
你了解过什么是稀疏微调吗?
-
训练后量化(PTQ)和量化感知训练(QAT)有什么区别?
-
LLMs中,量化权重和量化激活的区别是什么?
-
AWQ量化的步骤是什么?
-
介绍一下GPipe推理框架
-
矩阵乘法如何做数量并行?
-
请简述TPPO算法流程,它跟TRPO的区别是什么?
-
什么是检索增强生成(RAG)?
-
目前主流的中文向量模型有哪些?
-
为什么LLM的知识更新很困难?
-
RAG和微调的区别是什么?
-
大模型一般评测方法及其准是什么?
-
什么是Kv cache技术,它具体是如何实现的?
-
DeepSpeed推理对算子融合做了哪些优化?
-
简述一下FlashAttention的原理
-
MHA、GQA、MQA三种注意力机制的区别是什么?
-
请介绍一下微软的ZeRO优化器
-
Paged Attention的原理是什么,解决了LLM中的什么问题?
-
什么是投机采样技术,请举例说明?
-
简述GPT和BERT的区别
-
讲一下GPT系列模型的是如何演进的?
-
为什么现在的大模型大多是decoder-only的架构?
-
讲一下生成式语言模型的工作机理
-
哪些因素会导致LLM中的偏见?
-
LLM中的因果语言建模与掩码语言建模有什么区别?
-
如何减轻LLM中的“幻觉”现象?
-
解释ChatGPT的“零样本”和“少样本”学习的概念
-
你了解大型语言模型中的哪些分词技术?
-
如何评估大语言模型(LLMs)的性能?
-
如何缓解LLMs复读机问题?
-
请简述下Transformer基本原理
-
为什么Transformer的架构需要多头注意力机制?
-
为什么transformers需要位置编码?
-
transformer中,同一个词可以有不同的注意力权重吗?
-
Wordpiece与BPE之间的区别是什么?
-
有哪些常见的优化LLMs输出的技术?
-
GPT-3拥有的1750亿参数,是怎么算出来的?
-
温度系数和top-p、top-k参数有什么区别?
-
为什么transformer块使用LayerNorm而不是BatchNorm?
-
介绍一下post layer norm和pre layer norm的区别
-
什么是思维链(CoT)提示?
-
你觉得什么样的任务或领域适合用思维链提示?
-
目前主流的开源模型体系有哪些?
-
prefix LM和causal LM区别是什么?
-
涌现能力是啥原因?
-
大模型LLM的架构介绍?
-
什么是LLMs复读机问题?
-
为什么会出现LLMs复读机问题?
-
如何缓解LLMs复读机问题?
-
llama输入句子长度理论上可以无限长吗?
-
什么情况下用Bert模型,什么情况下用LLama、ChatGLM类大模型,咋选?
-
各个专长领域是否需要各自的大模型来服务?
-
如何让大模型处理更长的文本?
-
为什么大模型推理时显存涨的那么多还一直占着?
-
大模型在gpu和cpu上推理速度如何?
-
推理速度上,int8和fp16比起来怎么样?
-
大模型有推理能力吗?
-
大模型生成时的参数怎么设置?
-
有哪些省内存的大语言模型训练/微调/推理方法?
-
如何让大模型输出台规化
-
应用模式变更
-
大模型怎么评测?
-
大模型的honest原则是如何实现的?
-
模型如何判断回答的知识是训练过的已知的知识,怎么训练这种能力?
-
奖励模型需要和基础模型一致吗?
-
RLHF在实践过程中存在哪些不足?
-
如何解决人工产生的偏好数据集成本较高,很难量产问题?
-
如何解决三个阶段的训练(SFT->RM->PPO)过程较长,更新迭代较慢问题?
-
如何解决PPO的训练过程中同时存在4个模型(2训练,2推理),对计算资源的要求较高问题?
-
如何给LLM注入领域知识?
-
如果想要快速检验各种模型,该怎么办?
-
预训练数据Token重复是否影响模型性能?
-
什么是位置编码?
-
什么是绝对位置编码?
-
什么是相对位置编码?
-
旋转位置编码RoPE思路是什么?
-
旋转位置编码RoPE有什么优点?
-
什么是长度外推问题?
-
长度外推问题的解决方法有哪些?
-
ALiBi(Attention with Linear Biases)思路是什么?
-
ALiBi(Attention with Linear Biases)的偏置矩阵是什么?有什么作用?
-
ALiBi(Attention with Linear Biases)有什么优点?
-
Layer Norm的计算公式写一下?
-
RMS Norm的计算公式写一下?
-
RMS Norm相比于Layer Norm有什么特点?
-
Deep Norm思路?
-
写一下Deep Norm代码实现?
-
Deep Norm有什么优点?
-
LN在LLMs中的不同位置有什么区别么?如果有,能介绍一下区别么?
-
LLMs各模型分别用了哪种Layer normalization?
-
介绍一下FFN块计算公式?
-
介绍一下GeLU计算公式?
-
介绍一下Swish计算公式?
-
介绍一下使用GLU线性门控单元的FFN块计算公式?
-
介绍一下使用GeLU的GLU块计算公式?
-
介绍一下使用Swish的GLU块计算公式?
面试精选
-
《大模型面试宝典》(2024版) 正式发布!
-
一文搞懂 Transformer
-
一文搞懂 Attention(注意力)机制
-
一文搞懂 Self-Attention 和 Multi-Head Attention
-
一文搞懂 BERT(基于Transformer的双向编码器)
-
一文搞懂 GPT(Generative Pre-trained Transformer)
-
一文搞懂 Embedding(嵌入)
-
一文搞懂 Encoder-Decoder(编码器-解码器)
-
一文搞懂大模型的 Prompt Engineering(提示工程)
-
一文搞懂 Fine-tuning(大模型微调)
-
一文搞懂 LangChain
-
一文搞懂 LangChain 的 Retrieval 模块
-
一文搞懂 LangChain 的智能体 Agents 模块
-
一文搞懂 LangChain 的链 Chains 模块
相关文章:
100道大模型面试八股文
算法暑期实习机会快结束了,校招大考即将来袭。 当前就业环境已不再是那个双向奔赴时代了。求职者在变多,岗位在变少,要求还更高了。 最近,我们陆续整理了很多大厂的面试题,帮助球友解惑答疑和职业规划,分…...
【ARM Cache 及 MMU 系列文章 6.2 -- ARMv8/v9 Cache 内部数据读取方法详细介绍】
请阅读【ARM Cache 及 MMU/MPU 系列文章专栏导读】 及【嵌入式开发学习必备专栏】 文章目录 Direct access to internal memoryL1 cache encodingsL1 Cache Data 寄存器Cache 数据读取代码实现Direct access to internal memory 在ARMv8架构中,缓存(Cache)是用来加速数据访…...
使用Vue.js将form表单传递到后端
一.form表单 <form submit.prevent"submitForm"></form> form表单像这样写出来,然后把需要用户填写的内容写在form表单内。 二.表单内数据绑定 <div class"input-container"><div style"margin-left: 9px;"&…...
6、架构-服务端缓存
为系统引入缓存之前,第一件事情是确认系统是否真的需要缓 存。从开发角度来说,引入缓存会提 高系统复杂度,因为你要考虑缓存的失效、更新、一致性等问题;从运维角度来说,缓存会掩盖一些缺 陷,让问题在更久的…...
服务器遭遇UDP攻击时的应对与解决方案
UDP攻击作为分布式拒绝服务(DDoS)攻击的一种常见形式,通过发送大量的UDP数据包淹没目标服务器,导致网络拥塞、服务中断。本文旨在提供一套实用的策略与技术手段,帮助您识别、缓解乃至防御UDP攻击,确保服务器稳定运行。我们将探讨监…...
美团发布2024年一季度财报:营收733亿元,同比增长25%
6月6日,美团(股票代码:3690.HK)发布2024年第一季度业绩报告。受益于经济持续回暖和消费复苏,公司各项业务继续取得稳健增长,营收733亿元(人民币,下同),同比增长25%。 财报显示,一季度,美团继续…...
sql注入-布尔盲注
布尔盲注(Boolean Blind SQL Injection)是一种SQL注入攻击技术,用于在无法直接获得查询结果的情况下推断数据库信息;它通过发送不同的SQL查询来观察应用程序的响应,进而判断查询的真假,并逐步推断出有用的信…...
docker-compose部署 kafka 3.7 集群(3台服务器)并启用账号密码认证
文章目录 1. 规划2. 服务部署2.1 kafka-012.2 kafka-022.3 kafka-032.4 启动服务 3. 测试3.1 kafkamap搭建(测试工具)3.2 测试 1. 规划 服务IPkafka-0110.10.xxx.199kafka-0210.10.xxx.198kafka-0310.10.xxx.197kafkamp10.10.xxx.199 2. 服务部署 2.1…...
LeetCode-704. 二分查找【数组 二分查找】
LeetCode-704. 二分查找【数组 二分查找】 题目描述:解题思路一:注意开区间和闭区间背诵版:解题思路三: 题目描述: 给定一个 n 个元素有序的(升序)整型数组 nums 和一个目标值 target …...
Rust 性能分析
都说Rust性能好,但是也得代码写得好,猜猜下面两个代码哪个快 . - 力扣(LeetCode) use std::collections::HashMap; use lazy_static::lazy_static;lazy_static! {static ref DIGIT: HashMap<char, usize> {let mut m HashMap::new();for c in …...
Gradle和Maven都是广泛使用的项目自动化构建工具
Gradle和Maven都是广泛使用的项目自动化构建工具,但它们在多个方面存在差异。以下是关于Gradle和Maven的详细对比: 一、构建脚本语言 Maven:使用XML作为构建脚本语言。XML的语法较为繁琐,不够灵活,对于复杂的构建逻辑…...
Seed-TTS语音编辑有多强?对比实测结果让你惊叹!
GLM-4-9B 开源系列模型 前言 就在最近,ByteDance的研究人员最近推出了一系列名为Seed-TTS的大规模自回归文本转语音(TTS)模型,能够合成几乎与人类语音无法区分的高质量语音。那么Seed-TTS的表现究竟有多强呢?让我们一起来感受下Seed-TTS带来的惊喜吧! 介绍Seed-TTS…...
Vue3——实现word,pdf上传之后,预览功能(实测有效)
vue-office/pdf - npm支持多种文件(**docx、excel、pdf**)预览的vue组件库,支持vue2/3。也支持非Vue框架的预览。. Latest version: 2.0.2, last published: a month ago. Start using vue-office/pdf in your project by running npm i vue-office/pdf. There are …...
JVM之【类的生命周期】
首先,请区分Bean的声明周期和类的声明周期。此处讲的是类的声明周期 可以同步观看另一篇文章JVM之【类加载机制】 概述 在Java中数据类型分为基本数据类型和引用数据类型 基本数据类型由虚拟机预先定义,引用数据类型则需要进行类的加载 按照]ava虚拟机…...
分库分表场景下,如何设计与实现一种高效的分布式ID生成策略
在构建大规模分布式系统时,随着数据量的爆炸式增长,单个数据库往往难以承载如此庞大的数据存储与访问需求。这时,分库分表便成为一种有效的解决方案,它通过将数据分散存储在多个数据库或表中,从而提高系统的处理能力和…...
机器人系统ros2-开发学习实践16-RViz 用户指南
RViz 是 ROS(Robot Operating System)中的一个强大的 3D 可视化工具,用于可视化机器人模型、传感器数据、路径规划等。以下是RViz用户指南,帮助你了解如何使用RViz来进行机器人开发和调试。 启动可视化工具 ros2 run rviz2 rviz2…...
安全测试 之 安全漏洞 CSRF
1. 背景 安全测试是在功能测试的基础上进行的,它验证软件的安全需求,确保产品在遭受恶意攻击时仍能正常运行,并保护用户信息不受侵犯。 2. CSRF 定义 CSRF(Cross-Site Request Forgery),中文名为“跨站请…...
交易中的预测和跟随
任何的交易决策,一定是基于某种推理关系的,这种推理关系是基于t时刻之前的状态,得到t时刻之后的结果,我们基于这种推理关系,根据当前的状态,形成了未来结果的某种预期,然后基于这种预期采取相应…...
vs2022专业版永久密钥
vs2022专业版永久密钥: vs2022专业版永久密钥: Visual Studio 2022 Enterprise:VHF9H-NXBBB-638P6-6JHCY-88JWH Visual Studio 2022 Professional:TD244-P4NB7-YQ6XK-Y8MMM-YWV2J...
MongoDB环境搭建
一.下载安装包 Download MongoDB Community Server | MongoDB 二、双击下载完成后的安装包开始安装,除了以下两个部分需要注意操作,其他直接next就行 三.可视化界面安装 下载MongoDB-compass,地址如下 MongoDB Compass Download (GUI) | M…...
网络编程(Modbus进阶)
思维导图 Modbus RTU(先学一点理论) 概念 Modbus RTU 是工业自动化领域 最广泛应用的串行通信协议,由 Modicon 公司(现施耐德电气)于 1979 年推出。它以 高效率、强健性、易实现的特点成为工业控制系统的通信标准。 包…...
css实现圆环展示百分比,根据值动态展示所占比例
代码如下 <view class""><view class"circle-chart"><view v-if"!!num" class"pie-item" :style"{background: conic-gradient(var(--one-color) 0%,#E9E6F1 ${num}%),}"></view><view v-else …...
Linux相关概念和易错知识点(42)(TCP的连接管理、可靠性、面临复杂网络的处理)
目录 1.TCP的连接管理机制(1)三次握手①握手过程②对握手过程的理解 (2)四次挥手(3)握手和挥手的触发(4)状态切换①挥手过程中状态的切换②握手过程中状态的切换 2.TCP的可靠性&…...
【Redis技术进阶之路】「原理分析系列开篇」分析客户端和服务端网络诵信交互实现(服务端执行命令请求的过程 - 初始化服务器)
服务端执行命令请求的过程 【专栏简介】【技术大纲】【专栏目标】【目标人群】1. Redis爱好者与社区成员2. 后端开发和系统架构师3. 计算机专业的本科生及研究生 初始化服务器1. 初始化服务器状态结构初始化RedisServer变量 2. 加载相关系统配置和用户配置参数定制化配置参数案…...
微服务商城-商品微服务
数据表 CREATE TABLE product (id bigint(20) UNSIGNED NOT NULL AUTO_INCREMENT COMMENT 商品id,cateid smallint(6) UNSIGNED NOT NULL DEFAULT 0 COMMENT 类别Id,name varchar(100) NOT NULL DEFAULT COMMENT 商品名称,subtitle varchar(200) NOT NULL DEFAULT COMMENT 商…...
Java面试专项一-准备篇
一、企业简历筛选规则 一般企业的简历筛选流程:首先由HR先筛选一部分简历后,在将简历给到对应的项目负责人后再进行下一步的操作。 HR如何筛选简历 例如:Boss直聘(招聘方平台) 直接按照条件进行筛选 例如:…...
Spring数据访问模块设计
前面我们已经完成了IoC和web模块的设计,聪明的码友立马就知道了,该到数据访问模块了,要不就这俩玩个6啊,查库势在必行,至此,它来了。 一、核心设计理念 1、痛点在哪 应用离不开数据(数据库、No…...
使用Spring AI和MCP协议构建图片搜索服务
目录 使用Spring AI和MCP协议构建图片搜索服务 引言 技术栈概览 项目架构设计 架构图 服务端开发 1. 创建Spring Boot项目 2. 实现图片搜索工具 3. 配置传输模式 Stdio模式(本地调用) SSE模式(远程调用) 4. 注册工具提…...
CRMEB 中 PHP 短信扩展开发:涵盖一号通、阿里云、腾讯云、创蓝
目前已有一号通短信、阿里云短信、腾讯云短信扩展 扩展入口文件 文件目录 crmeb\services\sms\Sms.php 默认驱动类型为:一号通 namespace crmeb\services\sms;use crmeb\basic\BaseManager; use crmeb\services\AccessTokenServeService; use crmeb\services\sms\…...
jmeter聚合报告中参数详解
sample、average、min、max、90%line、95%line,99%line、Error错误率、吞吐量Thoughput、KB/sec每秒传输的数据量 sample(样本数) 表示测试中发送的请求数量,即测试执行了多少次请求。 单位,以个或者次数表示。 示例:…...
