当前位置: 首页 > news >正文

25届字节跳动 抖音NLP算法工程师 面经

请添加图片描述

目录

  • 一面/技术面 2024/08/30
  • 二面/技术面 2024/09/13

一面/技术面 2024/08/30

  1. 深挖实习(最近的一段实习)
  2. 深挖论文(让我共享屏幕,然后对着自己的论文讲)
  3. 论文做了多久完成的?主要都做了哪些工作?
  4. 如何计算语言模型的困惑度?
  5. 常见的PEFT方法都有哪些?LoRA有哪些关键的超参数?
  6. 常用的backbone都有哪些?(面试官想让我回答encoder、decoder、encoder-decoder这些)
  7. batch norm、layer norm、instance norm、group norm之间有什么区别?
  8. batch norm是在哪几个维度上norm的?
  9. 为什么NLP要用layer norm而不是batch norm?
  10. 手撕代码:现场写Attention,边写边讲思路,并要求跑通
  11. 为什么Q和K乘完要除以根号d?
  12. BERT、T5、GPT之间有什么区别?分别用了什么样的预训练任务?

二面/技术面 2024/09/13

  1. 介绍最近的一段实习
  2. 挑一些重要的项目展开讲讲
  3. 对分布式这一块是否了解?比如Megatron框架是如何提升效率的?
  4. 深挖另一段实习
  5. 讲一下Adapter,它作用在哪些层?
  6. LoRA可以作用在哪些层?你有没有尝试过不同的层,效果有多大差异?
  7. 假设你要对7B的模型做全量微调,大概要占用多少显存?
  8. 使用LoRA微调的话,一般会节约多少显存?
  9. 介绍一下你知道的推理加速方法
  10. KV-cache是怎样工作的?
  11. 推理时常见的参数,比如top-p、top-k、temperature,都展开讲讲
  12. 对Hive SQL或Spark等大数据处理工具了解吗
  13. 对传统的机器学习模型了解吗?比如决策树、随机森林这些
  14. Bagging和Boosting的区别?
  15. Transformer、BERT和GPT在网络结构上有何区别?
  16. 为什么现在的大模型都是decoder-only的架构?
  17. 手撕代码:在无重复元素的整数数组中寻找和为 target 的所有不同组合,返回结果应当是 List[List[int]]。数组中的同一个元素可以被无限制重复选取。

二面快结束的时候,跟面试官闲聊了一会,聊着聊着发现base地在深圳,我问面试官我不是投的杭州base吗,面试官说他也不知道,最后只能主动放弃了。

相关文章:

25届字节跳动 抖音NLP算法工程师 面经

目录 一面/技术面 2024/08/30二面/技术面 2024/09/13 一面/技术面 2024/08/30 深挖实习(最近的一段实习)深挖论文(让我共享屏幕,然后对着自己的论文讲)论文做了多久完成的?主要都做了哪些工作?…...

转行网络工程师以后的就业前景如何?

就业前景如何本质上取决于你在这行业的发展状况,而发展状况又主要由你的技术水平和与人交流的能力所决定。 如果你的技术能力仅限于"安服仔"、"脚本小子"等入门级水平,那你的职业发展可能会像浮萍一样漂泊不定。但如果你能轻松编写…...

docker 和 containerd 关系

containerd 是一个开源的容器运行时,它是用来管理容器生命周期的守护进程。containerd 支持 Docker 和其他容器格式,并且是许多现代容器编排系统(如 Kubernetes)的基础组件之一。 containerd 提供了一个命令行工具 ctr&#xff0…...

算法-二叉树的最大路径和

为了找到二叉树的最大路径和,我们需要考虑所有可能的路径,包括不经过根节点的路径,所以其实如果你从整体上来一条路径一条路径的遍历,太复杂,我们可以换个思路,从每个节点出发,就把那个节点当成…...

解决url含%导致404错误

String imageUrl;// 使用WebClient下载图片WebClient webClient WebClientUtil.getWebClient();Mono<ByteArrayOutputStream> byteArrayOutputStreamMono webClient.get().uri(imageUrl).retrieve().bodyToFlux(DataBuffer.class) // 获取图片内容的DataBuffer流.reduc…...

[Linux Codec驱动]音频路由概念

1. 音频路由的基本概念 源&#xff08;Source&#xff09;&#xff1a;音频信号的发出方&#xff0c;通常是一个音频输入设备&#xff0c;如麦克风、音频播放设备等。接收端&#xff08;Sink&#xff09;&#xff1a;音频信号的接收方&#xff0c;通常是音频输出设备&#xff…...

母线槽温度监测的哪个部位?安科瑞母线槽测温解决方案-安科瑞黄安南

安科瑞生产厂家&#xff1a;黄安南 壹捌柒/陆壹伍/零陆贰叁柒 母线槽简单来说充当着电缆的角色只不过它是大电流的输送设备&#xff0c;一般是铜排或者绿排做导体&#xff0c;用非烯性绝缘材料做支撑&#xff0c;搭配金属外壳。相对于电缆来说母线槽的载流能力强、电能损耗低、…...

《深度学习》—— 模型的部署

文章目录 一、部署方式二、部署步骤三、注意事项 深度学习中模型的部署是将训练好的模型应用到实际场景中的过程&#xff0c;以下是对深度学习模型部署的详细解析&#xff1a; 一、部署方式 嵌入式设备部署&#xff1a;将深度学习模型部署到嵌入式设备中&#xff0c;如智能手机…...

多IP访问浏览器

添加多个ip地址 nmcli connection modify ens160 ipv4.method manual ipv4.addresses 192.168.61.100/24 ipv4.addresses 192.168.61.200/24 ipv4.addresses 192.168.61.128 ipv4.gateway 192.168.61.2 ipv4.dns 114.114.114.114...

1024程序员节福利放送 | AI 照片修复魔法,一键重拾旧时记忆

程序员充电礼包 今天是 1024 程序员节&#xff0c;小贝特意为大家准备了重磅福利&#xff01;新用户使用邀请码「1024」注册 http://OpenBayes.com&#xff0c;即可获得 20 小时单卡 A6000 的免费使用时长&#xff0c;价值 80 元&#xff0c;资源 1 个月有效。仅限今日&#xf…...

OSPF特殊区域及其他特性

不用的链路这状态信息没必要一直保存&#xff0c;要不路由器承受不了。用OSPF 特殊区域解决 1. Stub区域和Totally Stub区域 R1作为ASBR引入多个外部网段&#xff0c;如果Area 2是普通区域&#xff0c;则R3将向该区域注入5类和4类LSA。 当把Area 2配置为Stub区域后&#xff1a…...

动态量化:大模型在端侧CPU快速推理方案

作为一款高性能的推理引擎框架&#xff0c;MNN高度关注Transformer模型在移动端的部署并持续探索优化大模型在端侧的推理方案。本文介绍权重量化的模型在MNN CPU后端的推理方案&#xff1a;动态量化。动态量化指在运行时对浮点型feature map数据进行8bit量化&#xff0c;然后与…...

什么是零拷贝以及其应用场景是什么?

写在前面 本文看下什么是零拷贝&#xff0c;以及其具体的应用场景有哪些。 1&#xff1a;什么是零拷贝 想要解释清楚什么是零拷贝&#xff0c;需要先来看下常规的阻塞io一次io的过程&#xff0c;这里以从文件读取内容然后写到socket为例来看下&#xff0c;如下&#xff1a; …...

开源(open source)是什么?为什么要开源?

为什么开源这个问题挺复杂&#xff0c;这里就从社会面以及个人两个角度来说。当然个人层面的开源其实是建立在社会面形成开源氛围后开始的。 社会面开源 这里举一个例子&#xff0c;既互联网从 web1.0 到 web3.0 &#xff08;开源 → 闭源 → 再开源&#xff09;的历程&#…...

基于Spring Boot的论坛网站:从零到部署

2相关技术 2.1 MYSQL数据库 MySQL是一个真正的多用户、多线程SQL数据库服务器。 是基于SQL的客户/服务器模式的关系数据库管理系统&#xff0c;它的有点有有功能强大、使用简单、管理方便、安全可靠性高、运行速度快、多线程、跨平台性、完全网络化、稳定性等&#xff0c;非常…...

vue开发的一个小插件vue.js devtools

可打开谷歌商城的情况下&#xff0c;不可打开的可以到极简插件里面去下载 极简插件官网_Chrome插件下载_Chrome浏览器应用商店 搜索vue即可...

GraphLLM:基于图的框架,通过大型语言模型处理数据

GraphLLM是一个创新的框架&#xff0c;它允许用户通过一个或多个大型语言模型&#xff08;LLM&#xff09;来处理数据。这个框架不仅提供了一个强大的代理&#xff0c;能够执行网络搜索和运行Python代码&#xff0c;还提供了一套工具来抓取网页数据&#xff0c;并将其重新格式化…...

HarmonyOS 5.0应用开发——Navigation实现页面路由

【高心星出品】 Navigation实现页面路由 Navigation&#xff1a;路由导航的根视图容器&#xff0c;一般作为页面&#xff08;Entry&#xff09;的根容器去使用&#xff0c;包括单页面&#xff08;stack&#xff09;、分栏&#xff08;split&#xff09;和自适应&#xff08;a…...

物联网行业应用实训室建设方案

一、建设背景 随着物联网技术的迅猛发展和广泛应用&#xff0c;物联网产业已跃升为新时代的经济增长引擎&#xff0c;对于产业升级和社会信息化水平的提升具有举足轻重的地位。因此&#xff0c;为了满足这一领域的迫切需求&#xff0c;培养具备物联网技术应用能力的优秀人才成…...

SOLIDWORKS 2025更灵活零件建模

SOLIDWORKS 2025更灵活零件建模 北京众联亿诚是达索官方授权的SOLIDWORKS经销商&#xff0c;专业经销SOLIDWORKS正版软件并提供免费试用、培训认证、二次开发等增值服务。 在工程设计领域&#xff0c;SOLIDWORKS作为一款功能强大的三维CAD软件&#xff0c;一直以其优越的性能…...

智能巡检机器人的大模型训练

随着工业自动化和智能化进程的不断加快&#xff0c;智能巡检机器人已成为维护和管理复杂设备的重要工具。在电力、石油化工、煤矿、数据中心等行业中&#xff0c;智能巡检机器人通过自主巡检、故障检测等功能&#xff0c;提高了设备管理的效率和安全性。大模型训练在智能巡检机…...

RabbitMQ系列学习笔记(九)--路由模式

文章目录 一、路由模式原理二、多重绑定三、路由模式实战1、消费者代码2、生产者代码3、运行结果分析 本文参考 尚硅谷RabbitMQ教程丨快速掌握MQ消息中间件rabbitmq RabbitMQ 详解 Centos7环境安装Erlang、RabbitMQ详细过程(配图) 一、路由模式原理 使用发布订阅模式时&#x…...

[OS] pthreads-1

线程的基本概念 线程是进程中的一个单一的执行流。一个进程可以包含多个线程&#xff0c;这些线程共享进程中的资源&#xff0c;并且在相同的地址空间中执行。多线程是提高应用程序并行性的流行方法。例如&#xff0c;在浏览器中&#xff0c;不同的标签页可以视作独立的线程。…...

ThreeJS入门(137):THREE.StringKeyframeTrack 知识详解,示例代码

作者&#xff1a; 还是大剑师兰特 &#xff0c;曾为美国某知名大学计算机专业研究生&#xff0c;现为国内GIS领域高级前端工程师&#xff0c;CSDN知名博主&#xff0c;深耕openlayers、leaflet、mapbox、cesium&#xff0c;webgl&#xff0c;ThreeJS&#xff0c;canvas&#xf…...

用大模型或者向量模型比如huggingface上的模型,处理一批图片,对该图片进行分类,检索

要使用大模型或向量模型对图片进行分类和检索,通常可以采用以下几种方法: 1. **图像分类**:使用预训练的图像分类模型(如ResNet、EfficientNet等)对图片进行分类。 2. **图像特征提取**:使用预训练的模型(如CLIP、ResNet等)提取图像的特征向量,然后进行相似度检索。 …...

Mac 使用 zsh 终端提示 zsh: killed 的问题

我的脚本的内容为&#xff1a; #!/bin/bashset -epids$(ps -ef | grep consul | grep -v grep | awk {print $2})for pid in $pids; doecho "kill process: $pid"kill -9 $pid donecd $(dirname $0)nohup ./consul agent -dev > nohup.log &可以看到这是一个…...

数字后端零基础入门系列 | Innovus零基础LAB学习Day6

今天没有具体的数字IC后端lab实验。今天的重点是熟悉掌握静态时序分析STA中的几类timing path以及setup和hold检查机制&#xff08;包含setup和hold计算公式&#xff09;。 芯片流片失败的那些故事 数字后端零基础入门系列 | Innovus零基础LAB学习Day5 等大家把今天内容学习…...

(Linux驱动学习 -13).SPI驱动实验

目录 一.SPI驱动相关结构体与函数 1.struct spi_master 结构体 2.申请 spi_master - spi_alloc_master 3.释放 spi_master - spi_master_put 4.向内核注册 spi_master - spi_register_master 5.注销掉 spi_master 6.struct spi_driver 结构体 7.向内核注册 spi_driver -…...

Angular 框架入门教程:从安装到路由、服务与状态管理详解

一、引言 在前端开发领域&#xff0c;Angular 是一个强大且流行的框架。它由 Google 维护&#xff0c;基于 TypeScript&#xff0c;采用模块化设计&#xff0c;提供了组件化开发、依赖注入、路由、表单处理等丰富功能&#xff0c;旨在帮助开发者构建高效、可维护的单页应用程序…...

【华为HCIP实战课程十八】OSPF的外部路由类型,网络工程师

一、外部路由类型: 上节讲的外部路由类型,无关乎COST大小,OSPF外部路由类型1优先于外部路由类型2 二、转发地址实验拓扑 我们再SW3/R5/R6三台设备运行RIP,SW3即运行RIP又运行OSPF SW3配置rip [SW3-rip-1]ver 2 [SW3-rip-1]network 10.0.0.0 AR5去掉ospf配置和AR6配置rip…...

匿名聊天网站怎么做/seo需要培训才能找到工作吗

1、当生成一个内部类的对象时&#xff0c;此对象与制造它的外围对象之间就有了一种联系&#xff0c;所以它能访问其外围对象的所有成员&#xff0c;而不需要任何条件。此外&#xff0c;内部类还拥有其外围类的所有元素的访问权。这是如何做到的呢&#xff1f;当某个外围类的对象…...

网站建设技术公司/营销计划书7个步骤

-二叉树递归遍历与非递归遍历实现 引言0 有关线性表结点定义-LinkNode1 栈的链式存储结构实现-LinkedStack2 队列的链式存储结构实现-LinkedQueue3 二叉树的链式存储结构实现3.1 树的结点定义-TreeNode3.2 二叉树定义3.3 前中后序遍历-递归算法实现3.4 前中后序遍历-非递归算法…...

武汉手机微信网站建设/洛阳seo博客

前言&#xff1a;上一章节我们讲述AT模式整合spring案例&#xff0c;此章节我们讲述AT模式整合spring boot案例&#xff0c;有如下几个知识点需要大家注意&#xff1a;dubbo&#xff0c;nacos&#xff0c;mybatis&#xff0c;mybatis-plus。(敲黑板&#xff1a;此章节的案例是依…...

免费做淘宝客网站/今日头条网页版

Oracle数据库中的case函数和decode函数 1、case函数 case函数有两种格式&#xff1a; &#xff08;1&#xff09;格式一 CASE exp1WHEN exp11 THEN exp12WHEN exp21 THEN exp22....WHEN expN1 THEN expN2ESLE expM END说明&#xff1a; 该函数的返回值为&#xff1a;当exp1…...

杭州网站排名优化/市场营销计划

现代数字系统设计——在线考试复习资料2021版 一、单选题 1. SOPC的中文意思是( )。 A.电子设计自动化 B.硬件描述语言 C.片上可编程系统 D.片上系统 答案:看左边查询 2.XPS是Xilinx公司提供的( )。 A.嵌入式系统的集成硬件设计和仿真工具 B.编辑FPGA的I/O引脚和面积约…...

手机上做ppt的软件/南通seo

--drop语句用来删除表&#xff0c;注意&#xff1a;删除的时候表和结构都会被清除掉 DROP TABLE tb_emp;--使用alter table语句可以修改表的结构 --修改列类型 【alter table 表名 MODIFY 列名 类型】 ALTER TABLE tb_emp MODIFY COMM VARCHAR(30); --将COMM表的数据类型修改为…...