[论文笔记] 自对齐指令反翻译:SELF-ALIGNMENT WITH INSTRUCTION BACKTRANSLATION
https://arxiv.org/pdf/2308.06259
这篇论文介绍了一种名为“指令反向翻译”(instruction backtranslation)的方法,用于通过自动标记人类书写的文本和相应的指令来构建高质量的指令跟随语言模型。这里是一个通俗易懂的解释:
一、背景
通常,训练一个高质量的指令跟随语言模型需要大量的手工标注的数据,这些数据非常昂贵且耗时。为了解决这个问题,作者提出了一种自动化的方法,通过“自我增强”和“自我筛选”来生成和选择高质量的训练数据。
二、方法概述
整个方法分为两个主要步骤:
-
自我增强(Self-Augmentation):
-
首先,使用一个小量的种子数据(即已标注好的指令和输出对)来微调一个基础语言模型(例如LLaMa)。
-
接下来,用微调后的模型生成候选的训练数据,这些数据来自未标注的文本(称为“增强数据”)。
-
-
自我筛选(Self-Curation):
-
在初始微调模型的基础上,选择高质量的增强数据用于下一次迭代的训练。
-
经过多次迭代,每次选择出更高质量的数据,最终得到一个更强的模型。
-
三、流程图解释
相关文章:
![](https://www.ngui.cc/images/no-images.jpg)
[论文笔记] 自对齐指令反翻译:SELF-ALIGNMENT WITH INSTRUCTION BACKTRANSLATION
https://arxiv.org/pdf/2308.06259 这篇论文介绍了一种名为“指令反向翻译”(instruction backtranslation)的方法,用于通过自动标记人类书写的文本和相应的指令来构建高质量的指令跟随语言模型。这里是一个通俗易懂的解释: 一、背景 通常,训练一个高质量的指令跟随语言…...
![](https://www.ngui.cc/images/no-images.jpg)
算术运算符. 二
# 表达式 # 操作数和运算符组成 比如 11 # 作用:表达式可以求值,也可以给变量赋值。 # Python算术运算符: # - * / % //(整除:向下取整) ** print(10 4) # 14 print(10 - 4) # 6 print(10 * 4) # 40 …...
![](https://www.ngui.cc/images/no-images.jpg)
代码优化方法记录
每次代码 review 之后,对 review 的情况进行总结记录,产出实际经验,方便组内学习、分享。 1、提取公共内容 公共内容要提取,避免重复编写; 2、css 色值使用变量 css 中的色值、字体,都换成组件库中的变…...
![](https://www.ngui.cc/images/no-images.jpg)
qt 图形、图像、3D相关知识
1.qt 支持3d吗 Qt确实支持3D图形渲染。Qt 3D模块是Qt的一个组成部分,它允许开发者在Qt应用程序中集成3D内容。Qt 3D模块提供了一组类和函数,用于创建和渲染3D场景、处理3D对象、应用光照和纹理等。 Qt 3D模块包括以下几个主要组件: Qt 3D …...
![](https://i-blog.csdnimg.cn/direct/b784011cc977421498f08d7b703fcf46.png)
【逆向基础】十、工具分享之DIE(Detect It Easy)
一、简介 DIE(Detect It Easy)是一款可以轻松检测PE文件的程序;其主要作用是查壳,并将pe文件的内容解析出来,包括PE文件中包含的导入函数、导出函数的名称及地址,入口函数地址等,是技术人员分析…...
![](https://www.ngui.cc/images/no-images.jpg)
Netcat:——网络瑞士军刀
Netcat: 网络瑞士军刀 概述 Netcat(通常称为 nc)是一个功能强大的网络工具,广泛用于网络测试和调试。它能够读取和写入网络数据,支持TCP、UDP协议,可以用于端口扫描、端口监听、文件传输等多种用途。 主要用途 获取…...
![](https://www.ngui.cc/images/no-images.jpg)
C++ //练习 14.50 在初始化ex1和ex2的过程中,可能用到哪些类类型的转换序列呢?说明初始化是否正确并解释原因。
C Primer(第5版) 练习 14.50 练习 14.50 在初始化ex1和ex2的过程中,可能用到哪些类类型的转换序列呢?说明初始化是否正确并解释原因。 struct LongDouble{LongDouble(double 0.0);operator double();operator float(); }; Long…...
![](https://i-blog.csdnimg.cn/direct/f7f5d1cb5cd34e948d7bb66bb8923afe.png)
【开源 Mac 工具推荐之 1】gibMacOS:方便快捷的 macOS 完整包下载 Shell 工具
简介 gibMacOS 是由 GitHub 开发者 corpnewt 编写的一款 Shell 工具。它采用 Python 编程语言,可以让用户打开后在纯文本页面中轻松选择并下载来源于 Apple 官方的 macOS 完整安装包。 Repo 地址:https://github.com/corpnewt/gibMacOS (其…...
![](https://www.ngui.cc/images/no-images.jpg)
pdf文件如何快速英文转中文?
要将 PDF 文件中的英文内容转换为中文,你可以使用以下几种方法: 1、在线翻译工具: 使用网上的免费在线翻译工具,如Google翻译、百度翻译或有道翻译,将整个 PDF 文档粘贴到工具中进行翻译。 2、专业翻译软件…...
![](https://img-blog.csdnimg.cn/img_convert/4f55d254b858f7d5204e8dd707a83b8d.gif)
程序的控制结构——if-else语句(双分支结构)【互三互三】
目录 🍁 引言 🍁if-else语句(双分支结构) 👉格式1: 👉功能: 👉程序设计风格提示: 👉例题 👉格式2: 👉…...
![](https://i-blog.csdnimg.cn/direct/52f953545a2a44feb130e061e0867f0d.gif)
[C++]初识C++(命名空间,命名空间使用,函数重载,缺省参数等)
💖💖💖欢迎来到我的博客,我是anmory💖💖💖 又和大家见面了 欢迎来到C探索系列 作为一个程序员你不能不掌握的知识 先来自我推荐一波 个人网站欢迎访问以及捐款 推荐阅读 如何低成本搭建个人网站…...
![](https://www.ngui.cc/images/no-images.jpg)
每天一个数据分析题(四百十六)- 线性回归模型
根据模型假设,线性回归模型中误差项的方差为 A. 常数 B. 函数 C. 随机变量 D. 以上都不是 数据分析认证考试介绍:点击进入 题目来源于CDA模拟题库 点击此处获取答案 数据分析专项练习题库 内容涵盖Python,SQL,统计学&#…...
![](https://i-blog.csdnimg.cn/direct/fe3e9f920f074de8acbbd7ed0dfe198c.png)
JupyterNotebook中导出当前环境,并存储为requirements.txt
使用Anaconda管理Python环境时,可以轻松地导出环境配置,以便在其他机器或环境中重新创建相同的环境。可以通过生成一个environment.yml文件实现的,该文件包含了环境中安装的所有包及其版本。但是,常常在一些课程中JupyterNotebo…...
![](https://www.ngui.cc/images/no-images.jpg)
Java对象复制系列二: 手把手带你写一个Apache BeanUtils
👆🏻👆🏻👆🏻关注博主,让你的代码变得更加优雅。 前言 Apache BeanUtils 是Java中用来复制2个对象属性的一个类型。 上一篇文章我们讲到了 Apache BeanUtils 性能相对比较差,今天…...
![](https://img-blog.csdnimg.cn/0d487ddcd20f4dce961ff98efa1e645e.jpg)
一个极简的 Vue 示例
https://andi.cn/page/621516.html...
![](https://i-blog.csdnimg.cn/direct/bff8c263f85e48d98aa874358b41f9c5.png)
修复 Ubuntu 24.04 Dock 丢失应用程序图标
找出应用程序窗口的类名 首先,您需要启动应用程序窗口。然后,按 Alt F2 启动“运行 Command”对话框。当对话框打开时,输入 lg 并按 Enter 键。 在该窗口中,单击Windows按钮,然后找出目标应用程序窗口的类名称。 在/…...
![](https://i-blog.csdnimg.cn/direct/599e42d41f1f424c90e36941bbf7e11e.png)
idea MarketPlace插件找不到
一、背景 好久没用idea了,打开项目后没有lombok,安装lombok插件时发现idea MarketPlace插件市场找不到,需要重新配置代理源,在外网访问时通过代理服务进行连接 二、操作 ### File-->setting 快捷键 Ctrl Alt S 远端源地…...
![](https://i-blog.csdnimg.cn/direct/b2ff5115e6de485daaecdf34279cb54d.png)
windows下使用编译opencv在qt中使用
记录一下:在windows下qt使用opencv 1、涉及需要下载的软件 CMake 下载地址opecnv下载地址mingw(需要配置环境变量) 这个在下载qt的时候可以直接安装一般在qt的安装路径下的tool里比如我的安装路径 (C:\zz\ProgramFiles\QT5.12\Tools\mingw730_64) 2、在安装好CMake…...
![](https://www.ngui.cc/images/no-images.jpg)
正则表达式-使用笔记
正则使用不当,会导致CPU飙升;场景区分,是判断存在还是提取内容;匹配范围,是匹配部分内容还是整行; 一、初识正则 正则表达式 – 语法 | 菜鸟教程 sparksql 正则匹配总结 https://www.cnblogs.com/he1m4n…...
![](https://i-blog.csdnimg.cn/direct/7fe3a9a4c42f433bb5ec517a6491f494.png)
C语言中的数组:掌握数据的有序集合【一维数组,二维数组,字符串数组,直方图打印,计算全排列,字符数组常用函数】
目录 C语言中的数组:掌握数据的有序集合【一维数组,二维数组,字符串数组】一维数组一维数组的创建数组的七种初始化完全初始化:部分初始化:字符数组的初始化:自动初始化为0:使用memset函数初始化…...
![](https://i-blog.csdnimg.cn/direct/6f13438f1ada402994376956a53190f9.png)
软件架构之计算机网络
软件架构之计算机网络 第 4 章 计算机网络4.1 网络架构与协议4.1.1 网络互联模型4.1.2 常见的网络协议4.1.3 IPv6 4.2 局域网与广域网4.2.2 无线局域网4.2.3 广域网技术4.2.4 网络接入技术 4.3 网络互连与常用设备4.4 网络工程4.4.1 网络规划4.4.2 网络设计4.4.3 网络实施 4.5 …...
![](https://i-blog.csdnimg.cn/direct/84993fb30cb94ba586b916ad421fe9bc.png)
Qt/C++项目积累: 2.主机监控器 - 2.2 历史功能实现
修订历史: 20240711:初始表设计,采用sqlite 正文: 关于历史数据存储,考虑的是用数据库来完成,目前考虑使用Sqlite和mysql,先用sqlite来实现,设计表过程如下: 机器总览…...
![](https://i-blog.csdnimg.cn/direct/23736131248b4d30a35205e07df438fa.png)
初识Spring Web MVC
1. 什么是 Spring Web MVC? Spring Web MVC 是基于 Servlet API 构建的原始 Web 框架,从⼀开始就包含在 Spring 框架中。它的正式名称“Spring Web MVC”来⾃其源模块的名称(Spring-webmvc),但它通常被称为"SpringMVC".Servlet&am…...
![](https://i-blog.csdnimg.cn/direct/f79a0a3636d249e594c51361ef6a133d.png)
【排序算法】归并排序
目录 一.基本思想 二.递归版本 三.非递归版本 四.特性总结 1.时间复杂度:O(N*logN) 2.空间复杂度:O(N) 3.稳定性:稳定 一.基本思想 归并排序是采用分治法的一个非常典型的应用。它将已经有序的序列合并为完全有序的序列,即…...
![](https://i-blog.csdnimg.cn/direct/b9f4967a35d34ea7affe7602374a2a65.png)
游戏AI的创造思路-技术基础-决策树(2)
上一篇写了决策树的基础概念和一些简单例子,本篇将着重在实际案例上进行说明 目录 8. 决策树应用的实际例子 8.1. 方法和过程 8.1.1. 定义行为 8.1.2. 确定属性 8.1.3. 构建决策树 8.1.4. 实施行为 8.1.5. 实时更新 8.2. Python代码 8. 决策树应用的实际例子…...
![](https://i-blog.csdnimg.cn/direct/8a89b80f209c4049893ccf0e86468a29.png)
vue缓存页面,当tab切换时保留原有的查询条件
需求: 切换tab时,查询条件不变 路由页面: 单个页面上加这句话:...
![](https://www.ngui.cc/images/no-images.jpg)
PythonConda系列(亲测有效):【解决方案】Collecting package metadata (current_repodata.json): failed
【解决方案】Collecting package metadata (current_repodata.json): failed 问题描述解决方案小结参考文献 问题描述 在cmd下运行:conda install pylint -y,报错如下: C:\Users\apr> conda install --name apr pylint -y Co…...
![](https://i-blog.csdnimg.cn/direct/3f5e042f20f14e5fb69b9619c4e796a9.png)
web前端开发——标签一(注释、标题、段落、换行、格式、图片)
今天我来针对web前端开发讲解标签一 目录 html标签_标题&段落&换行 注释标签:Ctrl/ 标题标签: h1-h6 段落标签: 换行标签: 格式标签 图片标签_src属性 html标签_标题&段落&换行 注释标签:Ctrl/ Ctrl/ &…...
![](https://www.ngui.cc/images/no-images.jpg)
Django 常见的操作符
在filter() 方法,exclude() 方法中使用大于,小于,模糊匹配等操作符。 常见的操作符如下: 操作符含义示例等于Book.objects.filter(price10)! 或 __ne不等于用于查找字段不等于特定值的记录。但更常用exclude()方法。__gt大于用于…...
![](https://www.ngui.cc/images/no-images.jpg)
AJAX是什么?原生语法格式?jQuery提供分装好的AJAX有什么区别?
ajax 的全称 Asynchronous JavaScript and XML (异步 JavaScript 和 XML)。 AJAX是一种创建交互式网页应用的网页开发技术。其中最核心的依赖是浏览器提供的 XMLHttpRequest 对象,是这个对象使得浏览器可以发出 HTTP 请求与接收 HTTP 响应。实现了在页 面不刷新的…...
![](http://terrylee.cnblogs.com/Images/OutliningIndicators/None.gif)
那个网站可以免费做风面/百度推广四川成都地区服务中心
摘要:在前一篇文章中我们并没有考虑配置的组件参数是什么类型,也没有在配置文件中指定过类型,那么Castle IOC是如何进行类型转换的?如何配置一些复杂的数据类型?如果有自定义的类型如何去进行类型转换?本文…...
![](https://img2018.cnblogs.com/blog/1239507/201811/1239507-20181126165131342-917378679.png)
天津网站建设哪里好/百度排名查询
框架名称是ui_auto_web,有bin、conf、lib、log、reports和webCase六个目录,lib目录下有core和page目录,page目录下又包含web目录,把每个功能的测试用例存放到webCase目录下,核心功能文件放在core目录下,rep…...
![](https://img-blog.csdnimg.cn/img_convert/fd61ea29f79dd9c1b49f98b4750b5b54.png#pic_center)
wordpress 媒体库 链接/市场营销实务
系统消息和通知 阻塞队列 BlockingQueue时一个接口,又许多实现类 Kafka入门 高吞吐量:Kafka是硬盘顺序读取:硬盘顺序读取高于内存的随机读取。 高可靠性:分布式的集群 高扩展性:加集群很方便 Broker:K…...
![](/images/no-images.jpg)
微信分销网站建设比较好/2023网站推广入口
2008年的年末到2009年的初始,翻过C的书、VC的教程,看过VC的视频,试图编写过VC的程序;安装过Delphi 7的程序,翻过Diphi的基础教程;甚至下载过Java的视频教程。而VB6的程序,几乎一个没写ÿ…...
![](https://img-blog.csdnimg.cn/20190221092525653.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L2l0eXFpbmc=,size_16,color_FFFFFF,t_70)
o2o网站建设如何/长沙百度网站排名优化
String String的创建机理 由于String在Java世界中使用过于频, Java为了避免在一个系统中产生大量的String对象, 引入了字符串常量池。 其运行机制是:创建一个字符串时,首先检查池中是否有值相同的字符串对象,如果有则不需要创建直接从池中刚查找到的对象引用;如果没有则新建…...
![](http://img1.51cto.com/attachment/201111/103022883.jpg)
自己做彩票网站/小企业广告投放平台
在SharePoint 2010文档库中,结合单选框,在Ribbon中提供了批量处理文档的功能,比如,批量删除、批量签出、批量签入等,但是,很遗憾,没有提供批量下载,默认的只能一个个下载,…...