当前位置: 首页 > news >正文

python-windows10普通笔记本跑bert mrpc数据样例0.1.048

python-windows10普通笔记本跑bert mrpc数据样例0.1.000

    • 背景
    • 参考章节
    • 获取数据
    • 下载bert模型
    • 下载bert代码
    • windows10的cpu进行训练
    • 进行预测
    • 注意事项
    • TODOLIST

背景

看了介绍说可以在gpu或者tpu上去微调,当前没环境,所以先在windows10上跑一跑,看是否能顺利进行,目标就是训练的过程中没有报错就行

参考章节

参考这个链接https://github.com/google-research/bert/tree/master?tab=readme-ov-file,其中的这个章节Sentence (and sentence-pair) classification tasks

获取数据

文章提高的使用 GLUE data by running this script(https://gist.github.com/W4ngatang/60c2bdb54d156a41194446737ce03e2e),但是我使用这个脚本下载不了,因为是内网,没有办法只能手动下载了,方法如下

  1. 下载download_glue_data.py这个脚本后
  2. 找到第39和40行,将里面的链接打开保存文件就可以获得msr_paraphrase_train.txt和sr_paraphrase_test.txt文件了
MRPC_TRAIN = 'https://dl.fbaipublicfiles.com/senteval/senteval_data/msr_paraphrase_train.txt'
MRPC_TEST = 'https://dl.fbaipublicfiles.com/senteval/senteval_data/msr_paraphrase_test.txt'
  1. 数据不大,我直接修改的文本格式为tsv,最后得到test.tsv和train.tsv文件
  2. 打开这个链接下载另外一个需要的数据dev_ids.tsv
    https://raw.githubusercontent.com/MegEngine/Models/master/official/nlp/bert/glue_data/MRPC/dev_ids.tsv
  3. 注释掉download_glue_data.py里面的下面的代码
#     try:
#         urllib.request.urlretrieve(TASK2PATH["MRPC"], os.path.join(mrpc_dir, "dev_ids.tsv"))
#     except KeyError or urllib.error.HTTPError:
#         print("\tError downloading standard development IDs for MRPC. You will need to manually split your data.")
#         return
  1. 将dev_ids.tsv的文件放在–data_dir下面的MRPC里面
  2. 运行download_glue_data.py文件生成数据如下
python .\download_glue_data.py --tasks=MRPC --data_dir=D:\jpdir\bert\glue_data\MRPC\fin --path_to_mrpc=D:\jpdir\bert\glue_data\MRPC

在这里插入图片描述
8. 将生成的dev.tsv文件放在python run_classifier.py脚本的data_dir目录下

下载bert模型

下载bert-base-uncased模型,如下图
在这里插入图片描述

下载bert代码

将这个链接https://github.com/google-research/bert/tree/master?tab=readme-ov-file的代码clone下来到本地,进入到这个文件夹里,执行如下命令即可:

python run_classifier.py --task_name=MRPC --do_train=true --do_eval=true --data_dir=D:\jpdir\bert\glue_data\MRPC --vocab_file=D:\jpdir\bert\bert-base-uncased\bert-base-uncased\bert-base-uncased\vocab.txt --bert_config_file

相关文章:

python-windows10普通笔记本跑bert mrpc数据样例0.1.048

python-windows10普通笔记本跑bert mrpc数据样例0.1.000 背景参考章节获取数据下载bert模型下载bert代码windows10的cpu进行训练进行预测注意事项TODOLIST背景 看了介绍说可以在gpu或者tpu上去微调,当前没环境,所以先在windows10上跑一跑,看是否能顺利进行,目标就是训练的…...

4句话明白虚拟机和容器的区别

一、虚拟机VM的组成 服务器-HostOS-虚拟化层-GustOS-libs-App 1、此时存在几个问题: 1、资源消耗大 2、扩展APP副本时到重复资源浪费(GustOS-libs) 3、当你开发在本地但要移植到云端,就会出现各种兼容性问题。 4、很难集成到DevOp…...

Django render()函数页面渲染

1, render() 函数 在Django框架中,render() 函数是一个非常有用的快捷方式,用于从视图函数返回一个完整的HTTP响应。它负责将给定的模板与上下文数据结合,渲染出最终的HTML页面,并返回一个HttpResponse对象。 from d…...

基于webrtc的媒体流传输工具tl-rtc-file

也不知道是什么意思,天天都有人在微信公众号的后台发,是打算找我兑奖吗? 本文软件是朋友 Eduna 推荐的,因为他觉得好像很好玩的样子。老苏一开始以为 tl-rtc-file 是跟 Snapdrop 一样的局域网文件传输工具,在看了 demo…...

【最新鸿蒙应用开发】——类Web开发范式2——前端语法

兼容JS的类Web开发范式 JS FA应用的JS模块(entry/src/main/js/module)的典型开发目录结构如下: 1. 项目基本结构 1.1. 目录结构 1.2. 项目文件分类如下: .hml结尾的HML模板文件,这个文件用来描述当前页面的文件布局结构。 .css结尾的CSS样…...

前端的强缓存和协商缓存

前端缓存机制 前端缓存主要分为两种类型:强缓存和协商缓存。 强缓存(HTTP Cache-Control) 通过设置HTTP响应头中的Cache-Control实现。浏览器根据Cache-Control的值决定是否重新请求资源。指令示例: no-cache:重新验…...

JSON如何处理包含特殊字符的字段

在JSON中处理包含特殊字符的字段时,你通常不需要直接处理这些特殊字符,因为JSON格式本身就会对特殊字符进行转义。当你使用编程语言或工具来生成或解析JSON时,这些转义通常是自动处理的。 然而,如果你需要手动处理或理解这些转义…...

JavaScript 中的 AbortController

AbortController 接口是 JavaScript 中 Fetch API 的一部分,引入它是为了处理和控制中止 fetch 请求的信号。这在需要取消正在进行的网络请求时特别有用,例如用户发起的动作取消,通过避免不必要的请求来提高性能,或优雅地处理超时…...

【前端】vue在线编辑器

以下是几个推荐的在线编辑器: CodeSandbox URL: https://codesandbox.io/特点: 支持 Vue、React、Angular 等多种前端框架,功能强大,社区活跃。 JSFiddle URL: https://jsfiddle.net/特点: 轻量级的在线编辑器,支持 Vue&#xff…...

leetcode67:二进制求和

题目链接&#xff1a;67. 二进制求和 - 力扣&#xff08;LeetCode&#xff09; class Solution { public:string addBinary(string a, string b) {int stralen a.size(), strblen b.size();int curtc;int Maxlen max(stralen, strblen);vector<int> stra;vector<i…...

程序员必备的职业素养:专业精神、沟通能力与持续学习

&#x1f34e;个人博客&#xff1a;个人主页 &#x1f3c6;个人专栏&#xff1a;日常聊聊 ⛳️ 功不唐捐&#xff0c;玉汝于成 目录 前言 正文 专业精神&#xff1a;技术的执着追求 沟通能力&#xff1a;团队合作的桥梁 持续学习&#xff1a;不断进步的动力 结语 我的…...

Spring源码:核心类的介绍

1. 前言 核心类代表了Spring框架中最基本的组件和功能&#xff0c;通过介绍这些类&#xff0c;学习者可以更好地理解Spring框架的核心工作原理和关键组件之间的关系。同时&#xff0c;了解这些核心类有助于学习者深入掌握Spring框架的使用和扩展方法。 2. ApplicationContextI…...

文化融合,市场共赢:品牌海外推广中的符号与象征策略

在全球化的今天&#xff0c;品牌海外推广不再仅仅是产品的输出&#xff0c;更是一种文化的交流和融合。品牌如何在保持自身特色的同时&#xff0c;又能融入当地文化&#xff0c;成为品牌海外拓展成功与否的关键。本文Nox聚星将和大家分析品牌如何运用具有当地文化特色的符号和象…...

fabric.util.enlivenObjects是什么意思

在Fabric.js中&#xff0c;fabric.util.enlivenObjects是一个实用函数&#xff0c;用于将一组对象的描述&#xff08;通常是JSON格式的对象数组&#xff09;转换回Fabric.js的对象实例。这个函数非常有用&#xff0c;特别是在涉及到从JSON恢复画布状态时&#xff0c;例如在实现…...

几个阶段性的面试难点整理

一、JVM篇 1、如何排查CPU、内存飙升的问题&#xff1f; 2、是否处理过线上问题&#xff1f;是怎么解决的&#xff1f; 3、谈谈G1收集器对比CMS收集器的优点&#xff1f;什么情况下适合用G1&#xff1f; 4、JVM调优的参数主要指哪方面的调优&#xff1f; 5、堆、栈中分别存放了…...

CTFHUB-技能树-web-信息泄露

目录 1.目录遍历 2.PHPINFO 3.备份文件下载 3.1 网站源码 3.2 bak文件 3.3 vim缓存 3.4 .DS_Store 4.Git泄露 4.1 Log 4.2 Stash 4.3 Index 5.SVN泄露 6.HG泄露 1.目录遍历 这个没什么好讲的&#xff0c;进去直接点击找flag,然后在下面目录翻&#xff0c;就找到了 …...

面试计算机网络八股文十问十答第八期

面试计算机网络八股文十问十答第八期 作者&#xff1a;程序员小白条&#xff0c;个人博客 相信看了本文后&#xff0c;对你的面试是有一定帮助的&#xff01;关注专栏后就能收到持续更新&#xff01; ⭐点赞⭐收藏⭐不迷路&#xff01;⭐ 1) TCP到底是什么连接&#xff1f; …...

0605-JavaSE-单例模式-饿懒汉模式

​​​​​​​ 不能放在方法里面&#xff08;因为每个线程调用都会在方法里面实例化一个locker对象&#xff0c;但不属于同一个对象&#xff09;&#xff0c;然后要用static修饰成静态变量才会起到效果 //单例设计模式 //饿汉模式&#xff1a;在加载类的时候就已经开始创建 /…...

TCP和UDP区别

TCP&#xff08;Transmission Control Protocol&#xff0c;传输控制协议&#xff09;和UDP&#xff08;User Datagram Protocol&#xff0c;用户数据报协议&#xff09;都是Internet协议套件中的传输层协议&#xff0c;但它们在工作方式、特性和适用场景上有显著区别&#xff…...

[Shell编程学习路线]——编制第一个shell脚本入门篇

&#x1f3e1;作者主页&#xff1a;点击&#xff01; &#x1f6e0;️Shell编程专栏&#xff1a;点击&#xff01; ⏰️创作时间&#xff1a;2024年6月12日10点23分 &#x1f004;️文章质量&#xff1a;93分 目录 ——前言—— &#x1f4a5;常用的几种shell Bash Sh …...

python数据处理分析库(一)

目录 一、NumPy 二、Pandas 三、Matplotlib and Seaborn 一、NumPy 场景&#xff1a;处理大规模数组和矩阵运算&#xff0c;可以用于科学计算、数据预处理简单示例&#xff1a; import numpy as npdata np.array([1, 2, 3, 4, 5]) mean np.mean(data) std_dev np.std(da…...

使用Transformer进行抄袭检测

动机 在许多行业中&#xff0c;尤其是在学术界&#xff0c;抄袭是一个重大问题。随着互联网和开放信息的兴起&#xff0c;这种现象甚至变得更加严重&#xff0c;任何人都可以通过点击访问特定主题的任何信息。 基于这一观察&#xff0c;研究人员一直在尝试使用不同的文本分析…...

基于深度学习的电池健康状态预测(Python)

电池的故障预测和健康管理PHM是为了保障设备或系统的稳定运行&#xff0c;提供参考的电池健康管理信息&#xff0c;从而提醒决策者及时更换电源设备。不难发现&#xff0c;PHM的核心问题就是确定电池的健康状态&#xff0c;并预测电池剩余使用寿命。但是锂电池的退化过程影响因…...

【吊打面试官系列-Mysql面试题】MySQL 如何优化 DISTINCT?

大家好&#xff0c;我是锋哥。今天分享关于 【MySQL 如何优化 DISTINCT&#xff1f;】面试题&#xff0c;希望对大家有帮助&#xff1b; MySQL 如何优化 DISTINCT&#xff1f; DISTINCT 在所有列上转换为 GROUP BY&#xff0c;并与 ORDER BY 子句结合使用。 SELECT DISTINCT t…...

企业IT运维管理体系-总体规划

企业IT运维管理体系-总体规划 企业IT运维管理体系的总体规划通过科学的调研、分析、设计和建设&#xff0c;提升管理成熟度、增强服务能力、实现技术创新和优化资源配置。重点在于建立组织保障体系、制定运维制度、构建运维平台和完善度量指标。通过明确运维治理模式和外包管理…...

RabbitMQ-Stream(高级详解)

文章目录 什么是流何时使用 RabbitMQ Stream&#xff1f;在 RabbitMQ 中使用流的其他方式基本使用Offset参数chunk Stream 插件服务端消息偏移量追踪示例 示例应用程序RabbitMQ 流 Java API概述环境创建具有所有默认值的环境使用 URI 创建环境创建具有多个 URI 的环境 启用 TLS…...

Web前端图片并排显示的艺术与技巧

Web前端图片并排显示的艺术与技巧 在Web前端开发中&#xff0c;图片并排显示是一种常见的布局需求。然而&#xff0c;实现这一目标并非易事&#xff0c;需要掌握一定的技巧和艺术。本文将从四个方面、五个方面、六个方面和七个方面深入探讨Web前端图片并排显示的奥秘。 四个方…...

豆瓣电影信息爬虫【2024年6月】教程

豆瓣电影信息爬虫【2024年6月】教程&#xff0c;赋完整代码 在本教程中&#xff0c;我们将使用以下技术栈来构建一个爬虫&#xff0c;用于爬取豆瓣电影列表页面的信息&#xff1a; 完整代码放到最后 &#xff1b; 完整代码放到最后 &#xff1b; 完整代码放到最后 &#xff1b;…...

Flutter- AutomaticKeepAliveClientMixin 实现Widget保持活跃状态

前言 在 Flutter 中&#xff0c;AutomaticKeepAliveClientMixin 是一个 mixin&#xff0c;用于给 State 类添加能力&#xff0c;使得当它的内容滚动出屏幕时仍能保持其状态&#xff0c;这对于 TabBarView 或者滚动列表中使用 PageView 时非常有用&#xff0c;因为这些情况下你…...

《计算机组成原理》期末复习题节选

第三章–存储系统 3.1 存储器性能指标 核心公式&#xff1a; 存储容量存储字数*字长 &#xff0c;存储字数表示存储器的地址空间的大小&#xff0c;字长表示一次存取操作的数据量.数据传输率数据宽度/存储周期 1、设机器字长为32位&#xff0c;一个容量为16MB的存储器&…...

绍兴网站建设报价/seo行业

题面&#xff1a;https://www.lydsy.com/JudgeOnline/problem.php?id5457 题解&#xff1a; 线段树合并&#xff0c;对于每个节点维护sum&#xff08;以该节点为根的子树中最大的种类和&#xff09;和kind&#xff08;以该节点为根的子树中种类和最大的种类&#xff09;即可。…...

东莞创建网站/百度投放广告收费标准

克鲁斯卡尔算法 迪杰斯特拉算法 笛卡尔乘积 欧拉回路 对称差 幂集 主析取范式 偏序集合 可达矩阵 奥尔定理 贪心算法...

如何做购物网站推广/淘数据

海量数据的解决方案参考文章&#xff1a; &#xff08;1&#xff09;海量数据的解决方案 &#xff08;2&#xff09;https://www.cnblogs.com/guxia/p/6398674.html 备忘一下。...

网站建设中网页模板/优化营商环境个人心得

之前在项目中使用ajax都是通过jQuery的Ajax API来进行的&#xff0c;今天试了一下通过基本的JavaScript来进行ajax请求&#xff0c;将代码记录下来&#xff1a; jsp 页面[xhtml] view plaincopy<% page pageEncoding"UTF-8"%> > <html> …...

wordpress网站自动伪原创/品牌推广方式有哪些

KMP算法是一种改进的字符串匹配算法&#xff0c;由D.E.Knuth&#xff0c;J.H.Morris和V.R.Pratt同时发现&#xff0c;因此人们称它为克努特——莫里斯——普拉特操作&#xff08;简称KMP算法&#xff09;。KMP算法的关键是利用匹配失败后的信息&#xff0c;尽量减少模式串与主串…...

无锡企业网站制作哪家比较好/百度升级最新版本下载安装

Shell命令替换是指将命令的输出结果作为值赋给某个变量。比如&#xff0c;在某个目录中输入ls命令可查看当前目录中所有的文件&#xff0c;但如何将输出内容存入某个变量中呢&#xff1f;这就需要使用命令替换了&#xff0c;这也是Shell编程中使用非常频繁的功能。Shell中有两种…...