当前位置：首页 > news >正文

word2vector训练数据集整理（代码实现）

news 2026/2/8 11:22:25

import math
import os
import random
import torch
import dltools
from matplotlib import pyplot as plt

#读取数据集
def read_ptb():"""将PTB数据集加载到文本行的列表中"""with open('./ptb/ptb.train.txt') as f:raw_text = f.read()return [line.split() for line in raw_text.split('\n')]sentences = read_ptb()
print(f'# sentences数：{len(sentences)}')

# sentences数：42069

#构建词表，并把频次低于10的词元替换为<unk>
vocab = dltools.Vocab(sentences, min_freq=10)
print(f'# vocab_size: {len(vocab)}')

#向下采样
def subsample(sentences, vocab):#排除未知词元‘<unk>’,对sentences进行处理sentences = [[token for token in line if vocab[token] != vocab.unk] for line in sentences]#对排除unk的sentences进行tokens计数  （未去重）counter = dltools.count_corpus(sentences)#聚合num_tokens = sum(counter.values())#若在下采样期间保留词元， 则返回True    def keep(token):return (random.uniform(0, 1) < math.sqrt(1e-4 / (counter[token] / num_tokens)))#降低冠词等无意义词的频次,  词频低越容易保留return ([[token for token in line if keep(token)] for line in sentences], counter)  subsampled, counter = subsample(sentences, vocab)

#画出下采样之后的图, 采取下采样前后的20条数据
before = [len(x) for x in sentences[:20]]
after = [len(x) for x in subsampled[:20]]
x = range(len(before))
plt.bar(x, height=before, width=0.4, alpha=0.8, color='red', label='before')
#[i + 0.4 for i in x] 是X轴刻度
plt.bar([i + 0.4 for i in x], height=after, width=0.4, color='green', label='after')
plt.xlabel('tokens per sentences')
plt.ylabel('count')
plt.legend(['before', 'after'])
plt.show()

def compare_counts(token):return (f'"{token}"的数量：' f'之前={sum([l.count(token) for l in sentences])}, ' f'之后={sum([l.count(token) for l in subsampled])}')compare_counts('the')

'"the"的数量：之前=50770, 之后=2000'

compare_counts('publishing')

'"publishing"的数量：之前=64, 之后=64'

#将词元映射到他们在语料库中的索引
corpus = [vocab[line] for line in subsampled]
corpus[:3]

[[], [71, 2115], [5277, 3054, 1580, 95]]

#中心词和上下文词的提取
def get_centers_and_contetxs(corpus, max_window_size):"""返回skip_gram模型中的中心词和上下文词"""centers, contexts = [], []for line in corpus:#要形成“中心词——上下文词对”， 每个句子至少需要有2个词if len(line) < 2:continuecenters += line #把满足条件的line放于中心词列表中for idx, i in enumerate(range(len(line))):   #上下文窗口的中间token的索引为iwindow_size = random.randint(1, max_window_size)print('中心词 {} 的窗口大小：{}'.format(idx, window_size))indices = list(range(max(0, i - window_size), min(len(line), i + window_size + 1)))#从上下文词中排除中心词indices.remove(i)contexts.append([line[x] for x in indices])return centers, contexts

#假设数据
tiny_dataset = [list(range(7)), list(range(7,10))]
print('数据集', tiny_dataset)
#表示解压函数，用于将打包的元组解压回原来的序列
for center, context in zip(*get_centers_and_contetxs(tiny_dataset, 2)):print('中心词：',center, '的上下文词是：', context)

数据集 [[0, 1, 2, 3, 4, 5, 6], [7, 8, 9]]
中心词 0 的窗口大小：1
中心词 1 的窗口大小：2
中心词 2 的窗口大小：2
中心词 3 的窗口大小：1
中心词 4 的窗口大小：2
中心词 5 的窗口大小：2
中心词 6 的窗口大小：2
中心词 0 的窗口大小：2
中心词 1 的窗口大小：1
中心词 2 的窗口大小：1
中心词 0 的上下文词是 [1]
中心词 1 的上下文词是 [0, 2, 3]
中心词 2 的上下文词是 [0, 1, 3, 4]
中心词 3 的上下文词是 [2, 4]
中心词 4 的上下文词是 [2, 3, 5, 6]
中心词 5 的上下文词是 [3, 4, 6]
中心词 6 的上下文词是 [4, 5]
中心词 7 的上下文词是 [8, 9]
中心词 8 的上下文词是 [7, 9]
中心词 9 的上下文词是 [8]

#在PTB上进行中心词和背景词提取
#max_window_size=5  业界常用到的数值，效果比较好
all_centers, all_contexts = get_centers_and_contetxs(corpus, 5)
'“中心词-上下文词对”的数量:{}'.format( sum([len(contexts) for contexts in all_contexts]))

'“中心词-上下文词对”的数量:1499666'

#负采样_按权重抽取
class RandomGenerator:"""根据n个采样权重在{1，2，,3，...n}中随机抽取"""def __init__(self, sampling_weights):#Exclude 排除self.population = list(range(1, len(sampling_weights) + 1))  #对采样数据的编号self.sampling_weights = sampling_weightsself.candidates = []  #采样结果self.i = 0def draw(self):if self.i == len(self.candidates):#缓存k个随机采样的结果    # population:集群。 weights:相对权重。 cum_weights:累加权重。 k:选取次数self.candidates = random.choices(self.population, self.sampling_weights, k=10000)  #k最大值=10000（采样数量）self.i = 0self.i += 1return self.candidates[self.i - 1]

#假设数据验证
generator = RandomGenerator([2, 3, 4])
[generator.draw() for _ in range(10)]

[2, 1, 1, 2, 1, 1, 3, 2, 3, 2]

#返回负采样中的噪声词
def get_negatives(all_contetxs, vocab, counter, K):#索引为1,2，....（索引0是此表中排除的未知标记）sampling_weights = [counter[vocab.to_tokens(i)]**0.75 for i in range(1, len(vocab))]all_negatives, generator = [], RandomGenerator(sampling_weights)for contexts in all_contetxs:  #遍历背景词negatives = []while len(negatives) < len(contexts) * K:neg = generator.draw()#噪声词不能是上下文词if neg not in contexts:negatives.append(neg)all_negatives.append(negatives)return all_negativesall_negatives = get_negatives(all_contexts, vocab, counter, 5)

# 小批量操作
def batchify(data):"""返回带有负采样的跳元模型的小批量样本"""max_len = max(len(c) + len(n) for _, c, n in data)centers, contexts_negatives, masks, labels = [], [], [], []for center, context, negative in data:cur_len = len(context) + len(negative)centers += [center]contexts_negatives += \[context + negative + [0] * (max_len - cur_len)]masks += [[1] * cur_len + [0] * (max_len - cur_len)]labels += [[1] * len(context) + [0] * (max_len - len(context))]return (torch.tensor(centers).reshape((-1, 1)), torch.tensor(contexts_negatives), torch.tensor(masks), torch.tensor(labels))

#小批量的例子
x_1 = (1, [2, 2], [3, 3, 3, 3])
x_2 = (1, [2, 2, 2], [3, 3])
batch = batchify((x_1, x_2))names = ['centers', 'contexts_negative', 'masks', 'labels']
for name, data in zip(names, batch):print(name, '=', data)

centers = tensor([[1],[1]])
contexts_negative = tensor([[2, 2, 3, 3, 3, 3],[2, 2, 2, 3, 3, 0]])
masks = tensor([[1, 1, 1, 1, 1, 1],[1, 1, 1, 1, 1, 0]])
labels = tensor([[1, 1, 0, 0, 0, 0],[1, 1, 1, 0, 0, 0]])

#整合后的数据加载处理模块
def load_data_ptb(batch_size, max_window_size, num_noise_words):"""下载PTB数据集， 然后将其加载到内存中"""#加载PTB数据集sentences = read_ptb()#获取词汇表vocab = dltools.Vocab(sentences, min_freq=10)#下采样subsampled, counter = subsample(sentences, vocab)#语料库corpus = [vocab[line] for line in subsampled]#获取中心词与背景词all_centers, all_contexts = get_centers_and_contetxs(corpus, max_window_size)#获取噪声词get_negatives(all_contetxs, vocab, counter, num_noise_words)class PTBDataset(torch.utils.data.Dataset):def __init__(self, centers, contexts, negatives):assert len(centers) == len(contexts) == len(negatives)self.centers = centersself.contexts = contextsself.negatives = negativesdef __getitem__(self, index):return (self.centers[index], self.contexts[index],self.negatives[index])def __len__(self):return len(self.centers)dataset = PTBDataset(all_centers, all_contexts, all_negatives)data_iter = torch.utils.data.DataLoader(dataset, batch_size, shuffle=True, collate_fn = batchify)return data_iter, vocab

data_iter, vocab = load_data_ptb(5, 5, 5)
for batch in data_iter:for name, data in zip(names, batch):print(name, 'shape:', data.shape)break

centers shape: torch.Size([5, 1])
contexts_negatives shape: torch.Size([5, 48])
masks shape: torch.Size([5, 48])
labels shape: torch.Size([5, 48])

batch

(tensor([[1259],[ 627],[5679],[   3],[ 960]]),tensor([[1983, 1136, 1186,   15, 3216, 5351,  512,  321, 2208, 1396,   60,  782,63,  929,  149,  105,  305,    7,   74,   11, 1530,    1, 5893, 2668,0,    0,    0,    0,    0,    0,    0,    0,    0,    0,    0,    0,0,    0,    0,    0,    0,    0,    0,    0,    0,    0,    0,    0],[ 298, 1960, 1098, 1288,    6, 1689, 4808,  981, 2040, 3887,  385,   59,2167, 4424,   91, 4159,   65, 1271, 3621, 6020,  585, 1426, 5097,  335,18,  770, 5317, 1408, 5828, 3321,  836,  529, 1772,  365, 6718,  269,101,  209, 1450,    1,   47,  834,    8,    2,  979,   28, 4029,  471],[6034,    2, 4028,  829, 1042, 5340,    0,    0,    0,    0,    0,    0,0,    0,    0,    0,    0,    0,    0,    0,    0,    0,    0,    0,0,    0,    0,    0,    0,    0,    0,    0,    0,    0,    0,    0,0,    0,    0,    0,    0,    0,    0,    0,    0,    0,    0,    0],[ 678,  582, 5033, 4220,  959,  280,  124,  397,  211,  787, 2795,  383,18,   16, 1293, 1212, 2149, 2627,  623,    8, 4467,  155, 3932, 1447,5595,   27,   15,   81,  283, 2631,  410,  938,    4,  344, 5204,  233,149,    2, 4933, 5675,   62,  182,   18, 1186,  227, 2429, 2349,   31],[ 128, 1332, 3790, 1370,  950,  119, 1369, 1328, 1007, 2831,  782,  374,723,   13,   14,   76,  618,    1,  821,  143, 2317, 5730,  978,  753,839, 2055,  160,   12,  377,    4,    0,    0,    0,    0,    0,    0,0,    0,    0,    0,    0,    0,    0,    0,    0,    0,    0,    0]]),tensor([[1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],[1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1],[1, 1, 1, 1, 1, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],[1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1],[1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,1, 1, 1, 1, 1, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0]]),tensor([[1, 1, 1, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],[1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],[1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],[1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],[1, 1, 1, 1, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0]]))

word2vector训练数据集整理（代码实现）

import math import os import random import torch import dltools from matplotlib import pyplot as plt #读取数据集 def read_ptb():"""将PTB数据集加载到文本行的列表中"""with open(./ptb/ptb.train.txt) as f:raw_text f.read()return…...

编程日记 2024/9/30 14:55:13

无心上班，只想为祖国庆生？让ChatGPT帮你搞定工作！

国庆假期临近，大家的心早已飞向诗和远方了吧。然而，现实总是无情地将我们拉回到堆积如山的工作任务上：紧急报告的截止日期就在眼前，复杂的项目策划还未动笔，客户的定制需求迫在眉睫。每年的这个时候，如何…...

编程日记 2024/9/30 14:54:12

【Python】YOLO牛刀小试：快速实现视频物体检测

YOLO牛刀小试：快速实现视频物体检测在深度学习的众多应用中，物体检测是一个热门且重要的领域。YOLO（You Only Look Once）系列模型以其快速和高效的特点，成为了物体检测的首选之一。本文将介绍如何使用YOLOv8模型进行…...

编程日记 2024/9/30 14:48:05

Vscode超好看的渐变主题插件

样式效果： 插件使用方法： 然后重启，之后会显示vccode损坏，不用理会，因为这个插件是更改了应用内部代码，直接不再显示即可。...

编程日记 2024/9/30 14:47:03

OceanBase技术解析：自适应分布式下压技术

在《OceanBase 数据库源码解析》这本书中，关于SQL执行器的深入剖析相对较少，因此，希望增添一些实用且详尽的补充内容。上一篇博客《 OceanBase技术解析： 执行器中的自适应技术》中，已初步介绍了执行器中几项典型的自适…...

编程日记 2024/9/30 14:46:03

Firebase和JavaScript创建Postback Link逻辑

Firebase是一个提供后端即服务（BaaS）的平台，它允许开发者快速构建应用程序而无需管理服务器。Firebase不直接提供生成Postback Link的功能，但您可以使用Firebase的功能来构建和管理URL，然后在客户端使用这些URL来实现Postback。以下是如何使用Firebase和JavaScript来创建…...

编程日记 2024/9/30 14:45:01

docker配置daemon.json文件

报错 ：Get "https://registry-1.docker.io/v2/": net/http: request canceled while waiting for connection (Client.Timeout exceeded while awaiting headers) 解决方法配置加速地址 vim /etc/docker/daemon.json添加以下内容 {"registry-mirro…...

编程日记 2024/9/30 14:44:00

【08】纯血鸿蒙HarmonyOS NEXT星河版开发0基础学习笔记-Scroll容器与Tabs组件

序言： 本文详细讲解了关于我们在页面上经常看到的可滚动页面和导航栏在鸿蒙开发中如何用Scroll和Tabs组件实现，介绍了Scroll和Tabs的基本用法与属性。笔者也是跟着B站黑马的课程一步步学习，学习的过程中添加部分自己的想法整理为笔记分享出…...

编程日记 2024/9/30 14:41:57

苏州数字化科技展厅展馆-「世岩科技」一站式服务商

数字化科技展厅展馆设计施工是一个综合性强、技术要求高的项目，涉及到众多方面的要点。以下是对数字化科技展厅展馆设计施工要点的详细分析： 一、明确目标与定位在设计之初，必须明确展厅的目标和定位。这包括确定展厅的主题、目标受众、展…...

编程日记 2024/9/30 14:38:54

音频搜索公司 DeepGram，定位语音搜索AI大脑，DeepGram想做“音频版”

1. 亦仁分享 DeepGram 成立于 2015 年，位于美国山景城，是一家基于 AI 技术的音频搜索引擎公司。运用机器学习进行语音识别、搜寻重要时刻并对音频和视频进行分类，帮助用户快速索引和浏览音频和视频文件，包括电话语音、会议语音、…...

编程日记 2024/9/30 14:37:53

基于php的在线租房管理系统

作者：计算机学姐开发技术：SpringBoot、SSM、Vue、MySQL、JSP、ElementUI、Python、小程序等，“文末源码”。专栏推荐：前后端分离项目源码、SpringBoot项目源码、Vue项目源码、SSM项目源码精品专栏：Java精选实战项目…...

编程日记 2024/9/30 14:30:46

如何评价 Python 语言的运行速度

Python 作为一门编程语言，其运行速度一直是业界讨论的焦点。它的简洁语法和广泛的应用使得它在开发过程中非常高效，然而，运行速度与一些更底层的编程语言相比存在一定的劣势。这是否是由于 Python 语法的简洁性所带来的代价？我们可…...

编程日记 2024/9/30 14:29:44

Tomcat系列漏洞复现

CVE-2017-12615——Tomcat put⽅法任意⽂件写⼊漏洞漏洞描述当 Tomcat运⾏在Windows操作系统时，且启⽤了HTTP PUT请求⽅法（例如，将 readonly初始化参数由默认值设置为false），攻击者将有可能可通过精⼼构造的攻击请求…...

编程日记 2024/9/30 14:28:43

K8S拉取本地docker中registry的镜像报错：http: server gave HTTP response to HTTPS client

本地部署了一个K8S集群，但是worker1和worker2的docker无法拉取外面的镜像，docker的daemon.json也配置了，无法下载，于是在master部署了一个docker registry。但是pod还是无法拉取registry的镜像并报错。我这里使用的是container…...

编程日记 2024/9/30 14:26:41

Leetcode 1235. 规划兼职工作

1.题目基本信息 1.1.题目描述你打算利用空闲时间来做兼职工作赚些零花钱。这里有 n 份兼职工作，每份工作预计从 startTime[i] 开始到 endTime[i] 结束，报酬为 profit[i]。给你一份兼职工作表，包含开始时间 startTime，结束时…...

编程日记 2024/9/30 14:23:38

LeetCode 2535.数组元素和与数字和的绝对差：模拟

【LetMeFly】2535.数组元素和与数字和的绝对差：模拟力扣题目链接：https://leetcode.cn/problems/difference-between-element-sum-and-digit-sum-of-an-array/ 给你一个正整数数组 nums 。元素和是 nums 中的所有元素相加求和。数字和是 nums 中每…...

编程日记 2024/9/30 14:20:34

SpringCloud-pom创建Eureka

<?xml version"1.0" encoding"UTF-8"?> <project xmlns"http://maven.apache.org/POM/4.0.0" xmlns:xsi"http://www.w3.org/2001/XMLSchema-instance"xsi:schemaLocation"http://maven.apache.org/POM/4.0.0 https://…...

编程日记 2024/9/30 14:19:32

动态规划算法专题（一）：斐波那契数列模型

目录 1、动态规划简介 2、算法实战应用【leetcode】 2.1 题一：第N个泰波那契数 2.1.1 算法原理 2.1.2 算法代码 2.1.3 空间优化原理——滚动数组 2.1.4 算法代码——空间优化版本 2.2 题二：三步问题 2.2.1 算法原理 2.2.2 算法代码 2.3 题二&a…...

编程日记 2024/9/30 14:17:29

H.264编解码工具 - x264

一、简介 x264是一个开源的H.264/AVC视频编码库，它可以将视频数据压缩成H.264格式，并且可以从H.264格式解码出原始视频数据。 x264是以C语言编写的，并且可以在多个平台上使用，包括Windows、Linux和Mac OS等操作系统。 x264具有很高的编码效率和视频质量，它支持多种编码…...

编程日记 2024/9/30 14:16:28

外卖点餐小程序源码系统单店多门店自助切换带完整的安装代码包以及搭建部署教程

系统概述本外卖点餐小程序源码系统旨在帮助餐饮企业和商家快速搭建一个功能完善的在线外卖平台。系统支持单店与多门店的灵活切换，方便商家根据自身业务需求进行管理和运营。同时，系统还提供了丰富的营销工具和数据分析功能，助力商家实现精…...

编程日记 2024/9/30 14:15:27

SpringBoot-17-MyBatis动态SQL标签之常用标签

文章目录 1 代码1.1 实体User.java1.2 接口UserMapper.java1.3 映射UserMapper.xml1.3.1 标签if1.3.2 标签if和where1.3.3 标签choose和when和otherwise1.4 UserController.java2 常用动态SQL标签2.1 标签set2.1.1 UserMapper.java2.1.2 UserMapper.xml2.1.3 UserController.ja…...

编程新知 2026/2/7 23:18:39

浅谈 React Hooks

React Hooks 是 React 16.8 引入的一组 API，用于在函数组件中使用 state 和其他 React 特性（例如生命周期方法、context 等）。Hooks 通过简洁的函数接口，解决了状态与 UI 的高度解耦，通过函数式编程范式实现更灵活 Rea…...

编程新知 2025/9/23 15:13:40

大型活动交通拥堵治理的视觉算法应用

大型活动下智慧交通的视觉分析应用一、背景与挑战大型活动（如演唱会、马拉松赛事、高考中考等）期间，城市交通面临瞬时人流车流激增、传统摄像头模糊、交通拥堵识别滞后等问题。以演唱会为例，暖城商圈曾因观众集中离场导致周边…...

编程新知 2026/1/23 7:15:40

AI编程--插件对比分析：CodeRider、GitHub Copilot及其他

AI编程插件对比分析：CodeRider、GitHub Copilot及其他随着人工智能技术的快速发展，AI编程插件已成为提升开发者生产力的重要工具。CodeRider和GitHub Copilot作为市场上的领先者，分别以其独特的特性和生态系统吸引了大量开发者。本文将从功…...

编程新知 2026/1/25 16:39:17

IP如何挑？2025年海外专线IP如何购买？

你花了时间和预算买了IP，结果IP质量不佳，项目效率低下不说，还可能带来莫名的网络问题，是不是太闹心了？尤其是在面对海外专线IP时，到底怎么才能买到适合自己的呢？所以，挑IP绝对是个技…...

编程新知 2026/1/28 3:04:35

音视频——I2S 协议详解

I2S 协议详解 I2S (Inter-IC Sound) 协议是一种串行总线协议，专门用于在数字音频设备之间传输数字音频数据。它由飞利浦（Philips）公司开发，以其简单、高效和广泛的兼容性而闻名。 1. 信号线 I2S 协议通常使用三根或四根信号线&a…...

编程新知 2026/2/1 2:08:53

DingDing机器人群消息推送

文章目录 1 新建机器人2 API文档说明3 代码编写 1 新建机器人点击群设置下滑到群管理的机器人，点击进入添加机器人选择自定义Webhook服务点击添加设置安全设置，详见说明文档成功后，记录Webhook 2 API文档说明点击设置说明查看自…...

编程新知 2026/1/30 4:18:53

Caliper 负载(Workload)详细解析

Caliper 负载(Workload)详细解析负载(Workload)是 Caliper 性能测试的核心部分，它定义了测试期间要执行的具体合约调用行为和交易模式。下面我将全面深入地讲解负载的各个方面。一、负载模块基本结构一个典型的负载模块(如 workload.js)包含以下基本结构： use strict;/…...

编程新知 2025/10/31 21:11:39

脑机新手指南（七）：OpenBCI_GUI：从环境搭建到数据可视化（上）

一、OpenBCI_GUI 项目概述 （一）项目背景与目标 OpenBCI 是一个开源的脑电信号采集硬件平台，其配套的 OpenBCI_GUI 则是专为该硬件设计的图形化界面工具。对于研究人员、开发者和学生而言，首次接触 OpenBCI 设备时，往…...

编程新知 2026/2/3 4:26:32

DeepSeek源码深度解析 × 华为仓颉语言编程精粹——从MoE架构到全场景开发生态

前言在人工智能技术飞速发展的今天，深度学习与大模型技术已成为推动行业变革的核心驱动力，而高效、灵活的开发工具与编程语言则为技术创新提供了重要支撑。本书以两大前沿技术领域为核心，系统性地呈现了两部深度技术著作的精华：…...

编程新知 2026/2/5 4:33:51

相关文章：