当前位置：首页 > news >正文

Dataset和DataLoader用法

news 2026/2/8 10:31:39

Dataset和DataLoader用法

在d2l中有简洁的加载固定数据的方式，如下

d2l.load_data_fashion_mnist()
# 源码
Signature: d2l.load_data_fashion_mnist(batch_size, resize=None)
Source:   
def load_data_fashion_mnist(batch_size, resize=None):"""Download the Fashion-MNIST dataset and then load it into memory.Defined in :numref:`sec_fashion_mnist`"""trans = [transforms.ToTensor()]if resize:trans.insert(0, transforms.Resize(resize))trans = transforms.Compose(trans)mnist_train = torchvision.datasets.FashionMNIST(root="../data", train=True, transform=trans, download=True)mnist_test = torchvision.datasets.FashionMNIST(root="../data", train=False, transform=trans, download=True)return (data.DataLoader(mnist_train, batch_size, shuffle=True,num_workers=get_dataloader_workers()),data.DataLoader(mnist_test, batch_size, shuffle=False,num_workers=get_dataloader_workers()))
File:      ~/anaconda3/envs/d2l/lib/python3.9/site-packages/d2l/torch.py
Type:      function

如果我们要自定义需要加载的数据集

数据集：一个图片文件夹，用csv文件来表示训练数据和标签

# 定义Dataset
import pandas as pd
import os
from PIL import Image
from torch.utils.data import Dataset, DataLoaderfrom sklearn.model_selection import train_test_split
from sklearn.preprocessing import LabelEncoder
import torchvision.transforms as transformsclass CustomDataset(Dataset):def __init__(self, csv_file, root_dir, transform=None):self.data = pd.read_csv(csv_file) self.root_dir = root_dirself.transform = transformlabel_encoder = LabelEncoder()self.labels = label_encoder.fit_transform(self.data['label'])def __len__(self):return len(self.data)def __getitem__(self, idx):img_name = os.path.join(self.root_dir, self.data.iloc[idx, 0])# 读取图片并做增广image = Image.open(img_name)if self.transform is not None:image = self.transform(image)# 将数字转换成独热编码的张量(记得转换成float)label = F.one_hot(torch.tensor(self.labels[idx]), 		num_classes=self.data['label'].nunique()).float()return image, label# 定义参数和超参数训练
batch_size = 256
lr = num_epoch = 0.9, 10# 加载数据
sample = '/kaggle/input/classify-leaves/sample_submission.csv'
ts_path = "/kaggle/input/classify-leaves/test.csv"
tr_path = "/kaggle/input/classify-leaves/train.csv"
image_path = '/kaggle/input/classify-leaves'dataset = CustomDataset(csv_file = sample, root_dir = image_path, transform=transform_train)
train_size = int(0.8 * len(dataset))
valid_size = len(dataset) - train_size
tr_dataset, te_dataset = torch.utils.data.random_split(dataset, [train_size, valid_size])tr_dataloader = DataLoader(tr_dataset, batch_size, shuffle=True)
ts_dataloader = DataLoader(te_dataset, batch_size, shuffle=False)

总结

需要将__init__,len,__getitem__按照数据集和模型的要求，对应的编写好代码。

Dataset和DataLoader用法

Dataset和DataLoader用法在d2l中有简洁的加载固定数据的方式，如下 d2l.load_data_fashion_mnist() # 源码 Signature: d2l.load_data_fashion_mnist(batch_size, resizeNone) Source: def load_data_fashion_mnist(batch_size, resizeNone):"""…...

编程日记 2023/9/25 10:17:54

【跟小嘉学习区块链】二、Hyperledger Fabric 架构详解

系列文章目录【跟小嘉学习区块链】一、区块链基础知识与关键技术解析【跟小嘉学习区块链】一、区块链基础知识与关键技术解析文章目录系列文章目录[TOC](文章目录) 前言一、Hyperledger 社区1.1、Hyperledger(面向企业的分布式账本)1.2、Hyperledger社区组织结构二、Hype…...

编程日记 2023/9/25 10:16:53

springboot下spring方式实现Websocket并设置session时间

概述 springboot实现websocket有4种方式 servlet，spring，netty，stomp 使用下来spring方式是最简单的. springboot版本：3.1.2 jdk：17 当前依赖版本 <dependency><groupId>org.springframework.boot<…...

编程日记 2023/9/25 10:15:51

LeetCode算法二叉树—相同的树

目录 100. 相同的树 - 力扣（LeetCode） 代码： 运行结果： 给你两棵二叉树的根节点 p 和 q ，编写一个函数来检验这两棵树是否相同。如果两个树在结构上相同，并且节点具有相同的值，则认为它们是…...

编程日记 2023/9/25 10:14:50

搭建Flink集群、集群HA高可用以及配置历史服务器

Flink集群搭建 Flink集群搭建集群规划下载并解压安装包修改集群配置分发安装目录启动集群访问Web UI Flink集群HA高可用概述集群规划配置flink配置master、workers配置ZK分发安装目录启动HA集群测试 Flink参数配置配置历史服务器概述配置启动、停止历史服务器提交一个Job任务查…...

编程日记 2023/9/25 10:12:47

vscode终端中打不开conda虚拟包管理

今天，想着将之前鸽的Unet网络模型给实现一下，结果发现，在vscode中运行python脚本，显示没有这包，没有那包。但是在其他的ipynb中是有的，感觉很奇怪。我检查了一下python版本，发现不是我深度学习的…...

编程日记 2023/9/25 10:11:46

【音视频】MP4封装格式

基本概念使用MP4box.js查看MP4内部组成结构整体结构数据索引（moov）数据流包（mdat） 各个包的位置，大小，信息，时间戳，编码方式等全在数据索引数据流包只有纯二进制码流数据数据…...

编程日记 2023/9/25 10:10:45

环境-使用vagrant快速创建linux虚拟机

1.下载软件虚拟机 Oracle VM VirtualBox 镜像 Vagrant by HashiCorp (vagrantup.com) 如果下载慢，可以复制下载链接，使用迅雷下载 2.安装根据提示点击下一步即可，建议安装到空间较大的非系统盘。打开 window cmd 窗口，…...

编程日记 2023/9/25 10:08:43

10.1网站编写(Tomcat和servlet基础)

一.Tomcat: 1.Tomcat是java写的,运行时需要依赖jre,所以要装jdk. 2.建议配置好环境变量. 3.默认端口号8080(业务端口)可能会被占用,建议改一下(本人改成了9999). 4.另一个默认端口是8005(管理端口). 二Servlet基础(编写一个hello world代码): 整体分为7个步骤,分别是创建…...

编程日记 2023/9/25 10:07:42

10CQRS

本系列包含以下文章： DDD入门DDD概念大白话战略设计代码工程结构请求处理流程聚合根与资源库实体与值对象应用服务与领域服务领域事件CQRS（本文） 案例项目介绍 # 既然DDD是“领域”驱动，那么我们便不能抛开业务而只讲技术&…...

编程日记 2023/9/25 10:04:39

DAZ To UMA⭐一.DAZ简单使用教程

文章目录 🟥 DAZ快捷键🟧 DAZ界面介绍 🟥 DAZ快捷键移动物体:ctrlalt鼠标左键旋转物体:ctrlalt鼠标右键导入模型:双击左侧模型UI 🟧 DAZ界面介绍 Files:显示全部文件 Products:显示全部产品 Figures:安装的全部人物 Wardrobe…...

编程日记 2023/9/25 10:03:36

面试题 —— Java集合篇（23题）

文章目录 1.Java中常见集合有哪些 ？2. 说说你对Java集合是怎么理解的？3.请你说一下List，Set，Map三者的特点是 ？4.在实际开发过程中如何更好的选择集合 ？5. ArrayList和Vector区别 ？6. ArrayList…...

编程日记 2023/9/25 10:02:35

SpringBoot2.7.14整合Swagger3.0的详细步骤及容易踩坑的地方

🧑‍💻作者名称：DaenCode 🎤作者简介：啥技术都喜欢捣鼓捣鼓，喜欢分享技术、经验、生活。 😎人生感悟：尝尽人生百味，方知世间冷暖。 📖所属专栏：Sp…...

编程日记 2023/9/25 9:59:32

题解：ABC321D - Set Menu

题解：ABC321D - Set Menu 题目链接：Atcoder。链接：洛谷。难度算法难度：B。思维难度：C。调码难度：B。综合评价：见洛谷链接。算法枚举二分查找。思路先对b升序排序&#x…...

编程日记 2023/9/25 9:57:30

什么是Progressive Web App（PWA）？它们有哪些特点？

聚沙成塔每天进步一点点 ⭐ 专栏简介⭐ 渐进式Web App简介⭐ PWAs的主要特点⭐ 总结⭐ 写在最后 ⭐ 专栏简介前端入门之旅：探索Web开发的奇妙世界欢迎来到前端入门之旅！感兴趣的可以订阅本专栏哦！这个专栏是为那些对Web开发感兴趣、刚刚踏入…...

编程日记 2023/9/25 9:56:29

MySQL的高级SQL语句

目录一、高级SQL语句 1、select 查询表中一个或多个字段的数据 2、distinct 不显示重复的数据记录 3、where 有条件查询 4、and与or 且与或 5、in 显示在某个范围值内的字段的信息 6、between 显示两个值范围内的数据记录 7、order by 对字…...

编程日记 2023/9/25 9:55:28

基于人脸5个关键点的人脸对齐（人脸纠正）

摘要：人脸检测模型输出人脸目标框坐标和5个人脸关键点，在进行人脸比对前，需要对检测得到的人脸框进行对齐（纠正），本文将通过5个人脸关键点信息对人脸就行对齐（纠正）。一、输入图像…...

编程日记 2023/9/25 9:54:27

vue3中两个el-select下拉框选项相互影响

vue3中两个el-select下拉框选项相互影响 1、开发需求2、代码2.1 定义hooks文件2.2 在组件中使用 1、开发需求如图所示，在项目开发过程中，遇到这样一个需求，常规时段中选中的月份在高峰时段中是禁止选择的状态，反之亦然。 2、代…...

编程日记 2023/9/25 9:53:27

博弈论——反应函数

反应函数 1 引言谢老师的《经济博弈论》书中对反应函数并没有给出一般笼统的定义，而是将其应用与古诺模型并给出了相关解释：反应函数是指在无限策略的古诺博弈模型中，博弈方的策略有无限多种，因此各个博弈方的最佳对策也有无限…...

编程日记 2023/9/25 9:50:23

UE5读取json文件

一、下载插件在工程中启用二、定义读取外部json文件的函数，参考我之前的文章 ue5读取外部文件_艺菲的博客-CSDN博客三、读取文件并解析为json对象这里Load Text就是自己定义的函数，ResourceBundle为一个字符串常量，通常是读取的文件夹…...

编程日记 2023/9/25 9:47:20

未来机器人的大脑：如何用神经网络模拟器实现更智能的决策？

编辑：陈萍萍的公主一点人工一点智能未来机器人的大脑：如何用神经网络模拟器实现更智能的决策？RWM通过双自回归机制有效解决了复合误差、部分可观测性和随机动力学等关键挑战，在不依赖领域特定归纳偏见的条件下实现了卓越的预测准…...

编程新知 2026/2/7 23:18:28

深入剖析AI大模型：大模型时代的 Prompt 工程全解析

今天聊的内容，我认为是AI开发里面非常重要的内容。它在AI开发里无处不在，当你对 AI 助手说 "用李白的风格写一首关于人工智能的诗"，或者让翻译模型 "将这段合同翻译成商务日语" 时，输入的这句话就是 Prompt。…...

编程新知 2026/2/7 5:56:30

Prompt Tuning、P-Tuning、Prefix Tuning的区别

一、Prompt Tuning、P-Tuning、Prefix Tuning的区别 1. Prompt Tuning（提示调优）核心思想：固定预训练模型参数，仅学习额外的连续提示向量（通常是嵌入层的一部分）。实现方式：在输入文本前添加可训练的连续向量（软提示），模型只更新这些提示参数。优势：参数量少（仅提…...

编程新知 2026/2/8 1:14:13

Golang 面试经典题：map 的 key 可以是什么类型？哪些不可以？

Golang 面试经典题：map 的 key 可以是什么类型？哪些不可以？ 在 Golang 的面试中，map 类型的使用是一个常见的考点，其中对 key 类型的合法性是一道常被提及的基础却很容易被忽视的问题。本文将带你深入理解 Golang 中…...

编程新知 2025/12/20 7:42:02

服务器硬防的应用场景都有哪些？

服务器硬防是指一种通过硬件设备层面的安全措施来防御服务器系统受到网络攻击的方式，避免服务器受到各种恶意攻击和网络威胁，那么，服务器硬防通常都会应用在哪些场景当中呢？ 硬防服务器中一般会配备入侵检测系统和预防系统&#x…...

编程新知 2025/11/9 19:17:07

从零实现STL哈希容器：unordered_map/unordered_set封装详解

本篇文章是对C学习的STL哈希容器自主实现部分的学习分享希望也能为你带来些帮助~ 那咱们废话不多说，直接开始吧！ 一、源码结构分析 1. SGISTL30实现剖析 // hash_set核心结构 template <class Value, class HashFcn, ...> class hash_set {ty…...

编程新知 2026/1/31 12:47:25

第 86 场周赛：矩阵中的幻方、钥匙和房间、将数组拆分成斐波那契序列、猜猜这个单词

Q1、[中等] 矩阵中的幻方 1、题目描述 3 x 3 的幻方是一个填充有从 1 到 9 的不同数字的 3 x 3 矩阵，其中每行，每列以及两条对角线上的各数之和都相等。给定一个由整数组成的row x col 的 grid，其中有多少个 3 3 的 “幻方” 子矩阵&am…...

编程新知 2026/2/7 13:27:36

vue3+vite项目中使用.env文件环境变量方法

vue3vite项目中使用.env文件环境变量方法 .env文件作用命名规则常用的配置项示例使用方法注意事项在vite.config.js文件中读取环境变量方法 .env文件作用 .env 文件用于定义环境变量，这些变量可以在项目中通过 import.meta.env 进行访问。Vite 会自动加载这些环境变…...

编程新知 2026/1/26 19:12:01

中医有效性探讨

文章目录西医是如何发展到以生物化学为药理基础的现代医学？传统医学奠基期（远古 - 17 世纪）近代医学转型期（17 世纪 - 19 世纪末）现代医学成熟期（20世纪至今） 中医的源远流长和一脉相承远古至…...

编程新知 2026/1/23 7:56:54

Spring是如何解决Bean的循环依赖：三级缓存机制

1、什么是 Bean 的循环依赖在 Spring框架中，Bean 的循环依赖是指多个 Bean 之间‌互相持有对方引用‌，形成闭环依赖关系的现象。多个 Bean 的依赖关系构成环形链路，例如：双向依赖：Bean A 依赖 Bean B，同时 Bean B 也依赖 Bean A（A↔B）。链条循环： Bean A → Bean…...

编程新知 2025/7/25 1:21:53

Dataset和DataLoader用法

总结

相关文章：