Python JSON 数据解析教程:从基础到高级
Python JSON 数据解析教程:从基础到高级
引言
在现代编程中,JSON(JavaScript Object Notation)已成为数据交换的标准格式。它以易于阅读和编写的文本格式存储和传输数据,广泛应用于Web API和配置文件中。Python提供了强大的内置库来处理JSON数据,使得解析和生成JSON变得简单高效。本文将深入探讨Python中的JSON数据解析,包括基础用法、高级技巧和实际案例,帮助你全面掌握这一重要技能。
什么是JSON?
JSON是一种轻量级的数据交换格式,易于人类阅读和编写,同时也易于机器解析和生成。JSON使用键值对的方式来表示数据,通常以对象({}
)和数组([]
)的形式出现。
JSON示例
以下是一个简单的JSON对象示例:
{"name": "Alice","age": 30,"is_student": false,"courses": ["Math", "Science"],"address": {"street": "123 Main St","city": "Anytown"}
}
在这个示例中,我们可以看到JSON对象包含了字符串、数字、布尔值、数组和嵌套对象。
Python中的JSON模块
Python的json
模块提供了简单的方法来处理JSON数据。我们可以使用json.loads()
将JSON字符串解析为Python对象,使用json.dumps()
将Python对象转换为JSON字符串。
导入JSON模块
在使用json
模块之前,我们需要先导入它:
import json
JSON数据解析的基本用法
1. 从JSON字符串解析为Python对象
使用json.loads()
函数可以将JSON字符串解析为Python对象。以下是一个简单的示例:
import json# JSON字符串
json_str = '{"name": "Alice", "age": 30, "is_student": false}'# 解析JSON字符串
data = json.loads(json_str)print(data)
print(data['name']) # 输出: Alice
2. 从Python对象转换为JSON字符串
使用json.dumps()
可以将Python对象转换为JSON字符串:
import json# Python字典
data = {"name": "Alice","age": 30,"is_student": False
}# 转换为JSON字符串
json_str = json.dumps(data)
print(json_str) # 输出: {"name": "Alice", "age": 30, "is_student": false}
3. 读取和写入JSON文件
在实际应用中,我们常常需要将JSON数据存储到文件中,或者从文件中读取JSON数据。可以使用json.load()
和json.dump()
函数来实现:
从文件读取JSON数据
import json# 读取JSON文件
with open('data.json', 'r') as file:data = json.load(file)print(data)
将Python对象写入JSON文件
import json# Python字典
data = {"name": "Alice","age": 30,"is_student": False
}# 写入JSON文件
with open('data.json', 'w') as file:json.dump(data, file)
JSON解析的高级用法
1. 处理复杂的JSON数据
在实际应用中,JSON数据可能会非常复杂,包含嵌套对象和数组。我们可以通过递归和循环来处理这些复杂的数据结构。
示例:解析嵌套JSON对象
import json# 复杂的JSON字符串
json_str = '''
{"name": "Alice","age": 30,"courses": [{"name": "Math","grade": "A"},{"name": "Science","grade": "B"}]
}
'''# 解析JSON字符串
data = json.loads(json_str)# 访问嵌套数据
for course in data['courses']:print(f"Course: {course['name']}, Grade: {course['grade']}")
2. 自定义JSON编码
在某些情况下,我们需要自定义如何将Python对象转换为JSON字符串。可以通过继承json.JSONEncoder
类来实现:
import json
from datetime import datetimeclass CustomEncoder(json.JSONEncoder):def default(self, obj):if isinstance(obj, datetime):return obj.isoformat() # 将日期时间对象转换为ISO格式return super().default(obj)# 使用自定义编码器
data = {"name": "Alice","timestamp": datetime.now()
}json_str = json.dumps(data, cls=CustomEncoder)
print(json_str)
3. 使用object_hook
参数解析JSON
在解析JSON时,我们可以使用object_hook
参数自定义如何将JSON对象转换为Python对象。例如,我们可以将JSON对象转换为自定义类的实例:
import jsonclass Person:def __init__(self, name, age):self.name = nameself.age = agedef custom_object_hook(dct):return Person(dct['name'], dct['age'])# JSON字符串
json_str = '{"name": "Alice", "age": 30}'# 解析JSON字符串并使用自定义对象钩子
person = json.loads(json_str, object_hook=custom_object_hook)
print(person.name) # 输出: Alice
print(person.age) # 输出: 30
实际案例:从API获取JSON数据
在实际应用中,处理JSON数据的一个常见场景是从Web API获取数据。以下是一个示例,演示如何从API获取JSON数据并进行解析:
示例:获取GitHub用户信息
import requests
import json# 发起HTTP GET请求
response = requests.get('https://api.github.com/users/octocat')# 解析JSON响应
data = response.json()# 打印用户信息
print(f"Username: {data['login']}")
print(f"Name: {data['name']}")
print(f"Public Repos: {data['public_repos']}")
在这个示例中,我们使用requests
库从GitHub API获取用户信息,并将响应解析为Python对象。
常见问题及解决方案
1. JSONDecodeError
在解析JSON字符串时,如果字符串格式不正确,可能会抛出JSONDecodeError
。确保你的JSON字符串符合标准格式,特别注意引号、逗号和括号的使用。
2. 处理Unicode字符
在JSON中,Unicode字符可能会导致编码问题。可以使用ensure_ascii=False
参数来确保正确处理Unicode字符:
data = {"message": "Hello, 世界"}
json_str = json.dumps(data, ensure_ascii=False)
print(json_str) # 输出: {"message": "Hello, 世界"}
3. JSON与Python数据类型的映射
了解JSON和Python数据类型之间的映射关系是非常重要的:
- JSON对象对应Python字典(
dict
) - JSON数组对应Python列表(
list
) - JSON字符串对应Python字符串(
str
) - JSON数字对应Python整数(
int
)或浮点数(float
) - JSON布尔值对应Python布尔值(
True
或False
) - JSON
null
对应PythonNone
总结
通过本文的学习,你已经掌握了Python中JSON数据解析的基本用法和高级技巧。从简单的JSON字符串解析到复杂的嵌套对象处理,再到自定义编码和从API获取数据,Python的json
模块为我们提供了强大的功能。希望这篇文章能帮助你在实际项目中高效地处理JSON数据。
相关文章:
Python JSON 数据解析教程:从基础到高级
Python JSON 数据解析教程:从基础到高级 引言 在现代编程中,JSON(JavaScript Object Notation)已成为数据交换的标准格式。它以易于阅读和编写的文本格式存储和传输数据,广泛应用于Web API和配置文件中。Python提供了…...

25.UE5时间膨胀,慢动作,切换地图,刷BOSS
2-27 时间膨胀、慢动作、切换地图、刷BOSS_哔哩哔哩_bilibili 目录 1.刷新BOSS逻辑 2.时间膨胀实现慢动作 3.胜利画面,下一关 3.1胜利画面UI 3.2第一关、第二关游戏模式 3.3下一关按钮事件的绑定 1.刷新BOSS逻辑 实现当场上的怪物都死亡后,进行刷…...

Three.js 相机控制器Controls
在 3D 场景中,摄像机的控制尤为重要,因为它决定了用户如何观察和与场景互动。Three.js 提供了多种相机控制器,最常用的有 OrbitControls、TrackballControls、FlyControls 和 FirstPersonControls。OrbitControls 适合用于查看和检查 3D 模型…...
Android开发实战班 - 现代 UI 开发之自定义 Compose 组件
Jetpack Compose 不仅提供了丰富的内置组件,还允许开发者根据项目需求创建自定义组件。自定义 Compose 组件可以提高代码复用性、简化 UI 逻辑,并使应用界面更加一致和模块化。本章节将介绍如何创建自定义 Compose 组件,包括组件的创建、样式…...

All-in-one Notion 介绍
Notion 是一款集笔记、知识管理、任务规划和协作于一体的工具,它以高度的灵活性和可自定义的工作空间而闻名。它适合个人和团队使用,能够帮助用户高效管理生活、学习和工作。以下是 Notion 的一些主要特点: 1. 多功能工作区 Notion 将笔记、…...

深入理解C++11右值引用与移动语义:高效编程的基石
文章目录 前言📚一、C11的历史发展📖1.1 C11 之前的背景📖1.2 C11 的发展历程📖1.3 C11 的主要设计目标📖1.4 C11 的主要特性📖1.5 C11 的影响 📚二、统一的列表初始化📖2.1 基本列表…...

【WRF-Urban】URBPARM_LCZ.TBL 查找表解释及内容
【WRF-Urban】URBPARM_LCZ.TBL 查找表解释及内容 URBPARM_LCZ.TBL 文件的作用URBPARM_LCZ.TBL 文件中的参数URBPARM_LCZ.TBL 的使用URBPARM_LCZ.TBL 文件内容如何调整或扩展 URBPARM_LCZ.TBL参考URBPARM_LCZ.TBL 文件是 WRF(天气研究与预报模型) 中用于处理 局地气候区(Loca…...
网络是怎么连接的
目录 URL HTTP(超文本传输协议) FTP(文件传输协议) File mailto HTTP的方法 Socket URL URL(Uniform Resource Locator)中文名为统一资源定位符,它是互联网上用来标识某一资源的地址。就…...
Java 实现PDF添加水印
maven依赖: <dependency><groupId>com.itextpdf</groupId><artifactId>itextpdf</artifactId><version>5.4.3</version> </dependency>网络地址添加水印代码: public static boolean waterMarkNet(Stri…...

网络安全问题概述
1.1.计算机网络面临的安全性威胁 计算机网络上的通信面临以下的四种威胁: (1) 截获——从网络上窃听他人的通信内容。 (2) 中断——有意中断他人在网络上的通信。 (3) 篡改——故意篡改网络上传送的报文。可应用于域名重定向,即钓鱼网站。 (4) 伪造——伪…...

(udp)网络编程套接字Linux(整理)
源IP地址和目的IP地址 唐僧例子1 在IP数据包头部中, 有两个IP地址, 分别叫做源IP地址, 和目的IP地址.思考: 我们光有IP地址就可以完成通信了嘛? 想象一下发qq消息的例子, 有了IP地址能够把消息发送到对方的机器上,但是还需要有一个其他的标识来区分出, 这个数据要给哪个程序进…...
Web应用安全入门:架构搭建、漏洞分析与HTTP数据包处理
Web应用安全入门:架构搭建、漏洞分析与HTTP数据包处理 引言 在当今数字化时代,Web应用已成为企业和个人在线交互的核心。然而,随着技术的发展,Web应用面临的安全挑战也日益增加。本文旨在为初学者提供一个关于Web应用架构搭建、…...

[JAVA]MyBatis框架—获取SqlSession对象
SqlSessionFactory作为MyBatis框架的核心接口有三大特性 SqlSessionFactory是MyBatis的核心对象 用于初始化MyBatis,创建SqlSession对象 保证SqlSessionFactory在应用中全局唯一 1.SqlSessionFactory是MyBatis的核心对象 假设我们要查询数据库的用户信息&#x…...
Perl 简介
Perl 简介 Perl 是一种高级、通用、解释型、动态编程语言。由 Larry Wall 于 1987 年首次发布,它结合了 C、sed、awk 和 shell 脚本语言的特性。Perl 最初被设计用于文本处理,如报告生成和文件转换,但随着时间的推移,它已经发展成…...
spring-bean的销毁流程
1 引入 在 Spring 框架中,Bean 的生命周期管理是其核心功能之一,而 Bean 的注销(Destruction)是生命周期的最后一步。无论是关闭数据库连接、释放线程资源,还是执行缓存持久化操作,合适的销毁策略都至关重…...

问:Spring MVC DispatcherServlet流程步骤梳理
DispatcherServlet是Spring MVC框架中的核心组件,负责接收客户端请求并将其分发到相应的控制器进行处理。作为前端控制器(Front Controller)的实现,DispatcherServlet在整个请求处理流程中扮演着至关重要的角色。本文将探讨Dispat…...

用源码编译虚幻引擎,并打包到安卓平台
用源码编译虚幻引擎,并打包到安卓平台 前往我的博客,获取更优的阅读体验 作业内容: 源码编译UE5.4构建C项目,简单设置打包到安卓平台 编译虚幻 5 前置内容 这里需要将 Epic 账号和 Github 账号绑定,然后加入 Epic 邀请的组织,…...

快速搭建Android开发环境:Docker部署docker-android并实现远程连接
目录 前言 1. 虚拟化环境检查 2. Android 模拟器部署 3. Ubuntu安装Cpolar 4. 配置公网地址 5. 远程访问 小结 6. 固定Cpolar公网地址 7. 固定地址访问 作者简介: 懒大王敲代码,计算机专业应届生 今天给大家聊聊快速搭建Android开发环境&#x…...
「Mac玩转仓颉内测版21」基础篇1 - 仓颉程序的基本组成
本篇将系统介绍Cangjie编程语言中程序的基本组成部分,涵盖 main 函数的定义、包与模块的使用、变量类型、作用域和代码结构原则,帮助开发者理解Cangjie程序的整体结构。 关键词 程序入口点main函数包与模块变量类型与作用域值类型与引用类型代码结构与规…...

【Linux网络编程】简单的UDP套接字
目录 一,socket编程的相关说明 1-1,sockaddr结构体 1-2,Socket API 二,基于Udp协议的简单通信 三,UDP套接字的应用 3-1,实现英译汉字典 一,socket编程的相关说明 Socket编程是一种网络通信…...

【大模型RAG】拍照搜题技术架构速览:三层管道、两级检索、兜底大模型
摘要 拍照搜题系统采用“三层管道(多模态 OCR → 语义检索 → 答案渲染)、两级检索(倒排 BM25 向量 HNSW)并以大语言模型兜底”的整体框架: 多模态 OCR 层 将题目图片经过超分、去噪、倾斜校正后,分别用…...

第19节 Node.js Express 框架
Express 是一个为Node.js设计的web开发框架,它基于nodejs平台。 Express 简介 Express是一个简洁而灵活的node.js Web应用框架, 提供了一系列强大特性帮助你创建各种Web应用,和丰富的HTTP工具。 使用Express可以快速地搭建一个完整功能的网站。 Expre…...
土地利用/土地覆盖遥感解译与基于CLUE模型未来变化情景预测;从基础到高级,涵盖ArcGIS数据处理、ENVI遥感解译与CLUE模型情景模拟等
🔍 土地利用/土地覆盖数据是生态、环境和气象等诸多领域模型的关键输入参数。通过遥感影像解译技术,可以精准获取历史或当前任何一个区域的土地利用/土地覆盖情况。这些数据不仅能够用于评估区域生态环境的变化趋势,还能有效评价重大生态工程…...

【JavaWeb】Docker项目部署
引言 之前学习了Linux操作系统的常见命令,在Linux上安装软件,以及如何在Linux上部署一个单体项目,大多数同学都会有相同的感受,那就是麻烦。 核心体现在三点: 命令太多了,记不住 软件安装包名字复杂&…...
IP如何挑?2025年海外专线IP如何购买?
你花了时间和预算买了IP,结果IP质量不佳,项目效率低下不说,还可能带来莫名的网络问题,是不是太闹心了?尤其是在面对海外专线IP时,到底怎么才能买到适合自己的呢?所以,挑IP绝对是个技…...

AirSim/Cosys-AirSim 游戏开发(四)外部固定位置监控相机
这个博客介绍了如何通过 settings.json 文件添加一个无人机外的 固定位置监控相机,因为在使用过程中发现 Airsim 对外部监控相机的描述模糊,而 Cosys-Airsim 在官方文档中没有提供外部监控相机设置,最后在源码示例中找到了,所以感…...

【p2p、分布式,区块链笔记 MESH】Bluetooth蓝牙通信 BLE Mesh协议的拓扑结构 定向转发机制
目录 节点的功能承载层(GATT/Adv)局限性: 拓扑关系定向转发机制定向转发意义 CG 节点的功能 节点的功能由节点支持的特性和功能决定。所有节点都能够发送和接收网格消息。节点还可以选择支持一个或多个附加功能,如 Configuration …...

ubuntu22.04有线网络无法连接,图标也没了
今天突然无法有线网络无法连接任何设备,并且图标都没了 错误案例 往上一顿搜索,试了很多博客都不行,比如 Ubuntu22.04右上角网络图标消失 最后解决的办法 下载网卡驱动,重新安装 操作步骤 查看自己网卡的型号 lspci | gre…...

实战设计模式之模板方法模式
概述 模板方法模式定义了一个操作中的算法骨架,并将某些步骤延迟到子类中实现。模板方法使得子类可以在不改变算法结构的前提下,重新定义算法中的某些步骤。简单来说,就是在一个方法中定义了要执行的步骤顺序或算法框架,但允许子类…...

解析两阶段提交与三阶段提交的核心差异及MySQL实现方案
引言 在分布式系统的事务处理中,如何保障跨节点数据操作的一致性始终是核心挑战。经典的两阶段提交协议(2PC)通过准备阶段与提交阶段的协调机制,以同步决策模式确保事务原子性。其改进版本三阶段提交协议(3PC…...