当前位置: 首页 > news >正文

Pandas 33个冷知识 0721

Pandas 33个冷知识

  1. 从Excel读取数据: 使用 pd.read_excel('file.xlsx') 来读取Excel文件。

  2. 写入Excel: 使用 df.to_excel('file.xlsx', index=False) 将DataFrame写入Excel文件。

  3. 创建日期索引: 使用 df.set_index(pd.to_datetime(df['date'])) 创建日期索引。

  4. 向后填充缺失值: 使用 df.fillna(method='bfill') 向后填充缺失值。

  5. 按索引选取多行: 使用 df.loc[[1, 2, 5]] 按索引选取多行。

  6. 按位置选取多行: 使用 df.iloc[[0, 2, 4]] 按位置选取多行。

  7. 创建空Series: 使用 pd.Series(dtype='float64') 创建一个空Series。

  8. 重置列顺序: 使用 df = df[['col2', 'col1']] 重新排列DataFrame的列顺序。

  9. 按多列排序: 使用 df.sort_values(by=['col1', 'col2'], ascending=[True, False]) 按多列排序。

  10. 按列查找最大值的行: 使用 df.loc[df['col'].idxmax()] 查找列中最大值所在的行。

  11. 按列查找最小值的行: 使用 df.loc[df['col'].idxmin()] 查找列中最小值所在的行。

  12. 按条件删除行: 使用 df.drop(df[df['col'] < 10].index) 按条件删除行。

  13. 按条件更新值: 使用 df.loc[df['col'] < 10, 'col'] = 10 按条件更新值。

  14. 按列计算累计最大值: 使用 df['cummax'] = df['col'].cummax() 计算列的累计最大值。

  15. 按列计算累计最小值: 使用 df['cummin'] = df['col'].cummin() 计算列的累计最小值。

  16. 按列计算累计乘积: 使用 df['cumprod'] = df['col'].cumprod() 计算列的累计乘积。

  17. 计算百分比变化: 使用 df['pct_change'] = df['col'].pct_change() 计算列的百分比变化。

  18. 滚动窗口最大值: 使用 df['rolling_max'] = df['col'].rolling(window=3).max() 计算滚动窗口最大值。

  19. 滚动窗口最小值: 使用 df['rolling_min'] = df['col'].rolling(window=3).min() 计算滚动窗口最小值。

  20. 检测重复值: 使用 df.duplicated() 检测重复值。

  21. 删除所有重复值: 使用 df.drop_duplicates() 删除所有重复值。

  22. 替换值中的空字符串: 使用 df.replace('', np.nan, inplace=True) 替换值中的空字符串。

  23. 数据透视表(多值): 使用 pd.pivot_table(df, values=['val1', 'val2'], index='col1', columns='col2') 创建数据透视表。

  24. 分组并计算自定义函数: 使用 df.groupby('col').apply(lambda x: x.max() - x.min()) 进行分组并计算自定义函数。

  25. 扩展列表到多行: 使用 df.explode('col') 将列表扩展到多行。

  26. 按列计算频率表: 使用 pd.crosstab(df['col1'], df['col2']) 计算频率表。

  27. 将列名改为小写: 使用 df.columns = df.columns.str.lower() 将所有列名改为小写。

  28. 将列名改为大写: 使用 df.columns = df.columns.str.upper() 将所有列名改为大写。

  29. 按列值绘制直方图: 使用 df['col'].hist() 绘制列值的直方图。

  30. 按列值绘制密度图: 使用 df['col'].plot(kind='kde') 绘制列值的密度图。

  31. 按列值绘制箱线图: 使用 df.boxplot(column='col') 绘制列值的箱线图。

  32. 按列值绘制散点图: 使用 df.plot.scatter(x='col1', y='col2') 绘制列值的散点图。

  33. 数据框列值字符串替换: 使用 df['col'].str.replace('old', 'new') 替换列中的字符串。

相关文章:

Pandas 33个冷知识 0721

Pandas 33个冷知识 从Excel读取数据: 使用 pd.read_excel(file.xlsx) 来读取Excel文件。 写入Excel: 使用 df.to_excel(file.xlsx, indexFalse) 将DataFrame写入Excel文件。 创建日期索引: 使用 df.set_index(pd.to_datetime(df[date])) 创建日期索引。 向后填充缺失值: 使用…...

C++ map和set的使用

目录 0.前言 1.关联式容器 2.键值对 3.树形结构的关联式容器 3.1树形结构的特点 3.2树形结构在关联式容器中的应用 4.set 4.1概念与性质 4.2使用 5.multiset 5.1概念与性质 5.2使用 6.map 6.1概念与性质 6.2使用 7.multimap 7.1概念与性质 7.2使用 8.小结 &a…...

yarn的安装和配置以及更新总结,npm的对照使用差异

1. Yarn简介 Yarn 是一个由 Facebook 开发的现代 JavaScript 包管理器&#xff0c;旨在提供更快、更安全、更可靠的包管理体验。 1.1 什么是Yarn Yarn 是一个快速、可靠和安全的 JavaScript 包管理器&#xff0c;它通过并行化操作和智能缓存机制&#xff0c;显著提升了依赖安…...

【Git命令】git rebase之合并提交记录

使用场景 在本地提交了两个commit&#xff0c;但是发现根本没有没必要分为两次&#xff0c;需要想办法把两次提交合并成一个提交&#xff1b;这个时候可以使用如下命令启动交互式变基会话&#xff1a; git rebase -i HEAD~N这里 N 是你想要重新调整的最近的提交数。 如下在本地…...

为什么品牌需要做 IP 形象?

品牌做IP形象的原因有多方面&#xff0c;这些原因共同构成了IP形象在品牌建设中的重要性和价值&#xff0c;主要原因有以下几个方面&#xff1a; 增强品牌识别度与记忆点&#xff1a; IP形象作为品牌的视觉符号&#xff0c;具有独特性和辨识性&#xff0c;能够在消费者心中留…...

Kubernetes 1.24 版弃用 Dockershim 后如何迁移到 containerd 和 CRI-O

在本系列的上一篇文章中&#xff0c;我们讨论了什么是 CRI 和 OCI&#xff0c;Docker、containerd、CRI-O 之间的区别以及它们的架构等。最近&#xff0c;我们得知 Docker 即将从 kubernetes 中弃用&#xff01;&#xff08;查看 kubernetes 官方的这篇文章&#xff09;那么让我…...

70. 爬楼梯【 力扣(LeetCode) 】

一、题目描述 假设你正在爬楼梯。需要 n 阶你才能到达楼顶。 每次你可以爬 1 或 2 个台阶。你有多少种不同的方法可以爬到楼顶呢&#xff1f; 二、测试用例 示例 1&#xff1a; 输入&#xff1a;n 2 输出&#xff1a;2 解释&#xff1a;有两种方法可以爬到楼顶。 1. 1 阶…...

R语言优雅的把数据基线表(表一)导出到word

基线表&#xff08;Baseline Table&#xff09;是医学研究中常用的一种数据表格&#xff0c;用于在研究开始时呈现参与者的初始特征和状态。这些特征通常包括人口统计学数据、健康状况和疾病史、临床指标、实验室检测、生活方式、社会经济等。 本人在既往文章《scitb包1.6版本发…...

XMl基本操作

引言 使⽤Mybatis的注解⽅式&#xff0c;主要是来完成⼀些简单的增删改查功能. 如果需要实现复杂的SQL功能&#xff0c;建议使⽤XML来配置映射语句&#xff0c;也就是将SQL语句写在XML配置⽂件中. 之前&#xff0c;我们学习了&#xff0c;用注解的方式来实现MyBatis 接下来我们…...

Linux——Shell脚本和Nginx反向代理服务器

1. Linux中的shell脚本【了解】 1.1 什么是shell Shell是一个用C语言编写的程序&#xff0c;它是用户使用Linux的桥梁 Shell 既是一种命令语言&#xff0c;有是一种程序设计语言 Shell是指一种应用程序&#xff0c;这个应用程序提供了一个界面&#xff0c;用户通过这个界面访问…...

pyspark使用 graphframes创建和查询图的方法

1、安装graphframes的步骤 1.1 查看 spark 和 scala版本 在终端输入&#xff1a; spark-shell --version 查看spark 和scala版本 1.2 在maven库中下载对应版本的graphframes https://mvnrepository.com/artifact/graphframes/graphframes 我这里需要的是spark 2.4 scala 2.…...

【web】-flask-简单的计算题(不简单)

打开页面是这样的 初步思路&#xff0c;打开F12&#xff0c;查看头&#xff0c;都发现了这个表达式的base64加密字符串。编写脚本提交答案&#xff0c;发现不对&#xff1b; 无奈点开source发现源代码&#xff0c;是flask,初始化表达式&#xff0c;获取提交的表达式&#xff0…...

Apache Sqoop

Apache Sqoop是一个开源工具&#xff0c;用于在Apache Hadoop和关系型数据库&#xff08;如MySQL、Oracle、PostgreSQL等&#xff09;之间进行数据的批量传输。其主要功能包括&#xff1a; 1. 数据导入&#xff1a;从关系型数据库&#xff08;如MySQL、Oracle等&#xff09;中将…...

【Python】TensorFlow介绍与实战

TensorFlow介绍与使用 1. 前言 在人工智能领域的快速发展中&#xff0c;深度学习框架的选择至关重要。TensorFlow 以其灵活性和强大的社区支持&#xff0c;成为了许多研究者和开发者的首选。本文将进一步扩展对 TensorFlow 的介绍&#xff0c;包括其优势、应用场景以及在最新…...

第100+16步 ChatGPT学习:R实现Xgboost分类

基于R 4.2.2版本演示 一、写在前面 有不少大佬问做机器学习分类能不能用R语言&#xff0c;不想学Python咯。 答曰&#xff1a;可&#xff01;用GPT或者Kimi转一下就得了呗。 加上最近也没啥内容写了&#xff0c;就帮各位搬运一下吧。 二、R代码实现Xgboost分类 &#xff08…...

【操作系统】定时器(Timer)的实现

这里写目录标题 定时器一、定时器是什么二、标准库中的定时器三、实现定时器 定时器 一、定时器是什么 定时器也是软件开发中的⼀个重要组件.类似于⼀个"闹钟".达到⼀个设定的时间之后,就执行某个指定 好的代码. 定时器是⼀种实际开发中⾮常常用的组件. ⽐如⽹络通…...

鸿蒙Navigation路由能力汇总

基本使用步骤&#xff1a; 1、新增配置文件router_map&#xff1a; 2、在moudle.json5中添加刚才新增的router_map配置&#xff1a; 3、使用方法&#xff1a; 属性汇总&#xff1a; https://developer.huawei.com/consumer/cn/doc/harmonyos-references/ts-basic-compone…...

​1:1公有云能力整体输出,腾讯云“七剑”下云端

【全球云观察 &#xff5c; 科技热点关注】 曾几何时&#xff0c;云计算技术的兴起&#xff0c;为千行万业的数字化创新带来了诸多新机遇&#xff0c;同时也催生了新产业新业态新模式&#xff0c;激发出高质量发展的科技新动能。很显然&#xff0c;如今的云创新已成为高质量发…...

【iOS】APP仿写——网易云音乐

网易云音乐 启动页发现定时器控制轮播图UIButtonConfiguration 发现换头像 我的总结 启动页 这里我的启动页是使用Xcode自带的启动功能&#xff0c;将图片放置在LaunchScreen中即可。这里也可以通过定时器控制&#xff0c;来实现启动的效果 效果图&#xff1a; 这里放一篇大…...

react 快速入门思维导图

在掌握了react中一下的几个步骤和语法&#xff0c;基本上就可以熟练的使用react了。 1、组件的使用。react创建组件主要是类组件和函数式组件&#xff0c;类组件有生命周期&#xff0c;而函数式组件没有。 2、jsx语法。react主要使用jsx语法&#xff0c;需要使用babel和webpa…...

微软研究人员为电子表格应用开发了专用人工智能LLM

微软的 Copilot 生成式人工智能助手现已成为该公司许多软件应用程序的一部分。其中包括 Excel 电子表格应用程序&#xff0c;用户可以在其中输入文本提示来帮助处理某些选项。微软的一组研究人员一直在研究一种新的人工智能大型语言模型&#xff0c;这种模型是专门为 Excel、Go…...

[算法题]两个链表的第一个公共结点

题目链接: 两个链表的第一个公共结点 图示: 两个链表如果长度一致, 那么两人同时一人走一步, 如果存在公共结点, 迟早会相遇, 但是如果长度不一致单存在公共结点, 两人同时一人走一步不会相遇, 此时定义两个变量, node1 和 node2, 这两个变量分别从 x1 和 x2 开始走, 当其走完…...

MySQL事务管理(上)

目录 前言 CURD不加控制&#xff0c;会有什么问题&#xff1f; CURD满足什么属性&#xff0c;能解决上述问题&#xff1f; 事务 什么是事务&#xff1f; 为什么会出现事务 事务的版本支持 事务提交方式 查看事务提交方式 改变 MySQL 的自动提交模式: 事务常见操作方式 前…...

HTML2048小游戏

源代码在效果图后面 效果图 源代码 <!DOCTYPE html> <html lang"zh-CN"><head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1.0"><title>2048 Game&l…...

为 android编译 luajit库、 交叉编译

时间&#xff1a;20200719 本机环境&#xff1a;iMac2017 macOS11.4 参考: 官方的文档&#xff1a;Use the NDK with other build systems 写在前边&#xff1a;交叉编译跟普通编译类似&#xff0c;无非是利用特殊的编译器、链接器生成动态或静态库; make 本质上是按照 Make…...

【音视频】音频重采样

文章目录 前言音频重采样的基本概念音频重采样的原因1. 设备兼容性2. 文件大小和带宽3. 音质优化4. 标准化和规范5. 多媒体同步6. 降低处理负载重采样的注意事项 总结 前言 音频重采样是指将音频文件的采样率转换成另一种采样率的过程。这在音频处理和传输中是一个常见且重要的…...

卷积神经网络学习问题总结

问题一&#xff1a; 深度学习中的损失函数和应用场景 回归任务&#xff1a; 均方误差函数&#xff08;MSE&#xff09;适用于回归任务&#xff0c;如预测房价、预测股票价格等。 import torch.nn as nn loss_fn nn.MSELoss() 分类任务&#xff1a; 交叉熵损失函数&…...

嵌入式面试总结

C语言中struct和union的区别 struct和union都是常见的复合结构。 结构体和联合体虽然都是由多个不同的数据类型成员组成的&#xff0c;但不同之处在于联合体中所有成员共用一块地址空间&#xff0c;即联合体只存放了一个被选中的成员&#xff0c;结构体中所有成员占用空间是累…...

超简单安装指定版本的clickhouse

超简单安装指定版本的clickhouse 命令执行shell脚本 idea连接 命令执行 参考官网 # 下载脚本 wget https://raw.githubusercontent.com/183461750/doc-record/d988dced891d70b23c153a3bbfecee67902a3757/middleware/data/clickhouse/clickhouse-install.sh # 执行安装脚本(中…...

FlowUs横向对比几款笔记应用的优势所在

FlowUs作为一个本土化的生产力工具&#xff0c;在中国市场的环境下相对于Notion有其独特的优势&#xff0c;尤其是在稳定性和模板适应性方面。 尽管Notion在笔记和生产力工具领域享有极高的声誉&#xff0c;拥有着诸多创新功能和强大的生态系统&#xff0c;但它并不一定适合每…...

网站建设内容大全/网页设计软件有哪些

前言在爬取https网站的时候&#xff0c;今天遇到了一个之前没有见过的异常javax.net.ssl.SSLHandshakeException&#xff0c;具体细节请看如图2020-06-01 23:18:17.032 DEBUG org.springframework.web.servlet.DispatcherServlet- Successfully completed requestjavax.net.ssl…...

永州公司做网站/河南关键词排名顾问

接口callable <V> 类型参数 V-call方法的结构类型 public interface Callable<V> 返回结果并且可能抛出的异常的任务。实现者定义一个不带任何参数的的call()方法&#xff0c; Callable 接口类似于Runnable ,两者都是为了哪些真实实例可能被另一个线程执行的类…...

网站建设多少钱一年/江苏seo团队

工作的前两年 如果你不能拼爹&#xff0c;或者不想拼爹&#xff0c;最好的方法是拼实力。 合抱之木&#xff0c;生于毫末&#xff1b;九层之台&#xff0c;起于垒土&#xff1b;千里之行&#xff0c;始于足下。 所以&#xff0c;你必须要从基层做起。当然&#xff0c;所谓的基…...

做动态网站/文章代写

批处理命令当中的START&#xff0c;可以用来打开窗口。打开窗口的时候&#xff0c;你还可以通过START参数来设置所打开窗口的各种属性&#xff0c;下面&#xff0c;逐一为你介绍START及参数是如何使用的。START命令功能&#xff1a;启动单独的“命令提示符”窗口来运行指定程序…...

网站建设流程与步骤/网站seo具体怎么做?

原来脚本运行很好,但是密码改成了带的密码之后就不能运行了,怎么办?sqlplus username/abc123456TNSname系统报不能解析解决思路如下&#xff1a;C:/>SQLPLUS "/ AS SYSDBA"SQL*Plus: Release 9.2.0.1.0 - Production on Mon Oct 6 11:15:52 2008Copyright (c) 19…...

上海微网站建设/低价刷粉网站推广

为什么80%的码农都做不了架构师&#xff1f;>>> 如果nginx一直出现 nginx bad gateway 5XX 之类的 首先用python manager.py runserver 0.0.0.0:8000 并且把debug改为True 输出调试信息 因为99%的可能性是项目源码中出现了问题 或者是uwsgi和nginx链接的socke…...