Linux系统crash后定位方法-PCIE举例
crash解释
在Linux操作系统中,"crash"通常是指一种用于分析系统崩溃(crash)的工具或方法。当系统发生崩溃时,可能会产生一些关键信息,如错误日志、内存转储文件等。使用crash工具可以分析这些信息,以便了解崩溃的原因和上下文。
crash工具是一个基于命令行的工具,它可以加载系统转储文件,然后提供一系列命令来查看和分析系统状态。例如,可以使用crash工具来查看进程列表、线程列表、内存映射、堆栈跟踪、寄存器值等信息。crash还支持多种操作系统架构和文件系统类型。
通过使用crash工具,开发人员和系统管理员可以更快地诊断和解决系统崩溃问题,从而提高系统的可靠性和稳定性。
crash生成文件
出现crash后会在指定路径生成文件
"vmcore"通常是指在Linux操作系统中,当系统发生崩溃(crash)时自动生成的内核转储文件。该文件包含了操作系统崩溃时的系统状态、进程信息、内存映射、寄存器值等重要信息,以便开发人员和系统管理员进行故障诊断和分析。
vmcore文件通常很大,它记录了整个系统在崩溃前的状态和各种信息,包括内核代码、驱动程序、应用程序和库等。管理员可以使用一些工具来分析vmcore文件,如crash、gdb等。这些工具可以从vmcore文件中提取出关键信息,帮助管理员找出系统崩溃的原因。
vmcore文件的生成通常由内核中的某些机制触发,例如内核崩溃、紧急情况下的系统抓取(Panic Timeout)、kdump等。其中,kdump是一种在Linux系统中用于生成vmcore文件的机制,它通过在系统崩溃时启动一个较小的内核(称为crash内核),将当前系统的内存转储到磁盘上,并生成一个vmcore文件。这样,管理员就可以在不影响当前系统运行的情况下,对vmcore文件进行分析和处理。
总之,vmcore文件是Linux系统在发生崩溃时自动生成的内核转储文件,它包含了有关系统崩溃时的状态和信息,可以用于故障诊断和分析。
分析方法
mcelog
安装
mcelog是一个Linux命令行工具,用于分析机器检查异常(MCE)日志,并将其转换为可读的ASCII格式。要使用mcelog --ascii命令,请按照以下步骤操作:
-
打开终端或控制台窗口。
-
运行以下命令来安装mcelog:
sudo apt-get install mcelog
-
运行以下命令以查看机器检查异常日志的ASCII格式输出:
sudo mcelog --ascii
-
如果您只想查看最近的MCE日志,请运行以下命令:
sudo mcelog --ascii --last
-
如果您只想查看特定CPU上的MCE日志,请运行以下命令,其中“X”表示CPU编号:
sudo mcelog --ascii --cpu X
-
您还可以将输出保存到文件中以进行进一步分析。例如,要将输出保存到名为“mce.log”的文件中,请使用以下命令:
sudo mcelog --ascii > mce.log
以上命令的输出将包括每个错误的时间戳、处理器和内存地址、错误类型、错误代码等详细信息,这有助于确定硬件故障的原因。
使用
使用的前提是要先安装运行
mcelog --daemonRun mcelog in daemon mode, waiting for errors from the kernel.
若要使用mcelog命令来分析crash日志,可以按照以下步骤:
-
打开终端或控制台窗口。
-
安装mcelog软件包。如果您的系统上已经安装了该软件包,请跳过此步骤。在Debian/Ubuntu系统上,您可以使用以下命令安装:
sudo apt-get install mcelog
-
运行以下命令以查看机器检查异常日志的ASCII格式输出:
sudo mcelog --ascii > mce.log
此命令将把mcelog的输出保存到名为“mce.log”的文件中。
-
使用文本编辑器(例如nano、vi或gedit)打开生成的日志文件:
nano mce.log
您也可以使用cat命令查看整个日志文件:
cat mce.log
-
在日志文件中查找有关发生crash的时间戳和CPU编号等信息。这些信息可以帮助您确定与错误相关的硬件设备。
-
通过分析日志中的其他详细信息,例如错误类型、错误代码和处理器状态等,来进一步诊断问题。
mcelog只能分析硬件错误并提供有关错误类型、地址和处理器状态等信息。对于其他类型的错误(例如软件错误),mcelog可能无法提供任何有用的信息。因此,在分析crash日志时,您可能需要使用其他工具和技术来确定问题的根本原因。
crash
使用crash来分析Linux系统崩溃通常需要以下步骤:
-
安装crash工具:在大多数Linux发行版中,crash工具已经包含在内核调试工具集中。如果没有安装,则可以通过操作系统的包管理器进行安装。
-
收集vmcore文件:如果是使用kdump机制生成的vmcore文件,则需要将其复制到本地系统中,以便进行分析。如果没有vmcore文件,则可以尝试手动导出系统转储(如sysrq-t)或其他方法来收集有关崩溃的信息。
-
启动crash工具:在终端中输入crash命令,然后指定要分析的vmcore文件路径。
crash <options> <path-to-vmcore>
-
使用crash命令:一旦进入crash环境,就可以使用一系列命令来查看和分析系统状态。例如,"bt"命令用于显示当前进程或线程的堆栈跟踪信息,"ps"命令用于列出当前运行的进程列表,"mem"命令用于查看内存映射等。
-
分析结果:根据crash命令输出的信息,可以识别出造成系统崩溃的原因和上下文。例如,可以查看系统日志、内存映射、堆栈跟踪等信息,以了解哪个进程或驱动程序引起了崩溃。
需要注意的是,crash工具的使用需要一定的Linux系统知识和调试技能。在进行分析之前,建议先阅读相关文档或参考教程,以便更好地理解和应用crash工具。
举例分析
执行crash 可以看到有符号镜像文件
查看crash
解释
这是一个内核崩溃的信息,以下是每一行的含义:- WARNING: kernel relocated [672MB]: patching 94975 gdb minimal_symbol values:警告内核已重定位,并正在对gdb最小符号值进行修补。
- KERNEL: /usr/lib/debug/lib/modules/4.18.0-193.el8.x86_64/vmlinux:指出内核文件所在的路径。
- DUMPFILE: vmcore [PARTIAL DUMP]:指出转储文件的名称和类型(部分转储)。
- CPUS: 48:指出系统的CPU数量。
- DATE: Sat May 13 11:03:35 2023:指出崩溃发生的日期和时间。
- UPTIME: 01:48:49:指出系统的运行时间。
- LOAD AVERAGE: 0.21, 0.06, 0.02:指出过去1、5、15分钟的平均负载。
- TASKS: 1063:指出系统当前正在运行的任务数。
- NODENAME: localhost.localdomain:指出主机名。
- RELEASE: 4.18.0-193.e18.x8664:指出内核版本。
- VERSION: #1 SMP Fri May 8 10:59:10 UTC 2020:指出内核编译时使用的版本信息。
- MACHINE: x86_64 (2100Mhz):指出CPU架构和频率。
- MEMORY: 31.7 GB:指出系统的总内存量。
- PANIC: "Kernel panic not syncing: Fatal machine check":指出内核崩溃的原因。
- PID: 0:指出正在运行的进程ID。
- COMMAND: "swapper/23":指出正在运行的进程名称。
- TASK: ff4cef3183ba8000 (10f48) [THREAD INFO: ff4cef3183ba8000] CPU: 23 STATE: TASK RUNNING (PANIC):指出正在运行的线程的信息,包括线程ID、CPU编号、状态等。
- #0 [fffffe00003e7c60] machine_kexec at ffffffffab05982e:指出当前堆栈帧的编号、函数名称和地址。
- #1 [fffffe00003e7cb8] crash_kexec at ffffffffab158d8d:指出上一级堆栈帧的信息。
- #2 [fffffe00003e7d80] panic at ffffffffab01498:指出更高一级堆栈帧的信息。
- #3 [fffffe00003e7e48] do_machine_check at ffffffffab03981a:指出更高一级堆栈帧的信息。
- #4 [fffffe00003e7f50] machine_check at ffffffffaba0l26b [exception RIP: mwait_idle+127]:指出更高一级堆栈帧的信息,并显示引起异常的指令地址(RIP)和标志寄存器(RFLAGS)。
- RIP: ffffffffab89458f RSP: ff7ed162c345beb0 RFLAGS: 00000246 RAX: 0000000000000000 RBX: 0000000000000017 RCX: 0000000000000000 RDX: 0000000000000000 RSI: 0000000000000017 RDI: ff4cef38df6dd5c0 RBP: 0000000000000017 R8: 0000000000000000 R9: 0000000000029480 R10: 000a527e953cc2e5 R11: 0000000000000000 R12: 0000000000000000 R13: 0000000000000000 R14: 0000000000000000 R15: 0000000000000000 ORIG_RAX: ffffffffffffffff CS: 0010 SS: 0018:显示了引起异常的指令的寄存器状态。
- <MCE exception stack>:指出崩溃时发生的机器检查(Machine Check Exception)异常的堆栈信息。
- #5 [ff7edl62c345bebo] mwait_idle at ffffffffab89458f:指出更高一级堆栈帧的信息。
- #6 [ff7ed162c345bedo] do_idle at ffffffffab0e67al:指出更高一级堆栈帧的信息。
- #7 [ff7ed162c345bf10] cpu_startup_entry at ffffffffab0e6aof:指出更高一级堆栈帧的信息。
- #8 [ff7ed162c345bf30] start_secondary at ffffffffab04eal7:指出更高一级堆栈帧的信息。
- #9 [ff7ed162c345bf50] secondary_startup_64 at ffffffffab0000e7:指出更高一级堆栈帧的信息。
- crash>:提示用户可以在命令行中输入命令来分析崩溃信息。
定位
查看RP的扩展空间
AERC
协议
相关文章:

Linux系统crash后定位方法-PCIE举例
crash解释 在Linux操作系统中,"crash"通常是指一种用于分析系统崩溃(crash)的工具或方法。当系统发生崩溃时,可能会产生一些关键信息,如错误日志、内存转储文件等。使用crash工具可以分析这些信息ÿ…...

瑞吉外卖 - 启用与禁用员工账号功能(8)
某马瑞吉外卖单体架构项目完整开发文档,基于 Spring Boot 2.7.11 JDK 11。预计 5 月 20 日前更新完成,有需要的胖友记得一键三连,关注主页 “瑞吉外卖” 专栏获取最新文章。 相关资料:https://pan.baidu.com/s/1rO1Vytcp67mcw-PD…...

【MySQL】索引
记录MySQL学习笔记,大部分图片来自黑马程序员MySQL教程。 文章目录 概述索引结构BTree为什么InnoDB使用BTree索引结构? 索引分类索引语法SQL性能分析1、查看执行频次2、慢查询日志3、profile详情4、explain执行计划 索引使用最左前缀法则索引失效情况1、…...

JavaScript全解析——express
express 的基本使用 ●express 是什么? ○是一个 node 的第三方开发框架 ■把启动服务器包括操作的一系列内容进行的完整的封装 ■在使用之前, 需要下载第三方 ■指令: npm install express 1.基本搭建 // 0. 下载: npm install express// 0. 导入 const express express()…...

【JavaScript数据结构与算法】字符串类(计算二进制子串)
个人简介 👀个人主页: 前端杂货铺 🙋♂️学习方向: 主攻前端方向,也会涉及到服务端(Node.js) 📃个人状态: 在校大学生一枚,已拿多个前端 offer(…...

TCP连接不释放,应用产生大量CLOSE_WAIT状态TCP
一、起源 23年元旦期间,大家都沉浸在一片祥和的过节气氛当中。 “滴滴滴”,这头同事的电话响起,具体说些什么我也没太在意,但见同事接完电话之后展现出了一副懊恼夹杂着些许不耐烦的表情。 我不解问道:“怎么了&…...

Spring基础核心概念理解(常见面试题:什么是IoC?什么是DI?什么是Spring?)
目录 IoC 和 SpringIoC DI Spring IoC 和 SpringIoC IoC是控制反转的意思,它意味着控制权(依赖对象)的反转,将控制权进行反转,它是一种思想. 举个例子,理解一下什么是控制反转 现在有三个对象A,B,C. A的创建依赖于B,B的创建依赖于C,当我们想要创建A的时候创建B,同理也要…...

牛客小白月赛 D.遗迹探险 - DP
题目描述 小Z是一名探险家。有一天,小Z误入了一个魔法遗迹。以下是该遗迹的具体组成: 1. 在 x 轴和 y 轴构成的平面上,满足在 1≤x≤n,1≤y≤m 的区域中(坐标(x,y)表示平面上的第x行的第y列),每个整数坐标 (x,y) 都有…...

前端架构师-week6-require源码解析
require 源码解析——彻底搞懂 npm 模块加载原理 require 的使用场景 加载模块类型 加载内置模块:require(fs)加载 node_modules 模块:require(ejs)加载本地模块:require(./utils)支持文件类型 加载 .js 文件加载 .mjs 文件加载 .json 文件…...

作为 IT 行业的过来人,你有什么话想对后辈说的?
作为 IT 行业的过来人,我想对后辈们说,要不断学习和探索新技术,但同时也要注意保持专注和耐心。在这个快速变化的时代,技术更新换代太快,可能会让人感到焦虑和无助,但只要有耐心并专注于自己所做的事情&…...

表数据编辑(数据库)
目录 一、插入数据 1.插入单个元组: INSERT…VALUES语句 2.插入子查询的结果: INSERT…SELECT语句 3.使用SELECT…INTO语句进行数据插入 二、修改数据 1、数据修改语句:UPDATE 2、修改给定表的所有行 3、基于给定表修改某…...

考虑多能负荷不确定性的区域综合能源系统鲁棒规划(Python代码实现)
💥💥💞💞欢迎来到本博客❤️❤️💥💥 🏆博主优势:🌞🌞🌞博客内容尽量做到思维缜密,逻辑清晰,为了方便读者。 ⛳️座右铭&a…...

RocketMQ整理
RocketMQ在阿里云上的商业版本,集成了阿里内部一些更深层次的功能及运维定制。开源版本,功能上略有缺失,但大体上是一样的。 使用Java开发,便于深度定制。最早叫MetaQ。消息吞吐量虽然依然不如Kafka,但是却比RabbitMQ高很多。在阿里内部,RocketMQ集群每天处理的请求数超过…...

Springboot +Flowable,会签、或签简单使用(二)
一.简介 **会签:**在一个流程中的某一个 Task 上,这个 Task 需要多个用户审批,当多个用户全部审批通过,或者多个用户中的某几个用户审批通过,就算通过。 例如:之前的请假流程,假设这个请假流程…...

将核心交换机配置为NTP服务器
AR配置外源NTP 1.配置ntp <XQ-R1220>sys [XQ-R1220]ntp-service unicast-server 120.25.115.20 #阿里云ntp [XQ-R1220]ntp-service unicast-server 203.107.6.88 #阿里云ntp 2.查看ntp状态 <XQ-R1220>display ntp status clock sta…...

application.properties文件注释
这是一个常用的Spring Boot配置文件 在这里,我们可以配置应用程序的各种属性 服务器端口号 server.port8080 数据库配置 spring.datasource.urljdbc:mysql://localhost:3306/test spring.datasource.usernameroot spring.datasource.password123456 spring.datasou…...

MySql查询报错this is incompatible with sql_mode=only_full_group_by
错误示例 Expression #1 of SELECT list is not in GROUP BY clause and contains nonaggregated column ‘yiliaohaocai_new.a.id’ which is not functionally dependent on columns in GROUP BY clause; this is incompatible with sql_modeonly_full_group_by 原因 SQL …...

VMware Workstation 网络备忘 + 集群规模
概述 在虚拟机中部署服务,进行IP规划,进行相关的前期准备 3 张网卡 2个不同的网段 1个NAT 概述截图 NAT 截图 VMnet0 截图 VMnet1 截图 总结: 网卡(网络适配器)名称IP网段备注NATens33192.168.139.0VMnet0ens34VMne…...

被裁现状,给找工作的同学一些建议
2022 到 2023 国内知名互联网公司腾讯、阿里、百度、快手、滴滴、京东、阿里、爱奇艺、知乎、字节跳动、小米等公司均有裁员,其中有不少公司,在过去年的一整年,进行了多轮裁员,以下是网传的一张 “2022 年裁员企业名单”。 这些裁…...

编程到底难在哪里?
编程是一门非常有挑战性的技术,能够让人们使用计算机来完成各种任务。它不仅需要掌握各种计算机语言和框架,还需要在实际应用中充分发挥自己的专业知识和创造力。 然而,对于初学者来说,在编程过程中遇到的难点可能是多方面的。以…...

C++ 仿函数(一)
目录 一、仿函数是什么? 二、仿函数的特点 1.仿函数在使用时,可以像普通函数那样调用, 可以有参数,可以有返回值 2.仿函数超出普通函数的概念,可以有自己的状态 编辑3.仿函数可以作为参数传递。 三、谓词 一元谓词示例&a…...

MATLAB连续LTI系统的时域分析(十)
目录 1、实验目的: 2、实验内容: 1、实验目的: 1)掌握利用MATLAB对系统进行时域分析的方法; 2)掌握连续时间系统零输入响应的求解方法; 3)掌握连续时间系统零状态响应、冲激响应和…...

HBuilderX使用
HBuilderX使用(Vue前后端分离) 概述:DCloud开发者后台 DAccount Service 1、官网下载开发工具:HBuilderX-高效极客技巧 注意:安装目录路径中不能出现中文特殊字符,否则会造成项目无法编译。比如C:/Progr…...

【JavaSE】多态(多态实现的条件 重写 向上转移和向下转型 向上转型 向下转型 多态的优缺点 避免在构造方法种调用重写的方法)
文章目录 多态多态实现的条件重写向上转移和向下转型向上转型向下转型 多态的优缺点避免在构造方法种调用重写的方法 多态 一种事物,多种形态。 多态的概念:去完成某个行为,当不同对象去完成时会产生出不同的状态。 多态实现的条件 1.必须…...

MySQL学习---13、存储过程与存储函数
1、存储过程概述 MySQL从5.0版本开始支持存储过程和函数。存储过程和函数能够将负杂的SQL逻辑封装在一起,应用程序无序关注存储过程和函数内部复杂的SQL逻辑,而只需要简单的调用存储过程和函数就可以。 1.1 理解 含义:存储过程的英文是Sto…...

Mysql日志管理、备份与恢复
文章目录 一、Mysql日志管理1.mysql日志2.日志种类3.日志的查询4.配置日志文件 二、Mysql备份与分类1.数据备份的重要性 一、Mysql日志管理 1.mysql日志 Mysql的日志默认保存位置为/usr/local/mysql/date,Mysql的日志配置文件为/etc/my.cnf,里面有一个…...

STM32单片机声控语音识别RGB彩灯多种模式亮度可调WS2812彩灯
实践制作DIY- GC0129-语音识别RGB彩灯 一、功能说明: 基于STM32单片机设计-语音识别RGB彩灯 二、功能介绍: STM32F103C系列最小系统板5VUSB电源64个灯珠的WS2812灯板1个开关键(3档亮度调节)1个模式切换键(白灯 红灯…...

高校9大学术工具推荐,一定要用起来哦!
1、文献管理工具:例如EndNote、Mendeley和Zotero,这些工具可以帮助您整理、管理和引用文献。 2、数据分析工具:例如SPSS、R和Python等,用于进行统计分析和数据处理。 3、学术写作工具:例如LaTeX和Microsoft Word&…...

记一次压力测试
性能测试文档 背景 为对产品性能有一定了解,现将产品展开一次性能测试; 环境与工具 本章为基本工具准备及linux命令说明,无先后顺序。 Xshell工具 本文使用Xshell在Windows界面下远程登录linux主机安装Xshell直接全部选择默认选项即可&…...

一个文明是否有竞争力,在很大程度上取决于信息传递的效率。
文章目录 引言I 有效地传递信息1.1 信息传播分类1.2 信息传递的有效性II 科技进步的必要条件和充分条件2.1 能量总量2.2 能量密度2.3 衡量科技成就的大小2.4 科学的诞生的意义:获得叠加式收益引言 科技进步的必要条件是能量总量,而充分条件是能量密度。一个文明是否有竞争力,…...