当前位置: 首页 > news >正文

PaddleOCR 图片日期识别

目录

一 . 获取图片信息种对应坐标区域日期信息  (类型为1:http链接   类型为 2本地图片路径)

二 . ocr图片识别日期信息获取,调用获取图片区域相应位置方法

三 .  如有所需获取rtsp流回放格式

四 . 完整代码如下 (路径可根据自己实际需求替换)


    当今数字化的时代,我们经常需要从图像中提取信息,以便进行后续的处理和分析。其中,日期 信息作为一种重要的时间标记,常常存在于各种图像中,例如照片、截图等。然而,要手动从图像中提取日期信息是一项耗时且繁琐的任务,特别是当图像数量庞大时。因此,我们需要一种自动化的方式来实现这一任务。

    PaddleOCR 是一个基于 PaddlePaddle 深度学习框架的开源 OCR(Optical Character Recognition,光学字符识别)工具库,它提供了强大的文字识别功能,能够准确地从图像中识别出各种文字信息,包括日期。在本文中,我们将探讨如何利用 PaddleOCR 来实现图像中日期信息的自动识别。

    本文要解决的问题:从图像中提取日期信息并生成rtsp视频回放URL


一 . 获取图片信息种对应坐标区域日期信息  (类型为1:http链接   类型为 2本地图片路径)

# 读取图片识别相应位置坐标获取  类型为1:http   类型为 2本地图片路径
def x_y_get(image,type):if type == 1:# Nginx图片的访问地址# image_url = "http://192.168.14.93:85/car_image/202306/20230601022933/em_1.jpg"image_url = image# 下载图片response = requests.get(image_url)image_data = response.content# 将图片数据加载为OpenCV图像image_array = np.frombuffer(image_data, np.uint8)image = cv2.imdecode(image_array, cv2.IMREAD_COLOR)else:# 读取图像image = cv2.imread(image)# 定义要截取的区域的坐标x, y, w, h = 20, 0, 800, 100  # 坐标# 截取图像区域cropped_image = image[y:y+h, x:x+w]# 将截取的图像转换为灰度图像gray_image = cv2.cvtColor(cropped_image, cv2.COLOR_BGR2GRAY)# # 展示处理后的图像# plt.imshow(cropped_image, cmap='gray')# plt.axis('off')  # 关闭坐标轴# plt.show()return gray_image

二 . ocr图片识别日期信息获取,调用获取图片区域相应位置方法

# ocr图片识别日期信息获取
def paddle_ocr(path,type):# 调用--读取图片识别相应位置坐标获取gray_image = x_y_get(path,type)# 加载PaddleOCR模型ocr = PaddleOCR(use_angle_cls=True, lang='ch')# 定义一个函数来提取日期def extract_dates(ocr_result):dates = []for line in ocr_result:for word in line:# 中文过滤linee = re.sub('[\u4e00-\u9fa5]', '', word[1][0])# 识别结果将中文进行过滤,但是列表位置可能不一需要进行判断if linee != '':dates.append(linee)# 将结果进行join为时间格式dates = ' '.join(dates).replace('-','').replace(':','').replace(' ','').replace('—','').replace(':','')return dates# 执行OCR识别result = ocr.ocr(gray_image, cls=True)# 提取日期信息dates = extract_dates(result)return dates

三 .  如有所需获取rtsp流回放格式

# 对应字符串日期转换处理,获取前五秒时间与后五秒时间-- 组装成rtsp返回格式
def get_time(original_timestamp):# 解析字符串为datetime对象dt = datetime.strptime(original_timestamp, '%Y%m%d%H%M%S')# 往前五秒before_5_seconds = dt - timedelta(seconds=5)# 往后五秒after_5_seconds = dt + timedelta(seconds=5)# 转换回字符串格式(与原格式一致)before_5_str = before_5_seconds.strftime('%Y%m%d%H%M%S')after_5_str = after_5_seconds.strftime('%Y%m%d%H%M%S')# 组成rtsp回放所需格式time = '?starttime={}t{}z&endtime={}t{}z'.format(before_5_str[0:8], before_5_str[8:], after_5_str[0:8],after_5_str[8:])return time#  ocr识别获取时间日期 类型为1--http  类型为2--本地
# res = paddle_ocr(r'http://192.168.14.93:85/car_image/202306/20230601022933/em_1.jpg',1)
res = paddle_ocr(r'D:\python_project\uu\Seal_monitoring_system\static\em_16.jpg',2)
print(res)# 获取rtsp前段流
rtsp ='rtsp://admin:1qaz2wsx!@QW@192.168.7.38:554/Streaming/tracks/101'# ocr时间日期传入来获取rtsp前后五秒格式--后段流
get_time_data = get_time(res)# 拼接为完整回放流
rtsp = rtsp+get_time_data
print(rtsp)

四 . 完整代码如下 (路径可根据自己实际需求替换)

import cv2
import re
import requests
import numpy as np
import matplotlib.pyplot as pltfrom paddleocr import PaddleOCR
from datetime import datetime, timedelta# 读取图片识别相应位置坐标获取  类型为1:http   类型为 2本地
def x_y_get(image,type):if type == 1:# Nginx图片的访问地址# image_url = "http://192.168.14.93:85/car_image/202306/20230601022933/em_1.jpg"image_url = image# 下载图片response = requests.get(image_url)image_data = response.content# 将图片数据加载为OpenCV图像image_array = np.frombuffer(image_data, np.uint8)image = cv2.imdecode(image_array, cv2.IMREAD_COLOR)else:# 读取图像image = cv2.imread(image)# 定义要截取的区域的坐标x, y, w, h = 20, 0, 800, 100  # 坐标# 截取图像区域cropped_image = image[y:y+h, x:x+w]# 将截取的图像转换为灰度图像gray_image = cv2.cvtColor(cropped_image, cv2.COLOR_BGR2GRAY)# # 展示处理后的图像# plt.imshow(cropped_image, cmap='gray')# plt.axis('off')  # 关闭坐标轴# plt.show()return gray_image# ocr图片识别日期信息获取
def paddle_ocr(path,type):# 调用--读取图片识别相应位置坐标获取gray_image = x_y_get(path,type)# 加载PaddleOCR模型ocr = PaddleOCR(use_angle_cls=True, lang='ch')# 定义一个函数来提取日期def extract_dates(ocr_result):dates = []for line in ocr_result:for word in line:# 中文过滤linee = re.sub('[\u4e00-\u9fa5]', '', word[1][0])# 识别结果将中文进行过滤,但是列表位置可能不一需要进行判断if linee != '':dates.append(linee)# 将结果进行join为时间格式dates = ' '.join(dates).replace('-','').replace(':','').replace(' ','').replace('—','').replace(':','')return dates# 执行OCR识别result = ocr.ocr(gray_image, cls=True)# 提取日期信息dates = extract_dates(result)return dates# 对应字符串日期转换处理,获取前五秒时间与后五秒时间-- 组装成rtsp返回格式
def get_time(original_timestamp):# 解析字符串为datetime对象dt = datetime.strptime(original_timestamp, '%Y%m%d%H%M%S')# 往前五秒before_5_seconds = dt - timedelta(seconds=5)# 往后五秒after_5_seconds = dt + timedelta(seconds=5)# 转换回字符串格式(与原格式一致)before_5_str = before_5_seconds.strftime('%Y%m%d%H%M%S')after_5_str = after_5_seconds.strftime('%Y%m%d%H%M%S')# 组成rtsp回放所需格式time = '?starttime={}t{}z&endtime={}t{}z'.format(before_5_str[0:8], before_5_str[8:], after_5_str[0:8],after_5_str[8:])return time#  ocr识别获取时间日期 类型为1--http  类型为2--本地
# res = paddle_ocr(r'http://192.168.14.93:85/car_image/202306/20230601022933/em_1.jpg',1)
res = paddle_ocr(r'D:\python_project\uu\Seal_monitoring_system\static\em_16.jpg',2)
print(res)# 获取rtsp前段流
rtsp ='rtsp://admin:1qaz2wsx!@QW@192.168.7.38:554/Streaming/tracks/101'# ocr时间日期传入来获取rtsp前后五秒格式--后段流
get_time_data = get_time(res)# 拼接为完整回放流
rtsp = rtsp+get_time_data
print(rtsp)

相关文章:

PaddleOCR 图片日期识别

目录 一 . 获取图片信息种对应坐标区域日期信息 (类型为1:http链接 类型为 2本地图片路径) 二 . ocr图片识别日期信息获取,调用获取图片区域相应位置方法 三 . 如有所需获取rtsp流回放格式 四 . 完整代码如下 &#xff08…...

HTML5学习记录

简介 超文本标记语言&#xff08;HyperText Markup Language&#xff0c;简称HTML&#xff09;&#xff0c;是一种用于创建网页的标准标记语言。 编辑器 下载传送门https://code.visualstudio.com/ 下载编辑器插件 标题 标题通过 <h1> - <h6> 标签进行定义。 …...

提升法律文书起草效率:AlphaGPT 助力律师快速生成诉讼和仲裁文件

法律文书起草对于法律专业人士而言是一项基础而关键的任务。无论是民事、刑事还是行政诉讼&#xff0c;以及仲裁案件&#xff0c;精确的法律文书撰写对于案件的成功至关重要。然而&#xff0c;这一过程往往既耗时又复杂&#xff0c;尤其是在处理复杂的案情和面对当事人难以理解…...

大数据之 Hive 快速搭建的详细步骤

Hive hive 搭建三种模式: 内嵌模式本地模式远程模式内嵌模式 Hadoop 和 Hive 整合 修改 hadoop/etc/下的 core-site.xml: <property><name>hadoop.proxyuser.root.hosts</name><value>*</value> </property> <property><nam…...

从入门到高级的99个python知识点

大家好&#xff0c;想掌握Python编程语言&#xff0c;从零基础的小白晋升为大神&#xff1f;没问题&#xff01;接下来我们将以轻松有趣的方式&#xff0c;逐一解锁Python学习路上的99个关键知识点。每一步都将结合实际应用场景、函数功能解析及简洁代码演示&#xff0c;带你深…...

设计模式之备忘录模式(上)

备忘录模式 1&#xff09;概述 1.定义 在不破坏封装的前提下&#xff0c;捕获一个对象的内部状态&#xff0c;并在该对象之外保存这个状态&#xff0c;可以在以后将对象恢复到原先保存的状态。 2.作用 备忘录模式提供了一种状态恢复的实现机制&#xff0c;使得用户可以方便…...

算法中二分搜索详解

文章目录 在有序数组中找num是否存在实现思路实现代码(里面运用了对数器)在有序数组中找>num的最左位置实现思路代码实现 在有序数组中找<num的最右位置实现思路实现代码 二分搜索不一定发生在有序数组上(比如寻找峰值问题)题目描述实现思路实现代码 在有序数组中找num是…...

关于无线充电项目总结IP6826

1、电路 1.1 选用芯片IP6826英集芯 支持PD3.0 5-15W 1.2 推荐电路 讲解这个是官方推荐图 注意以下几点&#xff1a; NTC是100K的别买错了 L就是线圈 我这选用的A11 6.3 uH 淘宝买的 需要陪400nf NPO或CBB 还可以10uh配250nf&#xff08;这个我没试过&#xff09; 如果led2闪烁…...

[CSS]样式属性+元素设置

哎呀&#xff0c;好多东西&#xff0c;根本记不住&#xff0c;更多的还是边用边记吧&#xff0c;这里的代码就当使用范例&#xff0c;但其实如果可以让gpt应该会更好&#xff0c;哎学吧&#xff0c;反正记得住当然更好 文本 属性名描述word-break单词换行。取值如下&#xff1…...

优雅关闭jar程序shell 脚本

参考竽道Linux部署 #!/bin/bash set -eDATE$(date %Y%m%d%H%M) # 基础路径 BASE_PATH/work/projects/yudao-server # 服务名称。同时约定部署服务的 jar 包名字也为它。 SERVER_NAMEyudao-server # 环境 PROFILES_ACTIVEdev# heapError 存放路径 HEAP_ERROR_PATH$BASE_PATH/he…...

基于51单片机多功能洗衣机控制(强洗弱洗漂洗)设计( proteus仿真+程序+设计报告+原理图+讲解视频)

基于51单片机多功能洗衣机控制(强洗弱洗漂洗)设计( proteus仿真程序设计报告原理图讲解视频&#xff09; 多功能洗衣机控制-强洗弱洗漂洗 1. 主要功能&#xff1a;2. 讲解视频&#xff1a;3. 仿真设计4. 程序代码5. 设计报告6. 原理图7. 设计资料内容清单资料下载链接&#xf…...

CVP(ChatGPT、Vector Database和Prompt)

CVP实际上指的是ChatGPT、Vector Database和Prompt的结合&#xff0c;这是一种新型的技术栈&#xff0c;用于构建智能应用。 首先&#xff0c;我们来看这三个组成部分&#xff1a; ChatGPT&#xff1a;这是一个强大的语言模型&#xff0c;它能够理解并生成自然语言文本。Chat…...

c语言-----数组知识汇总

前言 本文为我学习数组知识点之后&#xff0c;对c语言的数组部分进行的知识点汇总。 简单数组介绍 简单来说&#xff0c;数组就是一个数据组&#xff0c;像一个箱子&#xff0c;里面放有多个数据。 [1,2,3,4,5] 数组的定义 基础定义 语法&#xff1a; 数据类型 数组名[数组…...

【游戏开发之热更新技术】

游戏开发之热更新技术 热更新技术是指在不重新发布和安装应用的情况下&#xff0c;对已部署的应用程序进行更新和修补的技术。这种技术在现代软件开发中变得越来越重要&#xff0c;因为它能够为用户提供更加及时的服务和更好的体验。以下是一篇关于热更新技术的文章&#xff0…...

小红的白色字符串

题目描述 小红拿到了一个字符串&#xff0c;她准备将一些字母变成白色&#xff0c;变成白色的字母看上去就和空格一样&#xff0c;这样字符串就变成了一些单词。 现在小红希望&#xff0c;每个单词都满足以下两种情况中的一种&#xff1a; 1.开头第一个大写&#xff0c;其余为…...

Python+Django+Html网页版人脸识别考勤打卡系统

程序示例精选 PythonDjangoHtml人脸识别考勤打卡系统 如需安装运行环境或远程调试&#xff0c;见文章底部个人QQ名片&#xff0c;由专业技术人员远程协助&#xff01; 前言 这篇博客针对《PythonDjangoHtml网页版人脸识别考勤打卡系统》编写代码&#xff0c;代码整洁&#xf…...

第1章、react基础知识;

一、react学习前期准备&#xff1b; 1、基本概念&#xff1b; 前期的知识准备&#xff1a; 1.javascript、html、css&#xff1b; 2.构建工具&#xff1a;Webpack&#xff1a;https://yunp.top/init/p/v/1 3.安装node&#xff1a;npm&#xff1a;https://yunp.top/init/p/v/1 …...

物联网会用到哪些数据开发

物联网&#xff08;IoT&#xff09;涉及大量的设备和传感器&#xff0c;产生的数据种类繁多&#xff0c;因此在物联网领域进行数据开发时&#xff0c;可能涉及以下几个方面&#xff1a; 数据采集与存储&#xff1a; 设备数据采集&#xff1a;从各种传感器和设备中采集数据&…...

[Linux]一篇文章带你搞定软硬连接

阅读导览&#xff1a; 先在windows中先见见软硬连接从名字、inode等方面分析软硬连接如何实现软硬连接硬链接注意事项软硬链接都用来干什么如何在windows中实现硬链接 文章目录 概念简述文件系统windows下的快捷方式--软硬链接的直观体现角度1&#xff1a;文件名角度2&#xff…...

AI常见关键术语

哈喽&#xff0c;大家好&#xff0c;我是小码哥&#xff0c;人工智能技术的快速发展带来了许多专业术语&#xff0c;这些词汇对于理解AI的工作原理和应用至关重要。以下是一些关键的AI术语&#xff0c;以及它们的专业解释和通俗总结。 一、核心概念 人工智能 (AI) 专业解释&am…...

DataX案例,MongoDB数据导入HDFS与MySQL

【尚硅谷】Alibaba开源数据同步工具DataX技术教程_哔哩哔哩_bilibili 目录 1、MongoDB 1.1、MongoDB介绍 1.2、MongoDB基本概念解析 1.3、MongoDB中的数据存储结构 1.4、MongoDB启动服务 1.5、MongoDB小案例 2、DataX导入导出案例 2.1、读取MongoDB的数据导入到HDFS 2…...

HarmonyOS鸿蒙端云一体化开发--适合小白体制

端云一体化 什么是“端”&#xff0c;什么是“云”&#xff1f; 答&#xff1a;“端“&#xff1a;手机APP端 “云”:后端服务端 什么是端云一体化&#xff1f; 端云一体化开发支持开发者在 DevEco Studio 内使用一种语言同时完成 HarmonyOS 应用的端侧与云侧开发。 …...

Quanto: PyTorch 量化工具包

量化技术通过用低精度数据类型 (如 8 位整型 (int8)) 来表示深度学习模型的权重和激活&#xff0c;以减少传统深度学习模型使用 32 位浮点 (float32) 表示权重和激活所带来的计算和内存开销。 减少位宽意味着模型的内存占用更低&#xff0c;这对在消费设备上部署大语言模型至关…...

宝塔面板Docker+Uwsgi+Nginx+SSL部署Django项目

这次为大家带来的是从零开始搭建一个django项目并将它部署到linux服务器上。大家可以按照我的步骤一步步操作&#xff0c;最终可以完成部署。 步骤1&#xff1a;在某个文件夹中创建一个django项目 安装django pip install django创建一个django项目将其命名为djangoProject …...

Android 无线调试 adb connect ip:port 失败

1. 在手机打开 无线调试 使用 adb connect 连接 adb connect 192.168.14.164:39511如果连接成功, 查看连接的设备, 忽略 配对下面的步骤. adb devices如果连接失败: failed to connect to 192.168.14.164:39511如果失败了, 可以杀死一下进程, 然后执行后面的操作 adb kill…...

年龄与疾病c++

题目描述 某医院想统计一下某项疾病的获得与否与年龄是否有关&#xff0c;需要对以前的诊断记录进行整理&#xff0c;按照0-18岁、19-35岁、36-60岁、61以上&#xff08;含61&#xff09;四个年龄段统计的患病人数以及占总患病人数的比例。 输入 共2行&#xff0c;第一行为过…...

neo4j-01

Neo4j是&#xff1a; 开源的&#xff08;社区版开源免费&#xff09;无模式&#xff08;不用预设数据的格式&#xff0c;数据更加灵活&#xff09;noSQL&#xff08;非关系型数据库&#xff0c;数据更易拓展&#xff09;图数据库&#xff08;使用图这种数据结构作为数据存储方…...

正则表达式 速成

正则表达式的作用 正则表达式&#xff0c;又称规则表达式,&#xff08;Regular Expression&#xff0c;在代码中常简写为regex、regexp或RE&#xff09;&#xff0c;是一种文本模式&#xff0c;包括普通字符&#xff08;例如&#xff0c;a 到 z 之间的字母&#xff09;和特殊字…...

21、Lua 面向对象

Lua 面向对象 Lua 面向对象面向对象特征Lua 中面向对象一个简单实例创建对象访问属性访问成员函数完整实例 Lua 继承完整实例 函数重写 Lua 面向对象 面向对象编程&#xff08;Object Oriented Programming&#xff0c;OOP&#xff09;是一种非常流行的计算机编程架构。 以下…...

openssl3.2 - exp - class warp for sha3-512

文章目录 openssl3.2 - exp - class warp for sha3-512概述笔记调用方代码子类 - cipher_sha3_512.h子类 - cipher_sha3_512.cpp基类 - cipher_md_base.h基类 - cipher_md_base.cpp备注END openssl3.2 - exp - class warp for sha3-512 概述 前面实验整了一个对buffer进行sha…...

网站建设有生意吗/搜索引擎优化排名品牌

Kubernetes 是 Google 基于 Borg 开源的容器编排调度&#xff0c;用于管理容器集群自动化部署、扩容以及运维的开源平台。作为云原生计算基金会 CNCF&#xff08;Cloud Native Computing Foundation&#xff09;最重要的组件之一&#xff08;CNCF 另一个毕业项目 Prometheus &a…...

网站做的自适应体验差/怎么能在百度上做推广

一 1.加入此行代码&#xff0c;注意不要比过去(左边为修改后&#xff0c;右为修改后)&#xff0c;先修改framework下的AntiTheftManager.java文件&#xff08;路径&#xff1a;alps\frameworks\base\packages\Keyguard\src\com\mediatek\keyguard\AntiTheft&#xff09; 2.这里…...

昌平区事业单位公共知识培训网站/百度关键词优化软件怎么样

B/S结构&#xff0c;即Browser/Server(浏览器/服务器)结构&#xff0c;是随着Internet技术的兴起&#xff0c;对C/S结构的一种变化或者改进的结构。在这种结构下&#xff0c;用户界面完全通过WWW浏览器实现&#xff0c;一部分事务逻辑在前端实现&#xff0c;但是主要事务逻辑在…...

如何判断网站被google k/产品设计

字符串 1.单引号和双引号都一样2.单引号可以嵌套双引号,双引号可以嵌套单引号3.单单不能嵌套,双双不能嵌套,需要嵌套怎么办在里面的符号前面加上\用来转义4.charAt(n),打印第n几个数字,数字从0开始,如果参数大于最大长度或者负数,那么返回空字符串5.concat链接字符串 s1"…...

网易企业邮箱登录页/安徽网站seo公司

在第2部分中&#xff0c;我将向您介绍如何使用Exchange Server中提供的新cmdlet导入/导出数据&#xff0c;以及如何查看导入和导出的信息统计信息这样做。走起&#xff01;将数据从PST文件导入到邮箱现在是时候尝试使用New-MailboxImportRequest cmdlet 将数据从PST文件导入Exc…...

织梦网站建设流程/西安百度网站排名优化

5.1 wireshark简介和抓包原理及过程 5.2 实战&#xff1a;WireShark 抓包及快速定位数据包技巧 5.3 实战&#xff1a;使用 WireShark 对常用协议抓包并分析原理 数据包分析称为数据包嗅探&#xff0c;协议分析&#xff0c;我们捕获和解析网络上传输数据包的一个过程。为了更…...