全网招募P图高手!阿里巴巴持续训练鉴假AI
P过的证件如何鉴定为真?三千万网友都晒出了与梅西的合影?图像编辑技术的普及让人人都能P图,但也带来“假图”识别难题,甚至是欺诈问题。
为此,阿里安全联合华中科技大学国家防伪工程中心、国际文档分析识别方向的唯一顶会ICDAR在天池平台举办截图篡改检测比赛,并开辟“寻找全网最厉害的P图高手”特别赛道,以此完善假图检测算法模型,提升假图检测准确率。
华中科技大学电子信息与通信学院副教授周瑜指出,证件信息、截屏信息等都是易受到恶意篡改的主要对象,对个人、社会产生了严重的安全威胁。被篡改的图片真假难辨,给业界提出了一个困难而意义重大的研究任务。

图说:“寻找全网最厉害的P图高手”特别赛道部分玩法介绍
生活场景中的痛点是这个比赛十分看重的。为此,阿里高级安全专家渡明介绍:“特别赛道旨在降低技术迭代的参与门槛,提高趣味性,并为专业赛道提供丰富的样本,因此我们将投稿比赛图片分为截图区、证件区和其他区,希望更贴近真实生活中可能遇到的P图诈骗场景,让训练AI的样本更真实,从而提升它的识别能力。”
华中科技大学电子信息与通信学院副教授周瑜则认为,与企业合作,从真实应用中提炼关键问题,并将问题融入到竞赛中,可以让贴近真实的篡改样本为学术界和工业界提供帮助,推动图像鉴伪技术的研究与应用。
对于想体验鉴假技术的大众,比赛开放“假图粉碎机”公众体验入口:通过上传一张图,让AI识别图像是否被篡改,并以热力图形式呈现识别可能被篡改的区域结果。
“假图粉碎机”是由阿里安全与澳门大学的研究人员研发,在2022年6月推出的技术,旨在提升网民的网络安全意识,包含了多项图像篡改检测技术。
据介绍,图像篡改检测技术对图像进行全方位的分析和统计,根据不同图像像素区域的特性,分析图像中各个区域是否被压缩、重采样、引入新特征像素等,通过对比分析,标记不同图像区域的差异点,从而找出图像被篡改的部分。
整套图像篡改检测系统会经过原图识别、内容篡改检测和内容篡改定位三个步骤,完成对图像是否为篡改图像以及哪里经过篡改的识别和判断。
在原图识别阶段,图像篡改检测系统会对图像的文件信息进行原始性判断。图像的修改与传输往往会在头文件信息上留下痕迹,因此进行原图识别的第一步需要对图像的头文件信息进行原始性判断。
例如图像头文件中存储着各类时间信息表,原始图像中的时间信息基本一致,而经过PS等软件篡改图像的时间信息可能出现矛盾,由此可以判断出图像在拍摄之后是否经过修改;此外部分非原始图像会出现实际尺寸与头文件记录尺寸不一致的情况,某些重压缩(图像修改之后通常会经过转存重压)会改变图像实际宽高,而有时头文件所记录的宽高并未进行修改,导致图像头文件中的尺寸信息矛盾。
在内容篡改检测阶段,图像篡改检测系统会对图像内容层面上有无经过修改进行检测。例如可以通过对图像的压缩特性、重采样痕迹进行检测,追溯图像的压缩另存历史和估计图像的缩放因子。
例如,图像修改或者转存都会使JPG图像经过二次压缩,通过检测图像是否有二次压缩痕迹即可判断图像是否经过修改或转存。二次压缩痕迹肉眼难以发现,而二次压缩的DCT系数,由于前后两次量化系数的差异,直方图会呈现的周期性变化。需要通过提取图像中的DCT系数统计特性,对二次压缩进行学习和分类。

图说:从左到右依次为原图、二次压缩图像、二次压缩DCT系数统计特性
另外,图像篡改检测系统还可以对图像局部物体边缘一致性和内容连续性进行统计分析,判断图像中的内容有无经过修改。
在内容篡改定位阶段,通过上一阶段的判断,图像篡改检测系统结合端到端的AI算法对图像内容和特征进行分析,进一步标记出图像哪些区域经过修改。
不同于原图识别,图像内容篡改检测和定位需要具有较高的鲁棒性。在实际场景中,进行内容篡改的操作往往五花八门,包括马赛克、区域拼接、复制-粘贴、擦除、添加文字等。需要检测的图像类型也多种多样,包括资质、证件、软件截图、商品图、门脸图等各类图像。此外图像篡改定位还需要在图像经过全局的后处理之后仍能将图像的内容改动检测出来。常见的后处理操作包括裁剪、缩放、重压缩、模糊、滤波、翻拍等。针对不同篡改操作,检测的手段也有所不同。以下是抹除类型的篡改示例。
以抹除篡改为例,图像抹除的区域通常会经过平滑处理,因此对篡改图像各个区域进行平滑特征提取,再通过像素变化的幅度、梯度等特征进行分析,以确定图像哪些区域存在篡改。常见的技术手段包括基于传统的图像处理方法检测,如差分、模板匹配、边缘检测等,以及基于深度学习的方法,如卷积神经网络(CNN)。其中,深度学习方法因其能够自动学习特征并适应多种篡改类型而备受关注。
图说:抹除文字类型篡改示例
图像篡改检测技术在当今数字化时代具有重要的应用价值。通过对图像内容层面、局部物体边缘一致性和内容连续性的检测分析,以及结合端到端的AI算法进行内容篡改定位,可以有效地识别和定位图像是否被篡改,保障图像内容的真实性和可信度。随着技术的不断发展和应用场景的不断扩大,图像篡改检测技术将持续优化和完善,为各行各业提供更加精准和可靠的图像信息防伪和篡改检测识别服务。
渡明表示,好技术一定要沿着社会真实需求出发,聚焦真问题,解决真问题。借助这样一场比赛,将参赛样本与比赛产生的优秀检测算法模型一起吸收进来改进算法,有助于帮助解决社会真实场景面临的问题。他强调:“打造负责任的好科技是阿里巴巴科技伦理治理的重要目标。”
附比赛地址:假图粉碎机挑战赛 (aliyun.com)
相关文章:
全网招募P图高手!阿里巴巴持续训练鉴假AI
P过的证件如何鉴定为真?三千万网友都晒出了与梅西的合影?图像编辑技术的普及让人人都能P图,但也带来“假图”识别难题,甚至是欺诈问题。 为此,阿里安全联合华中科技大学国家防伪工程中心、国际文档分析识别方向的唯一顶…...
webrtc QOS笔记一 Neteq直方图算法浅读
webrtc QOS笔记一 Neteq直方图算法浅读 文章目录webrtc QOS笔记一 Neteq直方图算法浅读Histogram Algorithm获取目标延迟遗忘因子曲线Histogram Algorithm DelayManager::Update()->Histogram::Add() 会根据计算的iat_packet(inter arrival times, 实际包间间隔 / 打包时长…...
细分和切入点
本文重点介绍做SEO网站细分和切入点的方法:当我们的行业和关键词竞争性比较大的时候,我们可以考虑对行业或者产品做细分,从而找到切入点。可以按照以下三个方面进行细分。1、按城市细分例如:A:餐饮培训,当前…...
iOS创建Universal Link
iOS 9之前,一直使用的是URL Schemes技术来从外部对App进行跳转,但是iOS系统中进行URL Schemes跳转的时候如果没有安装App,会提示无法打开页面的提示。 iOS 9之后起可以使用Universal Links技术进行跳转页面,这是一种体验更加完美的…...
RuoYi-Vue搭建(若依)
项目简介 RuoYi-Vue基于SpringBootVue前后端分离的Java快速开发框架1.前端采用Vue、Element UI2.后端采用Spring Boot、Spring Security、Redis & Jwt3.权限认证使用Jwt,支持多终端认证系统4.支持加载动态权限菜单,多方式轻松权限控制5.高效率开发&a…...
进程组和用处
进程组:一个或多个进程的集合,进程组id是一个正整数。组长进程:进程组id 进程id组长进程可以创建一个进程组,创建该进程组的进程,终止了,只要进程组有一个进程存在,进程组就存在,与…...
Nacos集群+Nginx负载均衡
搭建Nacos集群 注意: 3个或3个以上Nacos节点才能构成集群。要求服务器内存分配最好大于6G以上(如果不够则需修改nacos启动脚本中的默认内存配置)根据nacos自带的mysql建库脚本建立对应数据库(/conf/nacos-mysql.sql)如果是三台服…...
TypeScript 学习之类型兼容
TypeScript 的类型兼容性是基于结构子类型的。 结构类型是一种只使用其成员来描述类型的方式。 interface Named {name: string; }class Person {name: string; }let p: Named; p new Person();// 赋值成功,因为都是结构类型,只要Person 类型的包含 Nam…...
Linux软件管理RPM
目录 前言 RPM软件管理程序:rpm RPM默认安装的路径 PRM讲解前准备工作 RPM安装(install) RPM查询(query) RPM卸载(erase) RPM升级与更新(upgrade/freshen) RPM重…...
01背包问题
背包问题的递归解决过程如下: 第一步明确思路 在解决问题之前,为描述方便,首先定义一些变量:Vi表示第 i 个物品的价值,Wi表示第 i 个物品的体积,定义V(i,j):当前背包容量 j,前 i 个…...
14_FreeRTOS二值信号量
目录 信号量的简介 队列与信号量的对比 二值信号量 二值信号量相关API函数 实验源码 信号量的简介 信号量是一种解决同步问题的机制,可以实现对共享资源的有序访问。 假设有一个人需要在停车场停车 1.首先判断停车场是否还有空车位(判断信号量是否有资源) 2.停车场正好…...
JavaScript随手笔记---轮播图(点击切换)
💌 所属专栏:【JavaScript随手笔记】 😀 作 者:我是夜阑的狗🐶 🚀 个人简介:一个正在努力学技术的CV工程师,专注基础和实战分享 ,欢迎咨询! &#…...
机器人学 markdown数学公式常用语法
参考链接1 本文包含了markdown常用的数学公式,按照目录可查询选用 初始类 行内数学公式均用两个符号包裹行间数学公式均用两个符号包裹 行间数学公式均用两个符号包裹行间数学公式均用两个符号包裹,用于表示重要的、需在行间单独列出的公式 $行内数学…...
如何使用 Python 语言来编码和解码 JSON 对象
JSON(JavaScript Object Notation) 是一种轻量级的数据交换格式,易于人阅读和编写。 JSON 函数 使用 JSON 函数需要导入 json 库:import json。 函数 描述 json.dumps 将 Python 对象编码成 JSON 字符串 json.loads 将已编码的 JSON 字符串解码为 Pyth…...
【蓝桥云课】求正整数的约数个数
一、求正整数n的约数个数 方法一(常用算法):从1到n逐一判断其能否整除n,若能整除n即为n的约数,否则不是n的约数。 方法二:从1到n\sqrt{n}n逐一判断是否为n的约数,当n\sqrt{n}n为n的约数时,个数加1&…...
刷题记录: wannafly25 E 牛客NC19469 01串 [线段树维护动态dp]
传送门:牛客 题目描述: Bieber拥有一个长度为n的01 串,他每次会选出这个串的一个子串作为曲谱唱歌,考虑该子串从左 往右读所组成的二进制数P。 Bieber每一秒歌唱可以让P增加或减少 2 的 k次方(k由Bieber选 定),但必须…...
懂九转大肠的微软New Bing 内测申请教程
最近微软的New Bing开放内测了,网上已经有拿到内测资格的大佬们对比了ChatGPT和New Bing。对比结果是New Bing比ChatGPT更强大。来看看具体对比例子吧 1.时效性更强 ChatGPT的库比较老,跟不上时事,比如你问它九转大肠的梗,ChatG…...
WRAN翻译
基于小波的图像超分辨残差注意力网络 Wavelet-based residual attention network for image super-resolution 代码: https://github.com/xueshengke/WRANSR-keras 摘要: 图像超分辨率技术是图像处理和计算机视觉领域的一项基础技术。近年来,…...
ROS学习笔记——第二章 ROS通信机制
主要跟着[1]学习ros::Rate r(1); //错误,应改为ros::Rate r(10);[2]对Topic通信打的比方很形象,便于理解记忆。[3]有整个过程的图片,对于初学者更加友好[4]对发布者的代码注释非常好,方便进一步学习此外CMake官方文档可以查询相关…...
MacOS Pytorch 机器学习环境搭建
学习 Pytorch ,首先要搭建好环境,这里将采用 Anoconda Pytorch PyCharm 来一起构建 Pytorch 学习环境。 1. Anoconda 安装与环境创建 Anoconda 官方介绍:提供了在一台机器上执行 Python/R 数据科学和机器学习的最简单方法。 为什么最简单…...
VSCode 2026远程容器连接卡顿?92%开发者忽略的4个Dockerd配置陷阱与实时修复命令清单
更多请点击: https://intelliparadigm.com 第一章:VSCode 2026远程容器连接卡顿现象全景诊断 VSCode 2026 版本在启用 Remote-Containers 扩展连接 Docker 容器时,高频出现 UI 响应延迟、终端输入滞后、文件同步中断等复合型卡顿现象。该问题…...
VSCode实时协作权限失控危机(2026 Beta用户实测:83%团队遭遇越权编辑),这份ACL策略清单请立刻保存
更多请点击: https://intelliparadigm.com 第一章:VSCode 2026实时协作权限失控的真相与影响 VSCode 2026 引入的 Live Share v4.2 协作引擎在默认配置下启用了隐式跨会话资源继承机制,导致用户在加入他人会话时,其本地工作区 .…...
告别Formik/Zod手动编码!VSCode 2026插件实现“画布设计→校验规则→API联调→单元测试”全链路自动生成
更多请点击: https://intelliparadigm.com 第一章:VSCode 2026低代码表单生成插件全景概览 VSCode 2026 引入了原生支持的低代码表单生成能力,其核心由官方插件集 vscode/form-builder 驱动,无需额外运行时服务即可在编辑器内完成…...
C++26反射元编程成本封顶术:4种编译期剪枝模式+1个编译器补丁级优化,已获ISO WG21非正式采纳
更多请点击: https://intelliparadigm.com 第一章:C26反射元编程成本封顶术全景导览 C26 正式引入静态反射(std::reflexpr)与编译期计算增强机制,使元编程从“类型推导黑箱”迈向“可审计、可截断、可封顶”的新范式。…...
Demoparty参与完全指南:从报名到发布的10个关键步骤
Demoparty参与完全指南:从报名到发布的10个关键步骤 【免费下载链接】teach_yourself_demoscene_in_14_days A guide to learn and become active in the demoscene within a couple of weeks 项目地址: https://gitcode.com/gh_mirrors/te/teach_yourself_demosc…...
为什么92%的边缘WASM部署在Docker中失败?(深度逆向libwasi-nn与containerd-shim-wasmv2源码)
更多请点击: https://intelliparadigm.com 第一章:为什么92%的边缘WASM部署在Docker中失败? WebAssembly(WASM)本应成为边缘计算的理想轻量运行时,但当开发者试图将其封装进标准 Docker 镜像并部署至边缘节…...
实用高效的AutoHotkey脚本编译指南:轻松将AHK转换为EXE可执行文件
实用高效的AutoHotkey脚本编译指南:轻松将AHK转换为EXE可执行文件 【免费下载链接】Ahk2Exe Official AutoHotkey script compiler - written itself in AutoHotkey 项目地址: https://gitcode.com/gh_mirrors/ah/Ahk2Exe Ahk2Exe是AutoHotkey官方的脚本编译…...
多智能体强化学习环境PettingZoo:从AEC/并行API到实战应用
1. 项目概述:从单智能体到多智能体的跃迁 如果你是从OpenAI Gym或者Gymnasium一路玩过来的强化学习爱好者,那么当你第一次尝试把研究兴趣扩展到多个智能体时,大概率会感到一阵头疼。单智能体环境里, env.reset() 、 env.step(…...
RTL8852BE Linux驱动实战指南:解决Realtek无线网卡兼容性问题
RTL8852BE Linux驱动实战指南:解决Realtek无线网卡兼容性问题 【免费下载链接】rtl8852be Realtek Linux WLAN Driver for RTL8852BE 项目地址: https://gitcode.com/gh_mirrors/rt/rtl8852be 还在为Linux系统下Realtek RTL8852BE无线网卡无法正常工作而烦恼…...
