当前位置：首页 > news >正文

亚马逊云科技人工智能内容审核服务：大大降低生成不安全内容的风险

news 文章来源：https://blog.csdn.net/caijingshiye/article/details/132714375 2025/4/20 18:34:13

生成式人工智能技术发展日新月异，现在已经能够根据文本输入生成文本和图像。Stable Diffusion是一种文本转图像模型，可以创建栩栩如生的图像应用。通过Amazon SageMaker JumpStart，使用Stable Diffusion模型轻松地从文本生成图像。

尽管生成式人工智能解决方案功能强大，应用广泛，但它们也很容易受到操纵和滥用。用户在使用它们生成图片时，应实施严格的审核程序，高度重视内容审核，以便保护其用户、平台和品牌，在创造安全和积极的用户体验的同时，确保平台和品牌的声誉不会受损。

此篇内容我们将探讨如何使用亚马逊云科技人工智能服务Amazon Rekognition和Amazon Comprehend以及其他技术，近乎实时地有效审核Stable Diffusion模型生成的内容。

解决方案概览

Amazon Rekognition和Amazon Comprehend是托管式人工智能服务，它们通过API接口提供预训练且可自定义的机器学习模型，无需机器学习（ML）专业知识。Amazon Rekognition Content Moderation可自动完成图像和视频的审核，简化这一过程。Amazon Comprehend利用机器学习来分析文本，发现有价值的洞察和关系。

以下参考资料介绍了如何创建RESTful代理API，用于近乎实时地审核Stable Diffusion文本转图像模型生成的图像。在此解决方案中，使用JumpStart启动并部署了Stable Diffusion模型（基于v2-1）。该解决方案使用负向提示、文本审核解决方案（例如Amazon Comprehend）以及基于规则的筛选条件来审核输入提示。它还利用Amazon Rekognition来审核生成的图像。在检测到不安全信息时，RESTful API会将生成的图像和审核警告返回给客户端。

此工作流中的步骤如下：

用户发送提示以生成图像。
AWS Lambda函数使用Amazon Comprehend、JumpStart和Amazon Rekognition协调图像的生成和审核：
将基于规则的条件应用到Lambda函数中的输入提示，使用禁用词检测强制执行内容审核。
使用Amazon Comprehend自定义分类器，分析提示文本以进行毒性分类。
通过SageMaker端点将提示发送到Stable Diffusion模型，传递提示作为用户输入，并传递预定义列表中的负向提示。
将从SageMaker端点返回的图像字节发送到Amazon Rekognition DetectModerationLabel API进行图片审核。
如果之前的步骤在提示或生成的图像中检测到任何不当信息，则会构造包含图像字节和警告的响应消息。
服务将响应发送回客户端。

以下屏幕截图显示了使用上述架构构建的示例应用程序。Web UI将用户输入提示发送到RESTful代理API，并显示从响应中收到的图像和所有审核警告。如果实际生成的图像包含不安全的内容，则演示应用程序会对内容进行模糊处理。我们使用示例提示“一位性感女士”测试了该应用程序。

您可以实施更复杂的逻辑来获得更好的用户体验，例如，在提示包含不安全的信息时拒绝请求。此外，您可以制定重试策略，在提示是安全的、但输出不安全时，重新生成图像。

预定义负向提示列表

Stable Diffusion支持负向提示，这样便可以指定在图像生成期间要避免的提示。创建预定义的负向提示列表是一种实用的主动式方法，用于防止模型生成不安全的图像。在调用SageMaker端点来运行Stable Diffusion模型的推理时，可以在Lambda函数中管理该实施，传递用户输入中的提示，并传递预定义列表中的负向提示。

尽管这种方法行之有效，但它可能会影响Stable Diffusion模型生成的结果并限制其功能。所以，要点在于将其视为审核技术之一，再结合其他方法，例如使用Amazon Comprehend和Amazon Rekognition进行文本和图像审核。

审核输入提示

文本审核的常用方法是使用基于规则的关键字查找方法，识别输入文本是否包含预定义列表中的任何禁用词或短语。这种方法相对容易实施，对性能的影响很小，成本也更低。但是，这种方法的主要缺点是，它只检测预定义列表中包含的单词，无法检测未包含在列表中的禁用词新变体或修改后的变体。用户还可以尝试使用其他拼写或特殊字符来替换字母，从而绕过规则。

为了解决基于规则的文本审核的局限性，许多解决方案采用混合方法，将基于规则的关键字查找与基于机器学习的毒性监察相结合。两种方法的结合可以提供更全面、更有效的文本审核解决方案，能够检测更大范围内的不当内容并提高审核结果的准确性。

在此解决方案中，使用Amazon Comprehend自定义分类器来训练毒性监察模型，使用该模型来检测在输入提示中可能存在有害内容、但未检测到明确使用禁用词的情况。借助机器学习的强大功能，可以教导模型识别文本中可能存在毒性内容的模式，即使基于规则的方法难于检测到此类模式也没问题。

使用Amazon Comprehend作为托管式人工智能服务，可以简化训练和推理。只需两个步骤，就可以轻松地训练和部署Amazon Comprehend自定义分类。

审核输出图像

尽管审核输入文本提示很重要，但它并不能保证对于目标受众而言，Stable Diffusion模型生成的所有图像都是安全的，因为该模型的输出可能包含一定程度的随机性。因此，审核Stable Diffusion模型生成的图像同样重要。

在此解决方案中，利用Amazon Rekognition Content Moderation这个预先训练过的机器学习模型，检测图像和视频中的不当内容。在此解决方案中，使用Amazon Rekognition DetectModerationLabel API，近乎实时地审核Stable Diffusion模型生成的图像。Amazon Rekognition Content Moderation提供预先训练的API，用于分析各种不当或冒犯性内容，。

用于微调模型的有效图像审核技术

微调是一种常用技术，用于根据特定任务来调节预训练的模型。对于Stable Diffusion，微调可用于生成包含特定对象、样式和字符的图像。在训练Stable Diffusion模型以防止创建不当或冒犯性的图像时，内容审核至关重要。这包括仔细审查并筛选出任何可能导致生成此类图像的数据。通过这样做，模型可以从更多样化和更具代表性的数据点进行学习，从而提高准确性并防止传播有害内容。

审核延迟和成本

此解决方案使用顺序模式来审核文本和图像。文本审核需要调用基于规则的函数和Amazon Comprehend，Amazon Rekognition则用于在调用Stable Diffusion之前和之后的图像审核。尽管这种方法可以有效地审核输入提示和输出图像，但它可能会增加解决方案的总体成本和延迟，这是需要考虑的问题。

延迟

Amazon Rekognition和Amazon Comprehend均提供了托管API，具备高可用性和内置的可扩展性。尽管由于输入大小和网络速度可能导致延迟变化，但在此解决方案中，所用两项服务中的API都提供了近实时的推理。对于大小小于100个字符的输入文本，Amazon Comprehend自定义分类器端点的处理速度低于200毫秒，而对于平均大小小于1MB的文件，Amazon Rekognition Image Moderation API的速度大约为500毫秒。

总共而言，对Amazon Rekognition和Amazon Comprehend的审核API调用会增加700毫秒的API调用时间。需要注意的是，根据提示的复杂性和底层基础设施功能，Stable Diffusion请求通常需要更长的时间。在测试账户中，使用ml.p3.2xlarge实例类型，通过SageMaker端点调用Stable Diffusion模型的平均响应时间约为15秒。因此，审核引入的延迟约为总响应时间的5%，因此对系统整体性能的影响微乎其微。

成本

Amazon Rekognition Image Moderation API采用基于请求数量的即用即付模式。费用因所用亚马逊云科技区域而异，采用分层定价结构。随着请求数量的增加，每次请求的成本会降低。

在此解决方案中，使用了Amazon Comprehend自定义分类器，并将其部署为Amazon Comprehend端点，以协助进行实时推理。这种实施会产生一次性训练成本和持续的推理成本。

使用Jumpstart，可以将Stable Diffusion模型作为单个软件包来快速启动和部署。在Stable Diffusion模型上运行推理将产生底层Amazon Elastic Compute Cloud（Amazon EC2）实例费用，以及入站和出站数据传输费用。

小结

综上所述，概述了一个示例解决方案，该解决方案展示了如何使用Amazon Comprehend和Amazon Rekognition，审核Stable Diffusion输入提示和输出图像。此外，可以在Stable Diffusion中定义负向提示，以防止生成不安全的内容。通过实施多个审核层，可以大大降低生成不安全内容的风险，从而确保更安全、更可靠的用户体验。

亚马逊云科技人工智能内容审核服务：大大降低生成不安全内容的风险

生成式人工智能技术发展日新月异，现在已经能够根据文本输入生成文本和图像。Stable Diffusion是一种文本转图像模型，可以创建栩栩如生的图像应用。通过Amazon SageMaker JumpStart，使用Stable Diffusion模型轻松地从文本生成图像。尽管生成式…...

编程日记 2023/9/7 7:46:39

2023年高教社杯数学建模思路 - 案例：最短时间生产计划安排

文章目录 0 赛题思路1 模型描述2 实例2.1 问题描述2.2 数学模型2.2.1 模型流程2.2.2 符号约定2.2.3 求解模型 2.3 相关代码2.4 模型求解结果建模资料 0 赛题思路 （赛题出来以后第一时间在CSDN分享） https://blog.csdn.net/dc_sinor?typeblog 最短时…...

编程日记 2023/9/7 7:45:36

算法工程题（二叉树递归）

* 题意说明： * 给你两棵二叉树的根节点 p 和 q ，编写一个函数来检验这两棵树是否相同。 * 如果两个树在结构上相同，并且节点具有相同的值，则认为它们是相同的。 * * 示例 1： * 输入：p [1,2,3]…...

编程日记 2023/9/7 7:44:35

“指针跃动”受邀参加全球贸易服务峰会

“指针跃动”受邀参加全球贸易服务峰会有“服”同享共赢未来引子在全球化日益盛行的今天，贸易不再仅仅是物质的交流，更涉及到服务、理念、文化和科技的共享。中国国际服务贸易交易会全球贸易服务峰会，就是这个趋势的集中体现。在这次峰会…...

编程日记 2023/9/7 7:43:34

Go Web开发的高级技巧和最佳实践

Go Web开发的高级技巧和最佳实践欢迎来到Go语言Web开发的高级技巧和最佳实践指南。在这篇文章中，我们将深入探讨Go语言Web应用程序的高级主题，包括性能优化、安全性、部署和微服务架构。性能优化性能是Web应用程序的关键因素之一。Go语言以其出色的…...

编程日记 2023/9/7 7:42:33

Verilog 基础知识

1、数值种类 Verilog HDL 有下列四种基本的值来表示硬件电路中的电平逻辑： 0：逻辑 0 或 “假”1：逻辑 1 或 “真”x 或 X：未知 x 意味着信号数值的不确定，即在实际电路里，信号可能为 1，也可能…...

编程日记 2023/9/7 7:41:32

element ui 表格组件与分页组件的二次封装

目录组件封装 parseTime函数 debounce 函数页面使用【扩展】vue 函数式组件函数式组件特点： 函数式组件的优点： 【扩展】vue中的render函数一、初步认识render函数二、为什么使用render函数三、render函数的解析组件封装这段代码是一…...

编程日记 2023/9/7 7:40:31

递归算法学习——有效的数独，解数独

一，有效的数独 1.题意请你判断一个 9 x 9 的数独是否有效。只需要根据以下规则 ，验证已经填入的数字是否有效即可。数字 1-9 在每一行只能出现一次。数字 1-9 在每一列只能出现一次。数字 1-9 在每一个以粗实线分隔的 3x3 宫内只能出现一次。&#x…...

编程日记 2023/9/7 7:39:30

基于Alexnet深度学习网络的人员口罩识别算法matlab仿真

目录 1.算法运行效果图预览 2.算法运行软件版本 3.部分核心程序 4.算法理论概述 5.算法完整程序工程 1.算法运行效果图预览 2.算法运行软件版本 matlab2022a 3.部分核心程序 file_path1 test\mask\;% 图像文件夹路径 %获取测试图像文件夹下所有jpg格式的图像文件…...

编程日记 2023/9/7 7:38:29

【Java Web】利用Spring整合Redis，配置RedisTemplate

1. 在config中加入RedisConfig配置类 package com.nowcoder.community.config;import org.springframework.context.annotation.Bean; import org.springframework.context.annotation.Configuration; import org.springframework.data.redis.connection.RedisConnectionFacto…...

编程日记 2023/9/7 7:37:28

如何正确的写出第一个java程序：hello java

1 前言最近公司由于项目需要，开始撸java代码了。学习一门新的编程语言，刚开始总是要踩很多坑，所以记录一下学习过程，也希望对java初学者有所帮助。 2 hello java 2.1 程序源码程序内容十分简单，这里就不再过多赘…...

编程日记 2023/9/7 7:36:27

使用llvm 编译最新的linux 内核(LoongArch)

1. 准备交叉工具链 llvm 使用了最新的llvm-17, 编译方法见:编译LoongArch的llvm交叉工具链 gcc 从linux 官方下载：http://mirrors.edge.kernel.org/pub/tools/crosstool/files/bin/x86_64/13.2.0/x86_64-gcc-13.2.0-nolibc-loongarch64-linux.tar.xz 发布llvm和g…...

编程日记 2023/9/7 7:35:26

Using Multiple RDF Knowledge Graphs for Enriching ChatGPT Responses

本文是LLM系列文章，针对《Using Multiple RDF Knowledge Graphs for Enriching ChatGPT Responses》的翻译。使用多个RDF知识图来丰富ChatGPT响应摘要1 引言2 相关工作3 GPT-LODS的过程和用例4 结束语摘要最近有一种趋势是使用新型人工智能聊天GPT聊天箱&…...

编程日记 2023/9/7 7:34:24

【Hive-小文件合并】Hive外部分区表利用Insert overwrite的暴力方式进行小文件合并

这里我们直接用实例来讲解，Hive外部分区表有单分区多分区的不同情况，这里我们针对不同情况进行不同的方式处理。利用overwrite合并单独日期的小文件 1、单分区 # 开启此表达式：(sample_date)?. set hive.support.quoted.identifiersnon…...

编程日记 2023/9/7 7:33:23

位运算 |(按位或) (按位与) ^(按位异或)

目录文章目录：本章讲解的主要是刷题系列 1：首先会介绍 I & ^这三个操作符的作用，性质 2：三道使用位运算操作符的经典笔试题(来自剑指offer) 题目链接如下： 1:136. 只出现一次的数字 - 力扣（LeetCode…...

编程日记 2023/9/7 7:32:22

Qt应用开发(基础篇)——复选按钮 QCheckBox 单选按钮 QRadioButton

一、前言 QCheckBox类与QRadioButton类继承于QAbstractButton，QCheckBox是一个带有文本标签的复选框，QRadioButton是一个带有文本标签的单选按钮。按钮基类 QAbstractButton QCheckBox QCheckBox复选框是一个很常用的控件，拥有开关(选中和未…...

编程日记 2023/9/7 7:31:21

AERMOD模型大气环境影响评价

随着我国经济快速发展，我国面临着日益严重的大气污染问题。近年来，严重的大气污染问题已经明显影响国计民生，引起政府、学界和人们越来越多的关注。大气污染是工农业生产、生活、交通、城市化等方面人为活动的综合结果，同时气象因…...

编程日记 2023/9/7 7:30:20

递归组装树结构的数据

开发中，经常遇到存在树形结构的数据，如行政区划这类数据，一级一级分层，后端需要组装好树形结构数据返回给前端。由于返给前端的json数据中，如果是叶子节点了，说明它没有子节点，那么就没必要返…...

编程日记 2023/9/7 7:29:19

企业架构LNMP学习笔记7

PHP介绍： HTML：超文本标记语言 http: 超文本传输协议端口80 浏览器将html代码解析成web页面。 PHP：超文本预处理器。后端语言开发，页面上需要动态改变修改的，需要连接数据库查询数据，转为html。主要…...

编程日记 2023/9/7 7:28:18

开店星小程序上架教程和后台Request failed with status code 500[undefined]问题处理

开店星小程序上架教程和后台Request failed with status code 500[undefined]问题处理刚刚安装好开店星网站后台之后都会出现这个code 500[undefined]的错误，需要改一下代码。改好了之后就可以正常使用了。如果大家不懂得这样处理的可以私聊我，帮忙处理…...

编程日记 2023/9/7 7:27:17

第一百三十六回 WillPopScope组件

文章目录概念介绍使用方法示例代码我们在上一章回中介绍了下拉刷新组件相关的内容，本章回中将介绍 WillPopScope组件.闲话休提，让我们一起Talk Flutter吧。概念介绍我们在本章回中介绍的WillPopScope组件是一种事件拦截类组件，它没有具…...

编程日记 2023/9/7 7:26:16

【论文爬虫】自动将论文详细信息直送notion并自动下载（含源码）

输入论文标题，本爬虫将自动在semanticscholar.com和arxiv.com搜索该文章，自动获取其日期、作者、url、摘要等信息，并自动发送到你提前设置好的notion数据库里，同时自动从arxiv下载论文，然后将论文的保存地址在notion页…...

编程日记 2023/9/7 7:25:15

Android知识点整理

关键点 Activity Fragment 调试应用处理应用程序配置 Intent 和 Intent 过滤器会使用Context 后台处理指南 Android 的数据隐私 Android 网络数据安全教程 Android 中的依赖项注入内容提供程序 Android 内存管理概览一些重要的库 1.Glide 是一个 Android 上的…...

编程日记 2023/9/7 7:24:13

JSON与电子表格

一、介绍电子表格是一种常见的电子数据处理工具，而JSON是一种数据交换格式。电子表格和JSON之间可以进行数据的导入和导出，以实现数据的相互转换和交互。在电子表格中，数据以行和列的形式组织，并可以包含不同的数据类型。每个…...

编程日记 2023/9/7 7:23:11

Oracle创建用户、授权视图权限

1、创建用户密码 create user 用户名 identified by 密码;2、创建视图 CREATE VIEW 用户1.表名1 AS SELECT * FROM 用户2.表名2 t;3、授权 GRANT SELECT ON 用户2.表名2 TO 用户1 with GRANT OPTION ；grant connect to 用户名; grant select on 用户1.表名1 t…...

编程日记 2023/9/7 7:22:11

MT4移动端应用指南：随时随地进行交易

如今，随着科技的不断发展，我们可以随时随地通过手机进行各种操作，包括进行金融交易。本文将为大家介绍一款优秀的金融交易软件——MT4（可在mtw.so/6gwPno这点下）移动端应用，并提供详细的使用指南&#xff0…...

编程日记 2023/9/7 7:21:10

【数据挖掘】学习笔记

文章目录 < 数据预处理 > 聚集：多个样本或特征进行合并（减少样本规模、转换标度、更稳定）抽样：抽取一部分样本降维：在地位空间中表示样本（PCA、SVD）特征选择：选取重要特征&am…...

编程日记 2023/9/7 7:20:08

MyBatis-Plus排除不必要的字段

查询学生信息排除年龄列表 📚🔍 使用MyBatis-Plus排除某些字段。如果你想要进行查询，但又不需要包含某些字段，那么这个功能将非常适合你。🔍🎓📝 1. 学生信息查询-排除年龄列表在使用 MyBat…...

编程日记 2023/9/7 7:19:07

webpack打包

文章目录一、什么是webpack二、使用步骤1.创建一个新的文件夹,并将其初始化2.在当前目录下安装webpack以及webpack-cli3.配置webpack自定义命令,使之生效4.运行自定义命令,打包webpack5.打包成功之后会将内容打包到dist文件夹下6.配置webpack1)修改webpack打包入口和出口2)配置…...

编程日记 2023/9/7 7:18:07

【Java SE】抽象类与接口

目录【1】抽象类【1.1】抽象类概念【1.2】抽象类语法【1.3】抽象类特性【1.4】抽象类的作用【2】接口【2.1】接口的概念【2.2】语法规则【2.3】接口使用【2.4】接口特性【2.5】实现多个接口【2.6】接口间的继承【2.7】接口使用实例【2.8】Clonable …...

编程日记 2023/9/7 7:17:06

相关文章：