当前位置: 首页 > news >正文

兰州高端网站建设/百度竞价优化软件

兰州高端网站建设,百度竞价优化软件,百度认证营销推广师,如何做电商设计目录 前言Amazon Bedrock关于OCR解决方案Amazon Bedrock进行OCR关键信息提取方案注册亚马逊账号API调用环境搭建 总结 前言 大语言模型是一种基于神经网络的自然语言处理技术,它能够学习和预测自然语言文本中的规律和模式,可以理解和生成自然语言的人工…

目录

  • 前言
  • Amazon Bedrock关于OCR解决方案
  • Amazon Bedrock进行OCR关键信息提取方案
    • 注册亚马逊账号
    • API调用
    • 环境搭建
  • 总结

前言

大语言模型是一种基于神经网络的自然语言处理技术,它能够学习和预测自然语言文本中的规律和模式,可以理解和生成自然语言的人工智能程序。在大型语言模型中,神经网络模型可以通过学习大量的语言数据,自动提取自然语言文本中的特征和模式,以实现自然语言的理解和生成。

OCR技术(Optical Character Recognition)是一种广泛应用的人工智能技术,在大语言模型基础上,能够从文档或图像中提取文本、手写字和数据。亚马逊云科技的方案可以在OCR识别出文字的基础上,进一步进行智能的实体识别与关系抽取,形成知识标签,支持风控、营销、推荐等业务产品的开发,并可引入图神经网络算法模型,走进更多的业务场景当中。

Amazon Bedrock关于OCR解决方案

在处理OCR相关问题时,亚马逊云科技提供了多种产品和解决方案,其中包括:

  1. Amazon Textract: 这是一项机器学习服务,可以自动从各种文档或图像中提取文本、手写文字和数据。通过Amazon Textract的AnalyzeDocument API,您可以提取表格结构,使其能够自动识别和提取文档中的表格信息。

  2. Amazon Rekognition: 这是一项功能强大的图像和视频分析服务,专门用于处理真实世界的图像,而不仅仅是文档图像。它支持多种拉丁语言的书写体文本和数字,还能够识别不同字体、样式、方向以及背景中的文本,包括横幅和海报上的文本。

  3. Amazon AI Solution Kit: 这提供了一系列云上AI功能,包括多语言高级文字识别、自然语言理解、通用物体识别、图像超分辨率、图片相似度、人像分割等。特别是在简体中文语言识别方面提供了增强的能力。

通过使用这三种亚马逊云科技的OCR产品和解决方案,您可以有效解决一些OCR技术的挑战,如文字质量低、手写文字识别等问题。特别是Amazon Textract支持多种文件格式,包括JPG、PNG和PDF,还能够处理扫描文档和手机拍摄的图像。除了提取文档中的内容,包括表格和表单字段等结构化数据,Amazon Textract还可以分析发票、收据或身份证等相关数据,同时保护个人隐私信息(PII)。

然而,在处理OCR内容提取时,文档的格式可能不固定,还需要上下文语义理解,仅仅依靠OCR技术无法完全解决这些问题。因此,在这种情况下,引入大型语言模型可以有助于克服这些局限性,加速文本内容的准确提取。这种综合使用OCR技术和大语言模型可以提高信息提取的精确度和效率。

Amazon Bedrock进行OCR关键信息提取方案

在这里插入图片描述

Amazon Bedrock 是一项完全托管的服务,使用单个 API 提供来自 AI21 Labs、Anthropic、Cohere、Meta、Stability AI 和 Amazon 等领先人工智能公司的高性能基础模型(FM),以及构建生成式人工智能应用程序所需的一系列广泛功能,在维护隐私和安全的同时简化开发。借助 Amazon Bedrock 的全面功能,您可以轻松尝试各种热门 FM,使用微调和检索增强生成(RAG)等技术利用您的数据对其进行私人定制,并创建可执行复杂业务任务(从预订旅行和处理保险索赔到制作广告活动和管理库存)的托管代理,所有这些都无需编写任何代码。由于 Amazon Bedrock 是无服务器的,因此您无需管理任何基础设施,并且可以使用已经熟悉的 AWS 服务将生成式人工智能功能安全地集成和部署到您的应用程序中。

解决方案架构如下:
在这里插入图片描述
其具有以下特点:

  • 1、从多种基础模型中进行选择
    -您可以访问来自 Amazon 和其他领先人工智能公司(例如 AI21 Labs、Anthropic、Cohere、Meta 和 Stability AI)的多种基础模型,并在试验环境中快速试验它们。这一系列基础模型包括 Amazon Titan、Jurassic-2、Claude 2、Command、Llama 2 和 Stable Diffusion XL,它们分别支持文本、嵌入和图像等不同模式。
    在这里插入图片描述

  • 2、专属定制基础模型
    使用 Amazon Bedrock 控制台,无需编写代码,您就可以利用您的数据对模型进行微调,以完成公司的特定任务。只需选择存储在 Amazon Simple Storage Service(Amazon S3)中的训练和验证数据集,并在需要时调整超参数,即可实现可能的最佳模型性能。
    在这里插入图片描述

3、单一 API
无论选择哪种模型,您都可以使用单一 API 进行推理。通过单一 API,您可以灵活地使用来自不同模型提供商的不同模型,并且只需对代码做出最少的更改,即可与最新的模型版本保持同步。

注册亚马逊账号

首先需要先注册亚马逊云科技账号。可以通过上面的链接到官网进行注册。
重要说明:申请 Amazon 必须持有一张信用,比如万事达、运通卡、VISA卡

1、登录亚马逊云科技网址,点击右上角的登录控制台。然后选择创建新 Amazon账号

在这里插入图片描述

在这里插入图片描述

2、按照提示填写邮件地址账户名称后点击验证电子邮件地址
在这里插入图片描述

3、查看邮箱中的验证码
在这里插入图片描述

4、输入验证码,点击验证
在这里插入图片描述

5、验证通过后输入根用户密码两次后并点击继续
在这里插入图片描述

6、按照提示输入联系人信息后并点击继续,所有信息不能用中文,拼音可以。
5、输入信用卡信息后点击继续,万事达、运通卡、VISA卡都可以。
6、确认身份信息后点击继续,中国地区代码+86。
7、输入短信验证码后继续
8、选择支持计划,选第一个基本支持 – 免费的即可。

API调用

API Gateway是由Amazon提供的服务,用于创建、发布、维护、监控和保护REST、HTTP和WebSocket API。它充当基于Web的应用程序的入口点,能够接收传入的Web请求,并将其转发给Lambda函数、Amazon服务或HTTP端点进行事件处理。在这个方案中,API Gateway负责管理和验证API密钥,以及根据请求触发Lambda函数。

Lambda是Amazon提供的一项服务,它允许您运行无需服务器的函数代码。在这个方案中,Lambda负责处理Amazon Bedrock的验证过程,以确保请求的合法性,并负责转换请求和响应体,以便与Amazon Bedrock进行交互。

具体来说,API Gateway充当了整个系统的前端入口,它接收外部请求并根据API密钥验证请求的合法性。一旦请求被验证通过,API Gateway会将请求转发给Lambda函数,Lambda函数负责与Amazon Bedrock进行通信,执行验证操作,并将请求转发给Amazon Bedrock。Amazon Bedrock会执行相应的操作,并将结果返回给Lambda函数,然后Lambda函数将结果转换为适当的响应体,并将其发送回API Gateway。最后,API Gateway将响应发送回给客户端,完成整个请求-响应过程。

这个体系结构允许构建一个强大的、可伸缩的生成性AI应用程序,它通过API Gateway提供了安全的入口点,通过Lambda函数处理请求和响应的转换,以及与Amazon Bedrock进行集成,从而实现了生成性AI应用程序的验证和处理。

环境搭建

由于需要构建运行在 X86_64 架构下的 Lambda 函数,我们使用 Amazon Cloud9 这个 亚马逊云科技的云端 IDE,配合 X86_64 的机型,例如 m6i.2xlarge 来作为我们的开发环境。
在这里插入图片描述

打开 Cloud9 后我们首先关闭 Amazon managed temporary credentials,防止在与 Amazon 交互过程中使用 EC2 上挂钩的 IAM Role,然后在 terminal 中执行 Amazon configure 配置开发环境用到的 IAM User。
在这里插入图片描述
使用 Conda 创建一个 Python 的虚拟环境

wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh
chmod +x Miniconda3-latest-Linux-x86_64.sh 
sudo ./Miniconda3-latest-Linux-x86_64.sh

重启 terminal 后执行

conda create -n py310 python=3.10
conda activate py310

由于 Amazon Bedrock 目前在预览阶段,仍需要特定版本的 Boto3 SDK,因此需要进行下载安装。创建 download-dependencies.sh 并加入以下内容

#!/bin/shecho "Creating directory"
mkdir -p ./dependencies && \
cd ./dependencies && \
echo "Downloading dependencies"
curl -sS https://preview.documentation.bedrock.aws.dev/Documentation/SDK/bedrock-python-sdk.zip > sdk.zip && \
echo "Unpacking dependencies"
unzip sdk.zip && \
rm sdk.zip

安装上述依赖

pip install ./dependencies/botocore-1.29.162-py3-none-any.whl --force-reinstall 
pip install ./dependencies/boto3-1.26.162-py3-none-any.whl --force-reinstall 
pip install ./dependencies/awscli-1.27.162-py3-none-any.whl PyYAML==5.3.1 --force-reinstall

环境安装完成就可以正常使用了

总结

通过结合OCR技术和大语言模型,可以有效解决OCR技术在文字质量低、手写文字识别等问题上的局限性,提高信息提取的精确度和效率。亚马逊云科技官网提供了全面的OCR产品和解决方案,支持从文档和图像中提取文本、手写文字和数据,并结合大语言模型进行智能的实体识别与关系抽取,支持多种业务场景。

相关文章:

亚马逊云科技大语言模型加速OCR应用场景发展

目录 前言Amazon Bedrock关于OCR解决方案Amazon Bedrock进行OCR关键信息提取方案注册亚马逊账号API调用环境搭建 总结 前言 大语言模型是一种基于神经网络的自然语言处理技术,它能够学习和预测自然语言文本中的规律和模式,可以理解和生成自然语言的人工…...

什么是分库?分表?分库分表?

分库分表,是企业里面比较常见的针对高并发、数据量大的场景下的一种技术优化方案,所谓“分库分表”,根本不是一回事,而是三件事,他们要解决的问题也都不一样。 这三个事分别是“只分库不分表”、“只分表不分库”、以…...

QT 中 sqlite 数据库使用

一、前提 --pro文件添加sql模块QT core gui sql二、使用 说明 --用于与数据库建立连接QSqlDatabase--执行各种sql语句QSqlQuery--提供数据库特定的错误信息QSqlError查看qt支持的驱动 QStringList list QSqlDatabase::drivers();qDebug()<<list;连接 sqlite3 数据库 …...

不一样的CSS(4)--icon图标系列之svg

序言 上一节内容我们讲解了如何利用css去画一个五角星&#xff0c;其中包括了使用svg的方法&#xff0c;有些小伙伴们对svg的使用不是很了解&#xff0c;那么本节内容我们主要来讲一下&#xff0c;关于svg标签的的使用。 目录 序言一、svg的介绍二、安装SVG扩展插件三、SVG基…...

Level DB --- Cache

class Cache是Level DB中的重要的数据结构&#xff0c;它是一个LRU&#xff08;Least Recently Used&#xff09; Cache的实现。这里面的判断条件主要是内存大小&#xff08;而不是存储entry的个数&#xff09;。当内存达到上界&#xff0c;会释放不被使用的entry&#xff08;存…...

学在西电录播课使用python下载,通过解析m3u8协议、多线程下载ts视频块以及ffmpeg合并

本文涵盖的内容仅供个人学习使用&#xff0c;如果侵犯学校权利&#xff0c;麻烦联系我删除。 初衷 研究生必修选逃&#xff0c; 期末复习怕漏过重点题目&#xff0c;但是看学在西电的录播回放课一卡一卡的&#xff0c;于是想在空余时间一个个下载下来&#xff0c;然后到时候就…...

Springboot3介绍

一、Springboot3简介: https://docs.spring.io/spring-boot/docs/current/reference/html/getting-started.html?spmwolai.workspace.0.0.68b62306Q6jtTw#getting-started.introducing-spring-boot 无论使用XML、注解、Java配置类还是他们的混合用法&#xff0c;配置文件过于…...

Oracle 11G DataGuard GAP 修复过程(通过主库scn增备恢复)

Oracle 11G DataGuard GAP 修复 &#xff08;通过主库scn增备恢复&#xff09; 介绍 DG GAP 顾名思义就是&#xff1a;DG不同步&#xff0c;当备库不能接受到一个或多个主库的归档日志文件时候&#xff0c;就发生了 GAP。 那么&#xff0c;如果遇到GAP如何修复呢&#xff1f…...

WLAN AutoConfig服务假死?重启服务恢复网络连接!

目录 背景&#xff1a; 过程&#xff1a; 可能引起原因&#xff1a; 具体解决步骤&#xff1a; 方法一&#xff1a; 方法二&#xff1a; 总结&#xff1a; 背景&#xff1a; 这个问题困扰我好长一段时间了&#xff0c;每次下班将电脑关机后&#xff0c;次日早上电脑开机…...

【linux】(30)shell-条件判断

if 语句 if 语句是 Shell 脚本中用于条件判断的基本结构。 基本语法 if 语句的基本语法如下&#xff1a; if [ condition ] thencommands ficondition 是要测试的条件。commands 是在条件为真时要执行的命令。 示例 简单条件判断 #!/bin/bashif [ 1 -eq 1 ] thenecho &q…...

docker安装启动问题解决排查

一、安装docker报错 刚开始安装docker报这个错&#xff1a; Error: Transaction test error: file /usr/libexec/docker/cli-plugins/docker-buildx from install of docker-ce-cli-1:20.10.8-3.el8.x86_64 conflicts with file from package docker-buildx-plugin-0:0.14.0…...

《MySQL 查询进阶:复杂查询语句的魅力》

一、引言 MySQL 的复杂查询语句就像是一把神奇的钥匙&#xff0c;能够打开数据世界的大门&#xff0c;展现出数据的无限魅力。本文将带你深入探索 MySQL 查询进阶技巧&#xff0c;从常用查询到子查询&#xff0c;再到视图的运用&#xff0c;让你领略复杂查询语句的强大功能。 …...

OpenHarmony-3.HDF框架(2)

OpenHarmony HDF 平台驱动 1.平台驱动概述 系统平台驱动框架是系统驱动框架的重要组成部分&#xff0c;它基于HDF驱动框架、操作系统适配层(OSAL, operating system abstraction layer)以及驱动配置管理机制&#xff0c;为各类平台设备驱动的实现提供标准模型。 系统平台驱动(…...

人大金仓(KingBaseEs)数据库操作手册

人大金仓数据库&#xff08;KingbaseES&#xff09;是由北京人大金仓信息技术股份有限公司&#xff08;简称人大金仓&#xff09;自主研发的、具有自主知识产权的通用关系型数据库管理系统。 官方下载地址&#xff1a;KingbaseES 人大金仓数据库 KES技术文档在线手册&#xf…...

Flink+Paimon实时数据湖仓实践分享

随着 Paimon 近两年的推广普及&#xff0c;使用 FlinkPaimon 构建数据湖仓的实践也越来越多。在 Flink 实时数据开发中&#xff0c;对于依赖大量状态 state 的场景&#xff0c;如长周期的累加指标计算、回撤长历史数据并更新等&#xff0c;使用实时数仓作为中间存储来代替 Flin…...

w~深度学习~合集1

我自己的原文哦~ https://blog.51cto.com/whaosoft/12663254 #Motion Plan 代码 github.com/liangwq/robot_motion_planing 轨迹约束中的软硬约束 前面的几篇文章已经介绍了&#xff0c;轨迹约束的本质就是在做带约束的轨迹拟合。输入就是waypoint点list&#xff0c;约束…...

KVM 虚拟化

KVM&#xff08;Kernel-based Virtual Machine&#xff09;是一种基于内核的虚拟机技术&#xff0c;具有以下优势&#xff1a; ‌开源性‌&#xff1a;KVM是完全开源的&#xff0c;这意味着它没有许可费用&#xff0c;适合预算有限的用户。‌性能‌&#xff1a;KVM利用Linux内…...

MONI后台管理系统-数据库设计

前言&#xff1a;该文档纯属个人总结设计&#xff0c;如果雷同&#xff0c;纯属巧合&#xff0c;其中还有很不合理之处&#xff0c;请大家批评指正。如有应用于项目&#xff0c;请慎重。 注意: 如有需要该文件的sql脚本&#xff0c;请移步&#xff1a;资源下载 1. 表清单 序号…...

Rigol DP711自动控制--SCPI命令

通过串口的SCPI命令来控制通道输入输出 也可以用UltraSigma UI来发送SCPI 物理连接&#xff1a; Pin2_2, Pin3_3, Pin5_5 串口命令控制&#xff1a; 命令&#xff1a;9600&#xff0c; 8bit, None SCPI CMD(Standard Commands for Programmable Instruments) OUTPut CH1, On…...

总结FastDFS的面试题

目录 一&#xff1a;FastDFS的基础知识 1&#xff1a;定义 2&#xff1a;FastDFS的优点 3&#xff1a;tracker server 4&#xff1a;storage server 二&#xff1a;FastDFS的存储原理 1&#xff1a;小文件存储的问题 2&#xff1a;小文件合并存储 3&#xff1a;文件上…...

Fiddler 5.21.0 使用指南:过滤浏览器HTTP(S)流量下(四)

概述 在上一篇文章中&#xff0c;我们介绍了一部分简单的过滤功能&#xff0c;已经可以帮助我们较为准确的定位到感兴趣的请求&#xff1b;提升我们的工作效率&#xff0c;我们可以通过设置更为复杂的过滤规则&#xff0c;精准到定位的我们想要的请求和响应信息。专注于分析对…...

【踩坑】pip安装依赖卡在Installing build dependencies ...

pip安装依赖卡在Installing build dependencies ... 如图&#xff0c;pip安装依赖一直卡着&#xff0c;最后不得不ctrlC强制终止 用–verbose显示详细安装信息&#xff0c;发现卡在安装numpy pip install -r requirements.txt --verbose大概率是网络问题&#xff0c;用镜像单…...

【WRF-Urban】SLUCM新增空间分布城市冠层参数及人为热排放AHF代码详解(下)

目录 详细解释更改文件内容4 运行模块(run):README.namelist5 输出模块(share):share/module_check_a_mundo.Fshare/output_wrf.F参考SLUCM新增空间分布城市冠层参数及人为热排放AHF代码详解的前两部分内容可参见-【WRF-Urban】SLUCM新增空间分布城市冠层参数及人为热排放A…...

云桌面:云计算桌面

目录 云桌面的定义和核心概念 技术架构详解 主流架构详解 管理成本分析 安全性措施 应用场景详解 云桌面的定义和核心概念 云桌面是一种通过云计算技术提供的虚拟桌面服务&#xff0c;它允许用户通过网络访问远程服务器上的虚拟机&#xff0c;这些虚拟机为用户提供了一个…...

WPF+LibVLC开发播放器-音量控制和倍速控制

界面 界面上增加音量的控件和倍速控制控件 音量控制 主要也是一个Slider进度条控件来实现音量调节 我们这里设置默认的最大值为100&#xff0c;默认Value值也为100&#xff0c;默认声音开到最大 这里目前完全由前端控制音量调节&#xff0c;可以直接使用ValueChanged事件实…...

数智运营一体化平台项目经营分享

分离前后台&#xff0c;增强产品管理灵活性 前端成熟的流程平台&#xff0c;支持低代码快速灵活配置流程表单&#xff0c;完美解决流程频繁变化与快速上线、费用控制的矛盾。使产品管理体系&#xff0c;摆脱了流程可移植性差和投入大量人力物力无止境修改流程的困境。同时&…...

记录blender学习过程中遇到的问题

物体发射的方向不对 被发射物体&#xff08;例如一棵树&#xff09;n键看旋转归0 切换正视图 将被发射物体的局部坐标的Z轴 指向 全局方向的X轴时 并且把粒子系统设置的物体旋转勾选上 方向就对了 做倒角发现有问题 检查缩放应用、面朝向、有没有重合点&#xff08;融合点&am…...

(八)腾讯cloudstudio+Stable-Diffusion-webui AI绘画教程-安装插件

一、说明 本文安装8个插件&#xff0c;先安装&#xff0c;后面在慢慢学习&#xff0c;我也是第一次喔 二、中英文双语语言包 &#xff08;二&#xff09;Ubuntu22.04Stable-Diffusion-webui AI绘画 中英双语插件安装-CSDN博客https://blog.csdn.net/jiangkp/article/details…...

记一次跑前端老项目的问题

记一次跑前端老项目的问题 一、前言二、过程1、下载依赖2、启动项目3、打包 一、前言 在一次跑前端老项目的时候&#xff0c;遇到了一些坑&#xff0c;这里记录一下。 二、过程 1、下载依赖 使用 npm install下载很久&#xff0c;然后给我报了个错 core-js2.6.12: core-js…...

深度学习:MindSpore自动并行

随着模型规模的逐渐增大&#xff0c;需要的算力逐渐增强&#xff0c;但是算力需求增长速度远高于芯片算力增长速度。现在唯一的解决方案只有通过超大规模集群训练大模型。 大集群训练大模型的挑战 内存墙 200B参数量的模型&#xff0c;参数内存占用745GB内存&#xff0c;训练…...