外贸网站建设 泰州/网店推广联盟
引言:知识工程的演变与重要性
知识工程(Knowledge Engineering,KE)是一个涉及激发、捕获、概念化和形式化知识以用于信息系统的过程。自计算机科学和人工智能(AI)历史以来,知识工程的工作流程因其在构建可靠智能代理中的重要性而被广泛使用。确实,开发适用于从常识到交通、犯罪和天气等应用的可信模型,需要对知识过程有深入的理解。同样,在这些领域内的任务解决方案,包括问答、摘要和预测,都预期将纳入标准化的KE程序,以便它们能够有意义地适用并与人类兼容。
随着时间的推移,知识工程的范围和目标任务正在发生变化,其范式也在转变,从早期的专家系统、语义网到语言建模。这些范式之间的用例和用户需求尚未全球性地分析,因为新范式通常满足先前的痛点,同时可能引入新的问题。最近,将系统模式抽象成框架学(boxology)为将知识工程的需求和用例与能够最好满足它们的系统、组件和软件对齐提供了契机。本文提出了一个愿景,即通过利用创建参考架构的软件工程方法来协调知识工程领域的最佳实践。我们描述了如何迭代设计和实施参考架构,以将用户需求与反复出现的系统模式联系起来,构建在现有知识工程工作流程和框架学之上。我们提供了一个六步路线图,可以实现这样的架构,包括范围定义、信息源选择、架构分析、基于信息源分析的架构综合、通过实例化评估,最终将其实例化为具体的软件架构。
论文标题、机构、论文链接
论文标题:Standardizing Knowledge Engineering Practices with a Reference Architecture
作者:Bradley P. Allen, Filip Ilievski
机构:University of Amsterdam, Amsterdam, The Netherlands; Vrije Universiteit, Amsterdam, The Netherlands
论文链接:https://arxiv.org/pdf/2404.03624.pdf
知识工程的定义与关键任务
1. 知识工程的历史回顾
知识工程(Knowledge Engineering,KE)是指为信息系统创建和维护知识的活动。自计算机科学和人工智能(AI)历史以来,知识工程的工作流程在构建跨领域和任务的可靠智能代理时一直是关键组成部分。例如,从常识到交通、犯罪和天气的应用程序的可信模型的开发,都需要经过良好理解的知识过程。同样,在这些领域内的任务解决方案,包括问答、摘要和预测,都预期将纳入标准化的知识工程程序,以便它们具有意义并与人类兼容。
2. 知识图谱与大语言模型在知识工程中的作用
知识图谱(Knowledge Graph,KG)工程作为知识工程的一个变体,旨在捕获、表示和利用有关实体、它们之间的关系及其底层语义的复杂信息。研究人员和领域专家设计了针对不同领域需求的知识图谱工程工作流程,如生物医学、图书馆和信息科学、网络民主、常识知识和出版物等。同时,大型语言模型(Large Language Models,LLMs)作为知识工件在知识工程工作流程中的角色也在积极研究中,以理解LLMs增强、替代或添加知识工程组件的潜力。
知识工程范式的演变
1. 专家系统时代
在20世纪60年代,研究人员对目标导向搜索和启发式算法进行实用的通用问题解决持乐观态度。然而,到了70年代,这些系统难以扩展到复杂应用成为显而易见。20世纪70年代中期,Feigenbaum受到Newell和Simon工作的影响,认为专注于特定领域对于成功的知识工程至关重要。
2. 语义网时代
在语义网时代,Tim Berners-Lee提倡使用特定的开放标准(如RDF和SPARQL)来编码Web内容中的知识,以改善Web内容的访问和可发现性,并实现自动化推理。然而,语义网技术的采用速度缓慢,最终导致研究人员寻求方法将这些标准和原则与一般软件行业规范更紧密地对齐,并使其更加开发者友好。
3. 知识图谱工程
近期的努力,特别是像谷歌和亚马逊这样的公司开发的商业知识图谱,表明了向基于属性图的自定义架构的转变。这种转变虽然创新,但通常绕过了Feigenbaum和Berners-Lee等早期愿景家所倡导的互操作性和联合理念。
4. 大语言模型与神经符号系统
2010年代,连接主义方法和图形处理硬件的兴起为使用大型语言模型进行知识生产带来了新的可能性。关于LLMs与知识库之间关系的两种主要观点已经出现。第一种观点将LLMs视为可查询的独立知识库,可以通过最小的人为干预从非结构化文本中学习。这种方法挑战了传统的、劳动密集型的知识工程过程,但对准确性、道德使用、互操作性和可策展性提出了担忧。第二种更谨慎的观点将语言模型视为知识工程工作流程中的组件,结合新旧方法。这种方法强调可访问性、手动编辑提取的知识以及推理方法的解释,解决了早期技术的局限性。
知识工程的挑战与需求
1. 用户需求与用例的多样性
知识工程(KE)的发展历程表明,随着人工智能(AI)的演进,KE的范式也在不断变化。从专家系统、语义网到最近的大型语言模型(LLMs),每个时期的KE都试图解决前一时期的痛点,但往往会引入新的挑战。用户的需求和用例多样性是KE面临的一大挑战。例如,早期的KE可能由计算机科学家执行,而现在则涉及直接与知识交互的领域专家、构建本体的知识工程师、修复过时信息的知识编辑、开发知识完善系统的数据科学家,以及测试可用知识的商业和组织利益相关者。这些不同的用户和任务要求KE系统能够灵活地定义和支持各种利益相关者的需求和优先级。
2. 系统设计模式的框架化(Boxology)
近期,将系统设计模式抽象为框架化的“盒子学”(Boxology)为将KE的需求和用例与最能满足这些需求的系统、组件和软件对齐提供了契机。然而,当前的盒子学模式尚未包含用户需求、任务和应用需求的信息,也缺乏将来可能包含这些信息的机制。此外,盒子学模式和流行的NeSy(神经符号系统)流程(例如微调)和工件(例如知识图谱)之间的对齐规范尚不明确,这表明KE系统需要一种原则性的方式来考虑不同用户需求、范式和用例。
3. 面向未来的知识工程需求
随着KE的范式和技术的不断演进,未来的KE需求将需要更加灵活和适应性强的系统。这些系统应该能够随着时间的推移和应用的变化而适应不断演变的需求,并提供一种规范性框架,标准化最佳实践,同时允许针对特定情况进行定制。
提出参考架构的概念与方法论
1. 参考架构的定义与用途
参考架构(RA)是一种框架,它通过最终架构和相应的软件系统将利益相关者的需求与设计模式对齐。RA作为一个通用架构,为特定信息系统类别内的软件工程实践社区提供标准化。RA的特点包括提供最高级别的抽象,强调架构质量,考虑但不包括利益相关者,并促进遵循共同标准,有效支持系统开发和沟通。
2. 六步法设计与实施参考架构
RA的设计和实施可以通过以下六步法进行:范围定义、信息源选择、架构分析、基于信息源分析的架构合成、通过实例化进行评估,最终将架构实例化为具体的软件架构。这一过程是人为中心和迭代的,特别适合于动态和频繁变化的学科,如KE。
3. 从信息源选择到架构评估的过程
选择信息源的过程可以通过系统地分析NeSy领域的文献来实现。例如,通过SPARQL查询针对KE任务的文献集,可以识别出与KE相关的系统。然后,可以通过对这些系统的分析来确定它们如何支持KE的质量属性。这种分析可以帮助确定候选的RA合成模式,并在实例化和使用中对合成的架构进行评估。
参考架构在知识工程中的应用示例
1. 内容发现与推荐系统的参考架构设计
在知识工程的实践中,参考架构(RA)的设计可以显著提高内容发现与推荐系统的效率和准确性。例如,企业可能希望改善其网站上内容的可发现性,以提升用户体验和商业成果。通过利用RA,企业可以构建一个系统,该系统使用特定领域本体进行内容标记,以支持用户寻找相关内容的任务。
在这个场景中,RA的设计需要考虑多个质量属性(QAs),例如领域特异性和可扩展性。领域特异性确保系统能够从特定领域的术语和定义中提供主题标签,而可扩展性则允许系统随着新内容和主题的出现而扩展。架构师可以通过查询知识图谱来识别符合这些QAs和需求的设计模式,例如F2设计模式,它描述了一个系统,该系统将输入的符号表示(企业知识图谱)和数据(网站内容)结合起来,通过模型(M)生成输出的符号表示,以将网站内容与领域特定主题分类联系起来。
2. 评估与实例化参考架构的方法
在RA设计完成后,需要通过实例化和使用来评估其效果。这可以通过轻量级的架构权衡分析方法(ATAM)来实现。在ATAM会议中,利益相关者和架构师聚集在一起,通过讨论用户场景来识别可能影响QAs实现的架构风险。这些场景可能包括数据集成、数据质量检查、实体解析、本体合并和对齐、查询优化以及自然语言处理等任务。
一旦RA通过评估,就可以进入具体的软件架构实例化阶段。在这个阶段,每个组件的实现选项将被确定,可能包括现有软件包的使用或定制开发。例如,可以为知识图谱完成提供Pytorch-Biggraph的接口,为使用约束评估质量提供Shape expressions (Shex)工具的接口,以及为跨知识工件的记录链接提供RLTK的接口。
讨论与未来方向
1. 参考架构对知识工程实践的影响
参考架构在知识工程中的应用可以带来多方面的影响。首先,它为分散的系统模式提供了组织原则,有助于系统化知识工程领域的实践。其次,RA通过考虑其范围、用例和相应需求,将模式整合在一起,同时考虑质量属性和功能需求。此外,RA的迭代开发过程确保了架构能够适应技术趋势的变化,并随着时间的推移和应用的变化而适应。
2. 面临的挑战与未来研究方向
尽管RA提供了一种有前景的方法来标准化知识工程实践,但在实际应用中仍面临挑战。例如,如何确保RA能够灵活地适应不断变化的技术和用户需求,以及如何有效地将RA与现有的知识工程工作流程和系统模式相结合。未来的研究方向可能包括进一步精细化RA的设计和评估过程,以及探索如何自动从系统化的论文集合中提取功能需求和质量属性。此外,随着知识工程领域的不断发展,RA的实例化和评估过程也需要不断迭代和完善。
总结:参考架构在标准化知识工程实践中的作用与前景
1. 参考架构的定义与应用
参考架构(RA)是一种软件工程方法论,它通过将用户需求与系统模式相结合,创建出一种通用的框架。这种框架不仅为特定类别的信息系统提供了一个高度抽象的通用架构,而且还强调了架构质量,并促进了对共同标准的遵循。RA的开发是以人为中心的,迭代式的,这使其特别适用于动态和频繁变化的学科,如知识工程(KE)。RA的主要优点在于它提供了一个共同的框架,同时允许用户为其狭窄的用例设计特定的RA。
2. 参考架构的六步发展路线图
在知识工程领域,RA的发展遵循了一个六步路线图,包括范围定义、信息源选择、架构分析、基于信息源分析的架构合成、通过实例化进行评估,最终将其实例化为具体的软件架构。这个过程旨在将用户需求与重复出现的系统模式相结合,建立在现有的知识工程工作流程和系统模式之上。
3. 参考架构在知识工程中的作用
RA在知识工程中的作用是将分散的系统模式组织起来,为知识工程领域的系统化提供了一个关键贡献。RA通过考虑其范围、定义的用例及其相应的需求,将模式整合在一起,这些需求被提炼为质量属性和功能需求。架构的合成是一个迭代过程,受到服务导向设计、电子政务和汽车行业参考架构成功案例的启发。架构的发展的一个关键方面是通过实例化和使用与代表性用户进行评估。最后,需要将参考架构组件实例化为软件,从而完成用户需求与现有技术能力之间的循环。
4. 参考架构的前景
随着知识工程领域的持续发展,RA提供了一种机制,将架构模式与用户需求相关联,并识别潜在的差距。RA的实现在实践中目前尚处于部分阶段。本文提出了一个通过定义代表性任务和提炼23个质量属性及8个功能需求来界定范围的路线图,并采用了最近识别出的神经符号知识工程系统模式作为信息源,提供了初始组件,可以用来构建RA。文章还展示了如何将QAs与识别出的架构模式直接映射,检测到各种程度的支持需求。对于从模式合成RA、通过实例化和使用评估RA以及将RA实例化为软件的步骤,文章提出了一个规范的、整合软件工程最佳实践和方法论的逐步过程,因为这些步骤高度依赖于特定用例。每个步骤都需要迭代设计、开发、实施和评估RA的专门努力,这是我们计划追求的下一步,以代表性的任务和领域的代表性子集为例。我们相信,为KE设计RA的提出的方法为系统化KE方法的新兴工作提供了重要的扩展,提供了一种机制,将架构模式与用户需求相关联,并识别潜在差距。
相关文章:

智能体可靠性的革命性提升,揭秘知识工程领域的参考架构新篇章
引言:知识工程的演变与重要性 知识工程(Knowledge Engineering,KE)是一个涉及激发、捕获、概念化和形式化知识以用于信息系统的过程。自计算机科学和人工智能(AI)历史以来,知识工程的工作流程因…...

Shell 初始化配置指北 | Ubuntu
唠唠闲话 概要:在不同的Shell环境(如Bash和Zsh)中设置环境变量、设置初始脚本,以及如何根据不同的使用场景(用户级或系统级)管理和设置初始运行命令。 p.s. 如果你很熟悉 Linux,推荐跳到最后一…...

[嵌入式系统-69]:RT-Thread-组件:网络组件“组”,RT-Thread系统通向外部网络世界的入口
目录 RT-Thread 提供的网络世界入口 - 网络组件 1. 总概 2. AT 3. Lwip: 轻量级IP协议栈 4. W5500 5. Netdev 6. RT-Thread SAL(Socket Abstraction Layer)套接字和BSD套接字区别 RT-Thread SAL 套接字接口示例 BSD 套接字接口示例 …...

Linux学习笔记1---Windows上运行Linux
在正点原子的教程中学习linux需要安装虚拟机或者在电脑上安装一个Ubuntu系统,但个人觉得太麻烦了,现在linux之父加入了微软,因此在Windows上也可以运行linux 了。具体方法如下: 一、 在Windows上的设置 在window的搜索框内&#…...

Java算法-力扣leetcode-135. 分发糖果
135. 分发糖果 n 个孩子站成一排。给你一个整数数组 ratings 表示每个孩子的评分。 你需要按照以下要求,给这些孩子分发糖果: 每个孩子至少分配到 1 个糖果。相邻两个孩子评分更高的孩子会获得更多的糖果。 请你给每个孩子分发糖果,计算并…...

企业为什么需要主数据管理工具?十大热门主数据管理工具盘点
主数据管理是一套综合性的策略和技术,用于协调和管理企业内用于识别关键业务实体(如客户、产品、供应商和员工)的一致性、准确性和统一性的数据。主数据管理的目的是创建一个“单一真相源”,确保在不同部门和系统之间共享的数据保…...

免费思维13招之一:体验型思维
思维01:体验型思维 第一大战略:体验型思维。 体验型思维是免费思维中最简单的思维,我们先从最简单的讲起,由简入繁,简单的我们少讲,复杂的我们多讲。 那么,什么是体验型思维呢? 很简单,就是先让客户进行体验,再进行成交的方式。这一种思维,具体的可以分为两种:…...

面试C++(基础篇)-NULL与nullptr的区别?
3: NULL与nullptr的区别? 在C中,NULL和nullptr都用于表示空指针,但它们之间存在一些关键的区别: 1. 来源和含义: • NULL:在C中,NULL最初是从C语言中继承过来的,定义在<cstddef…...

「AIGC」深度学习
深度学习是机器学习的一个子领域,它基于人工神经网络的学习算法。深度学习在图像和语音识别、自然语言处理、医学图像分析、药物发现、自动驾驶汽车等领域取得了显著的进展。以下是围绕深度学习的几个关键主题的阐述。 学习路线 基础数学: 了解线性代数…...

mysql5.7数据库安装及性能测试
mysql5.7数据库安装及性能测试 记录Centos7.9下安装mysql 5.7并利用benchmark工具简单测试mysql的性能。 测试机:centos7.9 配置:4C8G40G 1. 下安装mysql5.7 安装mysql5.7: # 通过官方镜像源安装$ wget http://dev.mysql.com/get/mysql57-com…...

聪明与诚实:社会信任的桥梁
在现代社会中,我们经常听到这样的评价:“某人真聪明。”然而,当我们深入思考时,会发现“聪明”这个词背后所承载的含义并不单一。聪明和狡诈往往被混淆,而诚实的价值却时常被忽视。在一个高度诚信的社会里,…...

基于单片机的无线数据传输系统设计
摘要:基于单片机的无线数据传输系统的设计,实现了温度和湿度的自动采集、无线通讯和报警功能。该系统包括了LCD1602显示电路、DHT11温湿度采集电路等,完成了基于无线数据传输的方法来实现温湿度的采集。 关键词:温湿度检测;N RF 24 L 01;单片机 0 引言 随着科技水平的提高,…...

【IP:Internet Protocol,子网(Subnets),IPv6:动机,层次编址:路由聚集(rout aggregation)】
文章目录 IP:Internet Protocol互联网的的网络层IP分片和重组(Fragmentation & Reassembly)IP编址:引论子网(Subnets)特殊IP地址IP 编址: CIDR子网掩码(Subnet mask)转发表和转发…...

智启算力平台基本操作
智启算力平台 智启算力平台路径搭载数据集搭载镜像配置 智启算力平台 开发文档 帮助文档 - OpenI - 启智AI开源社区 路径搭载 OpenIOSSG/promote: 启智AI协作平台首页推荐组织及推荐项目申请。 - notice/Other_notes/SDKGetPath.md at master - promote - OpenI - 启智AI开…...

微信小程序 【关键部分】
1. 动机 最近在开发小程序,小程序既需兼顾针对新用户的内容预览,又要为注册用户提供服务,简单梳理下,基本需求如下: 小程序共三个tab页,所有用户都可以浏览首页内容,了解我们可以提供的优质服…...

JavaEE技术之MySql高级(索引、索引优化、sql实战、View视图、Mysql日志和锁、多版本并发控制)
文章目录 1. MySQL简介2. MySQL安装2.1 MySQL8新特性2.2 安装MySQL2.2.1 在docker中创建并启动MySQL容器:2.2.2 修改mysql密码2.2.3 重启mysql容器2.2.4 常见问题解决 2.3 字符集问题2.4 远程访问MySQL(用户与权限管理)2.4.0 远程连接问题1、防火墙2、账号不支持远程…...

OCR文本识别模型CRNN
CRNN网络结构 论文地址:https://arxiv.org/pdf/1507.05717 参考:https://blog.csdn.net/xiaosongshine/article/details/112198145 git:https://github.com/shuyeah2356/crnn.pytorch CRNN文本识别实现端到端的不定长文本识别。 CRNN网络把包含三部分&…...

【数据结构】闲谈A股实时交易的数据结构-队列
今天有点忙,特意早起,要不先写点什么。看到个股的红红绿绿, 突然兴起,要不写篇文章分析下A股交易的简易版数据结构。 在A股实时股票交易系统中,按照个人理解,大致会用队列来完成整个交易。队列(…...

深入探索van Emde Boas树:原理、操作与C语言实现
van Emde Boas (vEB) 树是一种高效的数据结构,用于处理整数集合。它是由荷兰计算机科学家Jan van Emde Boas在1977年提出的。vEB树在处理整数集合的查找、插入、删除和迭代操作时,能够以接近最优的时间复杂度运行。vEB树特别适合于那些元素数量在某个较小…...

正点原子[第二期]Linux之ARM(MX6U)裸机篇学习笔记-14-主频和时钟配置
前言: 本文是根据哔哩哔哩网站上“正点原子[第二期]Linux之ARM(MX6U)裸机篇”视频的学习笔记,在这里会记录下正点原子 I.MX6ULL 开发板的配套视频教程所作的实验和学习笔记内容。本文大量引用了正点原子教学视频和链接中的内容。…...

tomcat打开乱码修改端口
将UTF-8改成GBK 如果端口冲突,需要修改tomcat的端口...

03 JavaSE-- 访问控制权限、接口、抽象类、内部类、Object类、异常
1. Exception 异常 在 Java 中,异常分为两种主要类型:强制性异常(Checked Exceptions)和非强制性异常(Unchecked Exceptions)。 强制性异常(Checked Exceptions): 强制…...

free5gc+ueransim操作
启动free5gc容器 cd ~/free5gc-compose docker-compose up -d 记录虚拟网卡地址,eth0 ifconfig 查看并记录amf网元的ip地址 sudo docker inspect amf "IPAddress"那一行,后面记录的即是amf的ip地址 记录上述两个ip地址,完成UER…...

麦肯锡精英高效阅读法笔记
系列文章目录 如何有效阅读一本书笔记 读懂一本书笔记 麦肯锡精英高效阅读法笔记 文章目录 系列文章目录序章 无法读书的5个理由无法读书的理由① 忙于工作,没时间读书无法读书的理由② 不知应该读什么无法读书的理由③ 没读完的书不断增多无法读书的理由④ 工作繁…...

高速、简单、安全的以太彩光,锐捷网络发布极简以太全光 3.X 方案
从 2021 年 3 月正式推出到现在,锐捷网络极简以太全光方案已经走进第四个年头。IT 仍在不断向前发展,数字化进程深入,数字化业务增多,更广泛的终端设备接入企业级园区网络,对园区网络提出了更高的要求,例如…...

图书管理系统
一、图书管理系统菜单 🍓管理员菜单 1.查找图书 2.新增图书 3.删除图书 4.显示图书 0.退出系统 --------------------------------------------------------------------------------------------------------------------------------- 🌼用户菜…...

图解HTTP(2、简单的 HTTP 协议)
HTTP 协议用于客户端和服务器端之间的通信 请求访问文本或图像等资源的一端称为客户端,而提供资源响应的一端称为服务器端。 通过请求和响应的交换达成通信 请求必定由客户端发出,而服务器端回复响应报文 请求报文是由请求方法、请求 URI、协议版本、…...

小鹅知识付费系统登录,网课怎么推广与宣传?有啥获客方法?
现在很多教育机构都开始做网络课程,同行之间的竞争也愈发激烈,机构的网课想要盈利就需要对课程进行宣传推广,网课要怎么推广和宣传呢? 在线课程要想推广获客方法有几种,不同推广方法获客效果也是不同的,只有…...

韩顺平0基础学Java——第5天
p72——p86 今天同学跟我说别学java,真的吗?唉,先把这视频干完吧。 逻辑运算符练习 x6,y6 x6,y5 x11,y6 x11,y5 z48 错了&a…...

单片机为什么能直接烧录程序?
在设计芯片的时候,关于烧录的环节是一个不得不考虑的问题。首先排除掉,由外部硬件直接操控FLASH的方案,这个方案有很多缺点。 1、每个IC使用的FLASH型号各不相同,每种型号的FLASH的烧录命令和流程都有差别,这会导致烧…...