当前位置: 首页 > news >正文

读AI新生:破解人机共存密码笔记15辅助博弈

1. 辅助博弈

1.1. assistance game

1.2. 逆强化学习如今已经是构建有效的人工智能系统的重要工具,但它做了一些简化的假设

1.2.1. 机器人一旦通过观察人类学会了奖励函数,它就会采用奖励函数,这样它就可以执行相同的任务

1.2.1.1. 解决这个问题很容易,我们只需确保机器人将偏好与人类联系起来,而不是与自身联系起来

1.2.2. 机器人正在观察一个人类解决单智能体决策问题

1.2.2.1. 机器人不知道人类有什么偏好,但它无论如何都想满足他们

1.3. “回形针”博弈

1.3.1. 在这个游戏中,人类哈里特有一种动机来向机器人罗比“发送”一些她的偏好信息

1.3.2. 罗比能够解读这个信号,因为它能玩这个游戏,由此它能理解哈里特有什么样的偏好,以便让她发出那样的信号

1.4. 关机博弈

1.4.1. 工具性目标通常可以用作几乎任何原始目标的子目标

1.4.2. 自我保护是一个工具性目标,因为很少有原始目标在死后能更好地实现

1.4.2.1. 这导致了关机问题:具有固定目标的机器将不允许自己被关机,并有动机禁用自己的关机按钮

1.4.3. 事实证明,目标的不确定性对于确保我们能够关闭机器至关重要,即便机器比我们更智能

1.4.3.1. 它知道自己不想做错事,但它不知道做错事意味着什么

1.4.4. 只要罗比不能完全确定自己将要做的事情就是哈里特自己会做的事,它就会更愿意被哈里特关闭

1.4.4.1. 哈里特的决定为罗比提供了信息,而信息对于改进罗比的决定总是有用的
1.4.4.2. 如果罗比对哈里特的决定有把握,那么她的决定就不会提供新的信息,所以罗比没有动机让她做决定

1.4.5. 允许有人为错误发生的可能性

1.4.5.1. 即使罗比提议的行动是合理的,哈里特有时也可能会关掉罗比
1.4.5.2. 即使罗比提议的行动并不可取,哈里特有时也会让罗比继续

1.4.6. 博弈的解决方案表明,罗比不太倾向于听从一个有时违背自己最大利益的、非理性的哈里特

1.4.6.1. 她的行为越随意,罗比在服从她之前就越不确定她的偏好

1.5. 有益的、顺从的行为和机器对人类偏好的不确定性之间的重要联系,会经受住这些细化和复杂化的考验

1.6. 随着罗比对哈里特的偏好越来越确定,它将和那些有固定目标的糟糕的旧人工智能系统越来越像:它不会征求许可,也不会让哈里特选择关闭它,而且它的目标不正确

1.7. 永远不要预先排除世界上可能成为哈里特偏好的一部分的属性

1.7.1. 当罗比根据已知的属性无法解释哈里特的决定时,罗比可以推断,有一个或多个先前未知的属性(例如天空的颜色)可能在起作用,而且它可以试着找出那些属性可能是什么

2. 禁例与漏洞原则

2.1. 保有人类目标的不确定性,或许并不是说服机器人在拿咖啡时不要禁用关机按钮的唯一方法

2.2. 以一种万无一失的方式编写这样的禁例就像试图编写无漏洞的税法,这是我们几千年来一直在尝试却一直失败的事情

2.2.1. 防止有人避税的最佳解决方案是确保相关实体都愿意纳税

2.3. 漏洞原理

2.3.1. 如果一台足够智能的机器有动机创造某种条件,那么一般而言,人类无法仅凭写禁例来限制它的行为,阻止它这样做,或是阻止它做一些等效的事情

2.3.1.1. 在人工智能系统可能出现问题的情况下,最好的解决方案是确保它愿意服从人类

3. 要求和指示

3.1. 指令不是不惜一切代价都要实现的目标

3.1.1. 这是一种传达哈里特偏好信息的方式,目的是诱导罗比进行某些行为

3.2. 机器永远无法确定人类的偏好

3.2.1. 尽管存在这种不确定性,它们仍然可以发挥作用

3.3. 语用学是语言学的一个分支,它研究的正是这种延伸的意义概念

4. 主动嗑电

4.1. 多巴胺的作用在20世纪50年代末被发现,但早在那之前,人们就知道对老鼠大脑直接进行电刺激可以产生一种类似奖励的反应

4.2. AlphaGo得到获胜的+1奖励的唯一方法是赢得它正在玩的模拟围棋游戏

4.2.1. AlphaGo唯一的动作就是将一枚棋子放在一个空的交叉点上,这些动作只影响围棋棋盘,而不影响其他任何东西,因为AlphaGo的模型中没有其他东西

4.2.2. AlphaGo在训练期间的生活一定相当令人沮丧:它做得越好,它的对手就做得越好,因为它的对手几乎就是它自己的翻版

4.3. 人们担心的是像AlphaGo这样的强化学习系统可能学会作弊,而不是掌握其预期的任务

4.3.1. 当奖励信号来自“宇宙之外”,并由人工智能系统永远无法修改的某个过程生成时,这个过程就能正常工作

4.3.2. 如果奖励生成过程(主体是人类)和人工智能系统处于同一个“宇宙”中,这个过程就失败了

4.4. 如何才能避免这种自欺行为?

4.4.1. 因为它混淆了两个不同的东西:奖励信号和实际奖励

4.4.2. 应该被区分对待,就像它们在辅助博弈中一样:奖励信号提供关于实际奖励积累的信息,该信息才是要被最大化的东西

4.4.3. 学习系统是在天堂积累积分,而奖励信号充其量只是提供积分的一种记录

4.4.3.1. 接管奖励信号机制的控制权只会丢失信息

4.4.4. 一个被设计成能够区分二者区别的理性学习者,有动力去避免任何类型的“主动嗑电”

5. 递归式自我完善

5.1. 机器在设计机器方面会强于人类

5.2. AlphaGo是一个不完美的训练过程的结果,即它用自我对弈进行强化学习,而获胜就是奖励

5.2.1. AlphaGo并不能保证逢局必胜

5.2.2. 事实上,它几乎总是输给AlphaZero

5.2.3. 当AlphaGo发现无论它选择什么着法,对手都有获胜的策略时,那么AlphaGo会或多或少地随机选择着法

6. 不同的人

6.1. 人类不是单一的、理性的实体,而是由多得不计其数的、令人讨厌的、嫉妒驱动的、非理性的、不一致的、不稳定的、计算能力有限的、复杂的、不断进化的、异质的实体组成的

6.1.1. 不同的文化,甚至不同的个人,有着完全不同的价值体系

6.2. 在人工智能中,我们需要加入心理学、经济学、政治理论和道德哲学的思想

6.2.1. 需要将这些思想熔化、塑形和锤炼成一个足够强大的结构,以抵御日益智能的人工智能系统给它带来的巨大压力

6.3. 我们不希望机器拥有自己正确的价值体系,我们只是想让它预测其他人的偏好

6.4. 关于机器难以满足人类不同偏好的困惑可能来自一种错误的想法,即机器采用的是它学习到的偏好

6.4.1. 它只需要学会预测素食者的饮食偏好

6.4.2. 根据第一原则,它会避免为这户家庭烹饪肉类

6.4.3. 机器人也会了解邻居“肉食狂人”的饮食偏好,而且,如果在主人同意的情况下,周末邻居借机器人帮忙举办晚宴,它会很乐意为他们做肉食吃

6.4.4. 除了帮助人类实现他们的偏好外,机器人并没有自己的一套偏好

6.5. 原则上,一台机器要学习80亿个偏好模型,即地球上每个人的偏好

6.5.1. 机器很容易互相分享它们学到的东西

6.5.2. 人类的偏好结构有很多共同点,所以机器通常不会从头开始学习每个模型

6.5.3. 机器人带着相当广泛的先验信念从盒子里走出来

6.5.3.1. 它不需要像以前从未见过人类一样开始了解特殊的人类
6.5.3.2. 相同的论点适用于其他各种各样的个人特征,这些特征在某种程度上可以预测个人偏好结构的各个方面

7. 效益主义

7.1. 威廉·斯坦利·杰文斯

7.1.1. 19世纪英国逻辑学家和经济学家

7.1.2. William Stanley Jevons

7.1.3. 逻辑钢琴”的机械计算机的发明者

7.1.4. 在1871年提出,人际效用是不可比较的

7.2. 肯尼斯·阿罗

7.2.1. 1972年诺贝尔奖得主、美国经济学家

7.2.2. Kenneth Arrow

7.2.3. 人际效用比较没有任何意义,事实上,就个人效用的可衡量性而言,对幸福感做比较没有意义

7.3. 罗伯特·诺齐克

7.3.1. 美国哲学家

7.3.2. Robert Nozick

7.3.3. 1974年,即使可以对效用进行人际比较,最大化效用的总和仍然不是一个好主意

7.3.3.1. 这会与“效用怪兽”(一个快乐和痛苦的体验比普通人强烈许多倍的人)相冲突

7.4. 问题在于我们如何衡量结果的可取性

7.5. 如果不同的实体有不同的效用尺度的想法已经建立在我们的思维方式中,那么不同的人有不同的尺度也是完全可能的

7.6. 机器可以从宽泛的关于人类偏好尺度的先验信念开始,通过长时间的观察来了解更多关于个体尺度的信息,这或许可以将自然观察与神经科学研究的发现联系起来

7.7. 在决策中使用适当的道德理论具有不确定性

7.7.1. 一种解决方案是为每种道德理论分配一定的概率,并使用“预期道德价值”做决策

8. 利他主义

8.1. 用现代经济学的说法,对他人的关心通常被归入利他主义的范畴

8.2. 一些经济学家把利他主义视为另一种形式的自私,旨在为给予者提供“温情”

8.3. 对自己内在幸福的偏好

8.3.1. 内在幸福指的是一个人自身的生活品质

8.3.2. 拥有住所、吃得饱、穿得暖、安全等,这些生活品质本身就是令人向往的,而不是一个人参考了别人的生活才想要的

8.4. 对他人幸福的偏好

8.5. 消极利他主义行为比人们想象的要普遍得多

8.6. 美国社会学家索尔斯坦·凡勃伦(Thorstein Veblen)在1899年出版的著作《有闲阶级论》

8.7. 个人在群体中的身份和地位以及该群体相对于其他群体的整体地位是人类自尊的重要组成部分

8.8. 设计得当的机器不会像它们观察的人那样行事,即便这些机器正在学习虐待狂的偏好

8.8.1. 事实上,如果我们人类发现自己每天都处于与纯粹利他主义实体打交道的陌生环境中,我们就可能会学习成为更好的人,变得更无私,也更少受到骄傲和嫉妒的驱使

相关文章:

读AI新生:破解人机共存密码笔记15辅助博弈

1. 辅助博弈 1.1. assistance game 1.2. 逆强化学习如今已经是构建有效的人工智能系统的重要工具,但它做了一些简化的假设 1.2.1. 机器人一旦通过观察人类学会了奖励函数,它就会采用奖励函数,这样它就可以执行相同的任务 1.2.1.1. 解决这…...

C++ 因项目需求,需要将0~2的32次方这个区间的数字保存到内存当中(内存大小为4G),并且可以实现对任意一个数字的增删。(先叙述设计思路,再写岀代码)

问题: C 因项目需求,需要将0~2的32次方这个区间的数字保存到内存当中(内存大小为4G),并且可以实现对任意一个数字的增删。(先叙述设计思路,再写岀代码) 解答 设计思路代码实现说明 为了在有限的内存(4GB)中存储和操作 …...

Linux 下的性能监控与分析技巧

在日常的服务器管理和问题诊断过程中,Linux 命令行工具提供了强大的支持。本文通过几个常用的示例,介绍如何快速定位问题、监控服务器性能。 无论你是编程新手还是有一定经验的开发者,理解和掌握这些命令,都将在你的工作中大放异…...

不可复制网站上的文字——2种方法

禁用javascript或Console控制台代码 (1)F12键——设置——勾选禁用javascript (2)Console控制台敲如下代码: var allowPaste function(e){ e.stopImmediatePropagation(); return true; }; document.addEventListe…...

Ubuntu 22.04上编译安装c++ spdlog library

Very fast, header-only/compiled, C logging library. 请以root身份或sudo执行。 1. 安装必需的依赖项: sudo apt-get update sudo apt-get install git g cmake 2. 克隆 spdlog 仓库: cd /opt git clone https://github.com/gabime/spdlog.git …...

ESP32代码开发入门

ESP-IDF ESP-ADF开发 开发概要 编译环境及SDK搭建 整个开发流程是:下载ESP-IDF, ESP-ADF(按需下载),并安装, 编写hello world工程,编译并烧录到主板验证 可参照ESP32 esp-idf esp-adf环境安装及.a库创建与编译api大部分可以用glibc的接口 做了封装,时间time(NULL), 创建线程p…...

“势”是“态”的偶然性减少

“态势感知”中的“势”指的是一种趋势或倾向性,而“态”则表示状态或局势。这个术语常用于描述在一段时间内系统或事件显示出来的方向性变化或发展趋势。因此,可以将“态势”理解为系统或事件状态变化的趋势,这种变化通常反映出偶然性减少的…...

人脑计算机技术与Neuroplatform:未来计算的革命性进展

引言 想象一下,你在某个清晨醒来,准备开始一天的工作,而实际上你的大脑正作为一台生物计算机的核心,处理着大量复杂的信息。这并非科幻电影的情节,而是人脑计算机技术即将带来的现实。本文将深入探讨FinalSpark公司的…...

新版周易测算系统源码 去授权完美运行

已经去掉授权可以完美运行 更新了三个模板市面上都是几千几千的卖 更新了三套首页新ui 自己后台切换就行 源码大小:338M 源码下载:https://download.csdn.net/download/m0_66047725/89447857 更多资源下载:关注我....

【PYTHON】力扣刷题笔记 -- 0053. 最大子数组和【中等】

题目描述:给你一个整数数组 array: nums ,请你找出一个具有最大和的连续子数组 sub-array,返回其最大和 子数组(最少包含一个元素): 是数组中的一个连续部分 示例 1: 输入:nums [-2,1,-3,4,-1…...

Linux启动elasticsearch,提示权限不够

Linux启动elasticsearch,提示权限不够,如下图所示: 解决办法: 设置文件所有者,即使用户由权限访问文件 sudo chown -R 用户名[:新组] ./elasticsearch-8.10.4 //切换到elasticsearch-8.10.4目录同级 chown详细格式…...

css 布局出现无法去除的空白

案件介绍&#xff1a;在没有设置任何的css样式的情况下 文字顶部出现无法去除的空白 源代码 <div click"onClick" ><div class"tableTextButton--container"></div><Icon v-if"loading || thisLoading" type"ios-lo…...

使用SpringBoot整合filter

SpringBoot整合filter&#xff0c;和整合servlet类似&#xff0c;也有两种玩儿法 1、创建一个SpringBoot工程&#xff0c;在工程中创建一个filter过滤器&#xff0c;然后用注解WebFilter配置拦截的映射 2、启动类还是使用ServletComponentScan注解来扫描拦截器注解WebFilter 另…...

Python酷库之旅-第三方库openpyxl(15)

目录 一、 openpyxl库的由来 1、背景 2、起源 3、发展 4、特点 4-1、支持.xlsx格式 4-2、读写Excel文件 4-3、操作单元格 4-4、创建和修改工作表 4-5、样式设置 4-6、图表和公式 4-7、支持数字和日期格式 二、openpyxl库的优缺点 1、优点 1-1、支持现代Excel格式…...

葡萄串目标检测YoloV8——从Pytorch模型训练到C++部署

文章目录 软硬件准备数据准备数据处理脚本模型训练模型部署数据分享软硬件准备 训练端 PytorchultralyticsNvidia 3080Ti部署端 fastdeployonnxruntime数据准备 用labelimg进行数据标注 数据处理脚本 xml2yolo import os import glob import xml.etree.ElementTree as ETxm…...

OpenAI推出自我改进AI- CriticGPT

每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗&#xff1f;订阅我们的简报&#xff0c;深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同&#xff0c;从行业内部的深度分析和实用指南中受益。不要错过这个机会&#xff0c;成为AI领…...

springboot系列七: Lombok注解,Spring Initializr,yaml语法

老韩学生 LombokLombok介绍Lombok常用注解Lombok应用实例代码实现idea安装lombok插件 Spring InitializrSpring Initializr介绍Spring Initializr使用演示需求说明方式1: IDEA创建方式2: start.spring.io创建 注意事项和说明 yaml语法yaml介绍使用文档yaml基本语法数据类型字面…...

专访ATFX首席战略官Drew Niv:以科技创新引领企业高速发展

在金融科技创新的浪潮中&#xff0c;人才是推动企业高速发展的核心驱动力&#xff0c;优质服务是引领企业急速前行的灯塔。作为差价合约领域的知名品牌&#xff0c;ATFX高度重视人才引进工作&#xff0c;秉持“聚天下英才而用之”的理念&#xff0c;在全球范围内广揽科技精英&a…...

关于FPGA对 DDR4 (MT40A256M16)的读写控制 4

关于FPGA对 DDR4 &#xff08;MT40A256M16&#xff09;的读写控制 4 语言 &#xff1a;Verilg HDL 、VHDL EDA工具&#xff1a;ISE、Vivado、Quartus II 关于FPGA对 DDR4 &#xff08;MT40A256M16&#xff09;的读写控制 4一、引言二、DDR4 SDRAM设备中模式寄存器重要的模式寄存…...

android——Livedata、StateFlow、ShareFlow和Channel的介绍和使用

目录 一、LiveData介绍 二、StateFlow介绍 三、ShareFlow介绍 四、Channel介绍 小结 一、LiveData介绍 LiveData是一种在Android开发中用于观察数据变化的组件。它可以被观察者注册并在数据变化时通知观察者&#xff0c;从而实现数据的实时更新。LiveData具有生命周期感知能力&…...

Debezium 同步 MySQL 实时数据并解决数据重复消费问题

我们使用 Debezium 实时同步一个 MySQL 的数据到另一个 MySQL&#xff0c;代码网上基本都有&#xff0c;都是在引入 debezium-api&#xff0c;debezium-embedded 后写 Java 代码&#xff0c;做好了基本配置后启动程序&#xff0c;Debezium 会自动读取 MySQL 的实时 binlog&…...

【图像处理】1、使用OpenCV库图像轮廓的检测和绘制

OpenCV (Open Source Computer Vision Library) 是一个用于计算机视觉和图像处理的开源库。它提供了数百种用于图像和视频分析的算法&#xff0c;并被广泛应用于研究和商业领域。OpenCV 支持多种编程语言&#xff0c;包括 C、Python、Java 等&#xff0c;具有跨平台的特性&…...

【AI编译器】triton学习:矩阵乘优化

Matrix Multiplication 主要内容&#xff1a; 块级矩阵乘法 多维指针算术 重新编排程序以提升L2缓存命 自动性能调整 Motivations 矩阵乘法是当今高性能计算系统的一个关键组件&#xff0c;在大多数情况下被用于构建硬件。由于该操作特别复杂&#xff0c;因此通常由软件提…...

动静分离网络

动静分离网络的主要目的是分别处理视频帧中的静止区域和运动区域&#xff0c;以便对不同区域采用不同的去噪策略。这里提供一个实现思路&#xff0c;通过两个分支网络分别处理静止区域和运动区域&#xff0c;然后将两者的输出融合起来。 实现步骤 帧差图生成&#xff1a;计算…...

Python商务数据分析知识专栏(三)——Python数据分析的应用①Matplotlib数据可视化基础

Python商务数据分析知识专栏&#xff08;三&#xff09;——Python数据分析的应用①Matplotlib数据可视化基础 Matplotlib数据可视化基础1.掌握绘图基本语法与常用绘图2.分析特征间关系3.分析特征内部数据分布与分散情况 Matplotlib数据可视化基础 1.掌握绘图基本语法与常用绘…...

DataV大屏组件库

DataV官方文档 DataV组件库基于Vue &#xff08;React版 (opens new window)&#xff09; &#xff0c;主要用于构建大屏&#xff08;全屏&#xff09;数据展示页面即数据可视化&#xff0c;具有多种类型组件可供使用&#xff1a; 源码下载...

paraview跨节点并行渲染

参考&#xff1a; https://cloud.tencent.com/developer/ask/sof/101483588 ParaView 支持使用其内置的网络拓扑来进行跨节点的并行渲染。以下是一个简单的步骤来设置和运行跨节点的并行渲染&#xff1a; 确保你的计算环境支持多节点计算&#xff0c;比如通过SSH、MPI或其他集…...

Java中相等比较详解

本文对Java中的相等判断进行详细解释&#xff0c;包括&#xff0c;equals和compareTo等。 一、 运算符 1. 用途 基本数据类型&#xff1a;用于比较两个基本数据类型的值是否相等。 引用类型&#xff1a;用于比较两个对象引用是否指向同一个对象。 2. 示例 // 基本数据类型比…...

HBuilder X 小白日记01

1.创建项目 2.右击项目&#xff0c;可创建html文件 3.保存CtrlS&#xff0c;运行一下 我们写的内容&#xff0c;一般是写在body里面 注释的快捷键&#xff1a;Ctrl/ h标签 <h1> 定义重要等级最高的(最大)的标题。<h6> 定义最小的标题。 H标签起侧重、强调的作用…...

使用Protocol Buffers优化数据传输

使用Protocol Buffers优化数据传输 大家好&#xff0c;我是免费搭建查券返利机器人省钱赚佣金就用微赚淘客系统3.0的小编&#xff0c;也是冬天不穿秋裤&#xff0c;天冷也要风度的程序猿&#xff01; 什么是Protocol Buffers&#xff1f; Protocol Buffers&#xff08;简称P…...

南京网站制作报价/网络广告推广方式

深度学习编译器综合研究报告 本文主要参考了&#xff1a; The Deep Learning Compiler: A Comprehensive Survey 本文主要回答以下几个问题&#xff1a; 为什么需要dl compiler当下流行的dl framwwork有哪些深度学习硬件有三类 都有哪些dl compiler的关键组件和技术流行的dl c…...

上海网站怎么备案表/优书网

曾几何时&#xff0c;云计算在中国市场成为企业竞相追逐的热点。这其中既有财大气粗的互联网企业&#xff0c;例如BAT所属的阿里云、百度云、腾讯云&#xff0c;也有传统ICT企业所属的华为云、浪潮云、联想云等&#xff0c;此外还有专攻云计算的专业厂商&#xff0c;例如小鸟云…...

东莞做网站那家好/营销网站建设培训学校

oracle数据库的启动和停止过程 一、管理监听程序 只有具备sysdba和sysoper系统权限的用户才能启动和关闭数据库。在启动数据库之前应先启动监听程序&#xff0c;如果监听程序没有启动就不能利用命令方式来管理数据库&#xff0c;包括启动和关闭数据库。 启动监听 lsnrctl star…...

网站开发制作公司简介/百度指数是什么

参考&#xff1a;http://www.cnblogs.com/denny402/p/5073427.html转载于:https://www.cnblogs.com/573177885qq/p/5805027.html...

专门做优选的网站/深圳推广服务

我们知道&#xff0c;swoole中有两大进程&#xff0c;分别是 master 主进程和 manager 管理进程。 (推荐学习&#xff1a;swoole视频教程)其中 master 主进程中会有一个主 reactor 线程和多个 reactor 线程&#xff0c;主要的作用就是用来维护TCP连接&#xff0c;处理网络IO&am…...

全屏网站宽度/图片在线转外链

1&#xff09;、把<script>标签放在<head>中意味着必须等到全部的js代码都下载解析和执行完成以后&#xff0c;才开始展现页面内容&#xff0c;为避免这个问题一般把js代码全部放在<body>元素内容后面 2&#xff09;、script标签不带defer和async属性&#…...