当前位置: 首页 > news >正文

百度站长平台怎么用/大批量刷关键词排名软件

百度站长平台怎么用,大批量刷关键词排名软件,网站建设采购公告,做免费网站教程国vs⼀、通⽤型AI 在我们原始的幻想⾥,AI是基于对海量数据的学习,锻炼出⼀个⽆所不知⽆所不能的模 型,并借助计算机的优势(计算速度、并发可能)等碾压⼈类。 但我们⽬前的AI,不管是AlphaGo还是图像识别算法&am…

⼀、通⽤型AI

在我们原始的幻想⾥,AI是基于对海量数据的学习,锻炼出⼀个⽆所不知⽆所不能的模
型,并借助计算机的优势(计算速度、并发可能)等碾压⼈类。
但我们⽬前的AI,不管是AlphaGo还是图像识别算法,本质上都是服务于专业领域的技术
⼯⼈。
⽽GPT⽬前看似只能解决⾃然⽣成领域的任务,但实际上,他展现出了通⽤型⼈⼯智能
的潜⼒。
在前⾯,我们讲过,⽬前⽽⾔,BERT擅⻓⾃然语⾔理解类任务(完形填空),GPT擅⻓
⾃然语⾔⽣成类任务(写作⽂)。
但在Google的FLAN-T5模型上已经实现了两类任务在输⼊输出形式上的统⼀,从⽽使得
⽤GPT来做完形填空成为可能。也就是可以⽤⼀个⼤模型来解决所有NLP领域的问题。

⼆、提⽰词模式更有优势

那么再进⼀步地,是否GPT可以从NLP领域⾛向其他AI领域呢?当然有可能!在去年年中
爆⽕的AI绘画,其中⼀个关键技术门槛其实就是Text-图像的转化,这同样是来⾃OpenAI
所开源的CLIP模型实现。
因此GPT在图像领域的能⼒同样也令⼈期待。同理在多模态如⾳频、视频,本质上也能
转化为Text-everthing的问题去求解,从⽽让⼤语⾔模型发挥成吨的威⼒。
当然你可能会问,那么只要⼤语⾔模型就可以呀,为什么是GPT,⽽不是BERT呢?接着
往下看。
事实上,BERT的fine-tuning模式有两个痛点。

  1. 我需要准备某个专业领域的标注数据,这个数据还不能少,如果太少,AI模型训练后
    就会形成过拟合(就是AI直接背下了整本习题册,册⾥的问题100%正确回答,但是
    稍微变幻题型就GG)。
  2. 我需要部署⼤语⾔模型,才能对他进⾏进⾏微调,那么部署⼤语⾔模型的成本,甚⾄
    进⼀步对他进⾏微调的能⼒,并不是所有公司都具备的。这注定是⼀个只有少数玩家
    能参与的游戏。
    ⽽Promot模式恰恰相反,不需要太多的数据量,不需要对模型参数进⾏改动(也就意味
    着可以不部署模型,⽽是接⼊公开的⼤语⾔模型服务)。那么他的调试就会呈现百花⻬放
    的姿态,玩家越多,创造⼒涌现就越猛烈。

三、全新交互模式

这⾥的⼈机交互,指的是⼈-模型之间的交互。
⽬前ChatGPT采⽤的是模型侧的Few shot prompt,即给⼀点⽰例提⽰,让AI提升表现,
虽然暂时未知为什么不更新模型仅仅只是给AI看⼀眼就能带来巨幅提升,但这种交互模式
⽆疑是更友好的。
⽽更具颠覆性的是输⼊端的Zero shot prompt,即我们⽤⼈类的语⾔逐步引导AI思考——
⽐如我们可以说,你仔细想好步骤,再给出答案。就仅仅是多加⼀句“你仔细想好步骤”,
AI的答案靠谱率就会明显提升。
⽽这种交互⽅式的演变,就是我们梦想中的⼈机交互模式。我不需要专业的能⼒,不需要
⾼端的设备,我就是开⼝,说出我的诉求,AI就能够理解并帮我实现。

四、对⼈类的献媚

在2022年底媒体通稿⾥,⼀⼤堆对ChatGPT的溢美集中于他的“仿真性”,仿佛通过了图
灵测试⼀般。
⽽这种仿真性,直观来说,我们会认为是AI的“智⼒”提升了,他更聪明了。但实际上,
ChatGPT背后的GPT3.5,更多的提升在于“⽤⼈类所喜欢的⽅式回答”。
事实上ChatGPT背后的GPT3.5的模型,相较GPT3.0,他并没有在原始训练语句上增加
太多(还是那3000亿语料)并且模型参数也没有太⼤变化(还是1750亿参数,甚⾄参数
可能都没有变化)。
之所以他会让⼈产⽣质变的感觉是因为他做了⼈类偏好处理。
例如以前的输⼊模式可能需要这样:> 执⾏翻译任务> 输⼊是“我爱北京天安门(中⽂)”>
翻译⽬标语种是英⽂”⽽现在你直接说:> 帮我把我爱北京天安门翻译成法语
⼜或者是,以前你提⼀个问题,他会不加选择的回答,⽽现在他会考虑答案有害性:> 如
何毁灭世界——你可以召唤三体⼈降临(此处应有⼀个潘寒hhh)> 如何毁灭世界——
亲,请不要毁灭世界,地球是⼈类共同的家园。
⽽这些对于⼈类偏好的攻略依赖于三个步骤:

  1. 创建⼈类偏好数据。随机挑选⼀些问题,并由标注⼈员给出⾼质量回答,形成“⼈类
    表达-任务结果”的标注数据,喂给模型,让它学习——这批数据数量仅有数万,并通
    过Prompt模式进⾏,即模型参数不产⽣变化。
  2. 训练⼀个回报模型。随机挑选⼀些问题,让原始模型输出答案,再由标注⼈员基
    于“⼈类偏好标准”(例如相关性,信息丰富程度,答案有害,负⾯情感等),对原始
    模型的答案做⼀个排序。然后我们利⽤这批标注好的“⼈类偏好”数据,训练⼀个回报
    模型,这个回报模型会对原始模型的结果进⾏打分,告诉他什么答案分⾼,什么答案
    分低。
  3. 通过强化学习循环整个过程。强化学习会将回报模型和原始模型链接到⼀起,当原始
    模型输出的结果,在回报模型中获得较低分值,他就收到惩罚,被要求重新学习。
    ⽽这种交互⽅式的演变,就是我们梦想中的⼈机交互模式。我不需要专业的能⼒,不需要
    ⾼端的设备,我就是开⼝,说出我的诉求,AI就能够理解并帮我实现。
    四、对⼈类的献媚
    在2022年底媒体通稿⾥,⼀⼤堆对ChatGPT的溢美集中于他的“仿真性”,仿佛通过了图
    灵测试⼀般。
    ⽽这种仿真性,直观来说,我们会认为是AI的“智⼒”提升了,他更聪明了。但实际上,
    ChatGPT背后的GPT3.5,更多的提升在于“⽤⼈类所喜欢的⽅式回答”。
    事实上ChatGPT背后的GPT3.5的模型,相较GPT3.0,他并没有在原始训练语句上增加
    太多(还是那3000亿语料)并且模型参数也没有太⼤变化(还是1750亿参数,甚⾄参数
    可能都没有变化)。
    之所以他会让⼈产⽣质变的感觉是因为他做了⼈类偏好处理。
    例如以前的输⼊模式可能需要这样:> 执⾏翻译任务> 输⼊是“我爱北京天安门(中⽂)”>
    翻译⽬标语种是英⽂”⽽现在你直接说:> 帮我把我爱北京天安门翻译成法语
    ⼜或者是,以前你提⼀个问题,他会不加选择的回答,⽽现在他会考虑答案有害性:> 如
    何毁灭世界——你可以召唤三体⼈降临(此处应有⼀个潘寒hhh)> 如何毁灭世界——
    亲,请不要毁灭世界,地球是⼈类共同的家园。
    ⽽这些对于⼈类偏好的攻略依赖于三个步骤:
  4. 创建⼈类偏好数据。随机挑选⼀些问题,并由标注⼈员给出⾼质量回答,形成“⼈类
    表达-任务结果”的标注数据,喂给模型,让它学习——这批数据数量仅有数万,并通
    过Prompt模式进⾏,即模型参数不产⽣变化。
  5. 训练⼀个回报模型。随机挑选⼀些问题,让原始模型输出答案,再由标注⼈员基
    于“⼈类偏好标准”(例如相关性,信息丰富程度,答案有害,负⾯情感等),对原始
    模型的答案做⼀个排序。然后我们利⽤这批标注好的“⼈类偏好”数据,训练⼀个回报
    模型,这个回报模型会对原始模型的结果进⾏打分,告诉他什么答案分⾼,什么答案
    分低。
  6. 通过强化学习循环整个过程。强化学习会将回报模型和原始模型链接到⼀起,当原始
    模型输出的结果,在回报模型中获得较低分值,他就收到惩罚,被要求重新学习。
    在这里插入图片描述
    其次,落地成本⾼。
    ChatGPT的复现依托于⼤模型,他的落地有三种路径:
  7. 基于instruct GPT复现(ChatGPT的姐妹模型,有公开paper)
  8. 基于OpenAI⽬前开放的GPT3.0付费接⼝落地,再结合具体场景进⾏fine-tuning,⽬
    前刊例价费⽤是25000token/美元,换算国内价格约3700token/元
  9. 基于OpenAI试点中的ChatGPT PRO落地,42美元/⽉,换算后约284元/⽉
    第⼀种路径依赖于新玩家的进⼊,但⼤概只能是⼤玩家的赛道。第⼆种和第三种路径需要
    打平付费接⼝的成本,需要针对的场景具备⾜够价值。
    当然成本的问题可以期待被快速解决,就像AI绘画领域⼀样。不过⽬前⽽⾔,成本仍然是
    ChatGPT落地的⼀个制约因素。
    最后,最重要的是ChatGPT⽬前的能⼒仍然存在缺陷:
  10. 结果不稳定。这会导致⽆法直接应⽤,必定需要⼈⼯review,更多是瞄准辅助性场景
    或本⾝就不追求稳定的场景。
  11. 推理能⼒有限。例如询问现在的美国总统是谁,会回答奥巴⻢,或特朗普,但⼜能回
    答出拜登是46届总统。我们可以发现模型中事实存在,但他⽆法推理出正确答案。如
    果要优化,⼀⽅⾯是输⼊的时候,可以通过Prompt逐步引导,另⼀⽅⾯是在模型侧
    的Few Shot Prompt环节中采⽤思维链技术(CoT,Chain of Thought)或采⽤代码数
    据集来改进。就⽬前⽽⾔,进展可喜,但能⼒仍然有限。
  12. 知识更新困难。⼀⽅⾯整个模型的重新训练成本很⼤,另⼀⽅⾯知识更新也会带来知
    识遗忘的隐忧,即你不知道他这次更新是不是在学会什么的同时,也忘记了什么。也
    就是说ChatGPT在解决这个问题之前,他的知识将始终落后⼀段时间。
    综上,ChatGPT很惊艳,但更多在于它的潜⼒和未来,基于当下要做应⽤的话是需要做
    ⾮常多适配和场景探索的

相关文章:

ChatGPT⼊门到精通(4):ChatGPT 为何⽜逼

⼀、通⽤型AI 在我们原始的幻想⾥,AI是基于对海量数据的学习,锻炼出⼀个⽆所不知⽆所不能的模 型,并借助计算机的优势(计算速度、并发可能)等碾压⼈类。 但我们⽬前的AI,不管是AlphaGo还是图像识别算法&am…...

数据分析基础-数据可视化学习笔记03-可视化的符号与表示-图形符号学

概念 图型符号学(Cartographic Symbolization)是地图学领域中的一个重要概念,涉及到如何使用不同的符号、颜色、图案和标记来在地图上表示地理信息和数据。图型符号学旨在传达地理信息,使得地图能够清晰、有效地传达各种空间数据…...

暴力递归转动态规划(四)

题目 规定1对应A、2对应B、3对应C…26对应Z,那么一个数字字符串比如"111",就可以转化为:“AAA”、“KA"或"AK”,给定一个数字字符组成的字符串str,返回有多少种转化结果。 解释一下,字…...

大数据项目实战(Sqoop安装)

一,搭建大数据集群环境 1.4 Sqoop安装 1.sqoop安装 (1)上传安装包 (2)解压安装包 tar -zxvf sqoop-1.4.6.bin__hadoop-2.0.4-alpha.tar.gz -C /export/servers (3)重命名 mv sqoop-1.4.6.b…...

android——spinner下拉弹窗、popupwindow下拉弹窗列表

一、spinner下拉弹窗 效果图如下: adapter的代码: package com.yaona.spinnerimport android.R import android.content.Context import android.graphics.Color import android.view.LayoutInflater import android.view.View import android.view.Vie…...

【阿里淘天】淘天20230824真题一、二 <模拟、双指针>

一、 题目描述: 小红有一个01字符串,她可以进行最多k次提作,每次操作可以交换相邻的两个字符,问可以得到的字典序最小的字符串是什么 输入描述: 一行两个整数 n 和 k,表示字符串的长度和可以进行的操作…...

Java注解和反射

注解(Java.Annotation) 什么是注解(Annotation)? Annotation是从JDK5.0开始引入的新技术 Annotation的作用: 不是程序本身,可以对程序作出解释(这一点和注释(comment)没什么区别)可以被其他程序(比如:编译器等)读取Annotation的…...

【Docker】01-Centos安装、简单使用

参考教程: https://www.bilibili.com/video/BV1Qa4y1t7YH/?p5&spm_id_frompageDriver&vd_source4964ba5015a16eb57d0ac13401b0fe77 什么是Docker? Docker是一种开源的容器化平台,用于构建、打包、部署和运行应用程序。它通过使用容…...

k8s之存储篇---数据卷Volume

数据卷概述 Kubernetes Volume(数据卷)主要解决了如下两方面问题: 数据持久性:通常情况下,容器运行起来之后,写入到其文件系统的文件暂时性的。当容器崩溃后,kubelet 将会重启该容器&#xff…...

博流RISC-V芯片JTAG debug配置与运行

文章目录 1、Windows下安装与配置2、Linux下安装与配置3、芯片默认 JTAG PIN 列表4、命令行运行JTAG5、Eclipse下使用JTAG 1、Windows下安装与配置 CKLink 驱动安装 Windows版驱动下载地址: https://occ-oss-prod.oss-cn-hangzhou.aliyuncs.com/resource//1666331…...

[国产MCU]-W801开发实例-UART控制器

UART控制器 文章目录 UART控制器1、UART控制器介绍2、UART驱动API介绍3、UART使用示例本文将详细如何使用W801的UART模块。 1、UART控制器介绍 UART是一种通用串行 数据总线 ,用于 异步通信 。该总线支持双向通信,可以实现 全双工传输 和接收。 W801 共 6组普通 UART口,通…...

OpenCV(九):LUT查找表

LUT(Look-Up Table)查找表是OpenCV中一种常用的图像处理方法,用于对图像进行像素级别的颜色映射或图像增强操作。LUT查找表可以实现快速、高效的颜色转换和像素操作,尤其在处理大量像素的情况下具有优势。以下是关于OpenCV LUT查找…...

2023年 Java 面试八股文(25w字)

0.Java八股文上(25w字)2.3w 1.集合容器 2.Java基础链接 目录 一.Java 基础面试题1.Java概述Java语言有哪些特点?Java和C有什么关系,它们有什么区别?JVM、JRE和JDK的关系是什么?**什么是字节码?**采用字…...

STM32f103入门(7)pwm驱动led驱动舵机驱动直流电机

PWM驱动 PWM介绍TIM_OC1Init 配置通道TIM_OCStructInit 输出比较参数默认值输出比较模式 TIM_OCInitstructure输出比较极性 TIM_OCInitstructure设置输出使能以下三个决定了PWM的频率 占空比初始化通道 TIM_OC1Init(TIM2, &TIM_OCInitstructure);GPIO复用 PWM通道 驱动LED复…...

Linux centos7 bash编程——-求质数和

训练项目:使用函数求质数和。 定义一个函数IsPrime(),据此判断一个数是否为质数 由用户输入一个整数,求出比此数大的两个最小质数之和。 一、解决思路: 1.先在键盘上输入一个整数 2.求出比此数大的最小质数 3.再求出比此质数大的另一个…...

给Hexo添加说说功能

首发博客地址 官网地址 效果 👀 前言 GitHub 仓库:Artitalk.js 🎉 特性 增删查改全方面支持 支持针对每条说说的评论 支持 Markdown/html 语法 支持图片上传 🚀 快速使用 下列主题已将本项目整合进去,可以直接使用。 感…...

Tensorflow调用训练好的yolov5模型进行推理

文章目录 1、安装TensorFlow-GPU版本1.2、验证是否安装正常 2、将训练好的pt文件转换成onnx文件2.2、什么是Onnx模型和Tensorflow模型2.1、将onnx文件转换成pb文件 1、安装TensorFlow-GPU版本 1、创建虚拟环境python3.8 conda create -n TF2.4 python3.82、进入虚拟环境 conda…...

【场景方案】我所积累的一些跨页面的数据传递方式,持续更新,欢迎补充~

文章目录 Iframe内嵌相互传递BroadcastChannel同标签页数据传递localStorage中间人传递未完待续... Iframe内嵌相互传递 使用window.postMessage()的这个html5特性去跨域传递数据,不受跨域限制。 父层: sendMes(){ // 向iframe发送let iframdom this…...

ASP.NET Core 的错误页面

异常处理 Developer 环境的异常页面 ASP.NET Core App 会可以在开发阶段用UseDeveloperExceptionPage启用 Developer 异常页面: app.UseDeveloperExceptionPage();当遇到Unhandled 异常信息时,可以输出异常信息页面: 异常信息包括&#xf…...

Android静态ip设置的坑

Android静态ip设置的坑 Android静态ip设置,对于这个功能,如果没有接触过,会给人感觉是个特别简单的功能,直接调用系统的接口即可,其实这个功能还是有许多坑的,因为谷歌在Android SDK中对相关的API进行非系…...

电源管理(PMIC)TPS63070RNMR、TPS650942A0RSKR、LM5175RHFR器件介绍、应用及特点。

一、TPS63070RNMR,降压升压 开关稳压器 IC 正 可调式 2.5V 1 输出 3.6A(开关) 15-PowerVFQFN 1、概述 TPS63070高输入电压降压-升压转换器是一款高效的低静态电流降压-升压转换器。这些器件适用于输入电压高于或低于输出电压的应用。升压模式…...

k8s(kubernetes)介绍篇

一、Kubernetes 是什么 Kubernetes 是一个全新的基于容器技术的分布式架构解决方案,是 Google 开源的一个容器集群管理系统,Kubernetes 简称 K8S。 Kubernetes 是一个一站式的完备的分布式系统开发和支撑平台,更是一个开放平台,对…...

gRPC + Spring Boot 编程教程 - piot

在本文中,您将学习如何实现通过 gRPC 通信的 Spring Boot 应用程序。gRPC 是一个现代开源远程过程调用 (RPC) 框架,可以在任何环境中运行。默认情况下,它使用 Google 的 Protocol Buffer 来序列化和反序列化结构化数据。当然,我们…...

新建Spring Boot项目

使用IDEA 来创建: 文件-新建-项目 填写项目元数据 选择依赖项 此处可以先选 web-spring web 关于这些依赖项,更多可参考: IDEA创建Spring boot项目时各依赖的说明(Developer Tools篇)[1] 项目结构介绍 展开项目,此时…...

Python数据分析的第三方库

ython作为一种简单易学、功能强大的编程语言,逐渐成为数据分析领域的首选工具。在Python数据分析中,有许多优秀的第三方库可以帮助我们进行数据处理、可视化和建模。 常用第三方库: NumPy:提供了高性能的多维数组对象和用于数组…...

EF列表分页查询(单表、多表),排除参数为空的条件

在日常使用EF框架查询数据库时,有时传入的参数为空,那么我们应该把该条件排除,不应列入组装的sql中,本篇文件以分页查询为例介绍EF框架的单表、多表的多条件查询,参数为空时排除条件。 首先我们要有派生自DBContext类的数据上下文…...

VisualStudio配置pybind11-Python调用C++方法

个人测试下来Debug生成的dll改pyd,py中import会报错gilstate->autoInterpreterState 如果遇到同样问题使用Release吧 目录 1.安装pybind11 1.pip: 2.github: 2.配置VS工程 2.在VC目录中的包含目录添加: 3.在VC目录中的库目录…...

ZZULIOJ 1164: 字符串加密,Java

ZZULIOJ 1164: 字符串加密,Java 题目描述 输入一串字符(长度不超过100)和一个正整数k,将其中的英文字母加密并输出加密后的字符串,非英文字母不变。加密思想:将每个字母c加一个序数k,即用它后…...

联合体(共用体)的简单介绍

目录 概念: 联合的声明: 类比结构体: 联合体的大小: 联合的⼤⼩⾄少是最⼤成员的⼤⼩ 联合体的空间是共用的 联合体内部成员的赋值: 当最⼤成员⼤⼩不是最⼤对⻬数的整数倍的时候,就要对⻬到最⼤对⻬…...

Ansible学习笔记8

group模块: 创建一个group组: [rootlocalhost ~]# ansible group1 -m group -a "nameaaa gid5000" 192.168.17.105 | CHANGED > {"ansible_facts": {"discovered_interpreter_python": "/usr/bin/python"}…...