当前位置: 首页 > news >正文

2024年9月第2周AI资讯

阅读时间:3-4min

更新时间:2024.9.9-2024.9.13

目录

Groq推出多模态大模型LLaVA v1.5 7B

AI通过重读问题可以变得更聪明

美国Weave公司发布Isaac多功能个人机器人

特斯拉机器人出租车将实现无线充电

 Adobe视频编辑新时代

无人驾驶汽车超越人类

 AI辅助设计的步行桌“Carpentopod”

Mistral多模态Pixtral 12B


Groq推出多模态大模型LLaVA v1.5 7B

概要

Groq 刚刚推出了LLaVA v1.5 7B,这是一种功能强大的新型多模态大模型,可以理解图像和文本,据称运行速度比 OpenAI 的 GPT-4o 快 4 倍。

详情

  • LLaVA v1.5 7B 可以回答有关图像的问题、生成字幕以及进行涉及文本、语音和图片的对话。
  • 该模型还可用于各种任务,例如视觉产品检查、库存管理以及为视障用户创建图像描述。
  • Groq目前免费提供此模型

推荐理由

 Groq 今年早些时候因其极快的人工智能速度而走红,现在它将这些功能与强大的多模式模型结合起来。对于人工智能应用程序来说,越快越好,疯狂的速度与先进的模型相结合,为源源不断的新应用程序打开了大门。

链接

  1. Groq官方博客
  2. HuggingFace
  3. 开发者控制台

AI通过重读问题可以变得更聪明

概要

研究人员发现,让人工智能系统模仿人类行为,“重读”问题两次,可以显著提高他们在各种任务中的推理和解决问题的能力。

详情

  • 这项技术被称为 RE2(重读),通过在回答之前简单地重复问题,可以提高人工智能在数学、常识和符号推理方面的表现。
  • 它适用于不同的人工智能模型,并且可以与其他人工智能推理技术相结合。
  • 该方法在重复问题两次时最有效——重复次数越多,性能就会降低。
  • RE2 甚至改进了非指令微调的 AI 模型,显示出广泛的适用性。

推荐理由

RE2 为越来越多的研究增添了新内容,显示了模仿人类思维和处理方式来改进人工智能的潜力。这项研究的简单性还表明,许多人工智能公司在寻求最高性能模型的过程中可能忽视了基本的、受人类启发的提示技术。

链接

  1. 论文

 美国Weave公司发布Isaac多功能个人机器人

美国Weave公司发布Isaac多功能个人机器人

概要

Isaac是一款多功能个人机器人,旨在帮助完成各种家务任务,将于 2025 年秋季向首批客户发货。

详情

  • Isaac可以自主整理、折叠衣物、整理空间以及执行许多其他家务。
  • 机器人管家可以响应语音或文本命令,并可以通过应用程序进行编程。
  • 出于隐私原因,Isaac随身携带的相机在不使用时可以折叠起来并存放在外壳中。
  • 售价:59,000 美元(或 48 个月每月 1,385 美元)以及 1,000 美元的预订费。

推荐理由

对价格实惠、智能的个人机器人助手的竞争正在持续升温(特斯拉的 Optimus、1X 的 NEO Beta、国产的AGIBOT ,Weave 的Isaac),看来到 2025 年我们将开始在家庭中看到这些机器人。

链接

官网


特斯拉电动汽车将实现无线充电

 

概要

特斯拉的一项新专利展示了其先进的无线充电系统,有可能解决电动汽车手动充电的需要——允许自动机器人出租车在无需人工干预的情况下充电。

详情

  • 该专利于二月份提交并于最近公布,重点介绍了一种使用智能技术来适应无线充电条件变化的系统。
  • 它提到了一个接地垫和一个车辆垫,它们一起工作,无需任何电线即可为汽车充电。
  • 充电站可以估计和调整线圈电感的变化,从而提高效率和安全性。
  • 特斯拉可能会在下个月即将举行的 Robotaxi 活动中推出这种无线充电技术,以契合该技术使自动驾驶车辆能够自动充电的潜力。

推荐理由 

虽然电动汽车的无线充电并不能解决主要问题,但它可能会改变自动驾驶汽车的游戏规则。如果特斯拉的 Robotaxis 可以无线充电,它们就可以几乎无休止地自主运行,无需人工干预——这是保持出租车队 24/7 运行的一个重要功能。

链接

WIPO - Search International and National Patent Collections


 Adobe开启视频编辑新时代

 

概要

Adobe展示了其 Firefly AI 视频模型,其中包括扩展现有视频以及根据文本或图像提示创建新剪辑的工具。

详情

  • 即将推出三个关键功能:文本到视频、图像到视频和生成扩展。
  • 文本到视频可以根据提示创建剪辑,并提供相机控制和参考图像的选项。
  • 图像到视频将静态图像或插图转换为真人剪辑。
  • Premiere Pro 测试版中的生成式扩展可以添加素材来覆盖间隙或扩展镜头。

推荐理由

Sora 专注于从头开始生成视频,Adobe 的目标是为视频编辑本身创造“一个新时代”。很快,任何人都将能够通过AI改变相机角度、扩展场景并立即生成幕后花絮。

链接

Bringing generative AI to video with Adobe Firefly Video Model | Adobe Blog


 无人驾驶汽车超越人类

概要

Waymo 新碰撞数据的深入研究表明,无人驾驶汽车比人类驾驶的车辆安全得多,造成伤害的碰撞事故和每英里行驶安全气囊的部署次数更少。

详情

  • Waymo 车辆已行驶超过 2200 万英里,仅报告了 20 起造成伤害的事故。
  • 这个比率还不到类似条件下人类驾驶员预期的三分之一。
  • 在 23 起严重事故中,有 16 起涉及人类驾驶员追尾 Waymo 车辆。
  • Waymo 估计,其车辆发生碰撞而引发安全气囊展开的可能性是人类驾驶员的六分之一。

推荐理由

数据表明,我们现在拥有安全的自动驾驶汽车,并且这些人工智能驱动的汽车可以显着减少道路事故和伤害。

链接

Human drivers are to blame for most serious Waymo collisions


 AI辅助设计的步行桌“Carpentopod”

概要

这是一款荷兰工程师打造的无线行走木制咖啡桌,采用AI优化设计的腿部结构。

详情

  • 该桌子有 12 个腿(每端 6 个),由精密切割的层压竹制成,由两个电机控制。
  • 腿部结构优化了行走速度、间隙和效率。
  • Carpentier 开发了一款定制电机控制软件,并使用经过改造控制器进行远程操作。

推荐理由

该项目展示了创客如何将AI、传统工艺和现代制造技术结合起来,将AI用于设计优化。

链接

Carpentopod: A walking table project

bilibili:荷兰工程师打造了AI辅助设计的步行桌“Carpentopod”


Mistral发布多模态大模型Pixtral 12B

概要

法国AI初创公司 Mistral发布了Pixtral 12B,这是他们的第一个能够处理图像和文本的多模态模型,可以免费下载。

详情

  • Pixtral 12B 是一个拥有 120 亿个参数的模型,大小约为 24GB,基于 Mistral 的文本模型 Nemo 12B 构建。
  • Pixtral 12B 是初创公司的第一个多模式模型,这意味着它可以处理和回答有关图像和文本的问题。
  • 它可以在 Apache 2.0 许可证下通过GitHub和Hugging Face下载,允许不受限制的使用和微调。
  • Mistral 计划很快在其聊天机器人和 API 平台 Le Chat 和 Le Plateforme 上提供 Pixtral 12B。

推荐理由

Mistral 凭借一支由顶尖研究人员组成的精干团队以及最近一轮 6.45 亿美元的融资,该公司正在通过强大的开放模型积极突破人工智能的界限。

链接

https://huggingface.co/mistral-community/pixtral-12b-240910?utm_source=www.therundown.ai&utm_medium=referral&utm_campaign=google-s-new-ai-turns-notes-into-podcasts

相关文章:

2024年9月第2周AI资讯

阅读时间:3-4min 更新时间:2024.9.9-2024.9.13 目录 Groq推出多模态大模型LLaVA v1.5 7B AI通过重读问题可以变得更聪明 美国Weave公司发布Isaac多功能个人机器人 特斯拉机器人出租车将实现无线充电 Adobe视频编辑新时代 无人驾驶汽车超越人类 AI…...

【软件使用-MEGA】构建进化树报错

*_summary.txt报错: MEGA-CC 10.2.6 Molecular Evolutionary Genetics Analysis Build#: 10210527-x86_640% Reading distance matrix MEGA-CC has logged the following error:When 2024年09月13日 下午 01时32分49秒 下午Data …...

面试常见八股

JAVA篇 基础 1、自动拆箱和装箱 装箱:装箱是将值类型(如int、double、struct等)转换为object类型或任何接口类型的过程。由于object是所有类型的基类(在.NET中),并且接口是引用类型,因此装箱…...

第十八章 番外 余弦相似度

余弦相似度(Cosine Similarity)是一种衡量两个非零向量之间角度的度量方式,用于评估它们之间的相似性。它的值范围从 -1 到 1,其中 1 表示完全相同的方向(即向量完全相同),0 表示正交&#xff0…...

HPA和helm

HPA pod的数量进行扩缩容 针对控制器创建的pod deployment: replica: 静态:edit yaml:apply -f HPA:基于cpu的利用率来实现pod数量的自动伸缩。 Horizontal pod autoscaling yaml文件————主流——————…...

基于人工智能的智能语音助手

语音助手的自然语言处理模块是语音助手系统的关键组成部分。通过这个模块,系统能够识别用户的意图并做出相应的回应。我们可以使用NLP技术来解析文本输入,并将其转换为系统可以理解的命令或指令。在本项目中,我们将结合语音识别、自然语言处理…...

java实际开发——数据库存储金额时用什么数据类型?(MySQL、PostgreSQL)

目录 java开发时金额用的数据类型——BigDecimal MySQL存储金额数据时用的数据类型是——decimal PostgreSQL存储金额数据时用的数据类型是——decimal 或 money java开发时金额用的数据类型——BigDecimal https://blog.csdn.net/Jilit_jilit/article/details/142180903?…...

Java 设计模式-状态模式

目录 一. 概述 二. 主要角色 三. 代码示例 四. 优缺点 优点: 缺点: 五. 常见应用场景 一. 概述 状态模式是一种行为设计模式,它允许一个对象在其内部状态改变时改变它的行为。对象看起来好像修改了它的类。状态模式把所有的与一个特定…...

2024.9.13 Python与图像处理新国大EE5731课程大作业,索贝尔算子计算边缘,高斯核模糊边缘,Haar小波计算边缘

1.编写一个图像二维卷积程序。它应该能够处理任何灰度输入图像,并使用以下内核进行操作: %matplotlib inline import numpy as np import matplotlib.pyplot as plt from scipy import linalg import random as rm import math import cv2# import and …...

动态IP池的IP都是纯净IP吗?

在当今互联网时代,动态IP池作为一种网络资源管理策略,被广泛应用于数据抓取、市场调研、广告验证等多种场景中。动态IP池能够提供大量可轮换的IP地址,以帮助用户避免因频繁访问同一网站而被封禁IP的情况。然而,一个关键的问题是&a…...

【MySQL】查询表中重复数据、模糊查询列信息、快速copy表数据(1)

一、SQL查询重复的数据: 1、SQL格式: Select * From 数据表 Where 重复记录字段 in ( select 重复记录字段 From 数据表 Group By 重复记录字段 Having Count(重复记录字段)>1) 2、举例: 在这个patient_member_info表中,我们…...

计算机操作系统之并行性与并发性笔记

目录 在计算机操作系统中,并行性与并发性是两个既相似又有区别的重要概念 并行性: 并发性: 可以通过多任务处理和资源共享来具体说明 并发性的例子 并行性的例子 总结 在计算机操作系统中,并行性与并发性是两个既相似又有区别…...

顶级高效的ChatGPT论文润色提示词和使用技巧

在学术研究中,精确和高效地对文本进行润色和修改是一个必不可少的重要环节。随着学术论文篇幅的增长和内容的复杂度上升,找到一种能够有效整理和优化修改内容的方法变得尤为关键。本文将探讨如何利用ChatGPT作为工具,通过具体的指令和策略,来优化文本的修改过程,提高学术写…...

WebAPI (一)DOM树、DOM对象,操作元素样式(style className,classList)。表单元素属性。自定义属性。间歇函数定时器

文章目录 Web API基本认知一、 变量声明二、 DOM1. DOM 树2. DOM对象3. 获取DOM对象(1)、选择匹配的第一个元素(2)、选择匹配多个元素 三、 操作元素1. 操作元素内容2. 操作元素属性(1)、常用属性(href之类的)(2)、通过style属性操作CSS(3)、通过类名(cl…...

若依框架开发

若依环境 介绍 ‌若依是一款快速开发平台(低代码),用于快速构建企业级后台管理系统,它提供了许多常用的功能模块和组件,包括权限管理、代码生成、工作流、消息中心等 官方地址: https://www.ruoyi.vip/ ‌基于Spring Boot和Spring Cloud‌…...

局域网windows下使用Git

windows下如何使用局域网进行git部署 准备工作第一步 ,ip设置设置远程电脑的ip设置,如果不会设置请点击[这里](https://blog.csdn.net/Black_Friend/article/details/142170705?spm1001.2014.3001.5501)设置本地电脑的ip:验证 第二步&#x…...

Redis访问工具

使用Redis存储缓存数据,如何通过Java去访问Redis? 防止后面看晕,先来张图。 1. Redis的客户端库 Redis的客户端库是Redis官方提供的,用于让Java等编程语言与Redis服务器进行通信的工具包。常见的Redis客户端库有多个&#xff0c…...

vue3+ant design vue动态实现级联菜单~

1、这里使用的是ant design vue 的TreeSelect 树选择来实现的。 <a-form-item name"staffDept" label"责任部门" labelAlign"left"><a-tree-selectv-model:value"formState.staffDept"show-search//允许在下拉框中添加搜索框…...

软件可维护性因素例题

答案&#xff1a;C 知识点&#xff1a; 系统可维护性因素决定 可理解性 可测试性 可修改性 选项C可移植性错误...

git的一些操作

参考视频: git分支详解&#xff08;约10分钟掌握分支80%操作&#xff09;&#xff0c;git-branch&#xff0c;git分支管理&#xff0c;git分支操作&#xff0c;git分支基础和操作&#xff0c;2023年git基础使用教程 不同的分支相当于不同的平行世界 合并分支 两个分支是我们项…...

UE5 学习系列(二)用户操作界面及介绍

这篇博客是 UE5 学习系列博客的第二篇&#xff0c;在第一篇的基础上展开这篇内容。博客参考的 B 站视频资料和第一篇的链接如下&#xff1a; 【Note】&#xff1a;如果你已经完成安装等操作&#xff0c;可以只执行第一篇博客中 2. 新建一个空白游戏项目 章节操作&#xff0c;重…...

CTF show Web 红包题第六弹

提示 1.不是SQL注入 2.需要找关键源码 思路 进入页面发现是一个登录框&#xff0c;很难让人不联想到SQL注入&#xff0c;但提示都说了不是SQL注入&#xff0c;所以就不往这方面想了 ​ 先查看一下网页源码&#xff0c;发现一段JavaScript代码&#xff0c;有一个关键类ctfs…...

【JavaEE】-- HTTP

1. HTTP是什么&#xff1f; HTTP&#xff08;全称为"超文本传输协议"&#xff09;是一种应用非常广泛的应用层协议&#xff0c;HTTP是基于TCP协议的一种应用层协议。 应用层协议&#xff1a;是计算机网络协议栈中最高层的协议&#xff0c;它定义了运行在不同主机上…...

STM32+rt-thread判断是否联网

一、根据NETDEV_FLAG_INTERNET_UP位判断 static bool is_conncected(void) {struct netdev *dev RT_NULL;dev netdev_get_first_by_flags(NETDEV_FLAG_INTERNET_UP);if (dev RT_NULL){printf("wait netdev internet up...");return false;}else{printf("loc…...

UDP(Echoserver)

网络命令 Ping 命令 检测网络是否连通 使用方法: ping -c 次数 网址ping -c 3 www.baidu.comnetstat 命令 netstat 是一个用来查看网络状态的重要工具. 语法&#xff1a;netstat [选项] 功能&#xff1a;查看网络状态 常用选项&#xff1a; n 拒绝显示别名&#…...

转转集团旗下首家二手多品类循环仓店“超级转转”开业

6月9日&#xff0c;国内领先的循环经济企业转转集团旗下首家二手多品类循环仓店“超级转转”正式开业。 转转集团创始人兼CEO黄炜、转转循环时尚发起人朱珠、转转集团COO兼红布林CEO胡伟琨、王府井集团副总裁祝捷等出席了开业剪彩仪式。 据「TMT星球」了解&#xff0c;“超级…...

生成 Git SSH 证书

&#x1f511; 1. ​​生成 SSH 密钥对​​ 在终端&#xff08;Windows 使用 Git Bash&#xff0c;Mac/Linux 使用 Terminal&#xff09;执行命令&#xff1a; ssh-keygen -t rsa -b 4096 -C "your_emailexample.com" ​​参数说明​​&#xff1a; -t rsa&#x…...

C++.OpenGL (10/64)基础光照(Basic Lighting)

基础光照(Basic Lighting) 冯氏光照模型(Phong Lighting Model) #mermaid-svg-GLdskXwWINxNGHso {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-GLdskXwWINxNGHso .error-icon{fill:#552222;}#mermaid-svg-GLd…...

JUC笔记(上)-复习 涉及死锁 volatile synchronized CAS 原子操作

一、上下文切换 即使单核CPU也可以进行多线程执行代码&#xff0c;CPU会给每个线程分配CPU时间片来实现这个机制。时间片非常短&#xff0c;所以CPU会不断地切换线程执行&#xff0c;从而让我们感觉多个线程是同时执行的。时间片一般是十几毫秒(ms)。通过时间片分配算法执行。…...

.Net Framework 4/C# 关键字(非常用,持续更新...)

一、is 关键字 is 关键字用于检查对象是否于给定类型兼容,如果兼容将返回 true,如果不兼容则返回 false,在进行类型转换前,可以先使用 is 关键字判断对象是否与指定类型兼容,如果兼容才进行转换,这样的转换是安全的。 例如有:首先创建一个字符串对象,然后将字符串对象隐…...