大语言模型通用能力排行榜(2024年10月8日更新)
数据来源SuperCLUE
榜单数据为通用能力排行榜
排名 | 模型名称 | 机构 | 总分 | 理科 | 文科 | Hard | 使用方式 | 发布日期 |
---|---|---|---|---|---|---|---|---|
- | o1-preview | OpenAI | 75.85 | 86.07 | 76.6 | 64.89 | API | 2024年11月8日 |
- | Claude 3.5 Sonnet(20241022) | Anthropic | 70.88 | 82.48 | 76.56 | 53.6 | POE | 2024年11月8日 |
- | ChatGPT-4o-latest | OpenAI | 70.85 | 84.65 | 77.1 | 50.8 | API | 2024年11月8日 |
🏅 | GLM-4-Plus | 智谱AI | 69.64 | 81.41 | 76.44 | 51.08 | API | 2024年11月8日 |
🏅 | SenseChat 5.5 | 商汤 | 69 | 81.17 | 76.67 | 49.16 | API | 2024年11月8日 |
🏅 | AndesGPT-2.0 | OPPO | 68.91 | 81.46 | 76.61 | 48.64 | API | 2024年11月8日 |
🏅 | Qwen2.5-72B-Instruct | 阿里巴巴 | 68.9 | 83.12 | 76.96 | 46.64 | API | 2024年11月8日 |
- | Claude 3.5 Sonnet(20240620) | Anthropic | 68.23 | 81.68 | 76.54 | 46.48 | poe | 2024年11月8日 |
- | Gemini-1.5-Pro-002 | | 68.19 | 80.42 | 76.32 | 47.82 | API | 2024年11月8日 |
- | Qwen-max-0919 | 阿里巴巴 | 68 | 83.03 | 76.5 | 44.48 | API | 2024年11月8日 |
- | GPT-4-Turbo-2024-04-09 | OpenAI | 67.48 | 80.78 | 74.85 | 46.82 | API | 2024年11月8日 |
🥈 | Hunyuan-Turbo | 腾讯 | 67.35 | 81.47 | 76.84 | 43.74 | API | 2024年11月8日 |
🥈 | 360gpt2-pro | 360 | 67.19 | 82.95 | 74.94 | 43.68 | API | 2024年11月8日 |
🥈 | Step-2-16k | 阶跃星辰 | 67.02 | 80.52 | 76.65 | 43.91 | API | 2024年11月8日 |
🥈 | DeepSeek-V2.5 | 深度求索 | 66.87 | 81.69 | 75.42 | 43.5 | API | 2024年11月8日 |
🥈 | Doubao-pro-0828 | 字节跳动 | 66.43 | 79.98 | 75.1 | 44.22 | API | 2024年11月8日 |
🥉 | Baichuan4 | 百川智能 | 66.28 | 81.81 | 75.94 | 41.1 | API | 2024年11月8日 |
🥉 | 山海大模型4.0 | 云知声 | 66.26 | 80.05 | 75.38 | 43.34 | API | 2024年11月8日 |
🥉 | TeleChat2-Large | TeleAI | 66.23 | 78.85 | 75.54 | 44.28 | API | 2024年11月8日 |
- | Llama-3.1-405B-Instruct | Meta | 65.84 | 80.54 | 71.53 | 45.46 | API | 2024年11月8日 |
4 | Ernie-4.0-turbo-8k-preview | 百度 | 64.93 | 78.69 | 74.4 | 41.7 | API | 2024年11月8日 |
- | GPT-4o-mini | OpenAI | 64.85 | 79.84 | 73.24 | 41.46 | API | 2024年11月8日 |
4 | Moonshot(kimi) | 月之暗面 | 63.93 | 74.37 | 75.08 | 42.34 | 网页 | 2024年11月8日 |
5 | Sky-Chat-3.0 | 昆仑万维 | 62.64 | 74.32 | 75.46 | 38.12 | API | 2024年11月8日 |
5 | TeleChat2-35B | TeleAI | 62.46 | 74.07 | 74.05 | 39.26 | 模型 | 2024年11月8日 |
- | Llama-3.1-70B-Instruct | Meta | 61.62 | 77.52 | 69.64 | 37.7 | API | 2024年11月8日 |
6 | Qwen2.5-7B-Instruct | 阿里巴巴 | 60.61 | 74.62 | 73.28 | 33.92 | API | 2024年11月8日 |
- | Llama-3.2-90B-Instruct | Meta | 60.58 | 75.89 | 69 | 36.84 | API | 2024年11月8日 |
7 | 讯飞星火V4.0 | 科大讯飞 | 59.4 | 72.49 | 71.55 | 34.16 | API | 2024年11月8日 |
8 | GLM-4-9B-Chat | 智谱AI | 56.83 | 69.22 | 71.94 | 29.32 | 模型 | 2024年11月8日 |
- | Gemma-2-9b-it | | 55.48 | 67.78 | 69.62 | 29.02 | 模型 | 2024年11月8日 |
9 | MiniCPM3-4B | 面壁智能 | 53.16 | 63.04 | 69.87 | 26.56 | 模型 | 2024年11月8日 |
- | Llama-3.1-8B-Instruct | Meta | 51.42 | 63.27 | 65.3 | 25.69 | API | 2024年11月8日 |
10 | Yi-1.5-9B-Chat-16K | 零一万物 | 51.37 | 59.2 | 67.86 | 27.06 | 模型 | 2024年11月8日 |
- | Llama-3.2-11B-Instruct | Meta | 50.61 | 63.1 | 64.02 | 24.72 | API | 2024年11月8日 |
11 | Yi-1.5-6B-Chat | 零一万物 | 48.69 | 57.03 | 63.89 | 25.16 | 模型 | 2024年11月8日 |
12 | Qwen2.5-1.5B-Instruct | 阿里巴巴 | 43.92 | 46.14 | 64.54 | 21.1 | API | 2024年11月8日 |
- | Gemma-2-2b-it | | 42.25 | 43.36 | 63.72 | 19.67 | 模型 | 2024年11月8日 |
- | Phi-3-Mini-4K-Instruct | 微软 | 39.98 | 52.28 | 44.75 | 22.9 | 模型 | 2024年11月8日 |
- | Mistral-7B-Instruct-v0.3 | Mistral AI | 37.11 | 41.06 | 51.21 | 19.05 | 模型 | 2024年11月8日 |
13 | Baichuan2-7B-Chat | 百川智能 | 33.59 | 28.46 | 58.09 | 14.22 | 模型 | 2024年11月8日 |
13 | Qwen2.5-0.5B-Instruct | 阿里巴巴 | 32.85 | 30.53 | 54.13 | 13.9 | API | 2024年11月8日 |
13 | RWKV-6-World-7B | RWKV | 32.76 | 27.46 | 58.05 | 12.76 | 模型 | 2024年11月8日 |
相关文章:
大语言模型通用能力排行榜(2024年10月8日更新)
数据来源SuperCLUE 榜单数据为通用能力排行榜 排名 模型名称 机构 总分 理科 文科 Hard 使用方式 发布日期 - o1-preview OpenAI 75.85 86.07 76.6 64.89 API 2024年11月8日 - Claude 3.5 Sonnet(20241022) Anthropic 70.88 82.4…...
第六节、Docker 方式部署指南 github 上项目 mkdocs-material
一、简介 MkDocs 可以同时编译多个 markdown 文件,形成书籍一样的文件。有多种主题供你选择,很适合项目使用。 MkDocs 是快速,简单和华丽的静态网站生成器,可以构建项目文档。文档源文件在 Markdown 编写,使用单个 YAML 配置文件配置。 MkDocs—markdown项目文档工具,…...
【MySQL】MySQL中的函数之JSON_REPLACE
在 MySQL 中,JSON_REPLACE() 函数用于在 JSON 文档中替换现有的值。如果指定的路径不存在,则 JSON_REPLACE() 不会修改 JSON 文档。如果需要添加新的键值对,可以使用 JSON_SET() 函数。 基本语法 JSON_REPLACE(json_doc, path, val[, path,…...
【大数据学习 | HBASE高级】hbase的API操作
首先引入hbase的依赖 <dependencies><dependency><groupId>org.apache.hbase</groupId><artifactId>hbase-server</artifactId><version>2.4.13</version></dependency><dependency><groupId>org.slf4j<…...
C++(Qt)软件调试---内存泄漏分析工具MTuner (25)
C(Qt)软件调试—内存泄漏分析工具MTuner (25) 文章目录 C(Qt)软件调试---内存泄漏分析工具MTuner (25)[toc]1、概述🐜2、下载MTuner🪲3、使用MTuner分析qt程序内存泄漏🦧4、相关地址ὁ…...
python核心语法
目录 核⼼语法第⼀节 变量0.变量名规则1.下⾯这些都是不合法的变量名2.关键字3.变量赋值4.变量的销毁 第⼆节 数据类型0.数值1.字符串2.布尔值(boolean, bool)3.空值 None 核⼼语法 第⼀节 变量 变量的定义变量就是可变的量,对于⼀些有可能会经常变化的数据&#…...
MATLAB用CNN-LSTM神经网络的语音情感分类深度学习研究
全文链接:https://tecdat.cn/?p38258 在语音处理领域,对语音情感的分类是一个重要的研究方向。本文将介绍如何通过结合二维卷积神经网络(2 - D CNN)和长短期记忆网络(LSTM)构建一个用于语音分类任务的网络…...
智能网页内容截图工具:AI助力内容提取与可视化
我们每天都会接触到大量的网页内容。然而,如何从这些内容中快速提取关键信息,并有效地进行整理和分享,一直是困扰我们的问题。本文将介绍一款我近期完成的基于AI技术的智能网页内容截图工具,它能够自动分析网页内容,截…...
Axure设计之文本编辑器制作教程
文本编辑器是一个功能强大的工具,允许用户在图形界面中创建和编辑文本的格式和布局,如字体样式、大小、颜色、对齐方式等,在Web端实际项目中,文本编辑器的使用非常频繁。以下是在Axure中模拟web端富文本编辑器,来制作文…...
【MyBatis源码】深入分析TypeHandler原理和源码
🎮 作者主页:点击 🎁 完整专栏和代码:点击 🏡 博客主页:点击 文章目录 原始 JDBC 存在的问题自定义 TypeHandler 实现TypeHandler详解BaseTypeHandler类TypeReference类型参考器43个类型处理器类型注册表&a…...
号卡分销系统,号卡系统,物联网卡系统源码安装教程
号卡分销系统,号卡系统,物联网卡系统,,实现的高性能(PHP协程、PHP微服务)、高灵活性、前后端分离(后台),PHP 持久化框架,助力管理系统敏捷开发,长期持续更新中。 主要特性 基于Auth验证的权限…...
常用命令之LinuxOracleHivePython
1. 用户改密 passwd app_adm chage -l app_adm passwd -x 90 app_adm -> 执行操作后,app_adm用户的密码时间改为90天有效期--查看该euser用户过期信息使用chage命令 --chage的参数包括 ---m 密码可更改的最小天数。为零时代表任何时候都可以更改密码。 ---M 密码…...
从dos上传shell脚本文件到Linux、麒麟执行报错“/bin/bash^M:解释器错误:没有那个文件或目录”
[rootkylin tmp]#./online_update_wars-1.3.0.sh ba51:./online_update_wars-1.3.0.sh:/bin/bash^M:解释器错误:没有那个文件或目录 使用scp命令上传文件到麒麟系统,执行shell脚本时报错 “/bin/bash^M:解释器错误:没有那个文件或目录” 解决方法: 执行…...
使用 Go 实现将任何网页转化为 PDF
在许多应用场景中,可能需要将网页内容转化为 PDF 格式,比如保存网页内容、生成报告、或者创建网站截图。使用 Go 编程语言,结合一些现有的库,可以非常方便地实现这一功能。本文将带你一步一步地介绍如何使用 Go 语言将任何网页转换…...
文件操作和IO
目录 一. 文件预备知识 1. 硬盘 2. 文件 (1) 概念 (2) 文件路径 (3) 文件类型 二. 文件操作 1. 文件系统操作 [1] File常见的构造方法 [2] File的常用方法 [3] 查看某目录下所有的目录和文件 2. 文件内容操作 (1) 打开文件 (2) 关闭文件 (3) 读文件 (4) 写文件 …...
【C++滑动窗口】1248. 统计「优美子数组」|1623
本文涉及的基础知识点 C算法:滑动窗口及双指针总结 LeetCode1248. 统计「优美子数组」 给你一个整数数组 nums 和一个整数 k。如果某个连续子数组中恰好有 k 个奇数数字,我们就认为这个子数组是「优美子数组」。 请返回这个数组中 「优美子数组」 的数…...
C语言导航 4.1语法基础
第四章 顺序结构程序设计 第一节 语法基础 语句概念 语句详解 程序详解 4.1.1语句概念 说明:构成高级语言源程序的基本单位。 特征:在C语言中语句以分号作为结束标志。 分类: (1)简单语句:空语句、…...
使用 Python 和 Py2Neo 构建 Neo4j 管理脚本
Neo4j 是一个强大的图数据库,适合处理复杂的关系型数据。借助 Python 的 py2neo 库,我们可以快速实现对 Neo4j 数据库的管理和操作。本文介绍一个功能丰富的 Python 脚本,帮助用户轻松管理 Neo4j 数据库,包含启动/停止服务、清空数…...
Centos 7 安装wget
Centos 7 安装wget 最小化安装Centos 7 的话需要上传wget rpm包之后再路径下安装一下。rpm包下载地址(http://mirrors.163.com/centos/7/os/x86_64/Packages/) 1、使用X-ftp 或者WinSCP等可以连接上传的软件都可以首先连接服务器,这里我用的…...
定时器的小应用
第一个项目 第一步,RCC开启时钟,这个基本上每个代码都是第一步,不用多想,在这里打开时钟后,定时器的基准时钟和整个外设的工作时钟就都会同时打开了 RCC_APB1PeriphClockCmd(RCC_APB1Periph_TIM2, ENABLE);第二步&…...
linux企业中常用NFS、ftp服务
1.静态ip配置 修改ip地址为静态vim /etc/sysconfig/network-scripts/ifcfg-enxxx BOOTPROTO"static" IPADDR192.168.73.10 GATEWAY192.168.73.2 # 该配置与虚拟机网关一致 NETMASK255.255.255.0重启网卡:systemctl restart network.service ping不通域名…...
数据结构与算法分析模拟试题及答案5
模拟试题(五) 一、单项选择题(每小题 2 分,共20分) (1)队列的特点是( )。 A)先进后出 B)先进先出 C)任意位置进出 D࿰…...
.NET 9.0 中 System.Text.Json 的全面使用指南
以下是一些 System.Text.Json 在 .NET 9.0 中的使用方式,包括序列化、反序列化、配置选项等,并附上输出结果。 基本序列化和反序列化 using System; using System.Text.Json; public class Program {public class Person{public string Name { get; se…...
Python自动检测requests所获得html文档的编码
使用chardet库自动检测requests所获得html文档的编码 使用requests和BeautifulSoup库获取某个页面带来的乱码问题 使用requests配合BeautifulSoup库,可以轻松地从网页中提取数据。但是,当网页返回的编码格式与Python默认的编码格式不一致时,…...
11.12机器学习_特征工程
四 特征工程 1 特征工程概念 特征工程:就是对特征进行相关的处理 一般使用pandas来进行数据清洗和数据处理、使用sklearn来进行特征工程 特征工程是将任意数据(如文本或图像)转换为可用于机器学习的数字特征,比如:字典特征提取(特征离散化)、文本特征提取、图像特征提取。 …...
RAG经验论文《FACTS About Building Retrieval Augmented Generation-based Chatbots》笔记
《FACTS About Building Retrieval Augmented Generation-based Chatbots》是2024年7月英伟达的团队发表的基于RAG的聊天机器人构建的文章。 这篇论文在待读列表很长时间了,一直没有读,看题目以为FACTS是总结的一些事实经验,阅读过才发现FAC…...
【配置后的基本使用】CMake基础知识
🌈 个人主页:十二月的猫-CSDN博客 🔥 系列专栏: 🏀各种软件安装与配置_十二月的猫的博客-CSDN博客 💪🏻 十二月的寒冬阻挡不了春天的脚步,十二点的黑夜遮蔽不住黎明的曙光 目录 1.…...
ollama+springboot ai+vue+elementUI整合
1. 下载安装ollama (1) 官网下载地址:https://github.com/ollama/ollama 这里以window版本为主,下载链接为:https://ollama.com/download/OllamaSetup.exe。 安装完毕后,桌面小图标有一个小图标,表示已安装成功&…...
【项目开发】理解SSL延迟:为何HTTPS比HTTP慢?
未经许可,不得转载。 文章目录 前言HTTP与HTTPS的耗时差异TCP握手HTTPS的额外步骤:SSL握手使用curl测量SSL延迟性能与安全的权衡前言 在互联网发展的早期阶段,Netscape公司设计了SSL(Secure Sockets Layer)协议,为网络通信提供加密和安全性。有人曾提出一个大胆的设想:…...
2.STM32之通信接口《精讲》之USART通信
有关通信详解进我主页观看其他文章!【免费】SPIIICUARTRS232/485-详细版_UART、IIC、SPI资源-CSDN文库 通过以上可以看出。根据电频标准,可以分为TTL电平,RS232电平,RS485电平,这些本质上都属于串口通信。有区别的仅是…...
简单个人网站制作流程/微营销平台系统
在网上看到一些关于NetBeans 6.0以上版本中设置中文的Java_Docs API 自己设置了多次,总是没办法成功,后面在看到关于Eclipse中设置中文API时需要将原代码的路径删除后才有用,就自己试了一下,果然,不将NetBeans中的源的…...
无锡网络公司网站建设/百度一下你就知道搜索引擎
首先要在“程序和功能”里面开启这个服务 然后重启系统使其生效。 然后打开 PowerShell,输入: Invoke-WebRequest -Uri https://aka.ms/wsl-ubuntu-1804 -OutFile Ubuntu.appx -UseBasicParsing 上述语句会从服务器中获取 Ubuntu1804 LTS 版本࿰…...
烟台消防建设信息网站/自己如何制作一个小程序
首先在我的职业生涯中,做性能测试的机会不多,发现性能瓶颈的次数更少,确切的说只有2次。随着大型分布式系统,特别是Web App和云计算的推广,性能测试的需求会更加迫切。今天我这个半桶水就来谈谈性能测试的话题…...
制作商务网站信息标题应/南宁百度推广代理商
Selenium Grid Parallel Test(C#)Author: Mars (hnynes)Email: hnynesgmail.comMSN: hnynesgmail.com前段时间由于项目中用到了Selenium Grid Test,只是(parallel)并行测试却一直没有做成功.昨天查了一个参数,感觉好像是并行了,但是testcase并未全部…...
网站做淘宝客排名会掉吗/最新旅游热点
某些情况下,为了给业务系统提供可配置化支持,我们一般会用原生态的方式去解析定义好的XML文件,然后转化为配置对象。这种方式对于简单、单一的配置文件,或者是XML配置格式固定的配置文件,还是比较容易处理的。但是对于…...
响应式网站设计案例/seo去哪里学
很抱歉,由于单片机AD转换的具体实现方法可能因不同的单片机型号和设备不同而有所差异,因此我不能简单地提供代码。但是,我可以提供一些指导,帮助您实现单片机的AD转换。 首先,您需要确定您所使用的单片机的型号&#x…...