人工智能大模型LLM开源资源汇总(持续更新)
说明
目前是大范围整理阶段,所以存在大量机翻说明,后续会逐渐补充和完善资料,减少机翻并增加说明。
Github上的汇总资源(大部分英文)
awesome-production-machine-learning
此存储库包含一系列精选的优秀开源库,可帮助您部署、监控、版本化、扩展和保护生产机器学习。您可以通过观看此 github 存储库来了解最新信息。此外,我们还提供了一个搜索工具包,可帮助您快速浏览工具链。如下图:
工具包:https://huggingface.co/spaces/zhiminy/Awesome-Production-Machine-Learning-Search
数据处理
data-juicer
Data-Juicer 是一个一站式多模式数据处理系统,可以使数据质量更高、更丰富、更易于LLMs理解。
阿里云人工智能平台(PAI)引用了他们的工作,并将Data-Juicer集成到其数据处理产品中。 PAI是一个AI Native大模型和AIGC工程平台,提供数据集管理、算力管理、模型工具链、模型开发、模型训练、模型部署和AI资产管理。有关数据处理的文档,请参阅: PAI-大型模型的数据处理。
Data-Juicer 正在积极更新和维护。我们将定期增强和添加更多功能、数据配方和数据集。
https://github.com/modelscope/data-juicer
datatrove
通过提供一组与平台无关的可自定义管道处理块,将数据处理从脚本疯狂中解放出来。
https://github.com/huggingface/datatrove
dolma
用于生成和检查 OLMo 预训练数据的数据和工具。
https://github.com/allenai/dolma
NeMo-Curator
用于数据管理的可扩展工具包。
https://github.com/NVIDIA/NeMo-Curator
dataverse
数据宇宙。关于数据、数据科学和数据工程。
https://github.com/UpstageAI/dataverse
EasyInstruct
一个易于使用的 LLM 指令处理框架。
https://github.com/zjunlp/EasyInstruct
data-prep-kit
用于 LLM 应用程序构建器数据准备的开源项目。
https://github.com/IBM/data-prep-kit
dps
多语言数据处理系统。
https://github.com/EleutherAI/dps
LLM 训练/微调
nanoGPT
用于训练/微调中型 GPT 的最简单、最快的存储库。
https://github.com/karpathy/nanoGPT
LLaMA-Factory
用于对 100+ LLM 进行高效微调的 WebUI。
https://github.com/hiyouga/LLaMA-Factory
unsloth
微调Llama 3.2、Mistral、Phi和Gemma LLMs的速度提高2-5倍,同时内存减少80%。
https://github.com/unslothai/unsloth
peft
PEFT: 最先进的参数高效微调。
llama-recipes
用于微调Meta Llama3的脚本,使用可组合的FSDP和PEFT方法覆盖单/多节点GPU。
https://github.com/huggingface/peft
litgpt
20+ 高性能 LLM,具有用于大规模预训练、微调和部署的配方。
https://github.com/Lightning-AI/litgpt
Megatron-LM
正在进行的研究大规模训练变压器模型。
https://github.com/NVIDIA/Megatron-LM
trl
使用强化学习训练 transformer 语言模型。
https://github.com/huggingface/trl
LMFlow
一个用于微调和推理大型基础模型的可扩展工具包。适合所有人的大型模型。
https://github.com/OptimalScale/LMFlow
gpt-neox
基于 Megatron 和 DeepSpeed 库的 GPU 上模型并行自回归转换器的实现。
https://github.com/EleutherAI/gpt-neox
torchtune
用于 LLM 微调的 Native-PyTorch 库。
https://github.com/pytorch/torchtune
xtuner
一个高效、灵活且功能齐全的工具包,用于微调 LLM (InternLM2, Llama3, Phi3, Qwen, Mistral, …)。
https://github.com/InternLM/xtuner
torchtitan
用于大型模型训练的原生 PyTorch 库。
https://github.com/pytorch/torchtitan
nanotron
极简大语言模型 3D 并行训练。
https://github.com/huggingface/nanotron
LLM 服务和推理
ollama
启动并运行 Llama 3.1、Mistral、Gemma 2 和其他大型语言模型。
https://github.com/ollama/ollama
gpt4all
GPT4All:在任何设备上与本地 LLM 聊天
https://github.com/nomic-ai/gpt4all
llama.cpp
C/C++ 中的 LLM 推理
https://github.com/ggerganov/llama.cpp
FastChat
一个用于训练、服务和评估大型语言模型的开放平台。Vicuna 和 Chatbot Arena 的发布存储库。
https://github.com/lm-sys/FastChat
vllm
用于 LLM 的高吞吐量和内存高效推理和服务引擎。
https://github.com/vllm-project/vllm
guidance
用于控制大型语言模型的指导语言。
https://github.com/guidance-ai/guidance
text-generation-inference
大型语言模型 Text Generation Inference
https://github.com/huggingface/text-generation-inference
TensorRT-LLM
TensorRT-LLM 为用户提供了一个易于使用的 Python API 来定义大型语言模型 (LLM) 并构建包含最先进优化的 TensorRT 引擎,以在 NVIDIA GPU 上高效执行推理。
https://github.com/NVIDIA/TensorRT-LLM
SGLang
是适用于大型语言模型和视觉语言模型的快速服务框架。
https://github.com/sgl-project/sglang
LMDeploy
是一个用于压缩、部署和提供 LLM 的工具包。
https://github.com/InternLM/lmdeploy
torchchat
在服务器、桌面和移动设备上本地运行.
https://github.com/pytorch/torchchat
RouteLLM
一个用于服务和评估 LLM 路由器的框架 - 在不影响质量的情况下节省 LLM 成本!
https://github.com/lm-sys/RouteLLM
LightLLM
是一个基于 Python 的 LLM(大型语言模型)推理和服务框架,以其轻量级设计、轻松的可扩展性和高速性能而著称。ModelTC
https://github.com/ModelTC/lightllm
LLM 防护/安全
NeMo-GuardrailsNeMo Guardrails
是一个开源工具包,用于轻松地将可编程护栏添加到基于 LLM 的对话系统中。
https://github.com/NVIDIA/NeMo-Guardrails
guardrails
向大型语言模型添加 guardrail。
https://github.com/guardrails-ai/guardrails
PurpleLlama
用于评估和改进 LLM 安全性的工具集。
https://github.com/meta-llama/PurpleLlama
llm-guard
用于 LLM 交互的安全工具包。
https://github.com/protectai/llm-guard
LLM开发和示例文档
openai-cookbook
使用 OpenAI API 的示例和指南。
anthropic-cookbook
一组笔记本/食谱,展示了一些使用 Claude 的有趣且有效的方法。
gemini-cookbook
使用 Gemini API 的示例和指南。
Phi-3CookBook
这是一本用于 Phi-3 入门的 Phi-3 书籍。Phi-3 是 Microsoft 开发的一系列开放式 AI 模型。
amazon-bedrock-workshop
这是专为 Amazon Bedrock(一种基础模型服务)设计的研讨会。
mistral-cookbook
Mistral Cookbook 包含由 Mistralers 和我们的社区以及我们的合作伙伴提供的示例。
gemma-cookbook
来自 Google 的 Gemma 开放模型的指南和示例集合。
amazon-bedrock-samples
此存储库包含供客户开始使用 Amazon Bedrock 服务的示例。这包含所有可用基础模型的示例
cohere-notebooks
适用于 Cohere 平台的代码示例和 Jupyter 笔记本Cohere
upstage-cookbook
Upstage API 示例和指南
课程
generative-ai-for-beginners
18 节课,开始使用生成式 AI 进行构建Microsoft LLM课程,通过路线图和 Colab 笔记本进入大型语言模型 (LLM)。
https://github.com/microsoft/generative-ai-for-beginners
llm-zoomcampLLM
关于构建问答系统的免费在线课程DataTalksClub
https://github.com/DataTalksClub/llm-zoomcamp
llm-twin-course
免费学习如何使用LLMOps最佳实践构建端到端的生产就绪LLM和RAG系统:~源代码+12个实践课程
https://github.com/decodingml/llm-twin-course
LLM 基准测试
SWE-benchSWE-bench
是一个基准测试,用于评估从 GitHub 收集的真实世界软件问题上的大型语言模型。
MMAU (axlearn)
大规模多任务代理理解 (MMAU) 基准测试旨在评估大型语言模型 (LLM) 作为代理在各种任务中的性能。
mle-benchMLE-bench
是衡量 AI 代理在机器学习工程中表现的基准
WindowsAgentArena(WAA)
是一个可扩展的操作系统平台,用于多模态 AI 代理的测试和基准测试。Microsoft
DevAI (agent-as-a-judge)DevAI,一个由 55 个现实的 AI 开发任务和 365 个分层用户需求组成的基准测试。
natural-planNatural Plan
是自然语言中现实的规划基准,包含 3 项关键任务:旅行计划、会议计划和日历安排。
RAG增强检索
AutoGPT AutoGPT is the vision of accessible AI for everyone, to use and to build on. Our mission is to provide the tools, so that you can focus on what matters.
langchain (LangChain
) Build context-aware reasoning applications
dify (LangGenius
) Dify is an open-source LLM app development platform. Dify’s intuitive interface combines AI workflow, RAG pipeline, agent capabilities, model management, observability features and more, letting you quickly go from prototype to production.
MetaGPT The Multi-Agent Framework: First AI Software Company, Towards Natural Language Programming
llama_index (LlamaIndex
) LlamaIndex is a data framework for your LLM applications
AutoGen (Microsoft
) A programming framework for agentic AI
Flowise (FlowiseAI
) Drag & drop UI to build your customized LLM flow
mem0 (Mem0
) The memory layer for Personalized AI
RAGFlow (InfiniFlow
) RAGFlow is an open-source RAG (Retrieval-Augmented Generation) engine based on deep document understanding.
crewAI (crewAI
) Framework for orchestrating role-playing, autonomous AI agents. By fostering collaborative intelligence, CrewAI empowers agents to work together seamlessly, tackling complex tasks.
GraphRAG (Microsoft
) A modular graph-based Retrieval-Augmented Generation (RAG) system
haystack (Deepset
) LLM orchestration framework to build customizable, production-ready LLM applications. Connect components (models, vector DBs, file converters) to pipelines or agents that can interact with your data.
swarm (OpenAI
) Educational framework exploring ergonomic, lightweight multi-agent orchestration. Managed by OpenAI Solution team.
Letta (Letta
) Letta (fka MemGPT) is a framework for creating stateful LLM services.
llmware (LLMware.ai
) Unified framework for building enterprise RAG pipelines with small, specialized models
TaskingAI (TaskingAI
) The open source platform for AI-native application development.
AgentScope (ModelScope
) Start building LLM-empowered multi-agent applications in an easier way.
pathway (Pathway
) Python ETL framework for stream processing, real-time analytics, LLM pipelines, and RAG.
llama-stack (Meta
) Model components of the Llama Stack APIs
- llama-stack-apps (
Meta
) Agentic components of the Llama Stack APIs
Qwen-Agent (QwenLM
) Agent framework and applications built upon Qwen>=2.0, featuring Function Calling, Code Interpreter, RAG, and Chrome extension.
Langroid (Langroid
) Harness LLMs with Multi-Agent Programming
AutoRAG (Markr Inc.
) AutoML tool for RAG
AgentOps (AgentOps-AI
) Python SDK for AI agent monitoring, LLM cost tracking, benchmarking, and more. Integrates with most LLMs and agent frameworks like CrewAI, Langchain, and Autogen
Lagent (InternLM
) A lightweight framework for building LLM-based agents
相关文章:
人工智能大模型LLM开源资源汇总(持续更新)
说明 目前是大范围整理阶段,所以存在大量机翻说明,后续会逐渐补充和完善资料,减少机翻并增加说明。 Github上的汇总资源(大部分英文) awesome-production-machine-learning 此存储库包含一系列精选的优秀开源库&am…...
目标跟踪算法:SORT、卡尔曼滤波、匈牙利算法
目录 1 目标检测 2 卡尔曼滤波 3《从放弃到精通!卡尔曼滤波从理论到实践》视频简单学习笔记 3.1 入门 3.2 进阶 3.2.1 状态空间表达式 3.2.2 高斯分布 3.3 放弃 3.4 精通 4 匈牙利算法 5 《【运筹学】-指派问题(匈牙利算法)》视…...
Java版-图论-拓扑排序与有向无环图
拓扑排序 拓扑排序说明 对一个有向无环图(Directed Acyclic Graph简称DAG)G进行拓扑排序,是将G中所有顶点排成一个线性序列,使得图中任意一对顶点u和v,若边<u,v>∈E(G),则u在线性序列中出现在v之前。通常,这样的线性序列称为满足拓扑次序(Topological Order)的序列…...
GTC2024 回顾 | 优阅达携手 HubSpot 亮相上海,赋能企业数字营销与全球业务增长
从初创企业入门到成长型企业拓展,再到 AI 驱动智能化运营,HubSpot 为企业的每步成长提供了全方位支持。 2024 年 11 月下旬,备受瞩目的 GTC2024 全球流量大会(上海)成功举办。本次大会汇聚了全国内多家跨境出海领域企业…...
eclipse启动的时候,之前一切很正常,但突然报Reason: Failed to determine a suitable driver class的解决
1、之前项目都是启动正常的,然后运行以后发现启动不了了,还会报错: 2、这个Reason: Failed to determine a suitable driver class,说是没有合适的驱动class spring:datasource:url: jdbc:sqlserver://192.168.1.101:1433;databa…...
_tkinter.TclError: can‘t find package tkdnd Unable to load tkdnd library.解决办法
Traceback (most recent call last): File “tkinterdnd2\TkinterDnD.py”, line 55, in _require _tkinter.TclError: can’t find package tkdnd During handling of the above exception, another exception occurred: Traceback (most recent call last): File “1.导入总表…...
VBA高级应用30例应用在Excel中的ListObject对象:向表中添加注释
《VBA高级应用30例》(版权10178985),是我推出的第十套教程,教程是专门针对高级学员在学习VBA过程中提高路途上的案例展开,这套教程案例与理论结合,紧贴“实战”,并做“战术总结”,以…...
folly库Conv类型转换源码解析
1,普通类型转换 例子1: bool boolV = true;EXPECT_EQ(to<bool>(boolV), true);int intV = 42;EXPECT_EQ(to<int>(intV), 42);float floatV = 4.2f;EXPECT_EQ(to<float>(floatV), 4.2f);double doubleV = 0.42;EXPECT_EQ(to<double>(doubleV), 0.42)…...
UE4 骨骼网格体合并及规范
实现代码 // Fill out your copyright notice in the Description page of Project Settings.#pragma once#include "CoreMinimal.h" #include "SkeletalMeshMerge.h" #include "Kismet/BlueprintFunctionLibrary.h" #include "AceMeshCom…...
Java版企业电子招标采购系统源业码Spring Cloud + Spring Boot +二次开发+ MybatisPlus + Redis
功能描述 1、门户管理:所有用户可在门户页面查看所有的公告信息及相关的通知信息。主要板块包含:招标公告、非招标公告、系统通知、政策法规。 2、立项管理:企业用户可对需要采购的项目进行立项申请,并提交审批,查看所…...
通过源码⼀步⼀步分析 ArrayList 扩容机制
ArrayList 是 Java 中常用的集合类,它底层实现是基于数组的。为了处理元素的动态增加,ArrayList 会在容量不足时进行扩容。以下是通过源码逐步分析 ArrayList 扩容机制的过程。 1. ArrayList 类的基本结构 ArrayList 继承自 AbstractList,实…...
源码分析之Openlayers中默认Controls控件渲染原理
概述 Openlayers 中默认的三类控件是Zoom、Rotate和Attribution 源码分析 defaults方法 Openlayers 默认控件的集成封装在defaults方法中,该方法会返回一个Collection的实例,Collection是一个基于数组封装了一些方法,主要涉及到数组项的添…...
中间件的分类与实践:从消息到缓存
目录 一. 中间件的基本概念 二. 中间件的主要类型 (1)消息中间件(Message-Oriented Middleware, MOM): (2)数据库中间件: (3)Web中间件: &a…...
京东e卡 h5st 4.96
声明: 本文章中所有内容仅供学习交流使用,不用于其他任何目的,抓包内容、敏感网址、数据接口等均已做脱敏处理,严禁用于商业用途和非法用途,否则由此产生的一切后果均与作者无关! 有相关问题请第一时间头像私信联系我删…...
《CSS 知识点》滚动条仅在 hover 时才显示(宽度不改变)
很简单! 滚动条的滑动小方块背景色默认透明,仅在hover时设置背景色; 滚动条的轨道背景色默认透明,仅在hover时设置背景色; /*滚动条的滑动小方块*/ ::-webkit-scrollbar-thumb {background: transparent; } /*hover…...
手里有病理切片+单细胞测序的数据,如何开展医工交叉的研究?
小罗碎碎念 这一期推文研究一个问题:病理如何与单细胞结合? 病理与单细胞的结合,时常出现在今年的各大顶刊中。 关于这一领域的研究,其实19年就开始了。我把部分低质量的文献做了剔除,但是也基本能反应这一领域的受关注…...
力矩扭矩传感器介绍
在机械臂(机器人臂)末端使用的力矩扭矩传感器主要用于测量机械臂末端执行器(例如机械手爪、抓取装置等)所受的扭矩和力。这些传感器对机械臂的控制系统至关重要,能够提供精确的力反馈信息,帮助实现更高效、…...
【Appium】AttributeError: ‘NoneType‘ object has no attribute ‘to_capabilities‘
目录 1、报错内容 2、解决方案 (1)检查 (2)报错原因 (3)解决步骤 3、解决结果 1、报错内容 在PyCharm编写好脚本后,模拟器和appium也是连接成功的,但是运行脚本时报错&…...
QT 中 多线程(备查)
基础 一个线程处理窗口事件,其他线程进行逻辑运算 在QT中使用多线程,需要额外注意的: 1)默认的线程在Qt中称之为窗口线程,也叫主线程,负责窗口事件处理或者窗口控件数据的更新 2)子线程负责后台…...
第八十六条:在实现serializable接口时要特别谨慎
要想使一个类的实例可被序列化,非常简单,只要在它的声明中加入"implements Serializable"字样即可。虽然使一个类可被序列化的直接开销低到甚至可以忽略不计,但是为了序列化而付出的长期开销往往是实实在在的。 为实现Serializable…...
【Elasticsearch 中间件】Elasticsearch 客户端使用案例
文章目录 一、安装 Elasticsearch1.1 启动 Elasticsearch1.2 启动 Kibana 二、客户端代码2.1 导入依赖2.2 配置 application.yaml2.3 定义实体类2.4 连接 Elasticserach2.5 定义 Service 层接口2.6 实现 Service 层功能 三、测试项目3.1 添加数据3.2 搜索数据3.3 更新数据3.4 删…...
深入理解MySQL中的ONLY_FULL_GROUP_BY
在MySQL数据库管理中,ONLY_FULL_GROUP_BY是一个重要的SQL模式,它直接影响着GROUP BY语句的执行方式和结果。本文将从基础概念出发,逐步解析ONLY_FULL_GROUP_BY的工作原理、应用场景及应对策略。 什么是ONLY_FULL_GROUP_BY? ONLY…...
获得日志记录之外的新视角:应用程序性能监控简介(APM)
作者:来自 Elastic David Hope 日志记录领域即将发生改变。在这篇文章中,我们将概述从单纯的日志记录到包含日志、跟踪和 APM 的完全集成解决方案的推荐流程。 通过 APM 和跟踪优先考虑客户体验 企业软件开发和运营已成为一个有趣的领域。我们拥有一些非…...
如何避免缓存击穿?超融合常驻缓存和多存储池方案对比
作者:SmartX 解决方案专家 钟锦锌 很多运维人员都知道,混合存储介质配置可能会带来“缓存击穿”的问题,尤其是大数据分析、数据仓库等需要频繁访问“冷数据”的应用场景,缓存击穿可能会更频繁地出现,影响业务运行。除…...
口语笔记——祈使句用法
省略主语 (You give me) a cup of tea, please. 一杯茶(You wait for) another minute. 两等一分钟(You) keep quiet. 保持安静give me a break. 饶了我吧take your hand off. 把你的手拿开take this thing away 把这东西拿开never talk to strangers. 永远不要跟陌生人说话Do…...
SQL连续登录问题(详细案例分析)
如果要统计用户活跃度,那就涉及连续登录问题,接下来将举一个简单的例子来详细说明这个问题: 一、创建一些模拟数据 一些测试数据如下: deviceid1,2022-10-26,2022-10-26,2022-11-01 deviceid1,2022-10-26,2022-11-03,2022-11-0…...
Next.js 系统性教学:深入理解缓存与数据优化策略
更多有关Next.js教程,请查阅: 【目录】Next.js 独立开发系列教程-CSDN博客 目录 前言 1. 缓存的基本概念 1.1 缓存的作用 1.2 Next.js 中的缓存策略 2. Next.js 的缓存机制 2.1 请求记忆化(Request Memoization) 2.1.1 什…...
【PyTorch】(基础六)---- 搭建卷积神经网络
关于神经网络中激活函数、卷积层、池化层等底层原理,我不会在本文中详解,但是关于pytorch中如何使用对应的方法实现这些层的功能我会进行解释,如果你想要了解一些关于神经网络底层的知识,我十分推荐你去看一下吴恩达老师的深度学习…...
【JAVA项目】基于ssm的【美食推荐管理系统】
【JAVA项目】基于ssm的【美食推荐管理系统】 技术简介:采用JSP技术、B/S架构、SSM框架、MySQL技术等实现。 系统简介:美食推荐管理系统,在系统首页可以查看首页、热门美食、美食教程、美食店铺、美食社区、美食资讯、我的、跳转到后台等内容。…...
adb 常用命令笔记
adb connect <ip> #连接指定ip adb disconnect <ip> #断开连接指定ip adb devices #查看连接中的设备 adb install <flie> #安装apk adb uninstall <packageName> #卸载app adb -s install <flie> #指定设备安装 adb shell pm list package…...
网站开发用什么字体一般/如何做seo优化
biti大师链接:http://biti_rainy.itpub.net/来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/39335/viewspace-351665/,如需转载,请注明出处,否则将追究法律责任。 转载于:http://blog.itpub.net/39335/viewspace-…...
163企业邮箱怎么申请/惠州市seo广告优化营销工具
开头 中国互联网发展的这些年,如今90后程序员是中国程序员的主力军,互联网的热潮也让一批批00后蠢蠢欲动,尝试涌入互联网圈。 当程序员容易,当一个优秀的程序员需要不断学习,从初级程序员到高级程序员,从…...
重庆市建设工程交易中心/搜索引擎优化培训免费咨询
2019独角兽企业重金招聘Python工程师标准>>> Zookeeper Watch机制 博客分类: zookeeper Znode发生变化(Znode本身的增加,删除,修改,以及子Znode的变化)可以通过Watch机制通知到客户端。那么要实…...
网站开发员的工资/网站推广沈阳
31.括号序列 题目描述 给出一个仅包含字符’(’,’)’,’{’,’}’,’[‘和’]’,的字符串,判断给出的字符串是否是合法的括号序列 括号必须以正确的顺序关闭,"()“和”()[]{}“都是合法的括号序列,但”(]“和”([)]"不合法。 输…...
搭建电商网站/在线识图
RedHat6.6 64位下载地址 链接:https://pan.baidu.com/s/1o6FkKkE(密码:1aah) ambari官网:http://ambari.apache.org/ Ambari是什么: Ambari跟Hadoop等开源软件一样,也是Apache Software Fou…...
如何远程连接 网站 数据库/2020年关键词排名
1.堆排序定义 n个关键字序列Kl,K2,…,Kn称为堆,当且仅当该序列满足如下性质(简称为堆性质): (1) ki≤K2i且ki≤K2i1 或(2)Ki≥K2i且ki≥K2i1(1≤i≤ ) 若将此序列所存储的向量R[1..n]看做是一棵完全…...