莒县城阳网站建设/百度云搜索引擎入口
文章目录
- DeepSeek介绍
- 公司背景
- 核心技术
- 产品与服务
- 应用场景
- 优势与特点
- 访问与体验
- 各个DeepSeek-R系列模型的硬件需求和适用场景
- Ollama
- 主要特点
- 优势
- 应用场景
- 安装和使用
- 配置环境变量
- 总结
- 安装open-webui
- 下载和安装docker desktop
- 配置镜像源
- 安装open-webui
- 运行和使用
- RagFlow介绍
- 主要功能
- 适用场景
- 优势
- 下载及安装
- 私有知识库
- 1. 模型供应商配置
- 2. 创建知识库
- 3. 创建数据集
- 4. 创建助理和对话

个人主页:道友老李
欢迎加入社区:道友老李的学习社区
DeepSeek介绍
DeepSeek官网
DeepSeek(深度求索)是一家专注于实现通用人工智能(AGI)的中国科技公司,致力于通过技术探索与创新,推动智能技术的广泛应用。以下是其核心信息的概述:
公司背景
- 成立时间:2023年(具体时间未公开披露)
- 总部:中国杭州
- 使命:通过AGI技术提升人类生产力,推动社会进步。
- 愿景:成为全球AGI领域的领导者。
核心技术
-
大语言模型(LLM)
- 自主研发高性能基座模型(如DeepSeek-R1、DeepSeek-R2),支持长文本理解、复杂推理和多语言处理。
- 模型参数量覆盖数十亿至千亿级,平衡性能与计算效率。
-
多模态AI
- 整合文本、图像、语音等多模态数据,开发跨模态理解与生成能力。
-
搜索增强技术
- 结合搜索引擎实时数据,提升模型在知识更新与事实准确性上的表现。
产品与服务
- 通用大模型:面向开发者的开放API(如DeepSeek API),支持文本生成、代码编写等任务。
- 行业定制模型:针对金融、医疗、教育等领域提供垂直场景优化方案。
- 企业级平台:提供模型训练、部署及管理的全流程工具链(如Fine-tuning平台)。
- 开源社区:部分模型和技术开源,促进开发者协作(如发布轻量版模型)。
应用场景
- 智能客服:自动化应答与客户意图分析。
- 内容生成:营销文案、代码、报告等自动化创作。
- 数据分析:从非结构化数据中提取洞察,辅助决策。
- 教育:个性化学习助手与智能题库生成。
优势与特点
- 技术领先:模型性能在多项基准测试(如MMLU、HumanEval)中位居前列。
- 场景深耕:聚焦企业级需求,提供高可用的行业解决方案。
- 生态合作:与云计算厂商、硬件供应商及高校建立联合实验室。
访问与体验
- 官网提供在线体验入口(如Chat界面)和开发者文档。
- 部分模型可通过Hugging Face、GitHub等平台获取。
如需更详细的技术参数、商业合作或最新动态,建议访问其官方网站或查阅官方发布的白皮书。
各个DeepSeek-R系列模型的硬件需求和适用场景
我的电脑配置:
可以跑7b和14b
Ollama
ollama search
Ollama 是一个开源的 AI 推理框架,专注于模型压缩和部署。它的目标是帮助用户在本地或边缘设备上高效运行大型语言模型(LLM),通过量化和其他技术显著减少模型大小,同时保持高性能。
主要特点
-
模型压缩与优化:
- Ollama 提供了多种模型压缩技术,如 4-bit 和 8-bit 量化,使大模型能够在低资源环境下运行。
- 支持主流语言模型(如 LLaMA、Vicuna 等)的适配和部署。
-
高性能推理:
- Ollama 能够在本地设备上实现低延迟、高吞吐量的推理,适合实时应用。
-
易于部署:
- 提供简洁的命令行界面(CLI),用户可以轻松下载模型、调整参数并运行推理服务。
- 支持 Docker 部署,便于在云服务器或边缘设备上快速搭建。
-
社区驱动:
- Ollama 是一个开源项目,依赖于活跃的社区支持,用户可以根据需求贡献和改进功能。
优势
- 轻量化:通过量化技术显著降低模型大小,适合资源受限的环境。
- 高性能:优化了推理速度,能够在本地快速响应。
- 灵活性:支持多种模型格式和后端(如 GGML、TensorRT 等)。
- 易于上手:用户无需复杂的配置即可开始使用。
应用场景
-
本地开发与实验:
- 开发者可以轻松在本地运行 LLM,用于快速测试和原型设计。
-
边缘计算:
- 在边缘设备(如 Raspberry Pi)上部署轻量级 AI 服务。
-
实时推理服务:
- 快速搭建支持多语言模型的推理服务器,满足企业或个人需求。
-
教育与研究:
- 提供了一个易于使用的工具,适合教学和研究场景。
安装和使用
国内下载:Ollama下载
-
打开cmd控制台,输入:
ollama
可以看到帮助命令
-
下载模型(以 DeepSeek-R系列为例):
ollama pull deepseek-r1:1.5b
-
启动推理服务:
ollama serve --port 11434
-
运行模型:
ollama run deepseek-r1:1.5b
可以开始对话了。
配置环境变量
OLLAMA_MODELS 是修改OLLAMA下载的模型存储位置,默认是在C盘
总结
Ollama 是一个强大的工具,旨在简化大型语言模型的部署和推理过程。它通过模型压缩和优化技术,使得在本地或边缘设备上运行 AI 模型变得高效且易于管理。无论是开发者、研究人员还是企业用户,Ollama 都能提供灵活和支持,满足多种应用场景的需求。
安装open-webui
下载和安装docker desktop
官网地址:Docker Desktop
GitHub地址:Docker Desktop
配置镜像源
第一个是阿里云的镜像源,可登录阿里云平台查看
"registry-mirrors": ["https://${阿里云的}.mirror.aliyuncs.com","https://docker.m.daocloud.io","https://mirror.baidubce.com","https://docker.nju.edu.cn","https://mirror.iscas.ac.cn"]
安装open-webui
搜索open-webui
我这里已经安装过了。
运行和使用
在容器中运行open-webui,然后浏览器输入http://localhost:3000
进入设置
配置Ollama地址
配置好后,保存,正常的情况下,界面就会显示Ollama中已下载好的模型了
完成!可以开始对话了!
RagFlow介绍
RagFlow 是一个基于大语言模型的流程自动化工具,旨在帮助用户通过自然语言处理(NLP)技术来自动化和优化工作流程。它结合了先进的AI技术和直观的用户界面,使得非技术人员也能轻松实现流程自动化。
主要功能
- 智能对话交互:用户可以通过与RagFlow进行自然语言对话,定义、管理和优化各种工作流程。
- 任务自动化:支持多种任务类型,如数据处理、信息提取、报告生成等,帮助用户自动完成重复性工作。
- 跨系统集成:能够与主流的第三方服务(如Slack、Jira、Google Drive等)无缝集成,实现不同系统的数据流动和协同工作。
- 动态流程调整:根据实时数据和上下文环境,智能调整工作流程,确保流程始终高效运行。
- 可扩展性:支持大规模业务需求,适用于从个人到企业的各种场景。
适用场景
- 企业流程优化:帮助企业在销售、 marketing、客服等环节实现自动化,提升效率。
- 个人任务管理:用户可以通过RagFlow自动化个人日常任务,如行程安排、邮件处理等。
- 数据整合与分析:通过自动化数据收集和处理,支持更高效的决策制定。
优势
- 易用性:无需编程知识,用户即可快速上手。
- 灵活性:支持定制化需求,满足不同用户的个性化要求。
- 高效性:利用AI技术提升流程执行效率,减少人工干预。
RagFlow 通过将复杂的流程自动化转化为简单的对话交互,极大地提升了工作效率和用户体验。如果你有具体的使用场景或问题,可以进一步探讨如何利用RagFlow来优化你的工作流程!
下载及安装
- 从github上下载 ragflow或直接:
git clone https://github.com/infiniflow/ragflow.git
- 运行脚本:进入docker 文件夹,利用提前编译好的 Docker 镜像启动服务器
docker compose -f docker-compose-CN.yml up -d
这个过程会很慢,成功后,会自动运行容器中的服务:
浏览器上输入:http://localhost
第一个注册的账号就是管理员,登录成功
私有知识库
1. 模型供应商配置
点击头像,进入模型供应商配置
选择下面列表中的Ollama,然后进行模型配置
模型名称就是Ollama中下载的模型名称
2. 创建知识库
解析方法改成General,其他默认即可
3. 创建数据集
新增本地文件
执行解析,等待解析完成
4. 创建助理和对话
切换到聊天页,新建助理,选择知识库
切换到模型设置,调整一下最大token数
新建聊天,开始对话
相关文章:

【AI大模型】Ollama部署本地大模型DeepSeek-R1,交互界面Open-WebUI,RagFlow构建私有知识库
文章目录 DeepSeek介绍公司背景核心技术产品与服务应用场景优势与特点访问与体验各个DeepSeek-R系列模型的硬件需求和适用场景 Ollama主要特点优势应用场景安装和使用配置环境变量总结 安装open-webui下载和安装docker desktop配置镜像源安装open-webui运行和使用 RagFlow介绍主…...

JDK 17 和 JDK 21 在垃圾回收器(GC)上有什么优化?如何调整 GC 算法以提升应用性能?
JDK 17 和 JDK 21 在垃圾回收器(GC)上有什么优化?如何调整 GC 算法以提升应用性能? 本文将从 JDK 17 与 JDK 21 的垃圾回收改进出发,结合代码示例解析优化方案,并提供实际项目中的调优策略,帮助…...

CNN-GRU卷积神经网络门控循环单元多变量多步预测,光伏功率预测(Matlab完整源码和数据)
代码地址:CNN-GRU卷积神经网络门控循环单元多变量多步预测,光伏功率预测(Matlab完整源码和数据) CNN-GRU卷积神经网络门控循环单元多变量多步预测,光伏功率预测 一、引言 1.1、研究背景和意义 随着全球能源危机和环境问题的日…...

kotlin中expect和actual关键字修饰的函数作用
在 Kotlin 多平台编程中,expect 和 actual 关键字用于定义跨平台的抽象和具体实现。这种机制允许开发者声明一个平台无关的接口或函数签名(使用 expect),然后在每个目标平台上提供具体的实现(使用 actual)。…...

鸿蒙音视频播放器:libwlmedia
libwlmedia 跨平台播放器wlmedia现在已经支持了鸿蒙(Harmony)平台了,SDK插件地址:libwlmedia 一、接入SDK 1.1 导入SDK ohpm i ywl5320/libwlmedia1.2 添加权限(可选) 如果需要播放网络视频,需要添加网络权限 #m…...

【devops】 Git仓库如何fork一个私有仓库到自己的私有仓库 | git fork 私有仓库
一、场景说明 场景: 比如我们Codeup的私有仓库下载代码 放入我们的Github私有仓库 且保持2个仓库是可以实现fork的状态,即:Github会可以更新到Codeup的最新代码 二、解决方案 1、先从Codeup下载私有仓库代码 下载代码使用 git clone 命令…...

CEF132编译指南 MacOS 篇 - 构建 CEF (六)
1. 引言 经过前面一系列的精心准备,我们已经完成了所有必要的环境配置和源码获取工作。本篇作为 CEF132 编译指南系列的第六篇,将详细介绍如何在 macOS 系统上构建 CEF132。通过配置正确的编译命令和参数,我们将完成 CEF 的构建工作…...

mysql大数据量分页查询
一、什么是MySQL大数据量分页查? MySQL大数据量分页查是指在使用MySQL数据库时,将大量数据分成多个较小的部分进行显示,以提高查询效率和用户体验。分页查询通常用于网页或应用程序中,以便用户能够逐步浏览结果集。 二、为什…...

计算机毕业设计SpringBoot校园二手交易小程序 校园二手交易平台(websocket消息推送+云存储+双端+数据统计)(源码+文档+运行视频+讲解视频)
温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片! 温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片! 温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片! 作者简介:Java领…...

尚硅谷爬虫note003
一、函数 1. 函数的定义 def 函数名(): 代码 2.函数的调用 函数名() 3. 定义参数(不调用函数不执行) def sum(a,b) #形参 c a b print(c&…...

【逆向工程】破解unity的安卓apk包
先了解一下普通apk包的逆向方法(无加密或加壳) 开发环境: 操作系统:windows 解apk包 下载工具:apktool【Install Guide | Apktool】按照文档说的操作就行,先安装java运行时环境【我安装的是jre-8u441-wind…...

稠密架构和稀疏架构
稠密架构和稀疏架构 flyfish 稠密架构 参数使用方面:稠密架构中的大部分参数在每次计算时都会被使用。也就是说,对于输入的每一个样本,模型的所有或大部分参数都会参与到计算过程中。计算特点:计算密集,需要对大量的…...

LeetCode --- 436周赛
题目列表 3446. 按对角线进行矩阵排序 3447. 将元素分配给有约束条件的组 3448. 统计可以被最后一个数位整除的子字符串数目 3449. 最大化游戏分数的最小值 一、按对角线进行矩阵排序 直接模拟,遍历每一个斜对角线,获取斜对角线上的数字,排…...

用easyExcel如何实现?
要使提供的 ExcelModelListener 类来解析 Excel 文件并实现批量存储数据库的功能,需要结合 EasyExcel 库来读取 Excel 数据。具体来说,可以使用 EasyExcel.read() 方法来读取 Excel 文件,并指定 ExcelModelListener 作为事件监听器。 下面是…...

从 X86 到 ARM :工控机迁移中的核心问题剖析
在工业控制领域,技术的不断演进促使着工控机从 X86 架构向 ARM 架构迁移。然而,这一过程并非一帆风顺,面临着诸多关键挑战。 首先,软件兼容性是一个重要问题。许多基于 X86 架构开发的工业控制软件可能无法直接在 ARM 架构上运行…...

大模型DeepSeek-R1学习
学习路线 机器学习-> 深度学习-> 强化学习-> 深度强化学习 大模型演进分支 微调: SFT 监督学习蒸馏:把大模型作为导师训练小模型RLHF:基于人类反馈的强化学习 PPO 近端策略优化 油门 - 重要性采样 权重 * 打分刹车 - clip 修剪…...

【STM32】H743的以太网MAC控制器的一个特殊功能
调试743的MAC,翻阅手册的时候,发现了一个有意思的功能 混杂模式 H743的MAC控制器,可以设置为混杂模式,这就意味着它可以做一些网络监控的应用,譬如连接具备端口镜像功能的交换机,然后直接代替PC实现网络数据…...

关于“i18n“在vue中的使用
关于"i18n"在vue中的使用 <!-- vue2中 --> <template><div>{{ $t("This campaign has expired.") }}}}</div> </template> <script> export default {created() {this.onLoading();},methods: {onLoading () {this.$…...

前缀树算法篇:前缀信息的巧妙获取
前缀树算法篇:前缀信息的巧妙获取 那么前缀树算法是一个非常常用的算法,那么在介绍我们前缀树具体的原理以及实现上,我们先来说一下我们前缀树所应用的一个场景,那么在一个字符串的数据集合当中,那么我们查询我们某个字…...

DVSI使用SenseGlove为开发虚拟现实场景技能培训
虚拟现实场景技能培训能够有效提升被培训者的技能熟练度,使其在现实世界中经历类似事件时第一时间做出正确反映,从而大大降低因缺乏相关技能经验所造成的财产、人员、时间损失。 DVSI(Digital Voice Systems Inc)是一家美国数字化…...

VSCode + Continue 实现AI编程助理
安装VS Code 直接官网下载安装,反正是免费的。 安装VS插件Continue 直接在插件市场中搜索, Continue,第一个就是了。 配置Chat Model 点击Add Chat model后进行选择: 选择Ollama后,需要点击下面的config file : 由于…...

【PHP的static】
关于静态属性 最简单直接:静态方法也是一样 看了很多关于静态和动态的说法,无非是从 调用方式, 类访问实例变量, 访问静态变量, 需不要实例化这几个方向,太空了。问使用场景,好一点的 能说个…...

考研操作系统----操作系统的概念定义功能和目标(仅仅作为王道哔站课程讲义作用)
目录 操作系统的概念定义功能和目标 操作系统的四个特征 操作系统的分类 编辑 操作系统的运行机制 系统调用 操作系统体系结构 操作系统引导 虚拟机 操作系统的概念定义功能和目标 什么是操作系统: 操作系统是指控制和管理整个计算机系统的软硬件资源&…...

从360度全景照片到高质量3D场景:介绍SC-Omnigs 3D重建系统
在当今的数字化时代,3D重建技术正在迅速发展,并广泛应用于文旅、空间智能和3D重建等领域。为了简化360度全景相机拍摄数据的处理流程,提高3D场景重建的质量和效率,我们开发了一款专门处理360度全景相机数据的3D重建系统——SC-Omnigs。本文将详细介绍这一系统的功能、特点及…...

前沿技术新趋势:值得关注的创新发展
量子通信是一种新兴的通信技术。它基于量子力学的原理,特别是量子叠加和量子纠缠。量子通信的核心在于量子比特qubits),与传统的比特不同,量子比特可以同时处于多种状态。这种特性使得信息的传输更为安全。 量子通信技术的最大优…...

算法跟练第十一弹——二叉树
文章目录 part01 递归遍历1.1 二叉树的前序遍历1.2 二叉树的中序遍历1.3 二叉树的后序遍历 part02 迭代遍历2.1 二叉树的前序遍历2.2 二叉树的中序遍历2.3 二叉树的后序遍历 part03 层序遍历3.1 二叉树的层序遍历3.2 二叉树的层序遍历II3.3 二叉树的右视图 归纳获取双重链表的第…...

机器学习(李宏毅)——BERT
一、前言 本文章作为学习2023年《李宏毅机器学习课程》的笔记,感谢台湾大学李宏毅教授的课程,respect!!! 读这篇文章必须先了解self-attention、Transformer,可参阅我其他文章。 二、大纲 BERT简介self-…...

新数据结构(7)——Object
Object类是所有类的父类,在 Java 中,每个类都直接或间接地继承自Object类,也就是说所有类都是object类的子类可以使用Object里的方法。 equals()和hashCode()是Java中Object类所包含的两个关键方法,下面将介绍两个方法。 和equa…...

云计算基础
环境准备 配置虚拟机安装docker 前提安装 步骤命令效果图 安装docker-compose 前提安装 步骤效果图 安装gitea 步骤命令效果图 执行docker-compose命令浏览器初始gitea配置浏览器登录gitea创建组织创建仓库 Drone安装 步骤效果图 非自动化部署 nginx安装redis安装jdk安装…...

利用kali linux 进行自动化渗透测试
本方案旨在自动化创建渗透测试全流程 一、架构 1.智能信息收集体系 class IntelligentOSINT:def __init__(self, target):self.target targetself.intelligence_sources [OSINT_Platforms,DeepWeb_Crawlers, SocialMedia_Trackers,ML_Correlation_Engine]def advanced_col…...