政府网站建设规定/南京网站设计公司大全
上图是台风席卷城市,现在企业的服务基本都是混合部署,云计算厂商的机房往往可以提供比较好的保护,一般在地下,扛多少级地震,扛多少级台风,而自建机房,往往写字楼经常停电,网络运营上经常断网。
那么怎么防护这种意外,保证服务在线,或者最短时间恢复?
答案就是多地备份,快速切换。
背景
飓风袭击亚特兰大,我们的转文服务器放在这个城市,担心断电或者断网。所以需要有一个备用的服务器来处理语音数据。
计划是在云计算厂商相对安全,距离又近的地方买一个服务器,重新搭建,来处理语音转文,左右声道拆分和角色识别。
然后是做完之后,需要通过配置能切换,同时保证功能正常。
目标
购买一个最低成本的带GPU的服务器,在阿里云上。做备用,在极端天气情况下使用备用的服务器。极端天气过后,切换到自建IDC的服务器。兼顾成本和高可用。
下面是操作步骤。记录下来,方便后续查看或者交给运维。
搭建步骤
1 购买机器
带GPU的,默认安装驱动;
选择的ubuntu系统。 设置账号密码,安全组端口全部关闭。 vpc选择跟产线环境互通,可以节约流量加快速度,进一步提高安全性。
2 查看gpu显卡信息
需要先安装工具。这将显示有关图形设备的信息。来看看买的GPU的资源是否给够了,当前的版本是什么,方便排查问题。
sudo apt-get install inxi
sudo inxi -G
然后查看GPU信息:
sudo nvidia-smi
这张图片显示了NVIDIA GPU的状态信息,使用了nvidia-smi
命令。下面是对各个字段的解释,以及一些类比和例子:
主要信息解释
- NVIDIA-SMI 550.90.07:
- 这是NVIDIA系统管理接口的版本号。就像软件的版本号,指示你正在使用哪个版本的驱动程序。
- Driver Version 550.90.07:
- 这是当前安装的GPU驱动程序版本。如果驱动程序不更新,可能会影响GPU性能和兼容性,就像手机应用需要定期更新以修复漏洞。
- CUDA Version 12.4:
- CUDA是NVIDIA的并行计算平台和编程模型,版本指示支持的CUDA功能。可以类比为操作系统的版本,决定了你可以使用哪些新特性。
- GPU Name: Tesla T4:
- 显示了GPU的型号。在这张图中,使用的是NVIDIA的Tesla T4,适用于深度学习和高性能计算。
- Fan Temp 44C:
- 风扇的温度,44摄氏度。可以类比于计算机的CPU温度,帮助监控硬件是否过热。
- Power Usage/Cap (10W / 70W):
- 当前功耗为10瓦,最大功耗为70瓦。这表明GPU在有效使用功率,类似于电器的功率消耗。
- Memory Usage (1MiB / 16384MiB):
- 当前使用的内存为1 MiB,总可用内存为16,384 MiB(即16 GB)。这一点可以与计算机的内存使用情况做类比。
- GPU Utilization (0%):
- 目前GPU的利用率为0%,表示没有正在运行的计算任务。可以看成汽车的油门,0%意味着完全没有加速。
- Processes:
- 该部分显示当前正在运行的进程。这里显示“没有正在运行的进程”,意味着没有任务占用GPU资源。
类比说明
可以把这整个信息看作一辆汽车的仪表盘:
- 版本号(NVIDIA-SMI, Driver, CUDA)类似于汽车的型号和生产年份。
- 温度(Fan Temp)类似于发动机的温度表,确保它在正常范围内运行。
- 功耗(Power Usage/Cap)就像油表,显示当前油量和油箱的容量。
- 内存使用(Memory Usage)就像后备箱的空间,显示了当前使用和可用的存储空间。
- 利用率(GPU Utilization)则像车速表,表示汽车当前的运行状态。
- 进程信息就像车内的乘客,显示当前有哪些人(进程)在使用这辆车(GPU)。
通过这些信息,用户可以有效监控和管理GPU的性能,确保其在最佳状态下运行。
3 安装sftp 修改开启端口
sudo apt-get update
sudo apt-get install openssh-serversudo vi /etc/ssh/sshd_config
# 修改端口
Port 9222
sudo systemctl restart ssh
安全组放开9222
同时IP开白,限定只有 prod ,qa环境的出网ip, 深圳 ,岳阳办公环境才能访问 .
因为最近安全问题频发,所以这块必须要保证,任何开放到公网的端口都有被攻击的风险。
4 挂载NAS盘 到/sftp
sudo apt-get update && sudo apt-get install nfs-commonsudo chmod 777 -R /etc/modprobe.dsudo echo "options sunrpc tcp_slot_table_entries=128" >> /etc/modprobe.d/sunrpc.conf
sudo echo "options sunrpc tcp_max_slot_table_entries=128" >> /etc/modprobe.d/sunrpc.confsudo mkdir /sftpsudo mount -t nfs -o vers=4,minorversion=0,rsize=1048576,wsize=1048576,hard,timeo=600,retrans=2,noresvport 13e6xxxx7-ojm48.us-east-1.nas.aliyuncs.com:/ /sftpdf -h | grep aliyun
进去可以看到NAS远程存储已经挂到了对应的 /sftp目录
防止录音文件太多导致爆盘。所以使用了远程存储。 还有一个原因就是远程存储价格便宜,低频的可以自动沉降。
5 安装whipser并测试
sudo apt update && sudo apt install ffmpegpip install setuptools-rustpip install -U openai-whisperwhisper --help
测试转文指令:
whisper /sftp/deskqa/mp3/test2.mp3 --model small --output_format json --output_dir /sftp/deskqa/mp3j --word_timestamps True
测试声道分离指令:
ffmpeg -i /sftp/deskqa/mp3/a.wav -map_channel 0.0.0 -threads 4 /sftp/deskqa/mp3/a_l.wav -map_channel 0.0.1 -threads 4 /sftp/deskqa/mp3/a_r.wav
java程序所需的基本底层能力测试通过。
6 安装wis-biz程序
安装java运行环境。
在Ubuntu上安装Java 8可以通过以下步骤完成。以下是详细的安装指令:
1. 更新包列表
首先,更新你的包列表以确保你获取到最新的软件包信息:
sudo apt-get update
2. 安装Java 8
使用以下命令安装Java 8:
sudo apt-get install openjdk-8-jdk
3. 验证安装
安装完成后,可以通过以下命令验证是否成功安装了Java 8:
java -version
你应该看到类似以下的输出,表示Java 8已成功安装:
openjdk version "1.8.0_292"
OpenJDK Runtime Environment (build 1.8.0_292-b10)
OpenJDK 64-Bit Server VM (build 25.292-b10, mixed mode)
4. 设置默认Java版本(可选)
如果你有多个Java版本安装在你的系统上,并且希望将Java 8设置为默认版本,可以使用 update-alternatives
命令:
sudo update-alternatives --config java
你会看到一个列表,显示所有已安装的Java版本。输入对应Java 8的选择编号,然后按Enter键。
5. 设置JAVA_HOME环境变量(可选)
为方便起见,你可能还希望设置 JAVA_HOME
环境变量。编辑你的 .bashrc
文件:
nano ~/.bashrc
在文件末尾添加以下行:
export JAVA_HOME=/usr/lib/jvm/java-8-openjdk-amd64
export PATH=$JAVA_HOME/bin:$PATH
保存并退出(在Nano中,按 Ctrl+O
保存,按 Ctrl+X
退出),然后使更改生效:
source ~/.bashrc
6. 验证环境变量设置(可选)
你可以通过以下命令验证 JAVA_HOME
环境变量是否设置正确:
echo $JAVA_HOME
输出应为 /usr/lib/jvm/java-8-openjdk-amd64
。
通过这些步骤,你就可以在Ubuntu系统上成功安装并配置Java 8。
上传jar包。
添加配置文件。放在 gitops下。 wis/qa wis/prod 分别放对应的配置文件,存档,方便后面做程序更新;
目录设计:
sudo mkdir -p /sftp/deskprod/mp3 /sftp/deskprod/mp3j /sftp/deskprod/mp32 /sftp/deskprod/config /sftp/deskprod/logssudo touch /sftp/deskprod/logs/wis.log
启动脚本:
/sftp/deskprod/start.sh
#!/bin/bash
sudo touch ./logs/wis.log | true
sudo mkdir -p ./logs | true(until java -Xms4096m -Xmx8096m -Djava.security.egd=file:/dev/./urandom -Dlogging.config=./config/logback-spring.xml -jar wis.jar; doecho "MyApp prod wis.jar crashed with exit code $?. Respawning... " >&2sleep 5done) &
7 本地测试/qa测试/产线测试
打电话,看看是不是转文成功。
下面是日志信息。
标识是已经按照逻辑处理了。
找测试同学分别在qa, prod ,hk环境都测试了,可以正常的转文。 所以这块没问题了。
更新采用修改配置的方式,重新出镜像包部署。
8 监控观察
4C的cpu基本跑满了,没有浪费,内存有空闲,也接近满载,利用率很高。
gpu使用率没有满的情况,因为限制了并发数,升级了whisper的版本,使用的小模型。高峰期有录音积压,平峰期可以消化掉。
小结
一步一步的安装完环境,并做了测试和监控。有记录,方便重新安装的时候查阅和交割。
告警可以加上,比如GPU的利用率如果超过95%,时间超过5分钟,则告警。
CPU ,内存等也可以告警出来。
处理可以加快一些。 最好可以根据GPU的负载来,或者增加并发度,买更高级的GPU ,内存更大,处理能力更强。。
原创不易,关注诚可贵,转发价更高!转载请注明出处,让我们互通有无,共同进步,欢迎沟通交流。
相关文章:

AIGC: 10 AI转文服务器的搭建过程记录
上图是台风席卷城市,现在企业的服务基本都是混合部署,云计算厂商的机房往往可以提供比较好的保护,一般在地下,扛多少级地震,扛多少级台风,而自建机房,往往写字楼经常停电,网络运营上…...

性能测试1初步使用Jmeter
当你看到这边文章的时候,详细你已经知道啥是性能测试,以及也听说过Jmeter了,所以不过多介绍,这里,只是帮助你快速的使用Jmeter来测试接口。 1获取安装包 官网下载地址:https://jmeter.apache.org/downloa…...

OpenGL ES 绘制一个三角形(2)
OpenGL ES 绘制一个三角形(2) 简述 本节我们基于Android系统,使用OpenGL ES来实现绘制一个三角形。在OpenGL ES里,三角形是一个基础图形,其他的图形都可以使用三角形拼接而成,所以我们就的案例就基于这个开始。 在Android系统中…...

QT----Creater14.0,qt5.15无法启动调试,Launching GDB Debugger报红
问题描述 使用QT Creater 14.0 和qt5.15,无法启动调试也没有报错,加载debugger报红 相关文件都有 解决方案 尝试重装QT,更换版本5.15.2,下载到文件夹,shift鼠标右键打开powershell输入 .\qt-online-installer-windows-x64-4.8.0.exe --mirror http://mirrors.ustc.edu.cn…...

初试React前端框架
文章目录 一、React概述二、React核心特性1、组件化设计2、虚拟DOM3、生态系统 三、实例操作1、准备工作2、创建项目结构3、启动项目4、编写React组件5、添加React样式6、运行项目,查看效果 四、实战小结 一、React概述 大家好,今天我们将一起探索React…...

华为OD机试真题---手机App防沉迷系统
题目概述 智能手机在方便我们生活的同时,也侵占了大量时间。手机App防沉迷系统旨在帮助用户合理规划手机App使用时间,确保在正确的时间做正确的事。系统的主要功能包括: 在一天24小时内,可注册每个App的允许使用时段。一个时段只…...

物流货运托运发货单二联三联打印软件定制 佳易王物流单管理系统操作教程
一、前言 物流货运托运发货单二联三联打印软件定制 佳易王物流单管理系统操作教程 1、软件为绿色免安装版,解压即可使用,已经内置数据库,不需再安装。 2、软件下载可以到本文章最后点击官网卡片下。 二、软件程序教程 1、如图,…...

代码随想录算法训练营| 找树左下角的值 、 路径总和 、 从中序与后序遍历序列构造二叉树
找树左下角的值 题目 参考文章 思路:这里寻找最左下角的值,其实用前中后序都是可以的,只要保证第一遍历的是左边开始就可以。设置Deep记录遍历的最大深度,deep记录当前深度。当遇到叶子节点时而且当前深度比最大深度还大则更换最…...

【开源免费】基于SpringBoot+Vue.JS服装销售平台(JAVA毕业设计)
博主说明:本文项目编号 T 054 ,文末自助获取源码 \color{red}{T054,文末自助获取源码} T054,文末自助获取源码 目录 一、系统介绍二、演示录屏三、启动教程四、功能截图五、文案资料5.1 选题背景5.2 国内外研究现状5.3 可行性分析…...

人工智能与自然语言处理发展史
前言 在科技的浪潮中,人工智能 (AI) 作为一股不可阻挡的力量,持续推动着社会与科技的进步。本博客旨在深入剖析人工智能及其核心领域——神经网络、自然语言处理、统计语言模型、以及大规模语言模型——的演进历程,以专业的视角展现这一领域…...

0基础跟德姆(dom)一起学AI 机器学习01-机器学习概述
【知道】人工智能 - Artificial Intelligence 人工智能 - AI is the field that studies the synthesis and analysis of computational agents that act intelligently - AI is to use computers to analog and instead of human brain - 释义 - 仿智; 像人…...

yakit使用教程(一,下载并进行基础配置)
一,yakit简介 YAKIT(Yet Another Knife for IT Security)是一款网络安全单兵工具,专为个人渗透测试员和安全研究人员设计。它整合了一系列实用的安全工具,例如密码破解工具、网络扫描器、漏洞利用工具等,帮…...

计算机毕业设计电影票购买网站 在线选票选座 场次订票统计 新闻留言搜索/springboot/javaWEB/J2EE/MYSQL数据库/vue前后分离小程序
系统功能 在线选票选座:用户可浏览电影场次,选择座位并生成订单。场次订票统计:系统实时统计各场次订票情况,便于影院管理。新闻发布与留言:发布最新电影资讯,用户可留言互动。搜索功能&a…...

DES、3DES 算法及其应用与安全性分析
一、引言 1.1 研究背景 在当今数字化时代,信息安全至关重要。对称加密算法作为信息安全领域的重要组成部分,发挥着关键作用。DES(Data Encryption Standard)作为早期的对称加密算法,由美国国家标准局于 1977 年采纳为数据加密标准。随着计算机运算能力的不断增强,DES 算…...

TypeScript介绍和安装
TypeScript介绍 TypeScript是由微软开发的一种编程语言,它在JavaScript的基础上增加了静态类型检查。静态类型允许开发者在编写代码时指定变量和函数的类型,这样可以在编译时捕获潜在的错误,而不是等到运行时才发现问题。比如,你…...

NetworkPolicy访问控制
NetworkPolicy是Kubernetes中一种用于控制Pod之间以及Pod与外部网络之间流量的资源对象。它可以帮助你在 IP 地址或端口层面(OSI 第 3 层或第 4 层)控制网络流量。NetworkPolicy 资源使用标签选择 Pod,并定义选定 Pod 所允许的通信规则。它可…...

C++面向对象基础
目录 一.作用域限定符 1.名字空间 2.类内声明,类外定义 二.this指针 1 概念 2.功能 2.1 类内调用成员 2.2 区分重名的成员变量和局部变量 2.3链式调用 三.stastic关键字 1.静态局部变量 2 静态成员变量 3 静态成员函数 4 单例设计模式(了解…...

遥感图像变换检测实践上手(TensorRT+UNet)
目录 简介 分析PyTorch示例 onnx模型转engine 编写TensorRT推理代码 main.cpp测试代码 小结 简介 这里通过TensorRTUNet,在Linux下实现对遥感图像的变化检测,示例如下: 可以先拉去代码:RemoteChangeDetection 分析PyTorch示…...

Transformers 引擎,vLLM 引擎,Llama.cpp 引擎,SGLang 引擎,MLX 引擎
1. Transformers 引擎 开发者:Hugging Face主要功能:Transformers 库提供了对多种预训练语言模型的支持,包括 BERT、GPT、T5 等。用户可以轻松加载模型进行微调或推理。特性: 多任务支持:支持文本生成、文本分类、问答…...

牛顿迭代法求解x 的平方根
牛顿迭代法是一种可以用来快速求解函数零点的方法。 为了叙述方便,我们用 C C C表示待求出平方根的那个整数。显然, C C C的平方根就是函数 f ( x ) x c − C f(x)x^c-C f(x)xc−C 的零点。 牛顿迭代法的本质是借助泰勒级数,从初始值开始快…...

端口隔离配置的实验
端口隔离配置是一种网络安全技术,用于在网络设备中实现不同端口之间的流量隔离和控制。以下是对端口隔离配置的详细解析: 基本概念:端口隔离技术允许用户将不同的端口加入到隔离组中,从而实现这些端口之间的二层数据隔离。这种技…...

洛谷 P10456 The Pilots Brothers‘ refrigerator
[Problem Discription] \color{blue}{\texttt{[Problem Discription]}} [Problem Discription] 给定一个 4 4 4 \times 4 44 的网格,每个网格有 0 , 1 0,1 0,1 两种状态。求最少可以通过多少次操作使得整个网格全部变成 1 1 1。 每次操作你需要选定一个格点 …...

windows+vscode+arm-gcc+openocd+daplink开发arm单片机程序
windowsvscodearm-gccopenocddaplink开发arm单片机程序,脱离keil。目前发现的最佳解决方案是,使用vscodeembedded ide插件。 Embedded IDE官方教程文档...

Mysql梳理10——使用SQL99实现7中JOIN操作
10 使用SQL99实现7中JOIN操作 10.1 使用SQL99实现7中JOIN操作 本案例的数据库文件分享: 通过百度网盘分享的文件:atguigudb.sql 链接:https://pan.baidu.com/s/1iEAJIl0ne3Y07kHd8diMag?pwd2233 提取码:2233 # 正中图 SEL…...

24.9.27学习笔记
Xavier初始化,也称为Glorot初始化,是一种在训练深度神经网络时用于初始化网络权重的策略。它的核心思想是在网络的每一层保持前向传播和反向传播时的激活值和梯度的方差尽可能一致,以避免梯度消失或梯度爆炸的问题。这种方法特别适用于激活函…...

C++第3课——保留小数点、比较运算符、逻辑运算符、布尔类型以及if-else分支语句(含视频讲解)
文章目录 1、课程笔记2、课程视频 1、课程笔记 #include<iostream>//头文件 input output #include<cmath> //sqrt()所需的头文件 #include<iomanip>//setprecision(1)保留小数点位数所需的头文件 using namespace std; int main(){/*复习上节课内容1、…...

韩媒专访CertiK首席商务官:持续关注韩国市场,致力于解决Web3安全及合规问题
作为Web3.0头部安全公司,CertiK在KBW期间联合CertiK Ventures举办的活动引起了业界的广泛关注。CertiK一直以来与韩国地方政府保持着紧密合作关系,在合规领域提供强有力的支持。而近期重磅升级的CertiK Ventures可以更好地支持韩国本地的区块链项目。上述…...

计算机毕业设计之:宠物服务APP的设计与实现(源码+文档+讲解)
博主介绍: ✌我是阿龙,一名专注于Java技术领域的程序员,全网拥有10W粉丝。作为CSDN特邀作者、博客专家、新星计划导师,我在计算机毕业设计开发方面积累了丰富的经验。同时,我也是掘金、华为云、阿里云、InfoQ等平台…...

小柴冲刺软考中级嵌入式系统设计师系列二、嵌入式系统硬件基础知识(3)嵌入式系统的存储体系
目录 感悟 一、存储系统的层次结构 存储器系统 二、内存管理单元 三、RAM和ROM的种类与选型 1、RAM RAM分类 2、ROM ROM分类 四、高速缓存Cache 五、其他存储设备 flechazohttps://www.zhihu.com/people/jiu_sheng 小柴冲刺软考中级嵌入式系统设计师系列总目录https…...

Unity android 接USBCamera
目录 一、前提 1. unity打包android后,链接USB摄像头,需要USB权限。 二、流程 1.Unity导出android工程,Player配置如图: 2.导出android工程 3.在android工程中找到AndroidManifest.xml加入usb权限相关 <?xml version&quo…...