当前位置：首页 > news >正文

【Python机器学习实战】 | 基于支持向量机（Support Vector Machine, SVM）进行分类和回归任务分析

news 2025/7/3 15:25:12

🎩 欢迎来到技术探索的奇幻世界👨‍💻

📜 个人主页：@一伦明悦-CSDN博客

✍🏻 作者简介： C++软件开发、Python机器学习爱好者

🗣️ 互动与支持：💬评论 👍🏻点赞 📂收藏 👀关注+

如果文章有所帮助，欢迎留下您宝贵的评论，

点赞加收藏支持我，点击关注，一起进步！

引言

svm.SVC是Scikit-learn中用于支持向量机（Support Vector Machine, SVM）分类任务的类。具体来说，svm.SVC实现了基于支持向量的分类器，其核心是在特征空间中找到最佳的超平面来区分不同类别的数据点。

主要参数解释：

C：

正则化参数，控制错误分类样本的惩罚力度。C值越小，容错空间越大，模型可能更简单；C值越大，容错空间越小，模型可能更复杂。

kernel：

核函数的选择，用于将数据从原始特征空间映射到更高维的空间，以便更好地分离不同类别的数据点。
常见的核函数包括线性核（‘linear’）、多项式核（‘poly’）、高斯径向基函数（RBF）核（‘rbf’）、sigmoid核等。

degree（仅在kernel='poly’时有效）：

多项式核函数的阶数。

gamma：

核函数的系数，影响模型的拟合能力。较大的gamma值可以产生更复杂的决策边界，可能导致过拟合。

class_weight：

类别权重的设置，用于处理不平衡类别问题。

probability：

是否启用概率估计。如果设置为True，则会启用概率估计，并在训练过程中计算每个类别的概率。

方法和属性：

fit(X, y)：

训练模型，X是特征数据，y是标签数据。

predict(X)：

对新数据进行预测。

decision_function(X)：

返回每个样本到决策函数的距离。

predict_proba(X)：

返回每个样本预测为各个类别的概率值（仅在probability=True时可用）。

support_：

返回支持向量的索引。

coef_和intercept_：

分别返回决策函数的系数和常数项。

示例用法：
from sklearn import svm
X = [[0, 0], [1, 1]]
y = [0, 1]
clf = svm.SVC()
clf.fit(X, y)
print(clf.predict([[2., 2.]]))
这段代码创建了一个svm.SVC分类器，并用样本X和标签y进行训练。然后，它对新的数据点[[2., 2.]]进行了预测。

总结来说，svm.SVC是一个强大的分类器，通过调整不同的参数（如C、kernel、gamma等），可以实现不同复杂度的分类模型，适用于多种分类问题。

正文

01-分类数据集，并将其可视化

这段代码的作用是生成一个简单的分类数据集，并将其可视化。

具体步骤和功能解释如下：

导入模块：

导入了需要使用的各种Python模块，如numpy用于数值计算，pandas用于数据处理，matplotlib用于绘图，以及一些机器学习相关的模块如sklearn。

设置警告过滤和绘图参数：

warnings.filterwarnings(action='ignore')：设置忽略警告，通常用于屏蔽不影响程序运行的警告信息。
%matplotlib inline：指定在Jupyter Notebook中显示matplotlib绘制的图形。
plt.rcParams：设置matplotlib绘图的一些参数，如中文字体和负号显示问题。

生成分类数据集：

使用make_classification函数生成具有两个特征的分类数据集。
n_samples=N：指定生成样本的数量为100。
n_features=2：每个样本具有2个特征。
n_redundant=0：生成的特征中不包含冗余信息。
n_informative=2：两个特征是信息性的。
class_sep=1：两个类之间的分离度为1。
random_state=1：随机数种子，确保结果可重现。
n_clusters_per_class=1：每个类别内部只有一个簇。
这些参数共同作用，生成了一个具有两个特征和两个类别的分类数据集。

数据集划分：

使用train_test_split函数将生成的数据集划分为训练集和测试集。
train_size=0.85：指定训练集占总数据的85%。
random_state=123：随机数种子，确保划分结果可重现。

数据可视化：

使用matplotlib进行数据的可视化。
markers=['^', 'o']：定义两种不同的标记样式，用于不同类别的数据点。
使用循环结构和条件筛选，分别在训练集和测试集上绘制不同类别的数据点。
plt.scatter函数用于绘制散点图，其中包括了标记样式、颜色、边缘颜色等参数。
plt.title、plt.xlabel、plt.ylabel设置图表标题和坐标轴标签。
plt.grid(True, linestyle='-.')添加网格线，并指定网格线的样式为虚线。

展示图形：

plt.show()显示生成的散点图，展示了训练集和测试集中不同类别的数据点分布情况。

总结：该段代码的主要作用是生成一个包含100个样本观测点的二维分类数据集，并通过散点图展示数据点在特征空间中的分布情况，其中训练集和测试集的不同类别用不同的标记和颜色区分开来。

#本章需导入的模块
import numpy as np
from numpy import random
import pandas as pd
import matplotlib.pyplot as plt
from mpl_toolkits.mplot3d import Axes3D
import warnings
warnings.filterwarnings(action = 'ignore')
%matplotlib inline
plt.rcParams['font.sans-serif']=['SimHei']  #解决中文显示乱码问题
plt.rcParams['axes.unicode_minus']=False
from sklearn.datasets import make_classification,make_circles,make_regression
from sklearn.model_selection import train_test_split,KFold
import sklearn.neural_network as net
import sklearn.linear_model as LM
from scipy.stats import multivariate_normal
from sklearn.metrics import r2_score,mean_squared_error,classification_report
from sklearn import svm
import osN=100
X,Y=make_classification(n_samples=N,n_features=2,n_redundant=0,n_informative=2,class_sep=1,random_state=1,n_clusters_per_class=1)
X_train, X_test, Y_train, Y_test = train_test_split(X,Y,train_size=0.85, random_state=123)
markers=['^','o']
for k,m in zip([1,0],markers):plt.scatter(X_train[Y_train==k,0],X_train[Y_train==k,1],marker=m,s=40)
for k,m in zip([1,0],markers):plt.scatter(X_test[Y_test==k,0],X_test[Y_test==k,1],marker=m,s=40,c='r',edgecolors='g')
plt.title("100个样本观测点的分布")
plt.xlabel("X1")
plt.ylabel("X2")
plt.grid(True,linestyle='-.')
plt.show()

运行结果如下图所示：

这段代码主要实现了以下功能：

生成网格数据：

使用 np.meshgrid 创建了一个密集的网格点集合 (X1, X2)，覆盖了训练数据集特征空间的范围。这样做是为了后续在整个特征空间内进行预测和可视化。

创建绘图框架：

使用 plt.subplots 创建了一个包含4个子图的图像框架，分布为2行2列，每个子图的大小为 (12, 8)。

循环训练和可视化：

使用循环遍历不同的随机种子 (123, 3000, 0, 20) 和对应的子图位置 (H, L)。
对于每个随机种子，创建一个 MLPClassifier 多层感知器模型 (NeuNet)：
activation='logistic'：指定激活函数为逻辑斯蒂函数。
random_state=seed：设置随机种子，以便结果可复现。
hidden_layer_sizes=(10,)：指定一个包含10个神经元的隐藏层。
max_iter=200：设置最大迭代次数为200。
使用 NeuNet.fit(X_train, Y_train) 对训练集进行训练。

预测和可视化分类结果：

使用训练好的模型 NeuNet 对整个特征空间 (X0) 进行预测，得到预测结果 Y0。
在每个子图中：
根据预测结果将网格点分别用灰色和淡红色表示，以显示模型预测的分类边界。
用不同的标记 ('^' 和 'o') 和颜色 ('r' 和 'g') 分别绘制训练集和测试集的数据点。
添加虚线网格以增强可读性。
设置子图标题，包括当前随机种子和测试误差率 (1 - NeuNet.score(X_test, Y_test)) 的信息。

总结：该段代码通过多次使用不同的随机种子训练 MLPClassifier 模型，并在网格点上绘制模型的分类边界，展示了模型在不同随机种子下的分类效果。每个子图展示了模型对特征空间的不同划分，帮助理解模型在决策边界上的表现。

X1,X2= np.meshgrid(np.linspace(X_train[:,0].min(),X_train[:,0].max(),300),np.linspace(X_train[:,1].min(),X_train[:,1].max(),300))
X0=np.hstack((X1.reshape(len(X1)*len(X2),1),X2.reshape(len(X1)*len(X2),1)))fig,axes=plt.subplots(nrows=2,ncols=2,figsize=(12,8))
for seed,H,L in [(123,0,0),(3000,0,1),(0,1,0),(20,1,1)]:NeuNet=net.MLPClassifier(activation='logistic',random_state=seed,hidden_layer_sizes=(10,),max_iter=200)NeuNet.fit(X_train,Y_train)#NeuNet.out_activation_  #输出节点的激活函数Y0=NeuNet.predict(X0)axes[H,L].scatter(X0[np.where(Y0==1),0],X0[np.where(Y0==1),1],c='lightgray')axes[H,L].scatter(X0[np.where(Y0==0),0],X0[np.where(Y0==0),1],c='mistyrose')for k,m in [(1,'^'),(0,'o')]:axes[H,L].scatter(X_train[Y_train==k,0],X_train[Y_train==k,1],marker=m,s=40)axes[H,L].scatter(X_test[Y_test==k,0],X_test[Y_test==k,1],marker=m,s=40,c='r',edgecolors='g')axes[H,L].grid(True,linestyle='-.')axes[H,L].set_title("分类平面(随机数种子=%d,测试误差=%.2f)"%(seed,1-NeuNet.score(X_test,Y_test)))

运行结果如下图所示：

02-线性可分下的支持向量机最大边界超平面分析

这段代码实现了以下功能：

生成数据集：

使用 make_classification 函数生成一个二维特征的分类数据集 X 和对应的标签 Y。数据集具有100个样本，每个样本包括2个特征，是一个线性可分的数据集。

数据集的可视化：

使用 train_test_split 将数据集分割成训练集 (X_train, Y_train) 和测试集 (X_test, Y_test)，其中训练集占85%。
使用 plt.scatter 绘制训练集中的样本点，分别用不同的标记 ('^' 和 'o') 表示两类样本，帮助可视化数据分布。

创建网格数据：

使用 np.meshgrid 创建密集的二维网格 (X1, X2)，覆盖了训练集特征空间的范围。这样做是为了后续在整个特征空间内进行预测和可视化。

训练支持向量机模型：

使用 svm.SVC 创建一个支持向量机分类器 modelSVC，采用线性核函数 (kernel='linear')，设置随机种子 (random_state=123) 和正则化参数 C=2。
使用 modelSVC.fit(X_train, Y_train) 对训练集进行训练，学习得到最大边界超平面以及支持向量的位置。

预测和可视化分类结果：

使用训练好的支持向量机模型 modelSVC 对整个特征空间 (X0) 进行预测，得到预测结果 Y0。
在单个图像中：
根据预测结果将网格点分别用灰色和淡红色表示，以显示模型预测的分类边界。
使用不同的标记 ('^' 和 'o') 和颜色 ('r' 和 'g') 分别绘制训练集和测试集的数据点。
使用蓝色圆圈标记支持向量的位置，并调整其透明度以区分它们。

添加图像元素：

设置图像的标题、坐标轴标签和网格线，增强图像的可读性和解释性。

总结：该段代码展示了如何使用支持向量机处理线性可分的二维数据集。通过训练模型并在特征空间中绘制分类边界和支持向量的位置，帮助理解支持向量机在数据分类中的应用及其决策边界的形成。

#本章需导入的模块
import numpy as np
from numpy import random
import pandas as pd
import matplotlib.pyplot as plt
from mpl_toolkits.mplot3d import Axes3D
import warnings
warnings.filterwarnings(action = 'ignore')
%matplotlib inline
plt.rcParams['font.sans-serif']=['SimHei']  #解决中文显示乱码问题
plt.rcParams['axes.unicode_minus']=False
from sklearn.datasets import make_classification,make_circles,make_regression
from sklearn.model_selection import train_test_split,KFold
import sklearn.neural_network as net
import sklearn.linear_model as LM
from scipy.stats import multivariate_normal
from sklearn.metrics import r2_score,mean_squared_error,classification_report
from sklearn import svm
import osN=100
X,Y=make_classification(n_samples=N,n_features=2,n_redundant=0,n_informative=2,class_sep=1,random_state=1,n_clusters_per_class=1)plt.figure(figsize=(9,6))
X_train, X_test, Y_train, Y_test = train_test_split(X,Y,train_size=0.85, random_state=123)
markers=['^','o']
for k,m in zip([1,0],markers):plt.scatter(X_train[Y_train==k,0],X_train[Y_train==k,1],marker=m,s=50)
plt.title("训练集中样本观测点的分布")
plt.xlabel("X1")
plt.ylabel("X2")
plt.grid(True,linestyle='-.')
plt.show()   N=100
X,Y=make_classification(n_samples=N,n_features=2,n_redundant=0,n_informative=2,class_sep=1,random_state=1,n_clusters_per_class=1)
X_train, X_test, Y_train, Y_test = train_test_split(X,Y,train_size=0.85, random_state=123)
X1,X2= np.meshgrid(np.linspace(X_train[:,0].min(),X_train[:,0].max(),500),np.linspace(X_train[:,1].min(),X_train[:,1].max(),500))
X0=np.hstack((X1.reshape(len(X1)*len(X2),1),X2.reshape(len(X1)*len(X2),1)))
modelSVC=svm.SVC(kernel='linear',random_state=123,C=2) #modelSVC=svm.LinearSVC(C=2,dual=False)
modelSVC.fit(X_train,Y_train)
print("超平面的常数项b：",modelSVC.intercept_)
print("超平面系数W：",modelSVC.coef_)
print("支持向量的个数：",modelSVC.n_support_)
Y0=modelSVC.predict(X0)
plt.figure(figsize=(6,4)) 
plt.scatter(X0[np.where(Y0==1),0],X0[np.where(Y0==1),1],c='lightgray')
plt.scatter(X0[np.where(Y0==0),0],X0[np.where(Y0==0),1],c='mistyrose')
for k,m in [(1,'^'),(0,'o')]:plt.scatter(X_train[Y_train==k,0],X_train[Y_train==k,1],marker=m,s=40)plt.scatter(X_test[Y_test==k,0],X_test[Y_test==k,1],marker=m,s=40,c='r',edgecolors='g')plt.scatter(modelSVC.support_vectors_[:,0],modelSVC.support_vectors_[:,1],marker='o',c='b',s=120,alpha=0.3)
plt.xlabel("X1")
plt.ylabel("X2")
plt.title("线性可分下的支持向量机最大边界超平面")
plt.grid(True,linestyle='-.')
plt.show()

运行结果如下图所示：

03-广义线性可分下的支持向量机最大边界超平面

这段代码主要包括以下几个部分：

导入必要的模块：

numpy：用于数值计算。
pandas：用于数据处理和分析。
matplotlib.pyplot：用于绘图。
mpl_toolkits.mplot3d：用于绘制3D图形。
warnings：用于控制警告输出。
sklearn 相关模块：包括生成数据集、模型选择、评估指标、支持向量机等。
scipy.stats：用于生成多维正态分布。
os：用于与操作系统进行交互。

生成样本数据和划分训练集、测试集：

使用 make_classification 生成具有分类信息的数据集，包括特征和类别标签。
使用 train_test_split 将数据集划分为训练集和测试集，比例为 0.85：0.15。

绘制训练集样本观测点的分布：

使用不同的标记符号和颜色展示训练集中两类样本点的分布情况。
设置图像标题、坐标轴标签，并显示网格线。
将绘制的图保存为文件，并展示在输出窗口中。

使用支持向量机 (SVM) 模型拟合数据和绘制决策边界：

使用线性核的 SVM 模型，分别设定不同的惩罚参数 C 值。
根据模型预测结果绘制分类边界和支持向量。
在两个子图中展示不同 C 值下的分类效果、支持向量，以及训练集、测试集样本的分布。
设置子图的标题、坐标轴标签，并显示网格线。
将绘制的图保存为文件。

整体上，这段代码主要展示了如何生成分类数据集、划分数据集、利用 SVM 模型进行分类，并通过可视化展示不同参数下的分类效果和支持向量分布。

#本章需导入的模块
import numpy as np
from numpy import random
import pandas as pd
import matplotlib.pyplot as plt
from mpl_toolkits.mplot3d import Axes3D
import warnings
warnings.filterwarnings(action = 'ignore')
%matplotlib inline
plt.rcParams['font.sans-serif']=['SimHei']  #解决中文显示乱码问题
plt.rcParams['axes.unicode_minus']=False
from sklearn.datasets import make_classification,make_circles,make_regression
from sklearn.model_selection import train_test_split,KFold
import sklearn.neural_network as net
import sklearn.linear_model as LM
from scipy.stats import multivariate_normal
from sklearn.metrics import r2_score,mean_squared_error,classification_report
from sklearn import svm
import osN=100
X,Y=make_classification(n_samples=N,n_features=2,n_redundant=0,n_informative=2,class_sep=1.2,random_state=1,n_clusters_per_class=1)
rng=np.random.RandomState(2)
X+=2*rng.uniform(size=X.shape)
X_train, X_test, Y_train, Y_test = train_test_split(X,Y,train_size=0.85, random_state=1)plt.figure(figsize=(9,6))
markers=['^','o']
for k,m in zip([1,0],markers):plt.scatter(X_train[Y_train==k,0],X_train[Y_train==k,1],marker=m,s=50)
plt.title("训练集中样本观测点的分布")
plt.xlabel("X1")
plt.ylabel("X2")
plt.grid(True,linestyle='-.')
plt.savefig("../4.png", dpi=500) 
plt.show()  N=100
X,Y=make_classification(n_samples=N,n_features=2,n_redundant=0,n_informative=2,class_sep=1.2,random_state=1,n_clusters_per_class=1)
rng=np.random.RandomState(2)
X+=2*rng.uniform(size=X.shape)
X_train, X_test, Y_train, Y_test = train_test_split(X,Y,train_size=0.85, random_state=1)
X1,X2= np.meshgrid(np.linspace(X_train[:,0].min(),X_train[:,0].max(),500),np.linspace(X_train[:,1].min(),X_train[:,1].max(),500))
X0=np.hstack((X1.reshape(len(X1)*len(X2),1),X2.reshape(len(X1)*len(X2),1)))
fig,axes=plt.subplots(nrows=1,ncols=2,figsize=(15,6))
for C,H in [(5,0),(0.1,1)]:modelSVC=svm.SVC(kernel='linear',random_state=123,C=C) modelSVC.fit(X_train,Y_train)Y0=modelSVC.predict(X0)axes[H].scatter(X0[np.where(Y0==1),0],X0[np.where(Y0==1),1],c='lightgray')axes[H].scatter(X0[np.where(Y0==0),0],X0[np.where(Y0==0),1],c='mistyrose')for k,m in [(1,'^'),(0,'o')]:axes[H].scatter(X_train[Y_train==k,0],X_train[Y_train==k,1],marker=m,s=40)axes[H].scatter(X_test[Y_test==k,0],X_test[Y_test==k,1],marker=m,s=40,c='r',edgecolors='g')axes[H].scatter(modelSVC.support_vectors_[:,0],modelSVC.support_vectors_[:,1],marker='o',c='b',s=120,alpha=0.3)axes[H].set_xlabel("X1")axes[H].set_ylabel("X2")axes[H].set_title("广义线性可分下的支持向量机最大边界超平面\n(C=%.1f,训练误差=%.2f)"%(C,1-modelSVC.score(X_train,Y_train)))axes[H].grid(True,linestyle='-.')
plt.savefig("../4.png", dpi=500)

运行结果如下图所示

04-广义线性可分下的支持向量机最大边界超平面

这段代码主要包括以下几个部分：

导入必要的模块：

numpy：用于数值计算。
pandas：用于数据处理和分析。
matplotlib.pyplot：用于绘图。
mpl_toolkits.mplot3d：用于绘制3D图形。
warnings：用于控制警告输出。
sklearn 相关模块：包括生成数据集、模型选择、评估指标、支持向量机等。
scipy.stats：用于生成多维正态分布。
os：用于与操作系统进行交互。

生成样本数据和可视化：

使用 make_circles 生成环形结构的数据集，包括特征和类别标签。
创建一个包含两个子图的大图(fig)，其中一个是 3D 散点图，另一个是二维散点图和等高线图。
在 3D 散点图中，根据数据点的位置和类别，使用不同的标记符号和颜色展示样本点的分布情况。
设置 3D 图的 x、y、z 轴标签以及标题。

在二维空间中绘制样本散点图和等高线图：

在第二个子图中，根据样本点的位置和类别，使用不同的标记符号展示样本点的分布情况。
设置二维图的标题、坐标轴标签，并显示网格线。
使用等高线图表示二维样本数据在三维空间中的分布情况。

整体上，这段代码主要展示了如何生成环形结构的数据集，并通过可视化在三维和二维空间中展示样本数据的分布情况。通过这种可视化方式，可以更直观地理解数据的特征和结构。

#本章需导入的模块
import numpy as np
from numpy import random
import pandas as pd
import matplotlib.pyplot as plt
from mpl_toolkits.mplot3d import Axes3D
import warnings
warnings.filterwarnings(action = 'ignore')
%matplotlib inline
plt.rcParams['font.sans-serif']=['SimHei']  #解决中文显示乱码问题
plt.rcParams['axes.unicode_minus']=False
from sklearn.datasets import make_classification,make_circles,make_regression
from sklearn.model_selection import train_test_split,KFold
import sklearn.neural_network as net
import sklearn.linear_model as LM
from scipy.stats import multivariate_normal
from sklearn.metrics import r2_score,mean_squared_error,classification_report
from sklearn import svm
import osN=100
X,Y=make_circles(n_samples=N,noise=0.2,factor=0.5,random_state=123)
fig = plt.figure(figsize=(20,6))
markers=['^','o']
ax = fig.add_subplot(121, projection='3d')
var = multivariate_normal(mean=[0,0], cov=[[1,0],[0,1]])
Z=np.zeros((len(X),))
for i,x in enumerate(X):Z[i]=var.pdf(x)
for k,m in zip([1,0],markers):ax.scatter(X[Y==k,0],X[Y==k,1],Z[Y==k],marker=m,s=40)
ax.set_xlabel('X1')
ax.set_ylabel('X2')
ax.set_zlabel('Z')
ax.set_title('三维空间下100个样本观测点的分布')  ax = fig.add_subplot(122)
X1,X2= np.meshgrid(np.linspace(X[:,0].min(),X[:,0].max(),500),np.linspace(X[:,1].min(),X[:,1].max(),500))
X0=np.hstack((X1.reshape(len(X1)*len(X2),1),X2.reshape(len(X1)*len(X2),1)))
Z=np.zeros((len(X0),))
for i,x in enumerate(X0):Z[i]=var.pdf(x)
for k,m in zip([1,0],markers):ax.scatter(X[Y==k,0],X[Y==k,1],marker=m,s=50)
ax.set_title("100个样本观测点在二维空间中的分布")
ax.set_xlabel("X1")
ax.set_ylabel("X2")
ax.grid(True,linestyle='-.')
contour = plt.contour(X1,X2,Z.reshape(len(X1),len(X2)),[0.12],colors='k')
#ax.clabel(contour,fontsize=10,colors=('k'))  #等高线上标明z（即高度）的值

运行结果如下图所示

总结

支持向量机（Support Vector Machine，SVM）是一种用于分类和回归分析的监督学习模型。以下是支持向量机的总结要点：

原理：

SVM的核心思想是找到一个最优的超平面，将不同类别的样本点分开，并使得两个类别的支持向量到超平面的距离最大化。
SVM在特征空间中寻找一个最优的划分超平面，最大化间隔（Margin），同时引入核技巧进行非线性分类。

优点：

可用于解决线性和非线性分类问题。
在高维空间中有效，适用于特征维度较高的数据集。
泛化能力较强，对过拟合的控制比较好。

缺点：

对大规模样本数据的训练耗时较长，不适用于数据量较大的情况。
对噪声敏感，数据集中存在噪声会影响模型性能。
需要调节核函数和正则化参数，选择合适的参数对模型性能影响较大。

应用：

SVM广泛应用于文本分类、图像识别、生物信息学、医学影像分析等领域。
在实践中，SVM被用于二分类、多分类，以及回归等任务。

核心概念：

支持向量（Support Vectors）：训练数据集中距离超平面最近的样本点。
超平面（Hyperplane）：在特征空间中将不同类别样本点分开的分界线。
间隔（Margin）：支持向量到超平面的距离。

SVM变种：

支持向量回归（Support Vector Regression，SVR）：用于回归问题。
核支持向量机（Kernel SVM）：用于处理非线性分类问题。
多类别SVM：通过一对一（One vs One）或一对其余（One vs Rest）策略处理多类别分类问题。

总的来说，支持向量机是一种强大的机器学习算法，具有良好的分类性能和泛化能力，适用于多种领域的分类和回归任务。在实际应用中，需要合理选择参数、优化模型，并根据具体问题调整算法以提高模型性能。

【Python机器学习实战】 | 基于支持向量机（Support Vector Machine, SVM）进行分类和回归任务分析

🎩 欢迎来到技术探索的奇幻世界👨‍💻 📜 个人主页：一伦明悦-CSDN博客 ✍🏻 作者简介： C软件开发、Python机器学习爱好者 🗣️ 互动与支持：💬评论 &…...

编程日记 2024/6/28 18:17:26

备份和还原

stai和dnta snat：源地址转换内网---外网内网ip转换成可以访问外网的ip 内网的多个主机可以使用一个有效的公网ip地址访问外部网络 DNAT：目的地址转发外部用户，可以通过一个公网地址访问服务内部的私网服务。私网的ip和公网ip做一个…...

编程日记 2024/6/28 18:16:24

Java数组的初始化方法

Java数组的初始化方法大家好，我是免费搭建查券返利机器人省钱赚佣金就用微赚淘客系统3.0的小编，也是冬天不穿秋裤，天冷也要风度的程序猿！在Java编程中，数组是一种非常基础也非常重要的数据结构，它能够存储…...

编程日记 2024/6/28 18:14:07

通过分离有色和无色pdf页面减少打印费

前言该工具是我认识的一位中科大的大佬在本科毕业的时候做的一个小工具，去打印店打印全彩的毕业论文的话会比较贵，他想到有没有一种方案可以实现有彩色页面的pdf和没有彩色页面的pdf分开打印，前者打印彩色，后者打印黑白&#xf…...

编程日记 2024/6/28 18:13:00

c语言--指针

前言欢迎来到我的博客个人主页:北岭敲键盘的荒漠猫-CSDN博客本文整理c语言中指针的相关知识点。指针概念指针存储的就是数据的地址。直观理解: 李华家是北洋路130号1单元101 用变量处理数据: 我们去李华家拿数据。用指针处理数据: 我们去北洋路130号1单元101拿数据…...

编程日记 2024/6/28 18:09:52

python-九九乘法表（对齐式1）

[题目描述] 输出九九乘法表，输出格式见样例。输入格式： 无输出格式： 输出乘法表，对齐方式见样例输出。样例输入无样例输出来源/分类（难度系数：一星） 完整代码展示： #对齐式1 a[] …...

编程日记 2024/6/28 18:06:47

thinkphp单独为某个接口设置缓存

参考官方文档 $this->request->cache(__URL__,600);只需要在接口方法的开头添加这个代码即可...

编程日记 2024/6/28 18:04:43

OpenCV视觉--视频人脸微笑检测（超详细，附带检测资源）

目录概述具体实现 1.加载分类器 2.打开摄像头并识别人脸 3.处理人脸并检测是否微笑效果总结概述 OpenCV（Open Source Computer Vision Library）是一个开源的计算机视觉和机器学习库，广泛应用于图像处理和视频分析等领…...

编程日记 2024/6/28 18:03:42

docker 搭建 AI大数据模型 --- 使用GPU

docker 搭建 AI大数据模型 — 使用GPU方式搭建本地大模型，最简单的方法！效果直逼GPT 服务器GPU系统HP580 G8P40Rocky9.2 安装程序AnythingLLM前端界面Open WebUIChatOllamaollama 一、AnythingLLM 介绍 AnythingLLM 是 Mintplex Labs Inc. 开发的一…...

编程日记 2024/6/28 18:02:39

面向对象, 常用类, 集合, 异常, JDBC, mysql数据库复习

1.面向对象 （1）面向过程和面向对象 ● 面向过程的程序设计思想 （procedure -Oriented Programming)，简称POP ● 关注的焦点是过程：过程就是操作数据的步骤。如果某个过程的实现代码重复出现，那么就可…...

编程日记 2024/6/28 18:01:38

js取数组最大值之Math.max、Math.max.apply

js取数组最大值之Math.max、Math.max.apply Math.maxMath.max.applyapply()第一个参数为什么可以是null 最小值同理 Math.max Math.max(n1,n2,n3,…,nX) 支持传递多个参数，带有较大的值的那个数 Math.max(2,5,3,6,2,4,2,15,9,6,0,1)Math.max.apply apply() 语法&a…...

编程日记 2024/6/28 18:00:36

各种中间件的安装

文章目录 20232306mysql的wondows安装 2023 2306 mysql的wondows安装常用mysql教程 springboot整合druid连接池SpringBoot配置Druid连接池 mysql的wondows安装 MySQL学习笔记 01、MySQL安装这个是安装的具体思路 win10 安装 mysql 5.7 msi版的教程图文详解这个是安装的…...

编程日记 2024/6/28 17:59:34

【Mysql】多表查询、隐式内链接、显式内连接、左外连接、右外连接

多表查询什么是多表查询 •DQL: 查询多张表,获取到需要的数据 •比如我们要查询家电分类下都有哪些商品,那么我们就需要查询分类与商品这两张表数据准备创建db3_2 数据库 -- 创建 db3_2 数据库,指定编码 CREATE DATABASE db3_2 CHARACTER SET utf8;创建分类表与商品表 …...

编程日记 2024/6/28 17:57:32

Linux驱动开发（三）--新字符设备驱动开发 LED驱动开发升级

1、新字符设备驱动原理使用 register_chrdev 函数注册字符设备的时候只需要给定一个主设备号即可，但是这样会带来两个问题需要我们事先确定好哪些主设备号没有使用会将一个主设备号下的所有次设备号都使用掉，比如现在设置 LED 这个主设备号为200&…...

编程日记 2024/6/28 17:54:29

MCU的最佳存储方案CS创世 SD NAND

大家都知道MCU是一种"麻雀"虽小，却"五脏俱全"的主控。它的应用领域非常广泛，小到手机手表，大到航空航天的设备上都会用到MCU.市面上目前几个主流厂商有意法半导体（其中最经典的一款就是STM32系列）…...

编程日记 2024/6/28 17:53:26

40岁学习java是否需要报班学习?

在开始前刚好我有一些资料，是我根据网友给的问题精心整理了一份「java的资料从专业入门到高级教程」， 点个关注在评论区回复“666”之后私信回复“666”，全部无偿共享给大家！！！应该不需要。各种公开免费的…...

编程日记 2024/6/28 17:52:25

Vitis Accelerated Libraries 学习笔记--OpenCV 运行测试

目录 1. 简介 2. 实例测试 2.1 实例介绍 2.2 创建工程 2.2.1 创建工程 2.2.2 获取路径 2.2.3 设置路径 2.2.4 打开工程 2.2.5 添加文件 2.2.6 启动 GUI 2.2.7 配置 csim 参数 3 常见错误 3.1 核心共享库报错 4. 总结 1. 简介在《Vitis Accelerated Libraries …...

编程日记 2024/6/28 17:51:24

加固三防平板如何提高轨道交通系统的运营效率？

在当今快节奏的社会中，轨道交通系统作为城市交通的重要组成部分，其运营效率的提升对于缓解交通拥堵、满足人们的出行需求以及促进城市的发展具有至关重要的意义。而加固三防平板作为一种先进的技术设备，正逐渐在轨道交通领域发挥着关键作用&a…...

编程日记 2024/6/28 17:50:23

Django 靓号管理系统：实现登录功能

本文将详细介绍如何在 Django 靓号管理系统中实现登录功能，包括用户认证、验证码生成、以及中间件的使用。我们将逐步展示所有相关代码，并附带详细注释。 1. 项目结构首先，让我们看一下项目的基本结构： number ├── manage.py ├── monaco.ttf ├── number │ …...

编程日记 2024/6/28 17:48:21

【Solr 学习笔记】Solr 源码启动教程

Solr 源码启动教程本教程记录了如何通过 IDEA 启动并调试 Solr 源码，从 Solr9 开始 Solr 项目已由 ant 方式改成了 gradle 构建方式，本教程将以 Solr 9 为例进行演示，IDE 选择使用 IntelliJ IDEA。 Solr github 地址：https://gi…...

编程日记 2024/6/28 17:47:19

地震勘探——干扰波识别、井中地震时距曲线特点

目录干扰波识别反射波地震勘探的干扰波井中地震时距曲线特点干扰波识别有效波：可以用来解决所提出的地质任务的波；干扰波：所有妨碍辨认、追踪有效波的其他波。地震勘探中，有效波和干扰波是相对的。例如，在反射波…...

编程新知 2025/7/1 10:09:55

基于大模型的 UI 自动化系统

基于大模型的 UI 自动化系统下面是一个完整的 Python 系统，利用大模型实现智能 UI 自动化，结合计算机视觉和自然语言处理技术，实现"看屏操作"的能力。系统架构设计 #mermaid-svg-2gn2GRvh5WCP2ktF {font-family:"trebuchet ms",verdana,arial,sans-…...

编程新知 2025/6/21 5:42:11

【HTTP三个基础问题】

面试官您好！HTTP是超文本传输协议，是互联网上客户端和服务器之间传输超文本数据（比如文字、图片、音频、视频等）的核心协议，当前互联网应用最广泛的版本是HTTP1.1，它基于经典的C/S模型，也就是客…...

编程新知 2025/6/16 8:33:33

uniapp手机号一键登录保姆级教程（包含前端和后端）

目录前置条件创建uniapp项目并关联uniClound云空间开启一键登录模块并开通一键登录服务编写云函数并上传部署获取手机号流程(第一种) 前端直接调用云函数获取手机号（第三种）后台调用云函数获取手机号错误码常见问题前置条件手机安装有sim卡手机开启…...

编程新知 2025/6/18 7:02:36

yaml读取写入常见错误 (‘cannot represent an object‘, 117)

错误一：yaml.representer.RepresenterError: (‘cannot represent an object’, 117) 出现这个问题一直没找到原因，后面把yaml.safe_dump直接替换成yaml.dump，确实能保存，但出现乱码： 放弃yaml.dump，又切…...

编程新知 2025/7/2 1:42:34

__VUE_PROD_HYDRATION_MISMATCH_DETAILS__ is not explicitly defined.

这个警告表明您在使用Vue的esm-bundler构建版本时，未明确定义编译时特性标志。以下是详细解释和解决方案： ‌问题原因‌： 该标志是Vue 3.4引入的编译时特性标志，用于控制生产环境下SSR水合不匹配错误的详细报告1使用esm-bundler…...

编程新知 2025/6/13 23:21:17

Gitlab + Jenkins 实现 CICD

CICD 是持续集成（Continuous Integration, CI）和持续交付/部署（Continuous Delivery/Deployment, CD）的缩写，是现代软件开发中的一种自动化流程实践。下面介绍 Web 项目如何在代码提交到 Gitlab 后，自动发布…...

编程新知 2025/6/26 0:05:21

【中间件】Web服务、消息队列、缓存与微服务治理：Nginx、Kafka、Redis、Nacos 详解

Nginx 是什么：高性能的HTTP和反向代理Web服务器。怎么用：通过配置文件定义代理规则、负载均衡、静态资源服务等。为什么用：提升Web服务性能、高并发处理、负载均衡和反向代理。优缺点：轻量高效，但动态处理能力较弱&am…...

编程新知 2025/6/25 14:24:26

timestamp时间戳转换工具

作为一名程序员，一款高效的在线转换工具 （在线时间戳转换计算器字节单位转换 json格式化）必不可少！https://jsons.top 排查问题时非常痛的点: 经常在秒级、毫秒级、字符串格式的时间单位来回转换，于是决定手撸一个…...

编程新知 2025/6/25 23:36:46

React与原生事件：核心差异与性能对比解析

💝💝💝欢迎莅临我的博客，很高兴能够在这里和您见面！希望您在这里可以感受到一份轻松愉快的氛围，不仅可以获得有趣的内容和知识，也可以畅所欲言、分享您的想法和见解。推荐：「storms…...

编程新知 2025/7/1 17:58:16

引言

正文

01-分类数据集，并将其可视化

02-线性可分下的支持向量机最大边界超平面分析

03-广义线性可分下的支持向量机最大边界超平面

04-广义线性可分下的支持向量机最大边界超平面

总结

相关文章：