当前位置: 首页 > news >正文

【52 机器学习 | 基于KNN近邻和随机森林模型对用户转化进行分析与预测】

文章目录

  • 🏳️‍🌈 1. 导入模块
  • 🏳️‍🌈 2. Pandas数据处理
    • 2.1 读取数据
    • 2.2 查看数据信息
    • 2.3 字段说明
    • 2.4 删除重复值
    • 2.5 删除空值
  • 🏳️‍🌈 3. 数据分析-特征分析
    • 3.1 年龄及转化率分析
    • 3.2 各营销渠道人数及转化率分析
    • 3.3 各营销类型人数及转化率分析
    • 3.4 营销花费分析
    • 3.5 网站点击率分析
    • 3.6 客户访问网站总次数与转化率分析
    • 3.7 客户每次访问网站时间与转化率分析
  • 🏳️‍🌈 4. 模型分析
    • 4.1 各特征相关性热图
    • 4.2 KNN近邻算法
      • 4.2.1 找到高精度的k值
      • 4.2.2 模型准确性
      • 4.2.3 混淆矩阵
      • 4.2.4 ROC曲线
    • 4.3 随机森林
      • 4.3.1 模型准确性
      • 4.3.2 混淆矩阵
      • 4.3.3 ROC曲线
      • 4.3.4 ROC曲线-置信区间
    • 4.4 特征重要性
  • 🏳️‍🌈 5. 总结
  • 🏳️‍🌈 6. 可视化项目源码+数据

大家好,我是 👉 【Python当打之年(点击跳转)】

本期将利用KNN近邻算法和随机森林模型对用户转化率进行分析与预测 ,看看两个模型更适合对此类问题进行预测,以及哪些特征量对用户转化率影响比较大,希望对大家有所帮助,如有疑问或者需要改进的地方可以联系小编。

涉及到的库:

  • Pandas — 数据处理
  • Matplotlib/Seaborn — 数据可视化
  • Sklearn — 机器学习

🏳️‍🌈 1. 导入模块

import seaborn as sns
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import warnings
warnings.filterwarnings('ignore')
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus'] = False

🏳️‍🌈 2. Pandas数据处理

2.1 读取数据

df1 = pd.read_csv('./用户转化预测数据集.csv')

在这里插入图片描述

2.2 查看数据信息

df.info()

在这里插入图片描述

2.3 字段说明

在这里插入图片描述

2.4 删除重复值

df = df.drop_duplicates()

2.5 删除空值

df = df.drop_duplicates()

🏳️‍🌈 3. 数据分析-特征分析

3.1 年龄及转化率分析

def get_Age_analyze1():fig = plt.figure(figsize=(12, 6), dpi=80)axis1 = fig.add_axes((0.1, 0.1, 0.8, 0.8))axis1.set_xlabel('年龄(岁)', color=color1, fontsize=size)axis1.set_ylabel('人数', color=color1, fontsize=size)axis1.tick_params('both', colors=color1, labelsize=size)sns.histplot(df['Age'], kde=True, bins=10)axis1.grid(True, which='both', linestyle='--', linewidth=0.5)plt.title('年龄分布',size=16) 

在这里插入图片描述

def get_Age_analyze2():fig = plt.figure(figsize=(12, 6), dpi=80)axis1 = fig.add_axes((0.1, 0.1, 0.8, 0.8))axis2 = axis1.twinx()# 绘制baraxis1.bar(labels, y_data1, label='人数',color=color1, alpha=0.8)axis1.set_ylim(0, 2500)axis1.set_ylabel('人数', color=color1, fontsize=size)axis1.tick_params('both', colors=color1, labelsize=size)for i, (xt, yt) in enumerate(zip(labels, y_data1)):axis1.text(xt, yt + 50, f'{yt:.2f}',size=size,ha='center', va='bottom', color=color1)# 绘制plotaxis2.plot(labels, y_data2,label='转化率', color=range_color[-1], marker="o", linewidth=2)axis2.set_ylabel('转化率(%)', color=color2,fontsize=size)axis2.tick_params('y', colors=color2, labelsize=size)axis2.set_ylim(80, 90)for i, (xt, yt) in enumerate(zip(labels, y_data2)):axis2.text(xt, yt + 0.3, f'{yt:.2f}',size=size,ha='center', va='bottom', color=color2)axis1.legend(loc=(0.88, 0.92))axis2.legend(loc=(0.88, 0.87))plt.gca().spines["left"].set_color(range_color[0])plt.gca().spines["right"].set_color(range_color[-1])plt.gca().spines["left"].set_linewidth(2)plt.gca().spines["right"].set_linewidth(2)plt.title("各年龄人数及转化率分布",size=16)

在这里插入图片描述

  • 客户年龄集中分布在10-70岁之间
  • 不同年龄段的客户转化率波动不大,所以年龄对客户是否转化没有太大影响

3.2 各营销渠道人数及转化率分析

def get_CampaignChannel_analyze():fig = plt.figure(figsize=(12, 6), dpi=80)axis1 = fig.add_axes((0.1, 0.1, 0.8, 0.8))# (left, bottom, width, height)axis2 = axis1.twinx()# 绘制baraxis1.bar(x_data, y_data1, label='人数',color=range_color[2], alpha=0.8)axis1.set_ylim(0, 2500)axis1.set_ylabel('人数', color=color1, fontsize=size)axis1.tick_params('both', colors=color1, labelsize=size)for i, (xt, yt) in enumerate(zip(x_data, y_data1)):axis1.text(xt, yt + 50, f'{yt:.2f}',size=size,ha='center', va='bottom', color=range_color[2])# 绘制plotaxis2.plot(x_data, y_data2,label='转化率', color=color2, marker="o", linewidth=2)axis2.set_ylabel('转化率(%)', color=color2,fontsize=size)axis2.tick_params('y', colors=color2, labelsize=size)axis2.set_ylim(80, 90)for i, (xt, yt) in enumerate(zip(x_data, y_data2)):axis2.text(xt, yt + 0.3, f'{yt:.2f}',size=size,ha='center', va='bottom', color=color2)axis1.legend(loc=(0.88, 0.92))axis2.legend(loc=(0.88, 0.87))plt.gca().spines["left"].set_color(range_color[2])plt.gca().spines["right"].set_color(range_color[-1])plt.gca().spines["left"].set_linewidth(2)plt.gca().spines["right"].set_linewidth(2)plt.title("各渠道人数及转化率分布",size=16)

在这里插入图片描述

  • 五个不同营销渠道的用户转化率波动在2%以内,所以营销渠道对客户是否转化没有太大影响

3.3 各营销类型人数及转化率分析

在这里插入图片描述

  • 不同营销类型的用户转化率波动最大接近10%,所以营销类型对客户是否转化有一定的影响

3.4 营销花费分析

def get_AdSpend_analyze1():fig = plt.figure(figsize=(12, 6), dpi=80)axis1 = fig.add_axes((0.1, 0.1, 0.8, 0.8))axis1.set_xlabel('营销花费(美元)', color=color1, fontsize=size)axis1.set_ylabel('人数', color=color1, fontsize=size)axis1.tick_params('both', colors=color1, labelsize=size)sns.histplot(df['AdSpend'], kde=True, bins=10)axis1.grid(True, which='both', linestyle='--', linewidth=0.5)plt.title('营销花费分布',size=16)

在这里插入图片描述
在这里插入图片描述

  • 不同营销花费的用户转化率波动比较明显,最大超过了10%,所以营销花费对客户是否转化有明显的影响

3.5 网站点击率分析

def get_ClickThroughRate_analyze1():fig = plt.figure(figsize=(12, 6), dpi=80)axis1 = fig.add_axes((0.1, 0.1, 0.8, 0.8))axis1.set_xlabel('网站点击率(%)', color=color1, fontsize=size)axis1.set_ylabel('人数', color=color1, fontsize=size)axis1.tick_params('both', colors=color1, labelsize=size)sns.histplot(df['ClickThroughRate'], kde=True, bins=10)axis1.grid(True, which='both', linestyle='--', linewidth=0.5)plt.title('网站点击率分布',size=16)

在这里插入图片描述
在这里插入图片描述

  • 不同点击率的用户转化率波动同样比较明显,最大超过了10%,所以点击率对客户是否转化也有明显的影响

3.6 客户访问网站总次数与转化率分析

def get_WebsiteVisits_analyze1():fig = plt.figure(figsize=(12, 6), dpi=80)axis1 = fig.add_axes((0.1, 0.1, 0.8, 0.8))axis1.set_xlabel('访问网站总次数', color=color1, fontsize=size)axis1.set_ylabel('人数', color=color1, fontsize=size)axis1.tick_params('both', colors=color1, labelsize=size)sns.histplot(df['WebsiteVisits'], kde=True, bins=10)axis1.grid(True, which='both', linestyle='--', linewidth=0.5)plt.title('访问网站总次数分布',size=16)

在这里插入图片描述
在这里插入图片描述

  • 不同客户访问网站总次数的用户转化率波动比较明显,最大超过了10%,所以客户访问网站总次数对客户是否转化有明显的影响

3.7 客户每次访问网站时间与转化率分析

def get_TimeOnSite_analyze1():fig = plt.figure(figsize=(12, 6), dpi=80)axis1 = fig.add_axes((0.1, 0.1, 0.8, 0.8))axis1.set_xlabel('每次访问平均时间', color=color1, fontsize=size)axis1.set_ylabel('人数', color=color1, fontsize=size)axis1.tick_params('both', colors=color1, labelsize=size)sns.histplot(df['TimeOnSite'], kde=True, bins=10)axis1.grid(True, which='both', linestyle='--', linewidth=0.5)plt.title('每次访问平均时间分布',size=16)

在这里插入图片描述
在这里插入图片描述

  • 不同客户每次访问网站时间的用户转化率波动比较明显,所以客户每次访问网站时间对客户是否转化有明显的影响。

🏳️‍🌈 4. 模型分析

from sklearn.preprocessing import LabelEncoder
from sklearn.neighbors import KNeighborsClassifier
from sklearn.ensemble import RandomForestClassifier
from sklearn.utils import resample
from scipy.interpolate import interp1d
from sklearn.metrics import confusion_matrix, roc_auc_score, roc_curve, auc
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score

4.1 各特征相关性热图

def get_model_analyze(): corrdf = data.corr()plt.figure(figsize=(12, 12), dpi=80)sns.heatmap(corrdf, annot=True,cmap="rainbow", linewidths=0.05,square=True,annot_kws={"size":8}, cbar_kws={'shrink': 0.8})plt.title("各特征相关性热图",size=16)

在这里插入图片描述

  • 通过各特征相关性热图可以看出:AdSpend、ClickThroughRate、ConversionRate、WebsiteVisits、PagesPerVisit、TimeOnSite、EmailOpens、EmailClicks、PreviousPurchases、LoyaltyPoints等特征量相较于其他特征量对用户是否转化有较明显的影响

4.2 KNN近邻算法

4.2.1 找到高精度的k值

k_values = range(1, 21)
accuracies = []
for k in k_values:model = KNeighborsClassifier(n_neighbors=k)model.fit(x_train, y_train)y_pred = model.predict(x_test.values)accuracy = accuracy_score(y_test, y_pred)accuracies.append(accuracy)

在这里插入图片描述

  • k = 15 时,模型的精度最高,达到 0.88625

4.2.2 模型准确性

model = KNeighborsClassifier(n_neighbors=best_k)
model.fit(x_train, y_train)
train_accuracy = accuracy_score(y_train, model.predict(x_train.values))
test_accuracy = accuracy_score(y_test, model.predict(x_test.values))y_pred = model.predict(x_test.values)
accuracy = accuracy_score(y_test, y_pred)
conf_matrix = confusion_matrix(y_test, y_pred)

4.2.3 混淆矩阵

在这里插入图片描述

4.2.4 ROC曲线

def get_model_roc1():y_probs = model.predict_proba(x_test.values)[:, 1]fpr, tpr, thresholds = roc_curve(y_test, y_probs)auc = roc_auc_score(y_test, y_probs)fig = plt.figure(figsize=(12, 6), dpi=80)axis1 = fig.add_axes((0.1, 0.1, 0.8, 0.8))axis1.tick_params('both', colors=color1, labelsize=size)axis1.plot(fpr, tpr, color='blue', lw=2, label=f'AUC = {auc:.2f}')axis1.plot([0, 1], [0, 1], color='gray', linestyle='--')plt.xlim([0.0, 1.0])plt.ylim([0.0, 1.05])plt.xlabel('假正率',color=color1, fontsize=size)plt.ylabel('召回率',color=color1, fontsize=size)plt.title(f'ROC曲线 - {type(model).__name__}',size=16)plt.legend(loc="lower right",fontsize=size)

在这里插入图片描述

  • AUC = 0.57
  • AUC = 1,是完美分类器,采用这个预测模型时,存在至少一个阈值能得出完美预测
  • 0.5 < AUC < 1,优于随机猜测。这个分类器妥善设定阈值的话,能有预测价值
  • AUC = 0.5,跟随机猜测一样(例:抛硬币),模型没有预测价值
  • AUC < 0.5,比随机猜测还差

4.3 随机森林

4.3.1 模型准确性

x_data = data.drop(columns=['Conversion'])
y = data['Conversion']
x_train, x_test, y_train, y_test = train_test_split(x_data, y, test_size=0.2, random_state=7)
model = RandomForestClassifier(random_state=15)
model.fit(x_train, y_train)y_pred = model.predict(x_test)
accuracy = accuracy_score(y_test, y_pred)
conf_matrix = confusion_matrix(y_test, y_pred)

4.3.2 混淆矩阵

在这里插入图片描述

4.3.3 ROC曲线

在这里插入图片描述

  • AUC = 0.83,效果比KNN更好

4.3.4 ROC曲线-置信区间

def get_model_roc3():# 计算原始ROC曲线的FPR, TPR, 和thresholdsfpr_orig, tpr_orig, thresholds_orig = roc_curve(y_test, y_probs)# 计算多个ROC曲线for i in range(n_bootstraps):x_resample, y_resample = resample(x_test, y_test)y_probs_resample = model.predict_proba(x_resample)[:, 1]fpr_resample, tpr_resample, _ = roc_curve(y_resample, y_probs_resample)# 线性插值fpr_interp = interp1d(np.linspace(0, 1, len(fpr_resample)), fpr_resample, fill_value="extrapolate")(np.linspace(0, 1, len(fpr_orig)))tpr_interp = interp1d(np.linspace(0, 1, len(tpr_resample)), tpr_resample, fill_value="extrapolate")(np.linspace(0, 1, len(tpr_orig)))fpr_bootstraps[i] = fpr_interptpr_bootstraps[i] = tpr_interp# 计算置信区间tpr_ci = np.percentile(tpr_bootstraps, [2.5, 97.5], axis=0)# 绘制ROC曲线和置信区间plt.figure(figsize=(12, 6), dpi=80)plt.plot(fpr_orig, tpr_orig, color='blue', lw=2, label=f'AUC = {auc:.2f}')plt.fill_between(fpr_orig, tpr_ci[0], tpr_ci[1], color='blue', alpha=0.2, label='95%置信区间')plt.plot([0, 1], [0, 1], color='gray', linestyle='--') # 随机猜测线plt.xlim([0.0, 1.0])plt.ylim([0.0, 1.05])plt.xlabel('假正率',color=color1, fontsize=size)plt.ylabel('召回率',color=color1, fontsize=size)plt.title('ROC曲线 - 95%置信区间')

在这里插入图片描述

4.4 特征重要性

def get_feature_importances():x_data = features_rf['特征'].tolist()y_data = features_rf['重要度'].tolist()fig = plt.figure(figsize=(12, 6), dpi=80)ax = fig.add_axes((0.1, 0.1, 0.8, 0.8))ax.set_xlim(0, 0.1)ax.tick_params('both', colors=color1, labelsize=size)bars = ax.barh(x_data, y_data, color=range_color[1])for bar in bars:w = bar.get_width()ax.text(w+0.001, bar.get_y()+bar.get_height()/2, '%.4f'%w, ha='left', va='center')plt.xlabel('重要度',color=color1, fontsize=size)plt.ylabel('特征',color=color1, fontsize=size)plt.title('随机森林特征重要性',size=16)plt.grid(True, which='both', linestyle='--', linewidth=0.5)plt.tight_layout()plt.show()

在这里插入图片描述

  • 点击转化率、每次访问平均在网站上花费的时间、点击率、每次访问网站总页数、营销花费、忠诚度积分、访问网站总次数、电子邮件被打开次数等特征对用户是否转化有显著性影响。

🏳️‍🌈 5. 总结

  • 通过对特征量进行分析,可以看出,年龄、营销活动传递渠道、营销类型等特征对用户是否转化没有显著的影响,营销花费、点击率、点击转化率、访问网站总次数、每次访问平均在网站上花费的时间等特征对用户是否转化有显著的影响。
  • 通过KNN和随机森林模型的预测对比,随机森林的模型准确性、AUC数值方面要优于KNN近邻模型,可以通过该模型去预测用户北转化的概率。
  • 从特征重要性图中可以看出,点击转化率、每次访问平均在网站上花费的时间、点击率、每次访问网站总页数、营销花费、忠诚度积分、访问网站总次数、电子邮件被打开次数等特征对用户是否转化有显著性影响,后期营销策略应着重优化这些方面,以提高用户的转化率。

🏳️‍🌈 6. 可视化项目源码+数据

点击跳转:【全部可视化项目源码+数据】


以上就是本期为大家整理的全部内容了,赶快练习起来吧,原创不易,喜欢的朋友可以点赞、收藏也可以分享注明出处)让更多人知道。

相关文章:

【52 机器学习 | 基于KNN近邻和随机森林模型对用户转化进行分析与预测】

文章目录 &#x1f3f3;️‍&#x1f308; 1. 导入模块&#x1f3f3;️‍&#x1f308; 2. Pandas数据处理2.1 读取数据2.2 查看数据信息2.3 字段说明2.4 删除重复值2.5 删除空值 &#x1f3f3;️‍&#x1f308; 3. 数据分析-特征分析3.1 年龄及转化率分析3.2 各营销渠道人数及…...

【Linux】Zookeeper 部署

Zookeeper 搭建方式 单机模式&#xff1a;Zookeeper只运行在一台服务器上&#xff0c;适合测试环境伪集群模式&#xff1a;就是在一台物理机上运行多个Zookeeper 实例&#xff1b;集群模式&#xff1a;Zookeeper运行于一个集群上&#xff0c;适合生产环境&#xff0c;这个计算…...

配置mysql 主主模式 GTID

文章目录 一、前提二、修改my.cnf主1 10.255.131.9主2 10.255.131.10 三、配置主主3.1 配置主 10.255.131.93.2 配置从 10.255.131.103.3 配置主 10.255.131.103.4 配置从 10.255.131.9 四、验证五、同步问题排查以及恢复5.1 查看同步状态5.2 查看同步是否数据一致性&#xff0…...

推荐一款多显示器屏幕亮度调节工具:Twinkle Tray

Twinkle Tray中文版使您可以轻松管理多台显示器的亮度级别。 尽管 Windows 10 能够调节大多数显示器的背光&#xff0c;但它通常不支持外部显示器。 Windows 还缺乏管理多台显示器的亮度的任何功能。 该应用程序将一个新图标插入系统托盘&#xff0c;您可以在其中单击以立即访问…...

第十一章 Shiro会话管理和加密

学习目标 11.1 会话管理11.1.1 会话相关API一、获取会话二、会话属性管理三、会话信息获取四、会话控制五、会话监听六、会话DAO七、会话验证 11.2 缓存一、缓存接口二、内置缓存实现三、配置缓存四、使用缓存五、缓存清理六、注意事项 前面两章我们已经掌握了Shiro四大基石的认…...

DDR4单个DQ仿真实战(一)

目录 引言1、新建Workspace2、导入brd文件3、在SiPro中打开Layout&#xff1a;查看并编辑叠层4、PCB剪裁&#xff08;可选&#xff09;5、创建SiPro6、创建分析模型7、查看分析结果8、创建原理图9、系统行为级仿真 引言 DDR4仿真将按照以下几个步骤进行&#xff1a; 新建Work…...

Android Studio插件版本与Gradle 版本对应关系

一、背景 Android Studio 构建系统以 Gradle 为基础&#xff0c;并且 Android Gradle 插件添加了几项专用于构建 Android 应用的功能。 虽然 Android 插件通常会与 Android Studio 的更新步调保持一致&#xff0c;但插件&#xff08;以及 Gradle 系统的其余部分&#xff09;可…...

Uni-App-01

HBuilder安装卸载 安装 官网地址&#xff1a;https://www.dcloud.io/hbuilderx.html 下载HBuilder最新版 解压到安装目录&#xff0c;路径中不要有中文和空格 在桌面上增加快捷方式 卸载 执行reset.bat 删除HBuilder文件夹&#xff08;如果提示文件被占用&#xff0…...

Java版本鸿鹄工程项目管理系统源码概述

项目背景 随着企业规模的扩大和业务的复杂化&#xff0c;传统的工程项目管理方式已经无法满足高效、准确、实时的管理需求。为了提高工程管理效率、优化资源配置、降低风险并控制成本&#xff0c;企业决定通过数字化转型&#xff0c;构建一个基于Spring Cloud、Spring Boot、M…...

基于echarts、php、Mysql开发的数据可视化大屏

大屏效果展示 管理员进入数据可视化页面将看到数据可视化大屏。大屏内容包括两个条形图&#xff0c;用于统计当前网站所有用户的MBTI 16型人格分布&#xff1b;玫瑰图&#xff0c;用于展示当前网站用户MBTI四个维度&#xff0c;八个字母的占比&#xff1b;折线图&#xff0c;用…...

Me-and-My-Girlfriend-1

Me-and-My-Girlfriend-1 解题 信息收集 nmap扫描存活主机 我的虚拟机为131 所以发现130为目标靶机。 查看网站&#xff0c;找到可利用点 使用浏览器查看&#xff0c;使用xff伪造本地用户。 注册用户cat&#xff0c;观察url有url_id,改为5&#xff0c;发现alice用户。 将…...

R语言实现GWAS meta分析(1)

1、基于数据集的Meta分析 datafilenamec("data1.txt","data2.txt"), setwd(workdir) library(Metalgwas) a1 name1c() for(i in datafilename){ assign(paste("file",a,sep""),data.table::fread(paste(getwd(),"/","…...

Kafka-代码示例

一、构建开发环境 File > New > Project 选择一个最简单的模板 项目和坐标命名 配置maven路径 添加maven依赖 <dependencies><!-- https://mvnrepository.com/artifact/org.apache.kafka/kafka-clients --><dependency><groupId>org.apache.kaf…...

LLVM - 编译器前端-llvm 基本块、指令、函数 的关系

一:基础概念: 在 LLVM 中,基本块、指令和函数是构建中间表示(IR)的核心概念,它们之间有着紧密的关系,首先了解下基本概念。 1. 基本块(Basic Block) 定义:基本块是一个不包含任何跳转指令的线性代码段,执行顺序是从头到尾。每个基本块至少有一个入口和一个出口。特…...

探索人工智能在自然语言处理中的应用

探索人工智能在自然语言处理中的应用 前言1. 机器翻译2. 情感分析3. 智能客服4. 文本生成未来展望 结语 前言 在信息爆炸的时代&#xff0c;自然语言处理&#xff08;NLP&#xff09;作为人工智能&#xff08;AI&#xff09;的一个重要分支&#xff0c;正以前所未有的速度改变着…...

IFC模型文本的含义

以下代码是一个STEP文件&#xff08;ISO-10303-21标准&#xff09;&#xff0c;它是一种用于表示产品数据的国际标准。STEP文件通常用于在不同的计算机辅助设计&#xff08;CAD&#xff09;系统之间交换数据。下面是对这段代码的逐行解释&#xff1a; HEADER部分&#xff1a; …...

构建高效评奖系统:SpringBoot在教育领域的应用

摘要 随着信息技术在管理上越来越深入而广泛的应用&#xff0c;管理信息系统的实施在技术上已逐步成熟。本文介绍了学生评奖评优管理系统的开发全过程。通过分析学生评奖评优管理系统管理的不足&#xff0c;创建了一个计算机管理学生评奖评优管理系统的方案。文章介绍了学生评奖…...

「二叉树进阶题解:构建、遍历与结构转化全解析」

文章目录 根据二叉树创建字符串思路代码 二叉树的层序遍历思路代码 二叉树的最近公共祖先思路代码 二叉搜索树与双向链表思路代码 从前序与中序遍历序列构造二叉树思路代码 总结 根据二叉树创建字符串 题目&#xff1a; 样例&#xff1a; 可以看见&#xff0c;唯一特殊的就…...

在使用代理IP时,需要注意以下几点:

1. 代理IP的质量和稳定性直接影响爬虫的效果。因此&#xff0c;我们需要定期更新代理IP列表&#xff0c;并筛选出可用的代理IP。 2. 有些代理IP可能存在被目标网站封禁的风险。因此&#xff0c;我们需要合理使用代理IP&#xff0c;避免过度频繁地访问目标网站。 3. 在使用代…...

深入理解Java基础概念的高级应用(1/5)

目录 1. Java内存模型&#xff1a;堆、栈与方法区 示例代码&#xff1a;对象存储位置 2. 类加载器的工作原理 示例代码&#xff1a;自定义类加载器 3. JVM如何执行字节码 字节码指令示例 4. Java基础数据类型的存储与操作 自动装箱与拆箱 示例代码&#xff1a;基础类型…...

高可用HA软件

高可用HA&#xff08;High Availability&#xff09;软件在分布式系统架构设计中至关重要&#xff0c;它们能够减少系统停机时间&#xff0c;确保应用程序持久、不间断地提供服务。以下是四款常用的高可用HA软件介绍&#xff1a; Keepalived Keepalived起初是为LVS&#xff08;…...

《近似线性可分支持向量机的原理推导》 拉格朗日函数 公式解析

本文是将文章《近似线性可分支持向量机的原理推导》中的公式单独拿出来做一个详细的解析&#xff0c;便于初学者更好的理解。 公式 9-41 解释&#xff1a; L ( w , b , ξ , α , μ ) 1 2 ∥ w ∥ 2 C ∑ i 1 N ξ i − ∑ i 1 N α i ( y i ( w T x i b ) − ( 1 − ξ …...

9.指针和字符串string类型

指针和字符串string类型 1.指针2.字符串string类型 1.指针 C完全兼容C语言指针&#xff0c;C多出一个this指针 交换两数 #include <iostream>using namespace std;void swap(int *a,int *b){int temp;temp *a;*a *b;*b temp; }int main() {//交换前int a 50;int b …...

八,Linux基础环境搭建(CentOS7)- 安装Mysql和Hive

Linux基础环境搭建&#xff08;CentOS7&#xff09;- 安装Mysql和Hive 大家注意以下的环境搭建版本号&#xff0c;如果版本不匹配有可能出现问题&#xff01; 一、Mysql下载及安装 MySQL是一个关系型数据库管理系统&#xff0c;由瑞典MySQL AB 公司开发&#xff0c;属于 Orac…...

海量数据面试题

⭐️前言⭐️ 本篇文章主要针对在面试时可能涉及到的海量数据的面试题&#xff0c;该类型面试题常常考虑通过位图、布隆过滤器或者哈希的方式来解决。 &#x1f349;欢迎点赞 &#x1f44d; 收藏 ⭐留言评论 &#x1f349;博主将持续更新学习记录收获&#xff0c;友友们有任何…...

基于SSM积分商城管理系统的设计与实现(源码+lw+部署文档+讲解等)

前言 伴随着基础网络设施的不断进步和终端电子设备的高度普及&#xff0c;互联网用户规模越来越大。现在人们越来越离不开计算机网络、互联网所带来的好处了&#xff0c;现如今不同的网站系统遍地都是&#xff0c;现在已经不同于以往的传统的管理方式了&#xff0c;只有跟上时代…...

MLP预售开启,革新去中心化通信生态:智能手机与AI Agent齐上阵

2024年10月22日&#xff0c;Matrix Layer Protocol&#xff08;MLP&#xff09;宣布其备受期待的第一期产品正式进入预售阶段。随着Web3世界的不断发展&#xff0c;去中心化技术已经深入到我们日常生活的方方面面。作为Web3世界中炙手可热的创新项目&#xff0c;Matrix Layer P…...

js获取浏览器指纹

Canvas指纹法 来源&#xff1a;https://www.cnblogs.com/leijing0607/p/8044218.html 从根本上来说&#xff0c;每一种浏览器都会使用不同的图像处理引擎&#xff0c;不同的导出选项&#xff0c;不同的压缩等级&#xff0c;所以每一台电脑绘制出的图形都会有些许不同&#xf…...

乐尚代驾的项目问题

订单状态如果在流转的过程中卡住了&#xff0c;怎么办&#xff1f; 卡住的原因有可能是&#xff1a; 网络问题 网络不稳定或中断可能导致订单状态更新的请求无法及时发送或接收。例如&#xff0c;司机端在更新代驾车辆信息时&#xff0c;如果网络出现故障&#xff0c;可能无法…...

uniapp app.onshow 和 onMounted一样用吗

在uni-app中&#xff0c;onShow和onMounted并不完全相同&#xff0c;它们分别属于应用生命周期和组件生命周期。‌ 应用生命周期中的onShow 在uni-app中&#xff0c;onShow是应用生命周期的一部分&#xff0c;它会在应用启动或从后台进入前台时触发。这意味着它不仅仅局限于页…...

搜索网站定制公司/刷僵尸粉网站推广

在一个正则表达式中&#xff0c;如果要提取出多个不同的部分&#xff08;子表达式项&#xff09;&#xff0c;需要用到分组功能。 在 C# 正则表达式中&#xff0c;Regex 成员关系如下&#xff0c;其中 Group 是其分组处理类。 Regex –> MatcheCollection (匹配项集合) –&g…...

网站建站制作价格/网站的seo优化报告

像任何其他产品一样&#xff0c;钟表设计代表了设计师的才华。人们厌倦了经典的钟表&#xff0c;出现在每一个房子&#xff0c;看起来都是相同的。这就是为什么一群有才华的设计师尽最大努力改变这一点&#xff0c;他们的创作都很优秀。相信你会很期待这些类型的时钟挂在墙上是…...

网站模板备份/对搜索引擎优化的认识

这是一个让我很头痛的问题&#xff0c;我是在一个其他的项目框架的基础上来开发新的项目。 当使用struts验证框架时&#xff0c;突然发现这个验证不起作用了&#xff0c;我就纳闷了之前用这个开发的项目好好的怎么到我这就不能用了呢&#xff1f; xml文件头 <?xml version&…...

安阳网站优化/谷歌优化培训

开始试读&#xff1a;https://yqfile.alicdn.com/714f8d4ad302530f78780d39e8b61e41.pdf 天猫购买链接&#xff1a;高性能Docker DockOne社区倾情翻译&#xff0c;阅读本书将掌握Docker性能优化实践&#xff0c;更快、更高效地部署容器&#xff0c;改善开发工作流《高性能Docke…...

帮诈骗公司做网站/拓客软件哪个好用

T3用友通销售发货单审核时提示“xx单据审核失败&#xff0c;保存失败”T3用友通销售发货单审核时提示“xx单据审核失败&#xff0c;保存失败”在销售发货单审核时&#xff0c;系统提示“xx单据审核失败&#xff0c;单据体保存失败。vouchtype表有问题。vouchtype表有问题&#…...

私密浏览器有哪些/网站关键词百度自然排名优化

meta learning在 少量数据集上 可以达到很好的效果&#xff0c;其目标主要是 通过 对traindata的探索&#xff0c;从而制定出适合的学习策略。简而言之&#xff0c;meta learning要做的事就是 学习如何去学习。 meta learning将传统GANs的训练过程由&#xff1a;设计模型–>…...