当前位置：首页 > news >正文

基于深度学习的图书管理推荐系统（python版）

news 2026/3/26 16:52:59

基于深度学习的图书管理推荐系统

1、效果图

在这里插入图片描述

1/1 [==============================] - 0s 270ms/step
[13 11  4 19 16 18  8  6  9  0]
[0.1780757  0.17474999 0.17390694 0.17207369 0.17157653 0.168248440.1668652  0.16665359 0.16656876 0.16519257]
keras_recommended_book_ids深度学习推荐列表 [9137, 10548, 1, 10546, 2, 1024, 10, 10550, 7, 512]

2、算法原理

使用Keras框架实现一个简单的深度学习推荐算法。Keras是建立在Python之上的高级神经网络API。Keras提供了一种简单、快速的方式来构建和训练深度学习模型。

根据用户对书籍的评分表，使用Emmbeding深度学习训练得到一个模型，预测用户可能评分高的书籍，并把前5本推荐给用户。

Emmbeding是从离散对象（如书籍 ID）到连续值向量的映射。
这可用于查找离散对象之间的相似性。
Emmbeding向量是低维的，并在训练网络时得到更新。
设计一个模型，将用户id作为用户向量，物品id作为物品向量。
分别Emmbeding两个向量，再Concat连接起来，最后加上3个全连接层构成模型，进行训练。
使用adam优化器，用均方差mse来衡量预测评分与真实评分之间的误差

流程图：
在这里插入图片描述

3、算法流程

1、从数据库中读取评分表信息并转成二维数组
2、数据预处理，把用户id，物品id映射成顺序字典
3、统计用户数量、物品数量
4、划分训练集与测试集
5、构建Embedding模型并进行数据训练得到模型
6、调用模型预测评分高的物品并推荐给用户

4、主体代码

# -*- coding: utf-8 -*-"""
@contact: 微信 1257309054
@file: recommend_keras.py
@time: 2024/3/30 16:21
@author: LDC
使用Keras框架实现一个深度学习推荐算法
"""import os
import django
from django.conf import settingsos.environ["DJANGO_SETTINGS_MODULE"] = "book_manager.settings"
django.setup()import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
import pymysql
from sklearn.model_selection import train_test_split
import warningswarnings.filterwarnings('ignore')from book.models import UserSelectTypes, LikeRecommendBook, Book, RateBook
from keras.layers import Input, Embedding, Flatten, Dot, Dense, Concatenate, Dropout
from keras.models import Modelfrom keras.models import load_modeldef get_select_tag_book(user_id, book_id=None):# 获取用户注册时选择的书籍类别各返回10门书籍category_ids = []us = UserSelectTypes.objects.get(user_id=user_id)for category in us.category.all():category_ids.append(category.id)unlike_book_ids = [d['book_id'] for d inLikeRecommendBook.objects.filter(user_id=user_id, is_like=0).values('book_id')]if book_id and book_id not in unlike_book_ids:unlike_book_ids.append(book_id)book_list = Book.objects.filter(tags__in=category_ids).exclude(id__in=unlike_book_ids).distinct().order_by("-like_num")[:10]return book_listdef get_data():'''从数据库获取数据'''conn = pymysql.connect(host=settings.DATABASE_HOST,user=settings.DATABASE_USER,password=settings.DATABASE_PASS,database=settings.DATABASE_NAME,charset='utf8mb4',use_unicode=True)sql_cmd = 'SELECT book_id, user_id,mark FROM rate_book'dataset = pd.read_sql(sql=sql_cmd, con=conn)conn.close()  # 使用完后记得关掉return datasetdef preprocessing(dataset):'''数据预处理'''book_val_counts = dataset.book_id.value_counts()book_map_dict = {}for i in range(len(book_val_counts)):book_map_dict[book_val_counts.index[i]] = i# print(map_dict)dataset["book_id"] = dataset["book_id"].map(book_map_dict)user_id_val_counts = dataset.user_id.value_counts()# 映射字典user_id_map_dict = {}for i in range(len(user_id_val_counts)):user_id_map_dict[user_id_val_counts.index[i]] = i# 将User_ID映射到一串字典dataset["user_id"] = dataset["user_id"].map(user_id_map_dict)return dataset, book_map_dict, user_id_map_dictdef train_model():'''训练模型'''dataset = get_data()  # 获取数据dataset, book_map_dict, user_id_map_dict = preprocessing(dataset)  # 数据预处理n_users = len(dataset.user_id.unique())  # 统计用户数量print('n_users', n_users)n_books = len(dataset.book_id.unique())  # 统计书籍数量print('n_books', n_books)# 划分训练集与测试集train, test = train_test_split(dataset, test_size=0.2, random_state=42)# 开始训练# creating book embedding pathbook_input = Input(shape=[1], name="Book-Input")book_embedding = Embedding(n_books + 1, 5, name="Book-Embedding")(book_input)Dropout(0.2)book_vec = Flatten(name="Flatten-Books")(book_embedding)# creating user embedding pathuser_input = Input(shape=[1], name="User-Input")user_embedding = Embedding(n_users + 1, 5, name="User-Embedding")(user_input)Dropout(0.2)user_vec = Flatten(name="Flatten-Users")(user_embedding)# concatenate featuresconc = Concatenate()([book_vec, user_vec])# add fully-connected-layersfc1 = Dense(128, activation='relu')(conc)Dropout(0.2)fc2 = Dense(32, activation='relu')(fc1)out = Dense(1)(fc2)# Create model and compile itmodel2 = Model([user_input, book_input], out)model2.compile('adam', 'mean_squared_error')history = model2.fit([train.user_id, train.book_id], train.mark, epochs=10, verbose=1)model2.save('regression_model2.h5')loss = history.history['loss']  # 训练集损失# 显示损失图像plt.plot(loss, 'r')plt.title('Training loss')plt.xlabel("Epochs")plt.ylabel("Loss")plt.show()print('训练完成')def predict(user_id, dataset):'''将预测评分高的图书推荐给该用户user_id'''model2 = load_model('regression_model2.h5')'''先拿到所有的图书索引ISBN，并去重成为book_data。再添加一个和book_data长度相等的用户列表user，不过这里的user列表中的元素全是1，因为我们要做的是：预测第1个用户对所有图书的评分，再将预测评分高的图书推荐给该用户。'''book_data = np.array(list(set(dataset.book_id)))user = np.array([user_id for i in range(len(book_data))])predictions = model2.predict([user, book_data])# 更换列->行predictions = np.array([a[0] for a in predictions])# 根据原array，取其中数值从大到小的索引，再只取前top10recommended_book_ids = (-predictions).argsort()[:10]print(recommended_book_ids)print(predictions[recommended_book_ids])return recommended_book_idsdef embedding_main(user_id, book_id=None, is_rec_list=False):'''1、获取数据、数据预处理2、划分训练集与测试集3、训练模型、模型评估4、预测user_id: 用户idbook_id: 用户已经评分过的书籍id,需要在推荐列表中去除is_rec_list: 值为True：返回推荐[用户-评分]列表，值为False：返回推荐的书籍列表'''dataset = get_data()  # 获取数据# print(dataset.head())if user_id not in dataset.user_id.unique():# 用户未进行评分则推荐注册时选择的图书类型print('用户未进行评分则推荐注册时选择的图书类型')if is_rec_list:return []# 推荐列表为空，按用户注册时选择的书籍类别各返回10门return get_select_tag_book(user_id, book_id)dataset, book_map_dict, user_id_map_dict = preprocessing(dataset)# user_id需要转换为映射后的user_id传到predict函数中predict_book_ids = predict(user_id_map_dict[user_id], dataset)  # 预测的书籍Idrecommend_list = []  # 最后推荐的书籍id# 把映射的值转为真正的书籍idfor book_id in predict_book_ids:for k, v in book_map_dict.items():if book_id == v:recommend_list.append(k)print('keras_recommended_book_ids深度学习推荐列表', recommend_list)if not recommend_list:# 推荐列表为空，且is_rec_list: 值为True：返回推荐[用户-评分]列表if is_rec_list:return []# 推荐列表为空，按用户注册时选择的书籍类别return get_select_tag_book(user_id, book_id)if is_rec_list:# 推荐列表不为空，且且is_rec_list: 值为True：返回推荐[用户-评分]列表return recommend_list# 过滤掉用户反馈过不喜欢的书籍unlike_book_ids = [d['book_id'] for d inLikeRecommendBook.objects.filter(user_id=user_id, is_like=0).values('book_id')]# 过滤掉用户已评分的数据already_mark_ids = [d['book_id'] for d in RateBook.objects.filter(user_id=user_id).values('book_id')]unrecommend = list(set(unlike_book_ids + already_mark_ids))if book_id and book_id not in unrecommend:unrecommend.append(book_id)book_list = Book.objects.filter(id__in=recommend_list).exclude(id__in=unrecommend).distinct().order_by("-like_num")return book_listif __name__ == '__main__':train_model() # 训练模型embedding_main(2) # 调用模型

输出：
在这里插入图片描述

基于深度学习的图书管理推荐系统（python版）

基于深度学习的图书管理推荐系统 1、效果图 1/1 [] - 0s 270ms/step [13 11 4 19 16 18 8 6 9 0] [0.1780757 0.17474999 0.17390694 0.17207369 0.17157653 0.168248440.1668652 0.16665359 0.16656876 0.16519257] keras_recommended_book_ids深度学习推荐列表 [9137…...

编程日记 2024/3/31 21:44:05

MATLAB 点云随机渲染赋色（51）

MATLAB 点云随机渲染赋色（51）一、算法介绍二、算法实现1.代码2.效果总结一、算法介绍为点云中的每个点随机赋予一种颜色，步骤和效果如图： 1、读取点云（ply格式） 2、随机为每个点的RGB颜色字段赋值 3、保存结果（ply格式）二、算法实现 1.代码代码如下（示例）：…...

编程日记 2024/3/31 21:41:00

通过一篇文章让你完全掌握VS和电脑常用快捷键的使用方法

VS常用快捷键前言一、 VS常用快捷键常用VS运行调试程序快捷键常用VS编辑程序快捷键二、常用windows系统操作快捷键前言 VS（Visual Studio）是一款强大的开发工具，提供了许多常用快捷键，以提高开发效率。这些快捷键包括文件操作…...

编程日记 2024/3/31 21:39:59

ChatGPT指引：借助ChatGPT撰写学术论文的技巧

ChatGPT无限次数:点击直达 ChatGPT指引：借助ChatGPT撰写学术论文的技巧在当今信息技术高度发达的时代，人工智能技术的不断发展为学术研究者提供了更多的便利和可能。其中，自然语言处理技术中的ChatGPT无疑是一种强大的工具，它能…...

编程日记 2024/3/31 21:34:54

魔改一个过游戏保护的CE

csdn审核不通过网易云课堂有配套的免费视频 int0x3 - 主页文章都传到github了 Notes/外挂/魔改CE at master MrXiao7/Notes GitHub 为什么要编译自己的CE 在游戏逆向的过程中，很多游戏有保护，我们运行原版CE的时候会被检测到比如我们开着CE运…...

编程日记 2024/3/31 21:33:53

rust嵌入式开发之await

嵌入式经常有类似通过串口发送指令然后等待响应再做出进一步反应的需求。比如，通过串口以AT命令来操作蓝牙模块执行扫描、连接，需要根据实际情况进行操作，复杂的可能需要执行7、8条指令才能完成连接。对于这样的需求，如果用异步…...

编程日记 2024/3/31 21:29:50

UE4_碰撞_碰撞蓝图节点——Line Trace For Objects（对象的线条检测）

一、Line Trace For Objects（对象的线条检测）：沿给定线条执行碰撞检测并返回遭遇的首个命中，这只会找到由Object types指定类型的对象。注意他与Line Trace By Channel(由通道检测线条）的区别，一个通过Obje…...

编程日记 2024/3/31 21:27:47

抽象类和接口的简单认识

目录一、抽象类 1.什么是抽象类 2.抽象类的注意事项 3.抽象类与普通类的对比二、接口 1.接口的简单使用 2.接口的特性 3.接口的使用案例 4.接口和抽象类的异同一、抽象类所谓抽象类，就是更加抽象的类，也就是说，这个类不能具体描…...

编程日记 2024/3/31 21:26:46

python-pytorch获取FashionMNIST实际图片标签数据集

在查看pytorch官方文档的时候，在这里链接中https://pytorch.org/tutorials/beginner/basics/data_tutorial.html的Creating a Custom Dataset for your files章节，有提到要自定义数据集，需要用到实际的图片和标签。在网上找了半天没找到&a…...

编程日记 2024/3/31 21:24:43

深入探秘Python生成器：揭开神秘的面纱

一、问题起源： 想象一下，您掌握了一种魔法，在代码世界里，您可以轻松呼唤出一个整数。然而，事情并不总是看起来那样简单。在Python的奇妙王国中，我遇到了一个有趣的谜题： def tst():try:print(…...

编程日记 2024/3/31 21:20:39

红队攻防渗透技术实战流程：红队目标信息收集之批量信息收集

红队资产信息收集 1. 自动化信息收集1.1 自动化信息收集工具1.2 自动域名转换IP工具1.3 自动企业信息查询工具1.4 APP敏感信息扫描工具1.5 自动化信息工具的使用1.5.1 资产灯塔系统(ARL)1.5.1.1 docker环境安装1.2.2.9.1 水泽-信息收集自动化工具1. 自动化信息收集 1.1 自动化…...

编程日记 2024/3/31 21:16:36

【vue3学习笔记（二）】（第141-143节）初识setup；ref函数_处理基本类型；ref函数_处理对象类型

尚硅谷Vue2.0Vue3.0全套教程丨vuejs从入门到精通本篇内容对应课程第141-143节课程 P141节《初识setup》笔记 1、setup是所有组合式API“表演的舞台”，组件中所用到的所有数据、方法、监视数据、生命周期钩子等都需要配置在setup中。 2、setup的两种返回值&…...

编程日记 2024/3/31 21:14:34

若依框架学习使用

若依官网项目拉取下来介绍 | RuoYi 项目运行： 1.idea安装，可以运行前后端编辑器idea、jdk环境安装、数据库mysql、navicat工具、redis(redis-server启动)安装 2.navicat数据库连接, 创建数据库ry-vue并导入数据脚本ry_2021xxxx.sql，qua…...

编程日记 2024/3/31 21:12:32

蓝桥杯_数学模板

1.试除法判定质数 #include <iostream> using namespace std;bool is_zs(int x) {if(x<2) return false;for(int i2;i<x/i;i)if(x%i0)return false;return true; }int main() {int n; cin>>n;while(n--){int x; cin>>x;if(is_zs(x)) cout<<&quo…...

编程日记 2024/3/31 21:11:31

稀碎从零算法笔记Day31-LeetCode:接雨水

半月一去，望舒一轮，明天开始攻坚哈德题了前言：非常经典的一道笔试题，看了保证血赚（今天银泰星笔试第四题就是这个） 题型：dp、模拟、双指针…… 链接：42. 接雨水 - 力扣&#xff…...

编程日记 2024/3/31 21:08:28

微前端的使用和注意事项 - qiankun

一、为什么使用微前端微前端架构旨在解决单体应用在一个相对长的时间跨度下，由于参与的人员、团队的增多、变迁，从一个普通应用演变成一个巨石应用(Frontend Monolith)后，随之而来的应用不可维护的问题。微前端的核心目标是将巨石应用拆解成…...

编程日记 2024/3/31 21:04:24

uniapp微信小程序消息订阅详解

一、微信公众平台申请订阅模板注意：订阅信息这个事件是当用户点击的时候触发或者是支付成功后触发， 用户勾选 “总是保持以上选择，不再询问” 之后或长期订阅，下次订阅调用 wx.requestSubscribeMessage 不会弹窗&#xf…...

编程日记 2024/3/31 21:02:22

git 查看文件夹结构树

在Git中，没有直接的命令可以像文件系统那样展示一个可视化的文件结构树。但是，你可以使用一些外部工具或命令来达到这个目的。以下是一些方法，你可以使用它们来查看Git仓库的文件结构树： 使用tree命令（如果你的系统已…...

编程日记 2024/3/31 21:01:21

设计模式一详解

一、观察者模式当一个对象状态发生改变时，依赖它的对象全部会收到通知，并自动更新场景：一个事件发生后，要执行一连串更新操作。传统的编程方式，就是在事件的代码之后直接加入处理逻辑。当更新的逻辑增多之后&#x…...

编程日记 2024/3/31 20:58:19

python 进程、线程、协程基本使用

1、进程、线程以及协程【1】进程概念【2】线程的概念线程的生命周期进程与线程的区别【3】协程(Coroutines) 2、多线程实现【1】threading模块【2】互斥锁【3】线程池【4】线程应用 3、多进程实现4、协程实现【1】yield与协程【2】asyncio模块【3】3.8版本【4】aiohttp 1. 并发…...

编程日记 2024/3/31 20:56:17

BthPS3驱动技术指南：实现PS3手柄在Windows 11系统的蓝牙适配与优化

BthPS3驱动技术指南：实现PS3手柄在Windows 11系统的蓝牙适配与优化【免费下载链接】BthPS3 Windows kernel-mode Bluetooth Profile & Filter Drivers for PS3 peripherals 项目地址: https://gitcode.com/gh_mirrors/bt/BthPS3 当你尝试将PS3手柄连接到…...

编程新知 2026/3/26 15:44:27

保姆级教程：Arduino IDE离线安装ESP32开发板支持包（附稳定镜像源）

Arduino IDE离线安装ESP32开发板支持包全攻略对于国内开发者来说，Arduino IDE安装ESP32开发板支持包常常会遇到网络连接不稳定、下载速度慢甚至完全无法访问的问题。本文将提供一套完整的离线安装方案，通过国内镜像源和分步操作指南，确保即…...

编程新知 2026/3/26 13:53:01

用NoneBot2给Lagrange机器人加buff：5个提升效率的插件开发技巧

用NoneBot2给Lagrange机器人加buff：5个提升效率的插件开发技巧在智能对话机器人领域，NoneBot2与Lagrange的组合已经成为QQ生态中高效开发的黄金搭档。但当你已经掌握了基础功能开发后，如何让机器人更智能、更稳定、更能应对复杂场景&#xf…...

编程新知 2026/3/26 13:20:57

Python离线环境搭建全攻略：从虚拟机到生产服务器的完整迁移方案

Python离线环境搭建全攻略：从虚拟机到生产服务器的完整迁移方案在金融、军工等对网络安全要求极高的行业，服务器通常运行在完全隔离的离线环境中。这种环境下，如何部署Python运行环境并确保所有依赖库正常工作，成为许多运维工程师…...

编程新知 2026/3/26 12:52:41

TI C2000 DSP新手必看：用CCS建第一个工程时，如何避免头文件找不到的坑？

TI C2000 DSP开发避坑指南：从零构建CCS工程的正确姿势第一次打开Code Composer Studio(CCS)时，那个充满按钮和菜单的界面就像面对一架航天飞机的控制台——每个开关都看起来很重要，但完全不知道从哪下手。特别是当你在教程指导下创建了第一个…...

编程新知 2026/3/26 12:30:33

医疗影像分析中的图像分割避坑指南：从Sobel到Canny的算法选型

医疗影像分析中的图像分割避坑指南：从Sobel到Canny的算法选型在CT和MRI扫描成为临床诊断常规手段的今天，医疗影像分析正面临前所未有的数据洪流。某三甲医院的放射科主任曾向我展示过一组数据：单台256排CT日均产生超过200GB的DICOM影像&…...

编程新知 2026/3/26 11:49:59

MediaPipe TouchDesigner GPU视觉插件实战：从零构建实时交互应用的完整指南

MediaPipe TouchDesigner GPU视觉插件实战：从零构建实时交互应用的完整指南【免费下载链接】mediapipe-touchdesigner GPU Accelerated MediaPipe Plugin for TouchDesigner 项目地址: https://gitcode.com/gh_mirrors/me/mediapipe-touchdesigner 你是否厌…...

编程新知 2026/3/26 8:20:30

如何监控模型性能？HY-MT1.5-1.8B Prometheus集成

如何监控模型性能？HY-MT1.5-1.8B Prometheus集成在实际部署AI模型服务时，仅仅让模型运行起来是远远不够的。如何实时了解模型的服务状态、性能表现和资源使用情况，才是确保服务稳定可靠的关键。今天我们就来探讨如何使用Prometheus监控部署…...

编程新知 2026/3/26 7:20:20

Fluent UI自定义Hook终极指南：10个常见使用场景详解

Fluent UI自定义Hook终极指南：10个常见使用场景详解【免费下载链接】fluentui 项目地址: https://gitcode.com/GitHub_Trending/of/fluentui Fluent UI作为微软推出的企业级UI组件库，其自定义Hook体系为开发者提供了高效处理状态管理、生命周期…...

编程新知 2026/3/26 5:36:40

Gin 日志体系详解

Gin 日志体系详解本文基于 Gin 企业开发的真实场景，从原生日志能力到主流日志工具选型，全程以实用为核心，附带可直接复制的集成代码、最佳实践和踩坑指南，解决 Gin 开发中日志的全场景需求。一、Gin 原生日志体系详解 Gin 自带了…...

编程新知 2026/3/26 5:13:50

基于深度学习的图书管理推荐系统

1、效果图

2、算法原理

3、算法流程

4、主体代码

相关文章：