当前位置: 首页 > news >正文

如何将图数据库应用于电影智能推荐

导读

电影,是一种结合视觉与听觉的现代艺术。如今,电影已不单是人们娱乐消遣的生活方式,也逐渐成为国家文化软实力的重要标志之一。据有关数据统计,2021年中国影视行业市场规模达2349亿元,同比增长23.2%,预计2020年至2025年的五年期复合年均增长率为5.0%,具备强大市场需求度。而国内影视行业政策注重内容端的输出,影视从业人员并未针对不同客群精准投放作品。

早在2014年,国外某影视平台就运用机器学习和个性化推荐算法技术,通过深度挖掘用户数据,打造影视个性化推荐系统。举个例子,假如有人邀请你看电影,那你的第一个问题一定是:什么电影?大部分情况下,我们可能会根据朋友推荐、热点票房、用户打分、标签类型来选择电影。那么这个时候出现一个朋友,基本在他推荐的电影里,总能命中喜好助你度过闲暇时光,即个性化推荐系统作用。艾媒咨询数据显示,在2021-2022年中国消费者偏好的不同形式影视作品中,74.5%消费者会选择电视剧,71.8%消费者会选择电影,61.5%消费者会选择综艺,47.4%消费者会选择动漫,29.4%消费者会选择纪录片。那么在未来,如何将大数据、人工智能技术运用到影视产业,促进产业智能化、智慧化升级,成为国内发展的新态势。

图技术需求

让更多人看见,是内容行业不变的准则。 但在现阶段,观影人普遍存在无法第一时间找到心仪影片的痛点,往往将时间浪费在菜单栏寻找或搜索框检索上。因此,影视行业应该将内容直接面向用户,根据观众的观影习惯“投其所好”。基于此背景,通过图数据库技术,将电影参演者信息、制作方信息、观影人信息、电影类型信息等相关的知识概念抽取出来,构建电影知识图谱,为影视从业人员提供全局视角,根据观众观音习惯快速匹配合适内容。

以Galaxybase图数据库构建电影知识图谱的基本原理图如下。
以Galaxybase图数据库构建电影知识图谱的基本原理

图模型构建

构建电影、观众、参影人之间的互联关系,可根据实际情况进行展开,将电影、观众、参影人、IP、标签设置为点,参影人与电影、观众与电影、电影与IP、电影与标签间的依赖关系设置为边。接下来使用Galaxybase图数据库来创建数据模型,点类型和点属性如下表所示。

点类型属性
参影人参影人ID、出生年份、姓名等
观众观众ID、观众类型等
电影电影ID、上映年份、语言、评分、电影名等
IPIP_ID、类型、IP名称等
标签标签名

边类型、起始点类型、终止点类型如下表所示。

边类型起始点类型终止点类型
作者IP参影人
相关IPIP
属于IP标签
参演参影人电影
主演参影人电影
导演参影人电影
属于参影人标签
相关电影IP
属于电影标签
观影观众观影
相似标签标签

电影知识图谱模型如下图所示。
电影知识图谱模型

图谱应用 - 电影推荐

在电影知识图谱中,系统将根据观众观看过的历史电影信息,为其推荐可能感兴趣的内容到首页,提高电影的点击率和观众满意度。举例,在上文所建图模型中,系统将寻找编号为“A001”的观众观看过的历史电影,从其历史电影的IP、标签出发,推测其观影偏好,找到风格类似的电影,自动将这些电影推荐至首页。

查询语句

// 查询观众 ID 为 “A001”的观众历史观影数据
MATCH p1=(:观众{观众ID:"A001"})-[:观影]->(m1:电影)
WITH p1,m1
// 找到上述电影的标签和IP
MATCH p2=(m1)-[:属于|相关]-(m2)
WITH p1,p2,m2
// 找与上述电影有相同标签或IP的其它电影
MATCH p3=(m2)-[:属于|相关]-(m3:电影)
// 返回该观众历史观影数据,相关电影推荐
RETURN p1,p2,p3

查询结果

如下图所示,根据返回结果可以发现观众ID为“A001”的观众观看过ID为“7873”、“M99”、“890”的三部影片,而ID为“456”的影片,与“M99”拥有一个相同IP,两个相同标签;ID为“34535”、“67856”的影片与上述电影均有两个相同标签,由此推测观众可能对这三部影片感兴趣,可以建议系统优先推荐。
电影推荐查询结果

图谱应用 - 智能问答

在电影知识图谱中,应当存在简单的问答推理功能,满足用户对电影、演员个性化选择的需求。举例,观众观看了吴京主演的长津湖,想起来甄子丹和吴京都是我们熟知的武打影星,那他们有没有一起参与主演的电影呢,在上文所建图模型中,我们将进行探查。

查询语句

// 查询有两个人参与或主演的电影
MATCH p1=(m1:参影人)-[r1:参演|主演]-(m2:电影)-[r2:参演|主演]-(m3:参影人)
// 参影人的变量同时去匹配吴京和甄子丹两个姓名
WHERE m1.姓名 = "甄子丹" AND m3.姓名 = "吴京"
WITH m2,p1
// 查询这个电影的标签和IP
MATCH p2=(m2)-[:相关|属于]-(m4)
// 返回两条路径
RETURN p1,p2

查询结果

如下图所示,可以看到吴京和甄子丹在标签内同属功夫巨星,他们一同参演或主演的电影是杀破狼,这部影片属于动作片和剧情片,系统将用户搜索的结果返回,并将影片推荐至首页。
智能问答查询结果

结语

以上仅为电影知识图谱的简单展示,通过上述两个例子,可以看到相较于传统的推荐算法,基于图数据库的知识图谱,能够抽取电影信息、参影人信息、观影信息等数据,将用户、电影、演员之间的依赖关系以全局统一视角进行整合,挖掘观众与电影间内在的隐性关联,进行精准电影推荐和用户个性化问答,提高用户观影体验,助力影视产业实现智能化升级。

后续,我们会在创邻科技微信公众号与官网发布更多图数据库热点应用场景和前沿资讯,并将可复现的数据集、建模方法、查询语句进行公开,欢迎对图数据库感兴趣的同学关注。

相关文章:

如何将图数据库应用于电影智能推荐

导读 电影,是一种结合视觉与听觉的现代艺术。如今,电影已不单是人们娱乐消遣的生活方式,也逐渐成为国家文化软实力的重要标志之一。据有关数据统计,2021年中国影视行业市场规模达2349亿元,同比增长23.2%,预…...

CSS实现动画效果的菜单收起展开图标,html实现动画效果的箭头

效果 实现代码 此处JS代码引入了jquery <!DOCTYPE html> <html><head><meta charset"UTF-8"><title></title><style>.menu-icon{position: absolute;left: 20%;top: 30%;transition: all .3s;}.menu-icon:before, .menu…...

大数据平台小结

搭建大数据平台启动流程1、启动Nginx服务&#xff08;在bdp-web-mysql服务中&#xff09;cd /usr/local/nginx/# 启动Nginx ./sbin/nginx# 查看端口是否存在 netstat -tunlp|grep 200012、启动zookeeper&#xff08;在bdp-executor-realtime123&#xff09;cd /app/bdp/apache-…...

力扣-139单词拆分

力扣-139单词拆分 1、题目 给你一个字符串 s 和一个字符串列表 wordDict 作为字典。请你判断是否可以利用字典中出现的单词拼接出 s 。 注意&#xff1a;不要求字典中出现的单词全部都使用&#xff0c;并且字典中的单词可以重复使用。 示例 1&#xff1a; 输入: s "…...

图机器学习-图神经网络

图神经网络 前面讲了图机器学习的一些传统方法&#xff0c;现在正式进入到课程的核心部分&#xff1a;图神经网络。 Design of GNN 那么图神经网络和我们之前接触的一些深度神经网络有什么不同呢&#xff1f; 对于别的类型的神经网络&#xff0c;往往我们都是处理一些类似网…...

配置Airbyte资源限制

资源限制有三种不同的级别配置&#xff1a;Instance-wide - 应用到Airbyte实例创建的Sync Job的所有容器上。Connector-specific - 应用到Airbyte实例创建的Sync Job的所有指定类型连接器的容器上Connection-specific - 应用到Airbyte实例创建的Sync Job的所有指定管道的容器上…...

python实现PCA降维画分类散点图并标出95%的置信区间

此代码以数据集鸢尾花为例&#xff0c;对其使用PCA降维后&#xff0c;绘制了三个类别的样本点和对应的置信圆&#xff08;即椭圆&#xff09;。先放效果图。 下面是完整代码&#xff1a; from matplotlib.patches import Ellipsedef plot_point_cov(points, nstd3, axNone, **…...

Mysql高级之索引结构详解

Mysql的索引详解1.索引定义2.索引结构2.1数据结构分析2.1.1熟知的数据结构2.1.2分析为什么这么多的数据结构不全适用于索引结构2.2Hash结构2.3B tree结构3.索引分类3.1聚集索引&#xff08;聚簇索引&#xff09;3.2非聚集索引&#xff08;稀疏索引&#xff09;3.3联合索引3.4主…...

【线程-J.U.C】

Lock J.U.C最核心组件&#xff0c;Lock接口出现之前&#xff0c;多线程的并发安全只能由synchronized处理&#xff0c;但java5之后&#xff0c;Lock的出现可以解决synchronized的短板&#xff0c;更加灵活。 Lock本质上是一个接口&#xff0c;定义了释放锁&#xff08;unlock&…...

docker布署spring boot jar包项目

目录docker 安装创建目录制作镜像启动容器查看日志docker 安装 Docker安装、详解与部署 创建目录 服务器中创建一个目录&#xff0c;存放项目jar包和Dockerfile 文件 mkdir /目录位置创建目录后创建Dockerfile文件&#xff0c;上传jar包到同一目录下 创建dockerfile vim Doc…...

极简Vue3教程--Pinia状态管理

Pinia&#xff08;发音为/piːnjʌ/&#xff0c;如英语中的“peenya”&#xff09;是最接近pia&#xff08;西班牙语中的菠萝&#xff09;的词&#xff1b;Pinia开始于大概2019年&#xff0c;最初是作为一个实验为Vue重新设计状态管理&#xff0c;让它用起来像组合式API&#x…...

常用的map转bean互转方法

提示&#xff1a;文章写完后&#xff0c;目录可以自动生成&#xff0c;如何生成可参考右边的帮助文档 常用的map转bean互转方法一、hutool工具类二、fastjson工具类三、beanutils_BeanUtils工具类 不太好用四、cglib BeanMap工具类 不太好用五、reflect 反射来玩 不太好玩六、I…...

2.4G收发一体芯片NRF24L01P跟国产软硬件兼容 SI24R1对比

超低功耗高性能 2.4GHz GFSK 无线收发器芯片Si24R1&#xff0c;软硬件兼容NRF24L01P. Si24R1 是一颗工作在 2.4GHz ISM 频段&#xff0c;专为低功耗无线场合设计&#xff0c;集成嵌入式ARQ 基带协议引擎的无线收发器芯片。工作频率范围为 2400MHz-2525MHz&#xff0c;共有 126个…...

设计模式之七大原则(一)——单一职责原则、开放-关闭原则

目录一、设计模式的目的二、设计模式的七大原则1.单一职责原则2.开放-关闭原则一、设计模式的目的 设计模式的目的是为了提高代码重用性、可读性、可扩展性、可靠性&#xff0c;使得程序呈现出高内聚、低耦合的特性。 代码重用性&#xff08;相同功能的代码&#xff0c;不用多…...

C++ set、unordered_set、multiset它们之间的区别与一些使用方法(不断更新)

set、unordered_set、multiset是什么&#xff1f;以及它们之间的区别 首先&#xff0c;它们三个都是C标准库提供的关联容器中的一种。只不过set、multiset容器是有序的&#xff0c;而unordered_set容器是无序的 std::set 是 C 标准库中的一个容器&#xff0c;其存储的元素按设…...

hadoop调优

hadoop调优 1 HDFS核心参数 1.1 NameNode内存生产配置 1.1.1 NameNode内存计算 每个文件块大概占用150byte&#xff0c;如果一台服务器128G&#xff0c;能存储的文件块如下 128 (G)* 1024(MB) * 1024(KB) * 1024(Byte) / 150 Byte 9.1 亿 1.1.2 Hadoop2.x 在Hadoop2.x中…...

EM@三角函数诱导公式

文章目录诱导公式单位圆坐标和三角函数记忆口诀符号看象限奇变偶不变例常用诱导公式&#x1f388;常用部分(5对)倒数关系六种三角函数间的转换关系小结ReflectionsShifts and periodicity诱导公式 诱导公式 - 维基百科&#xff0c;自由的百科全书 (wikipedia.org) 单位圆坐标…...

是不是只能学IT互联网技术才有发展前途?

当然不是&#xff0c;三百六十行&#xff0c;行行出状元。 但我们需要认清一个现实是&#xff0c;我们正处于一个信息爆炸的时代&#xff0c;掌握紧跟潮流的技术&#xff0c;才可以让我们更自信地面对每天的生活&#xff0c;才有多余的精力、财力来享受生活。“人生在世&#…...

Linux 进程:exit和_exit的辨析

目录1.接口与函数2.缓冲区3.exit 与 _exit(1)_exit(2)exit这里来认识exit函数和 _exit接口 &#xff0c;它们的作用是类似的&#xff0c;都是在调用后退出程序&#xff0c;可以在程序的任何地方调用。 1.接口与函数 exit函数和_exit接口&#xff0c;一个函数&#xff0c;一个…...

智能电子标签——商超版价签

2.1英寸TFT黑白电子价签 ★ 快速变价&#xff0c;高效运营 ★ 市场实用&#xff0c;布局物联网未来 ★ 更好客户体验 ★ 降低系统成本&#xff0c;具备竞争力 ★ 2.1英寸黑白红电子价签 ★ 电池低能耗&#xff0c;常规使用三年 ★ 穿透力强不慣障碍 ★ 2.4G载波&#x…...

Java 语言特性(面试系列2)

一、SQL 基础 1. 复杂查询 &#xff08;1&#xff09;连接查询&#xff08;JOIN&#xff09; 内连接&#xff08;INNER JOIN&#xff09;&#xff1a;返回两表匹配的记录。 SELECT e.name, d.dept_name FROM employees e INNER JOIN departments d ON e.dept_id d.dept_id; 左…...

设计模式和设计原则回顾

设计模式和设计原则回顾 23种设计模式是设计原则的完美体现,设计原则设计原则是设计模式的理论基石, 设计模式 在经典的设计模式分类中(如《设计模式:可复用面向对象软件的基础》一书中),总共有23种设计模式,分为三大类: 一、创建型模式(5种) 1. 单例模式(Sing…...

C++ 基础特性深度解析

目录 引言 一、命名空间&#xff08;namespace&#xff09; C 中的命名空间​ 与 C 语言的对比​ 二、缺省参数​ C 中的缺省参数​ 与 C 语言的对比​ 三、引用&#xff08;reference&#xff09;​ C 中的引用​ 与 C 语言的对比​ 四、inline&#xff08;内联函数…...

Unsafe Fileupload篇补充-木马的详细教程与木马分享(中国蚁剑方式)

在之前的皮卡丘靶场第九期Unsafe Fileupload篇中我们学习了木马的原理并且学了一个简单的木马文件 本期内容是为了更好的为大家解释木马&#xff08;服务器方面的&#xff09;的原理&#xff0c;连接&#xff0c;以及各种木马及连接工具的分享 文件木马&#xff1a;https://w…...

基于Springboot+Vue的办公管理系统

角色&#xff1a; 管理员、员工 技术&#xff1a; 后端: SpringBoot, Vue2, MySQL, Mybatis-Plus 前端: Vue2, Element-UI, Axios, Echarts, Vue-Router 核心功能&#xff1a; 该办公管理系统是一个综合性的企业内部管理平台&#xff0c;旨在提升企业运营效率和员工管理水…...

在 Spring Boot 项目里,MYSQL中json类型字段使用

前言&#xff1a; 因为程序特殊需求导致&#xff0c;需要mysql数据库存储json类型数据&#xff0c;因此记录一下使用流程 1.java实体中新增字段 private List<User> users 2.增加mybatis-plus注解 TableField(typeHandler FastjsonTypeHandler.class) private Lis…...

面试高频问题

文章目录 &#x1f680; 消息队列核心技术揭秘&#xff1a;从入门到秒杀面试官1️⃣ Kafka为何能"吞云吐雾"&#xff1f;性能背后的秘密1.1 顺序写入与零拷贝&#xff1a;性能的双引擎1.2 分区并行&#xff1a;数据的"八车道高速公路"1.3 页缓存与批量处理…...

大数据驱动企业决策智能化的路径与实践

&#x1f4dd;个人主页&#x1f339;&#xff1a;慌ZHANG-CSDN博客 &#x1f339;&#x1f339;期待您的关注 &#x1f339;&#x1f339; 一、引言&#xff1a;数据驱动的企业竞争力重构 在这个瞬息万变的商业时代&#xff0c;“快者胜”的竞争逻辑愈发明显。企业如何在复杂环…...

Win系统权限提升篇UAC绕过DLL劫持未引号路径可控服务全检项目

应用场景&#xff1a; 1、常规某个机器被钓鱼后门攻击后&#xff0c;我们需要做更高权限操作或权限维持等。 2、内网域中某个机器被钓鱼后门攻击后&#xff0c;我们需要对后续内网域做安全测试。 #Win10&11-BypassUAC自动提权-MSF&UACME 为了远程执行目标的exe或者b…...

性能优化中,多面体模型基本原理

1&#xff09;多面体编译技术是一种基于多面体模型的程序分析和优化技术&#xff0c;它将程序 中的语句实例、访问关系、依赖关系和调度等信息映射到多维空间中的几何对 象&#xff0c;通过对这些几何对象进行几何操作和线性代数计算来进行程序的分析和优 化。 其中&#xff0…...