推荐系统实践 笔记
诸神缄默不语-个人CSDN博文目录
这是我2020年写的笔记,我从印象笔记搬过来公开。
如果那年还在读本科的同学也许有印象,那年美赛出了道根据电商评论给商户提建议的题。其实这件事跟推荐系统关系不大,但我们当时病急乱投医,我打开了这本书。
然后发现还蛮好玩的就看完了。
这本书写于2012年,哦多么古早的时代……
小书,读得很快,但是能让用户迅速对早期推荐系统有个通览的了解。
如果我以后真的干推荐系统了,可能会再回来更新相应笔记内容。
文章目录
- 第一章 好的推荐系统
- 第二章 利用用户行为数据
- 2.1 用户行为数据
- 2.2 用户行为分析
- 第三章 推荐系统冷启动问题
- 第四章 利用用户标签数据
- 第五章 利用上下文信息
- 第六章 利用社交网络数据
- 第七章 推荐系统实例
- 第八章 评分预测问题
- 其他来源的相关参考资料
- 豆瓣书评
- 知乎
- CSDN
- 博客园
- 豆瓣用户整理的附录和参考资料
第一章 好的推荐系统
- 在推荐系统中,主要有3种评测推荐效果的实验方法,即离线实验( offline experiment)、用户调查( user study)和在线实验( online experiment)。
- 离线实验
离线实验的方法一般由如下几个步骤构成:- 通过日志系统获得用户行为数据,并按照一定格式生成一个标准的数据集;
- 将数据集按照一定的规则分成训练集和测试集;
- 在训练集上训练用户兴趣模型,在测试集上进行预测;
- 通过事先定义的离线指标评测算法在测试集上的预测结果。
- 用户调查:尽量是双盲实验
- 在线实验:AB测试
- 周期长
- 切分流量(正交):控制变量,以防互相干扰
- 离线实验
- 推荐系统评测指标
- 用户满意度
- 用户调查:问卷
- 在线实验:一些对用户行为的统计
- 预测准确度:离线数据集做机器学习
- 评分预测
- RMSE,MAE
- Netflix认为RMSE加大了对预测不准的用户物品评分的惩罚(平方项的惩罚),因而对系统的评测更加苛刻。研究表明,如果评分系统是基于整数建立的(即用户给的评分都是整数),那么对预测结果取整会降低MAE的误差
- TopN推荐: 给用户一个个性化的推荐列表
- 准确率( precision) /召回率( recall)
- 用户在训练集上的行为给用户作出的推荐列表
- 用户在测试集上的行为列表
- 有的时候,为了全面评测TopN推荐的准确率和召回率,一般会选取不同的推荐列表长度N,计算出一组准确率/召回率,然后画出准确率/召回率曲线( precision/recall curve)
- 覆盖率( coverage):描述一个推荐系统对物品长尾的发掘能力
- 最简单的定义:推荐系统能够推荐出来的物品占总物品集合的比例
- 内容提供商会关心这一指标
- 其他衡量指标:信息熵、基尼系数
- 多样性
- 新颖性:给用户推荐那些他们以前没有听说过的物品
- 惊喜度 (serendipity):如果推荐结果和用户的历史兴趣不相似,但却让用户觉得满意,那么就可以说推荐结果的惊喜度很高,而推荐的新颖性仅仅取决于用户是否听说过这个推荐结果
- 信任度( trust)
- 提高推荐系统的信任度的方法
- 增加推荐系统的透明度( transparency):主要办法是提供推荐解释。只有让用户了解推荐系统的运行机制,让用户认同推荐系统的运行机制,才会提高用户对推荐系统的信任度
- 考虑用户的社交网络信息,利用用户的好友信息给用户做推荐,并且用好友进行推荐解释。这是因为用户对他们的好友一般都比较信任,因此如果推荐的商品是好友购买过的,那么他们对推荐结果就会相对比较信任。
- 提高推荐系统的信任度的方法
- 实时性
- 实时地更新推荐列表来满足用户新的行为变化
- 推荐系统需要能够将新加入系统的物品推荐给用户
- 健壮性(即robust,鲁棒性)指标:一个推荐系统抗击作弊的能力
- 著名作弊方法: 行为注入攻击 ( profile injection attack)
- 评测的主要方法:模拟攻击
- 提高系统健壮性的方法
- 选择健壮性高的算法
- 设计推荐系统时尽量使用代价比较高的用户行为
- 在使用数据前,进行攻击检测,从而对数据进行清理
- 商业目标
- 评测维度
- 用户维度:主要包括用户的人口统计学信息、活跃度以及是不是新用户等。
- 物品维度:包括物品的属性信息、流行度、平均分以及是不是新加入的物品等。
- 时间维度:包括季节,是工作日还是周末,是白天还是晚上等。
- 评分预测
- 用户满意度
第二章 利用用户行为数据
2.1 用户行为数据
- 日志 会话日志
- 显性反馈行为( explicit feedback)和隐性反馈行为( implicit feedback)
- 正反馈和负反馈
2.2 用户行为分析
- 用户活跃度和物品流行度的分布:长尾分布 Power Law
- 协同过滤算法
- 基于邻域的方法( neighborhood-based)
- 基于用户的协同过滤算法:这种算法给用户推荐和他兴趣相似的其他用户喜欢的物品。
基于用户的协同过滤算法主要包括两个步骤:- 第一步:找到和目标用户兴趣相似的用户集合。
- 关键:计算两个用户的兴趣相似度
- 协同过滤算法主要利用行为的相似度计算兴趣的相似度
- 第二步:找到这个集合中的用户喜欢的,且目标用户没有听说过的物品推荐给目标用户。
- 物品-用户倒排表
- UserCF算法会给用户推荐和他兴趣最相似的K个用户喜欢的物品
- 缺点
- 首先,随着网站的用户数目越来越大,计算用户兴趣相似度矩阵将越来越困难,其运算时间复杂度和空间复杂度的增长和用户数的增长近似于平方关系
- 其次,基于用户的协同过滤很难对推荐结果作出解释
- 第一步:找到和目标用户兴趣相似的用户集合。
- 基于物品的协同过滤算法ItemCF:这种算法给用户推荐和他之前喜欢的物品相似的物品
基于物品的协同过滤算法主要分为两步:- 第一步:计算物品之间的相似度。
- 第二步:根据物品的相似度和用户的历史行为给用户生成推荐列表。
- 用ItemCF算法计算物品相似度时也可以首先建立用户—物品倒排表(即对每个用户建立一个包含他喜欢的物品的列表),然后对于每个用户,将他物品列表中的物品两两在共现矩阵C中加1。
- 哈利波特问题:惩罚热门商品
- 基于用户的协同过滤算法:这种算法给用户推荐和他兴趣相似的其他用户喜欢的物品。
- LFM隐语义模型( latent factor model)
- 物品分类(属于每个类的权重)
- 隐性反馈行为的负样本采集
- 物品分类(属于每个类的权重)
- 基于图的随机游走算法( random walk on graph)
- 用户行为数据的二分图表示
- 基于图的推荐算法
- 给用户u推荐物品的任务就可以转化为度量用户顶点和与没有边直接相连的物品节点在图上的相关性,相关性越高的物品在推荐列表中的权重就越高。
- 一般来说图中顶点的相关性主要取决于下面3 个因素:
- 两个顶点之间的路径数
- 两个顶点之间路径的长度
- 两个顶点之间的路径经过的顶点
- 基于随机游走的PersonalRank算法
- 基于邻域的方法( neighborhood-based)
第三章 推荐系统冷启动问题
- 用户冷启动
- 物品冷启动
- 系统冷启动
- 提供非个性化的推荐:非个性化推荐的最简单例子就是热门排行榜,我们可以给用户推荐热门排行榜,然后等到用户数据收集到一定的时候,再切换为个性化推荐。
- 利用用户注册时提供的年龄、性别等数据做粗粒度的个性化。
- 用户的注册信息分3种:
- 人口统计学信息:包括用户的年龄、性别、职业、民族、学历和居住地。
- 用户兴趣的描述:有一些网站会让用户用文字描述他们的兴趣。
- 从其他网站导入的用户站外行为数据:比如用户通过豆瓣、新浪微博的账号登录,就可以在得到用户同意的情况下获取用户在豆瓣或者新浪微博的一些行为数据和社交网络数据。
- 基于注册信息的个性化推荐流程基本如下:
- (1) 获取用户的注册信息;
- (2) 根据用户的注册信息对用户分类;
- (3) 给用户推荐他所属分类中用户喜欢的物品。
- 利用用户的社交网络账号登录(需要用户授权),导入用户在社交网站上的好友信息,然后给用户推荐其好友喜欢的物品。
- 要求用户在登录时对一些物品进行反馈,收集用户对这些物品的兴趣信息,然后给用户推荐那些和这些物品相似的物品。
- 启动物品的特点:比较热门、具有代表性和区分性、启动物品集合要有多样性
- 决策树
- 对于新加入的物品,可以利用内容信息,将它们推荐给喜欢过和它们相似的物品的用户。
- 话题模型LDA(物品的话题分布相似度:KL散度)
- 在系统冷启动时,可以引入专家的知识,通过一定的高效方式迅速建立起物品的相关度表。
第四章 利用用户标签数据
- 标签:特征表现方式
- 根据给物品打标签的人的不同,标签应用一般分为两种
- 一种是让作者或者专家给物品打标签
- 另一种是让普通用户给物品打标签,也就是UGC( User Generated Content,用户生成的内容)的标签应用。
- UGC
- 标签系统中的推荐问题主要有以下两个。
- 如何利用用户打标签的行为为其推荐物品(基于标签的推荐)?
- 如何在用户给物品打标签时为其推荐适合该物品的标签(标签推荐)?
- 标签扩展(标签相似度)
- 话题模型
- 基于邻域的方法
- 标签清理
- 有的标签不反应用户兴趣
- 有的标签是同义词
- 将标签作为推荐解释
- 方法
- 去除词频很高的停止词
- 去除因词根不同造成的同义词
- 去除因分隔符造成的同义词
- 基于图的推荐算法
- 节点:用户、物品、标签
- SimpleTagGraph
- PersonalRank
- 给用户推荐标签
- 方便用户输入
- 提高数据质量(同义词)
- 推荐的标签:热门标签,该物品常用,该用户常用
- 对新用户/新物品
- 抽取关键词作为标签
- 扩展标签(见上)
- 基于图的标签推荐算法
第五章 利用上下文信息
- 时间
- 用户历史兴趣变化
- 物品生命周期
- 季节效应
- 节日效应
- 推荐算法的时间多样性
- 实时推荐系统
- 在生成推荐结果时加入一定的随机性
- 对较久远的行为降权
- 随机应用不同的推荐算法
- 最近最热门
- ItemCF算法(数学衰减函数)
- UserCF算法(相似兴趣用户的最近行为)
- 时间段图模型(路径融合算法)
- 地点
- 基于位置的服务LBS
- (明尼苏达大学)LARS位置感知推荐系统
- 物品/用户:有无空间属性
- 用户有地理位置——金字塔模型:树,ItemCF。每一层训练推荐模型,叠加
- 物品有地理位置——TravelPenalty
- 心情
第六章 利用社交网络数据
- 社会化推荐
- 增加推荐的信任度
- 解决冷启动问题
- 社交图谱/兴趣图谱
- 双向确认的社交网络数据/单向关注的社交网络数据/基于社区的社交网络数据
- 基于邻域的社会化推荐算法
- 用户之间的熟悉程度(共同好友比例)
- 用户之间的兴趣相似度
- 图
- friendship/membership(同一社区)
- 时效问题——解决方案:做截断(只用相似度最高的N个好友、只用1个月的行为等)、重新设计数据库(Twitter的消息队列,每次更新都把所有人的写一遍)
- 评测:用户调查和在线实验(AB Test)
- 信息流推荐(Facebook的EdgeRank)
- 给用户推荐好友:链路预测link prediction
- 基于内容的匹配
- 基于共同兴趣的好友
- 基于社交网络图的好友推荐
- 随机图
- 中心度
第七章 推荐系统实例
外围架构
按照前面数据的规模和是否需要实时存取,不同的行为数据将被存储在不同的媒介中。一般来说,需要实时存取的数据存储在数据库和缓存中,而大规模的非实时地存取数据存储在分布式文件系统(如HDFS)中。
- 推荐系统架构
- 生成用户特征(人口统计学特征、行为特征、话题特征(历史行为→话题模型))
- 根据特征找到物品
- 推荐引擎架构
- 生成用户特征向量
- 特征和特征的权重
- 用户行为的种类(代价反映的偏爱)
- 用户行为产生的时间
- 用户行为的次数
- 物品的热门程度
- 生成用户推荐物品列表
- 过滤(用户已经产生过行为物品、候选物品以外的物品、某些质量很差的物品(用户评分))
- 排名
- 新颖性排名(内容相似度矩阵)
- 多样性(内容、属性上的)
- 时间多样性(实时性)
- 用户反馈(点击模型)
- 生成用户特征向量
第八章 评分预测问题
- 前:TopN推荐
- 按时间划分数据集
- 评分预测算法
- 平均值
- 全局平均值
- 用户评分平均值
- 物品评分平均值
- 用户分类对物品分类的平均值
- 分类: 用户和物品的平均分, 用户活跃度和物品流行度
- 基于邻域的方法
- 隐语义模型与矩阵分解模型: 如何通过降维的方法将评分矩阵补全
- SVD分解
- Funk-SVD/LFM
- 加入偏置项后的LFM
- 考虑邻域影响的LFM
- 加入时间信息
- 基于邻域的模型融合时间信息
- 基于矩阵分解的模型融合时间信息
- 模型融合
- 模型级联融合
- 模型加权融合
- 平均值
其他来源的相关参考资料
豆瓣书评
- 新一代推荐系统包含三个子模块
- 前台的展示页面
- 后台的日志系统
- 推荐算法系统
- 社交网站的API接口:好友行为
知乎
- 入门推荐系统,你不应该错过的知识清单 - 第四范式 先荐的文章 - 知乎
- 推荐系统入门要点哪些技能树? - 知乎
CSDN
- 《推荐系统实践》项亮 书中程序实现
- 推荐系统案例
博客园
- 协同滤波 Collaborative filtering 《推荐系统实践》 第二章
豆瓣用户整理的附录和参考资料
附上Reference 中的干货 (Paper,Blog等资料的链接)
http://en.wikipedia.org/wiki/Information_overload
P1
http://www.readwriteweb.com/archives/recommender_systems.php
(A Guide to Recommender System) P4
http://en.wikipedia.org/wiki/Cross-selling
(Cross Selling) P6
http://blog.kiwitobes.com/?p=58 , http://stanford2009.wikispaces.com/
(课程:Data Mining and E-Business: The Social Data Revolution) P7
http://thesearchstrategy.com/ebooks/an%20introduction%20to%20search%20engines%20and%20web%20navigation.pdf
(An Introduction to Search Engines and Web Navigation) p7
http://www.netflixprize.com/
p8
http://cdn-0.nflximg.com/us/pdf/Consumer_Press_Kit.pdf
p9
http://stuyresearch.googlecode.com/hg-history/c5aa9d65d48c787fd72dcd0ba3016938312102bd/blake/resources/p293-davidson.pdf
(The Youtube video recommendation system) p9
http://www.slideshare.net/plamere/music-recommendation-and-discovery
( PPT: Music Recommendation and Discovery) p12
http://www.facebook.com/instantpersonalization/
P13
http://about.digg.com/blog/digg-recommendation-engine-updates
(Digg Recommendation Engine Updates) P16
http://static.googleusercontent.com/external_content/untrusted_dlcp/research.google.com/en//pubs/archive/36955.pdf
(The Learning Behind Gmail Priority Inbox)p17
http://www.grouplens.org/papers/pdf/mcnee-chi06-acc.pdf
(Accurate is not always good: How Accuracy Metrics have hurt Recommender Systems) P20
http://www-users.cs.umn.edu/~mcnee/mcnee-cscw2006.pdf
(Don’t Look Stupid: Avoiding Pitfalls when Recommending Research Papers)P23
http://www.sigkdd.org/explorations/issues/9-2-2007-12/7-Netflix-2.pdf
(Major componets of the gravity recommender system) P25
http://cacm.acm.org/blogs/blog-cacm/22925-what-is-a-good-recommendation-algorithm/fulltext
(What is a Good Recomendation Algorithm?) P26
http://research.microsoft.com/pubs/115396/evaluationmetrics.tr.pdf
(Evaluation Recommendation Systems) P27
http://mtg.upf.edu/static/media/PhD_ocelma.pdf
(Music Recommendation and Discovery in the Long Tail) P29
http://ir.ii.uam.es/divers2011/
(Internation Workshop on Novelty and Diversity in Recommender Systems) p29
http://www.cs.ucl.ac.uk/fileadmin/UCL-CS/research/Research_Notes/RN_11_21.pdf
(Auralist: Introducing Serendipity into Music Recommendation ) P30
http://www.springerlink.com/content/978-3-540-78196-7/#section=239197&page=1&locus=21
(Metrics for evaluating the serendipity of recommendation lists) P30
http://dare.uva.nl/document/131544
(The effects of transparency on trust in and acceptance of a content-based art recommender) P31
http://brettb.net/project/papers/2007%20Trust-aware%20recommender%20systems.pdf
(Trust-aware recommender systems) P31
http://recsys.acm.org/2011/pdfs/RobustTutorial.pdf
(Tutorial on robutness of recommender system) P32
http://youtube-global.blogspot.com/2009/09/five-stars-dominate-ratings.html
(Five Stars Dominate Ratings) P37
http://www.informatik.uni-freiburg.de/~cziegler/BX/
(Book-Crossing Dataset) P38
http://www.dtic.upf.edu/~ocelma/MusicRecommendationDataset/lastfm-1K.html
(Lastfm Dataset) P39
http://mmdays.com/2008/11/22/power_law_1/
(浅谈网络世界的Power Law现象) P39
http://www.grouplens.org/node/73/
(MovieLens Dataset) P42
http://research.microsoft.com/pubs/69656/tr-98-12.pdf
(Empirical Analysis of Predictive Algorithms for Collaborative Filtering) P49
http://vimeo.com/1242909
(Digg Vedio) P50
http://glaros.dtc.umn.edu/gkhome/fetch/papers/itemrsCIKM01.pdf
(Evaluation of Item-Based Top-N Recommendation Algorithms) P58
http://www.cs.umd.edu/~samir/498/Amazon-Recommendations.pdf
(Amazon.com Recommendations Item-to-Item Collaborative Filtering) P59
http://glinden.blogspot.com/2006/03/early-amazon-similarities.html
(Greg Linden Blog) P63
http://www.hpl.hp.com/techreports/2008/HPL-2008-48R1.pdf
(One-Class Collaborative Filtering) P67
http://en.wikipedia.org/wiki/Stochastic_gradient_descent
(Stochastic Gradient Descent) P68
http://www.ideal.ece.utexas.edu/seminar/LatentFactorModels.pdf
(Latent Factor Models for Web Recommender Systems) P70
http://en.wikipedia.org/wiki/Bipartite_graph
(Bipatite Graph) P73
http://ieeexplore.ieee.org/xpl/login.jsp?tp=&arnumber=4072747&url=http%3A%2F%2Fieeexplore.ieee.org%2Fxpls%2Fabs_all.jsp%3Farnumber%3D4072747
(Random-Walk Computation of Similarities between Nodes of a Graph with Application to Collaborative Recommendation) P74
http://www-cs-students.stanford.edu/~taherh/papers/topic-sensitive-pagerank.pdf
(Topic Sensitive Pagerank) P74
http://www.stanford.edu/dept/ICME/docs/thesis/Li-2009.pdf
(FAST ALGORITHMS FOR SPARSE MATRIX INVERSE COMPUTATIONS) P77
https://www.aaai.org/ojs/index.php/aimagazine/article/view/1292
(LIFESTYLE FINDER: Intelligent User Profiling Using Large-Scale Demographic Data) P80
http://research.yahoo.com/files/wsdm266m-golbandi.pdf
( adaptive bootstrapping of recommender systems using decision trees) P87
http://en.wikipedia.org/wiki/Vector_space_model
(Vector Space Model) P90
http://tunedit.org/challenge/VLNetChallenge
(冷启动问题的比赛) P92
http://www.cs.princeton.edu/~blei/papers/BleiNgJordan2003.pdf
(Latent Dirichlet Allocation) P92
http://en.wikipedia.org/wiki/Kullback%E2%80%93Leibler_divergence
(Kullback–Leibler divergence) P93
http://www.pandora.com/about/mgp
(About The Music Genome Project) P94
http://en.wikipedia.org/wiki/List_of_Music_Genome_Project_attributes
(Pandora Music Genome Project Attributes) P94
http://www.jinni.com/movie-genome.html
(Jinni Movie Genome) P94
http://www.shilad.com/papers/tagsplanations_iui2009.pdf
(Tagsplanations: Explaining Recommendations Using Tags) P96
http://en.wikipedia.org/wiki/Tag_(metadata)
(Tag Wikipedia) P96
http://www.shilad.com/shilads_thesis.pdf
(Nurturing Tagging Communities) P100
http://www.stanford.edu/~morganya/research/chi2007-tagging.pdf
(Why We Tag: Motivations for Annotation in Mobile and Online Media ) P100
http://www.google.com/url?sa=t&rct=j&q=delicious%20dataset%20dai-larbor&source=web&cd=1&ved=0CFIQFjAA&url=http%3A%2F%2Fwww.dai-labor.de%2Fen%2Fcompetence_centers%2Firml%2Fdatasets%2F&ei=1R4JUKyFOKu0iQfKvazzCQ&usg=AFQjCNGuVzzKIKi3K2YFybxrCNxbtKqS4A&cad=rjt
(Delicious Dataset) P101
http://research.microsoft.com/pubs/73692/yihgoca-www06.pdf
(Finding Advertising Keywords on Web Pages) P118
http://www.kde.cs.uni-kassel.de/ws/rsdc08/
(基于标签的推荐系统比赛) P119
http://delab.csd.auth.gr/papers/recsys.pdf
(Tag recommendations based on tensor dimensionality reduction)P119
http://www.l3s.de/web/upload/documents/1/recSys09.pdf
(latent dirichlet allocation for tag recommendation) P119
http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.94.5271&rep=rep1&type=pdf
(Folkrank: A ranking algorithm for folksonomies) P119
http://www.grouplens.org/system/files/tagommenders_numbered.pdf
(Tagommenders: Connecting Users to Items through Tags) P119
http://www.grouplens.org/system/files/group07-sen.pdf
(The Quest for Quality Tags) P120
http://2011.camrachallenge.com/
(Challenge on Context-aware Movie Recommendation) P123
http://bits.blogs.nytimes.com/2011/09/07/the-lifespan-of-a-link/
(The Lifespan of a link) P125
http://www0.cs.ucl.ac.uk/staff/l.capra/publications/lathia_sigir10.pdf
(Temporal Diversity in Recommender Systems) P129
http://staff.science.uva.nl/~kamps/ireval/papers/paper_14.pdf
(Evaluating Collaborative Filtering Over Time) P129
http://www.google.com/places/
(Hotpot) P139
http://www.readwriteweb.com/archives/google_launches_recommendation_engine_for_places.php
(Google Launches Hotpot, A Recommendation Engine for Places) P139
http://xavier.amatriain.net/pubs/GeolocatedRecommendations.pdf
(geolocated recommendations) P140
http://www.nytimes.com/interactive/2010/01/10/nyregion/20100110-netflix-map.html
(A Peek Into Netflix Queues) P141
http://www.cs.umd.edu/users/meesh/420/neighbor.pdf
(Distance Browsing in Spatial Databases1) P142
http://www.eng.auburn.edu/~weishinn/papers/MDM2010.pdf
(Efficient Evaluation of k-Range Nearest Neighbor Queries in Road Networks) P143
http://blog.nielsen.com/nielsenwire/consumer/global-advertising-consumers-trust-real-friends-and-virtual-strangers-the-most/
(Global Advertising: Consumers Trust Real Friends and Virtual Strangers the Most) P144
http://static.googleusercontent.com/external_content/untrusted_dlcp/research.google.com/en//pubs/archive/36371.pdf
(Suggesting Friends Using the Implicit Social Graph) P145
http://blog.nielsen.com/nielsenwire/online_mobile/friends-frenemies-why-we-add-and-remove-facebook-friends/
(Friends & Frenemies: Why We Add and Remove Facebook Friends) P147
http://snap.stanford.edu/data/
(Stanford Large Network Dataset Collection) P149
http://www.dai-labor.de/camra2010/
(Workshop on Context-awareness in Retrieval and Recommendation) P151
http://www.comp.hkbu.edu.hk/~lichen/download/p245-yuan.pdf
(Factorization vs. Regularization: Fusing Heterogeneous
Social Relationships in Top-N Recommendation) P153
http://www.infoq.com/news/2009/06/Twitter-Architecture/
(Twitter, an Evolving Architecture) P154
http://www.google.com/url?sa=t&rct=j&q=&esrc=s&source=web&cd=2&ved=0CGQQFjAB&url=http%3A%2F%2Fciteseerx.ist.psu.edu%2Fviewdoc%2Fdownload%3Fdoi%3D10.1.1.165.3679%26rep%3Drep1%26type%3Dpdf&ei=dIIJUMzEE8WviQf5tNjcCQ&usg=AFQjCNGw2bHXJ6MdYpksL66bhUE8krS41w&sig2=5EcEDhRe9S5SQNNojWk7_Q
(Recommendations in taste related domains) P155
http://www.ercim.eu/publication/ws-proceedings/DelNoe02/RashmiSinha.pdf
(Comparing Recommendations Made by Online Systems and Friends) P155
http://techcrunch.com/2010/04/22/facebook-edgerank/
(EdgeRank: The Secret Sauce That Makes Facebook’s News Feed Tick) P157
http://www.grouplens.org/system/files/p217-chen.pdf
(Speak Little and Well: Recommending Conversations in Online Social Streams) P158
http://blog.linkedin.com/2008/04/11/learn-more-abou-2/
(Learn more about “People You May Know”) P160
http://domino.watson.ibm.com/cambridge/research.nsf/58bac2a2a6b05a1285256b30005b3953/8186a48526821924852576b300537839/$FILE/TR%202009.09%20Make%20New%20Frends.pdf
(“Make New Friends, but Keep the Old” – Recommending People on Social Networking Sites) P164
http://www.google.com.hk/url?sa=t&rct=j&q=social+recommendation+using+prob&source=web&cd=2&ved=0CFcQFjAB&url=http%3A%2F%2Fciteseerx.ist.psu.edu%2Fviewdoc%2Fdownload%3Fdoi%3D10.1.1.141.465%26rep%3Drep1%26type%3Dpdf&ei=LY0JUJ7OL9GPiAfe8ZzyCQ&usg=AFQjCNH-xTUWrs9hkxTA8si5fztAdDAEng
(SoRec: Social Recommendation Using Probabilistic Matrix) P165
http://olivier.chapelle.cc/pub/DBN_www2009.pdf
(A Dynamic Bayesian Network Click Model for Web Search Ranking) P177
http://www.google.com.hk/url?sa=t&rct=j&q=online+learning+from+click+data+spnsored+search&source=web&cd=1&ved=0CFkQFjAA&url=http%3A%2F%2Fwww.research.yahoo.net%2Ffiles%2Fp227-ciaramita.pdf&ei=HY8JUJW8CrGuiQfpx-XyCQ&usg=AFQjCNE_CYbEs8DVo84V-0VXs5FeqaJ5GQ&cad=rjt
(Online Learning from Click Data for Sponsored Search) P177
http://www.cs.cmu.edu/~deepay/mywww/papers/www08-interaction.pdf
(Contextual Advertising by Combining Relevance with Click Feedback) P177
http://tech.hulu.com/blog/2011/09/19/recommendation-system/
(Hulu 推荐系统架构) P178
http://mymediaproject.codeplex.com/
(MyMedia Project) P178
http://www.grouplens.org/papers/pdf/www10_sarwar.pdf
(item-based collaborative filtering recommendation algorithms) P185
http://www.stanford.edu/~koutrika/Readings/res/Default/billsus98learning.pdf
(Learning Collaborative Information Filters) P186
http://sifter.org/~simon/journal/20061211.html
(Simon Funk Blog:Funk SVD) P187
http://courses.ischool.berkeley.edu/i290-dm/s11/SECURE/a1-koren.pdf
(Factor in the Neighbors: Scalable and Accurate Collaborative Filtering) P190
http://nlpr-web.ia.ac.cn/2009papers/gjhy/gh26.pdf
(Time-dependent Models in Collaborative Filtering based Recommender System) P193
http://sydney.edu.au/engineering/it/~josiah/lemma/kdd-fp074-koren.pdf
(Collaborative filtering with temporal dynamics) P193
http://en.wikipedia.org/wiki/Least_squares
(Least Squares Wikipedia) P195
http://www.mimuw.edu.pl/~paterek/ap_kdd.pdf
(Improving regularized singular value decomposition for collaborative filtering) P195
http://public.research.att.com/~volinsky/netflix/kdd08koren.pdf
(Factorization Meets the Neighborhood: a Multifaceted
Collaborative Filtering Model) P195
相关文章:
推荐系统实践 笔记
诸神缄默不语-个人CSDN博文目录 这是我2020年写的笔记,我从印象笔记搬过来公开。 如果那年还在读本科的同学也许有印象,那年美赛出了道根据电商评论给商户提建议的题。其实这件事跟推荐系统关系不大,但我们当时病急乱投医,我打开…...
【JavaEE】JUC(Java.util.concurrent)常见类
文章目录 前言ReentrantLock原子类线程池信号量CountDownLatch相关面试题 前言 经过前面文章的学习我们大致了解了如何实现多线程编程和解决多线程编程中遇到的线程不安全问题,java.util.concurrent 是我们多线程编程的一个常用包,那么今天我将为大家分…...
清除浮动的方法
为什么需要清除浮动? 父级的盒子不能把height定死这样,浮动子类就没有了(行内块元素的特点),父类高度为零。故引用清除浮动 1、父级没有高度 2、子盒子浮动了 3、影响下面的布局了,我们就应该清除浮动了…...
LangChain 摘要 和问答示例
在Azure上的OpenAI端点 注意 OpenAI key 可以用微软 用例【1. 嵌入 ,2. 问答】 1. import os import openai from langchain.embeddings import OpenAIEmbeddings os.environ["OPENAI_API_KEY"] "****" # Azure 的密钥 os.environ["OP…...
(32)测距仪(声纳、激光雷达、深度摄影机)
文章目录 前言 32.1 单向测距仪 32.2 全向性近距离测距仪 32.3 基于视觉的传感器 前言 旋翼飞机/固定翼/无人车支持多种不同的测距仪,包括激光雷达(使用激光或红外线光束进行距离测量)、360 度激光雷达(可探测多个方向的障碍…...
教你拥有一个自己的QQ机器人!0基础超详细保姆级教学!基于NoneBot2 Windows端搭建QQ机器人
0.序言 原文链接:教你本地化部署一个QQ机器人本教程主要面向Windows系统用户教程从0开始全程详细指导,0基础萌新请放心食用🍕如果你遇到了问题,请仔细检查是否哪一步有遗漏。如果你确定自己的操作没问题,可以到原文链…...
智能银行卡明细筛选与统计,轻松掌握账户总花销!
作为现代生活的重要组成部分,银行卡成为了我们日常消费和收入的主要途径。但是,当我们需要了解自己的银行卡账户的总花销时,繁琐的明细筛选和统计工作常常让人头疼。现在,让我们向您推荐一款智能银行卡明细筛选与统计工具…...
SRT服务器SLS
目前互联网上的视频直播有两种,一种是基于RTMP协议的直播,这种直播方式上行推流使用RTMP协议,下行播放使用RTMP,HTTPFLV或者HLS,直播延时一般大于3秒,广泛应用秀场、游戏、赛事和事件直播,满足了…...
Linux 安装 Android SDK
先安装jdk RUN apt-get install default-jdk 参考:http://t.zoukankan.com/braveym-p-6143356.html mkdir -p $HOME/install/android-sdk wget https://dl.google.com/android/repository/commandlinetools-linux-9123335_latest.zip unzip commandlinetools-linu…...
【QT开发笔记-基础篇】| 第四章 事件QEvent | 4.4 鼠标按下、移动、释放事件
本章要实现的整体效果如下: QEvent::MouseButtonPress 鼠标按下时,触发该事件,它对应的子类是 QMouseEvent QEvent::MouseMove 鼠标移动时,触发该事件,它对应的子类是 QMouseEvent QEvent::MouseButtonRel…...
vue3父子通信+ref,toRef,toRefs使用实例
ref是什么? 生成值类型的响应式数据可用于模板和reactive通过.value修改值可以获取DOM元素 <p ref”elemRef”>{{nameRef}} -- {{state.name}}</p> // 获取dom元素 onMounted(()>{ console.log(elemRef.value); }); toRef是什么? 针对一个响应式对象(rea…...
输入电压转化为电流性 5~20mA方案
输入电压转化为电流性 5~20mA方案 方案一方案二方案三 方案一 XTR111是一款精密的电压-电流转换器是最广泛应用之一。原因有二:一是线性度非常好、二是价格便宜。总结成一点,就是性价比高。 典型电路 最终电路 Z1二极管处输出电流表达式:…...
SpringBoot自带模板引擎Thymeleaf使用详解①
目录 前言 一、SpringBoot静态资源相关目录 二、变量输出 2.1 在templates目录下创建视图index.html 2.2 创建对应的Controller 2.3 在视图展示model中的值 三、操作字符串和时间 3.1 操作字符串 3.2 操作时间 前言 Thymeleaf是一款用于渲染XML/HTML5内容的模板引擎&am…...
推荐算法——Apriori算法原理
0、前言: 首先名字别读错:an pu ruo ao rui 【拼音发音】Apriori是一种推荐算法推荐系统:从海量数据中,帮助用户进行信息的过滤和选择。主要推荐方法有:基于内容的推荐、协同过滤推荐、基于关联规则的推荐、基于知识的…...
vue ant 隐藏 列
vue ant 隐藏 列 如果你使用的是Vue和Ant Design Vue组件库,你可以使用v-if指令来实现条件渲染来隐藏列。以下是一个示例代码: <template><a-table :columns"columns" :data-source"data"><template v-slot:custom…...
java基础之初始化顺序
初始化顺序 在类中变量定义的顺序决定了它们初始化的顺序。在创建任何java对象时,都是依次调用父类非静态初始化块、父类构造器执行初始化、本类的非静态初始化块、本类构造器执行初始化 public class House { // 构造器之前 Window w1 new Window(1); Ho…...
FFmpeg 命令:从入门到精通 | ffmpeg filter(过滤器 / 滤镜)
FFmpeg 命令:从入门到精通 | ffmpeg filter(过滤器 / 滤镜) FFmpeg 命令:从入门到精通 | ffmpeg filter(过滤器 / 滤镜)ffmpeg fliter 基本内置变量视频裁剪文字水印图片水印画中画视频多宫格处理 FFmpeg 命…...
【C语言】23-结构体类型
目录 1. 如何建立结构体类型2. 如何使用结构体2.1 定义结构体变量2.2 结构体变量的初始化和引用2.3 结构体数组2.4 结构体指针2.4.1 指向结构体变量的指针2.4.2 指向结构体数组的指针C 语言提供了一些由系统已定义好的数据类型,如: int、 float、 char 等,用户可以在程序…...
Python小技巧:快速合并字典dict()
文章目录 前言知识点字典合并1. dict.update()基础合并2. 字典推导式 update() 后话 前言 这里是Python小技巧的系列文章。这是第四篇,快速合并字典。 在Python的使用中,有时候需要将两个 dict(字典) 进行合并。 通常我们会借助 dict(字典) 的内置方法 …...
如何使用 React 和 Docusaurus 编写的一些自定义钩子(Hook)
import useRouteContext from @docusaurus/useRouteContext; import {DependencyList, useEffect, useRef, useState, useMemo } from react; import {dequal } from dequal; /* eslint-disable global-require */ // @ts-ignore/*** 用于深度检测依赖的useMemo钩子* @param fa…...
【初识Linux】Linux环境配置、Linux的基本指令 一
Linux基本指令一 一、学习前提(环境配置)①安装Xshell和云服务器推荐②Xshell用途如下图③打开Xshell 二、 Linux基本指令①whoami和who指令②pwd、ls、ls -l三个指令ls指令扩充 ③cd指令前提了解有了上面的认识,我们就可以开始cd指令的学习了 ④tree指令…...
conda常用命令参数,指定版本,依赖库文件,创建虚拟环境,删除,激活,退出,内部安装包,pip通过代理安装包
以下是conda的常用命令和参数: 1. 创建虚拟环境: - 创建一个新的虚拟环境:conda create -n 环境名 pythonx.x - 使用指定的依赖文件创建虚拟环境:conda create -n 环境名 --file requirements.txt 2. 激活虚拟环境&#x…...
【锁的区别】C++线程库和POSIX线程库锁的区别
C线程库和POSIX线程库锁的区别 C线程库代码段的互斥:mutex、recursive_mutex、timed_mutex、recursive_timed_mutex互斥量mutex:直接进行lock()或者unlock()递归互斥锁recursive_mutex:可以多次加锁,意味着加几次锁就需要解几次锁…...
网络层·IP协议
承接前文TCP协议-CSDN博客 简介 协议头格式 网段划分(重要) 划分方法 IP地址的数量限制(背景介绍) 私有IP地址和公网IP地址(提出解决思路) NAT技术(解决方法) 路由 网络层 在复杂的网络环境中确定一个合适的路径 IP协议 主机: 配有IP地址, 可以认为就是你的电脑; 路由器:…...
RabbitMQ学习笔记(下):延迟队列,发布确认高级,备份交换机
十、延迟队列 延迟队列 概念: 延迟队列使用场景: 流程图: 延迟队列整合Springboot 导入依赖: <dependencies><dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot…...
Python 无废话-基础知识面向对象编程详解
类定义 如何理解万物皆对象? 生活中一些事物,动物(可爱的小狗、调皮的小猫)、交通工具(比亚迪U8汽车、飞机)、人(学生、教师)…… 这些对象都有着独特或共性的属性和方法来描述其…...
凉鞋的 Unity 笔记 106. 第二轮循环场景视图Sprite Renderer
106. 第二轮循环&场景视图&Sprite Renderer 从这一篇开始,我们开始进行第二轮循环。 这次我们至少能够在游戏运行窗口看到一些东西。 首先还是在场景层次窗口进行编辑,先创建一个 Sprite,操作如下: 创建后,会在 Scene …...
Vue中如何进行分布式路由配置与管理
Vue中的分布式路由配置与管理 随着现代Web应用程序的复杂性不断增加,分布式路由配置和管理成为了一个重要的主题。Vue.js作为一种流行的前端框架,提供了多种方法来管理Vue应用程序的路由。本文将深入探讨在Vue中如何进行分布式路由配置与管理࿰…...
Solidity 合约漏洞,价值 38BNB 漏洞分析
Solidity 合约漏洞,价值 38BNB 漏洞分析 1. 漏洞简介 https://twitter.com/NumenAlert/status/1626447469361102850 https://twitter.com/bbbb/status/1626392605264351235 2. 相关地址或交易 攻击交易: https://bscscan.com/tx/0x146586f05a451313…...
【C++】:类和对象(2)
朋友们、伙计们,我们又见面了,本期来给大家解读一下有关Linux的基础知识点,如果看完之后对你有一定的启发,那么请留下你的三连,祝大家心想事成! C 语 言 专 栏:C语言:从入门到精通 数…...
交易类网站seo怎么做/seo入门教程seo入门
在应用有frameset或者iframe的页面时,parent是父窗口,top是最顶级父窗口(有的窗口中套了好几层frameset或者iframe),self是当前窗口,opener是用open方法打开当前窗口的那个窗口。 window.self 功能…...
做网站建立数据库/郑州厉害的seo优化顾问
首先,先查看一下Linuxi的一级目录结构: ls: /:表示根目录,文件系统的入口,最高一级目录。 bin和sbin:命令保存目录,bin是普通用户能,sbin是root用户用的;/bin存放着系统所…...
西宁网站建设哪家好/网站开发技术有哪些
flash 在通信方面用于客户端的方面能够表现出丰富的视角效果和体现,但是在服务器技术方面相对较弱,这样不得不借助于其他的服务器技术。如c java jsp php 等等。 我们希望在客户端里面呈现丰富的体现效果,这里可以使用到flex做客户端。它的组…...
不相关的网站做单项链接可以吗/关键词优化公司哪家好
我从零开始训练了GoogLeNet模型。 但它没有给我带来希望的结果。 作为替代,我想对我的数据集中的GoogLeNet模型进行微调。 有谁知道我应该遵循什么步骤? 采纳答案: 假设你正在尝试做图像分类。 这些应该是微调模型的步骤: 1.分类层…...
购物网站前台功能/阿里云域名注册官网
以前的需求是将mysql厘米的表和函数转为oracle里面 试过了很多种方法,oracle sqldeveloper,里面加入mysql包,就可以转换,但是有些会转化错误。 这边强烈建议使用Navicat_Premium,基本上都能成功。...
网站能获取访问者/seo和sem推广
文档对象模型是用来描述文档,这里的文档,是特指 HTML 文档。同时它又是一个“对象模型”,这意味着它使用的是对象这样的概念来描述 HTML 文档,DOM 也是使用树形的对象模型来描述一个 HTML 文档。 DOM API 大致会包含 4 个部分。 …...