矩阵分解模型（1）（ALS学习算法）推荐系统

一、矩阵分解模型。
用户对物品的打分行为可以表示成一个评分矩阵A(m*n)，表示m个用户对n各物品的打分情况。如下图所示：

文章图片

【矩阵分解模型（1）（ALS学习算法）】其中，A(i,j)表示用户user i对物品item j的打分。但是，用户不会对所以物品打分，图中？表示用户没有打分的情况，所以这个矩阵A很多元素都是空的，我们称其为“缺失值（missing value）”。在推荐系统中，我们希望得到用户对所有物品的打分情况，如果用户没有对一个物品打分，那么就需要预测用户是否会对该物品打分，以及会打多少分。这就是所谓的“矩阵补全（填空）”。
ALS 的核心就是下面这个假设：打分矩阵A是近似低秩的。换句话说，一个的打分矩阵 A 可以用两个小矩阵和的乘积来近似：。这样我们就把整个系统的自由度从一下降到了。我们接下来就聊聊为什么 ALS 的低秩假设是合理的。世上万千事物，人们的喜好各不相同。但描述一个人的喜好经常是在一个抽象的低维空间上进行的，并不需要把其喜欢的事物一一列出。举个例子，我喜欢看略带黑色幽默的警匪电影，那么大家根据这个描述就知道我大概会喜欢昆汀的《低俗小说》、《落水狗》和韦家辉的《一个字头的诞生》。这些电影都符合我对自己喜好的描述，也就是说他们在这个抽象的低维空间的投影和我的喜好相似。再抽象一些，把人们的喜好和电影的特征都投到这个低维空间，一个人的喜好映射到了一个低维向量，一个电影的特征变成了纬度相同的向量，那么这个人和这个电影的相似度就可以表述成这两个向量之间的内积。我们把打分理解成相似度，那么“打分矩阵A(m*n)”就可以由“用户喜好特征矩阵U(m*k)”和“产品特征矩阵V(n*k)”的乘积来近似了。矩阵U、矩阵V如下图所示：

文章图片

文章图片

U V
二、交替最小二乘法（ALS）。矩阵分解模型的损失函数为：

文章图片

有了损失函数之后，下面就开始谈优化方法了，通常的优化方法分为两种：交叉最小二乘法（alternative least squares）和随机梯度下降法（stochastic gradient descent）。本文使用交叉最小二乘法（ALS）来最优化损失函数。算法的思想就是：我们先随机生成然后固定它求解，再固定求解，这样交替进行下去，直到取得最优解min(C)。因为每步迭代都会降低误差，并且误差是有下界的，所以 ALS 一定会收敛。但由于问题是非凸的，ALS 并不保证会收敛到全局最优解。但在实际应用中，ALS 对初始点不是很敏感，是不是全局最优解造成的影响并不大。
算法的执行步骤：
1、先随机生成一个。一般可以取0值或者全局均值。
2、固定（即：认为是已知的常量），来求解。
此时，损失函数为：
文章图片

由于C中只有Vj一个未知变量，因此C的最优化问题转化为最小二乘问题，用最小二乘法求解Vj的最优解：
固定j（j=1,2,......,n），则：C的导数

文章图片

令
文章图片
，得到：

文章图片

即：

文章图片

令
文章图片
，
文章图片
，则：

文章图片

按照上式依次计算v1，v2，......，vn，从而得到。
3、固定（即：认为是已知的量），来求解。
此时，损失函数为：
文章图片

同理，用步骤2中类似的方法，可以计算ui的值：

文章图片

令
文章图片
，得到：

文章图片

即：

文章图片

令
文章图片
，
文章图片
，则：

文章图片

依照上式依次计算u1，u2，......，um，从而得到。
4、循环执行步骤2、3，直到损失函数C的值收敛（或者设置一个迭代次数N，迭代执行步骤2、3 N次后停止）。这样，就得到了C最优解对应的矩阵U、V。

矩阵分解模型（1）（ALS学习算法）

推荐阅读

椰子油的生活小妙用椰子油有什么用途和功效

庆东锅炉故障代码是什么如何解决

教学教务管理人员是干什么的

联想yoga2

如何选择抗体稀释液？抗体稀释液

下载导航地图，导航地图下载

流媒体后视镜可以当行车记录仪吗行车记录仪有必要买流媒体吗

炒苔菜用不用焯水，苔菜用不用焯水再炒

昆明工业职业技术学院怎么样

（152）感赏女儿|（152）感赏女儿 2020-12-4

桃子核发霉外面是好的还能吃吗

离散傅立叶分析,origin怎么进行傅立叶分析

次密接触者的一般接触者需要隔离吗

海带炖土豆的做法海带炖土豆的做法窍门

大概的近义词大概的近义词是什么标准答案

合金筷子是塑料还是金属合金筷子是什么材质

真我与假我

钢材包括哪些钢材怎么分类

heos,黑色素瘤

【家事】节如流水