推荐算法本质上就是在解决两个问题:记忆和泛化,传统的LR等模型,将大量的ID类稀疏特征直接喂给模型,再由广义线性模型直接学习这些ID类特征的权重,本质上就是模型对特征的简单粗暴的记忆,因此,泛化扩展性得不到保证,从未出现过的特征(如很重要的交叉特征等),模型无法学习该特征权重,故特征的指征能力无法体现;因此,深度学习模型引入Embedding稠密向量概念,将不同特征之间的一部分共性抽象出,放入Embedding空间进行学习,这样的操作可以近乎看作是模糊查找,具有较强的泛化能力,但记忆性显然不如LR等模型,wide&&deep的提出是兼容记忆性与泛化性的考虑,在此基础上,后续的DeepFM等模型,也只是在wide端加强了模型对特征的显式交叉,但架构本质与wide&&deep模型是一样的。

Wide&Deep.jpg