2021年3月


撰写于    浏览:1071 次  分类: PyTorch 教程
1、GAN原理介绍生成式对抗网络(GAN, Generative Adversarial Networks )是一种深度学习模型,是近年来复杂分布上无监督学习最具前景的方法之一。模型通过框架中(至少)两个模块:生成模型(Generative Model)和判别模型(Discriminative Model)的互相博弈学习产生相当好的输出。GAN出自[...]

撰写于    浏览:1212 次  分类: 算法工程师经验分享
推荐系统会存储大量的用户与items交互数据,这些数据可以用二部图呈现。二部图对消除推荐系统中数据稀疏性和冷启动有着巨大的帮助。本文主要总结了3个典型的GNN方法在推荐系统领域处理用户与items的二部图。user-item二部图我们可以通过每个用户交互过的item列表,构建一个巨大的二部图,如下图所示:传统的神经网络方法(如协同过滤,双塔),是无[...]

撰写于    浏览:796 次  分类: 默认分类
通常情况下,confidence weight可以被分为三类:(1)Heuristic:典型的例子是加权的矩阵分解以及动态MF,未观测到的交互被赋予较低的权重。还有很多工作则基于用户的活跃度指定置信度等。但是赋予准确的置信权重是非常有挑战的,所以这块依然处理的不是非常好。(2)Sampling: 另一种解决曝光bias的方式就是采样,经常采用的采样[...]

撰写于    浏览:947 次  分类: 自然语言处理与推荐系统
1、NLTK是什么?NLTK 全称"Natural Language Toolkit",诞生于宾夕法尼亚大学,以研究和教学为目的而生,因此也特别适合入门学习。NLTK虽然主要面向英文,但是它的很多NLP模型或者模块是语言无关的,因此如果某种语言有了初步的Tokenization或者分词,NLTK的很多工具包是可以复用的。NLTK收集了大量公开数据集[...]