撰写于    浏览:1073 次  分类: PyTorch 教程
1、GAN原理介绍生成式对抗网络(GAN, Generative Adversarial Networks )是一种深度学习模型,是近年来复杂分布上无监督学习最具前景的方法之一。模型通过框架中(至少)两个模块:生成模型(Generative Model)和判别模型(Discriminative Model)的互相博弈学习产生相当好的输出。GAN出自[...]

撰写于    浏览:1212 次  分类: 算法工程师经验分享
推荐系统会存储大量的用户与items交互数据,这些数据可以用二部图呈现。二部图对消除推荐系统中数据稀疏性和冷启动有着巨大的帮助。本文主要总结了3个典型的GNN方法在推荐系统领域处理用户与items的二部图。user-item二部图我们可以通过每个用户交互过的item列表,构建一个巨大的二部图,如下图所示:传统的神经网络方法(如协同过滤,双塔),是无[...]

撰写于    浏览:796 次  分类: 默认分类
通常情况下,confidence weight可以被分为三类:(1)Heuristic:典型的例子是加权的矩阵分解以及动态MF,未观测到的交互被赋予较低的权重。还有很多工作则基于用户的活跃度指定置信度等。但是赋予准确的置信权重是非常有挑战的,所以这块依然处理的不是非常好。(2)Sampling: 另一种解决曝光bias的方式就是采样,经常采用的采样[...]

撰写于    浏览:948 次  分类: 自然语言处理与推荐系统
1、NLTK是什么?NLTK 全称"Natural Language Toolkit",诞生于宾夕法尼亚大学,以研究和教学为目的而生,因此也特别适合入门学习。NLTK虽然主要面向英文,但是它的很多NLP模型或者模块是语言无关的,因此如果某种语言有了初步的Tokenization或者分词,NLTK的很多工具包是可以复用的。NLTK收集了大量公开数据集[...]

撰写于    浏览:670 次  分类: 默认分类
2021年初,一款现象级的应用打破了互联网圈许久的沉寂。在网红马斯克的站台下,美国音频社交软件Clubhouse在海内外一炮而红。一时间,全网都在疯狂寻求邀请码。在eBay平台上,一个Clubhouse邀请码甚至被炒到了100美元上下。如此火爆的市场情绪迅速被中国互联网平台捕捉,数款号称“中国版Clubhouse”的产品纷纷上线。不管是主流大厂,抑[...]

撰写于    浏览:3155 次  分类: 数据结构与算法电子书
1、封面介绍2、出版时间2020年10月3、推荐理由算法是个有趣的东西——针对某个问题设计算法的时候,不会的人感觉像“大海捞针”,而会的人则感觉像“一苇渡江”。高手的头脑里都有一张“算法地图”,算法之间不是孤立的,而是彼此连通的。算法之间的内在联系有很多,但挖掘到根源上,就是递推与递归两种思想。本书从深度解析递推和递归这基本算法思想开始,用它们贯穿[...]

撰写于    浏览:1145 次  分类: 数据结构与算法电子书
1、封面介绍2、出版时间2021年2月3、推荐理由本书以"问题驱动”为导向,结合数据结构课程知识的精华内容,通过学生对日常学习、生活中遇到的典型问题和案例的分析、讨论,引导学生了解数据结构的相关知识,培养学生对算法设计和分析的兴趣,帮助学生了解"计算思维”的内涵及本质,提高学生"IT”职业素养和分析能力。 本书共10章,内容涉及线性表、堆栈、队列、[...]

撰写于    浏览:1180 次  分类: 数据结构与算法电子书
1、封面介绍2、出版时间2021年1月3、推荐理由本书是作者积多年讲授与研究“数据结构”课程的经验并结合指导学生上机的实践编写而成的。作者力求从实践的角度,帮助读者深入学习、理解和掌握数据结构知识并能灵活应用这些知识。本书涵盖了“数据结构”课程涉及的上机实践内容,并且列举了理论知识对应的算法实现程序,这些程序都已在VC++6.0环境下调试通过。 本[...]

撰写于    浏览:1718 次  分类: 数据结构与算法电子书
1、封面介绍2、出版时间2021年1月3、推荐理由数据结构是高等学校计算机及其相关专业的核心课程,是计算机程序设计的基础。本书按照"像外行一样思考,像专家一样实践”的解决问题的思维方法,基于学习者的认知规律,列举大量实际或工程案例,从具体问题中引出抽象概念,运用类比、图形化描述等方式,对经典数据结构内容做深入浅出的介绍。在介绍数据结构和算法的基本概[...]

撰写于    浏览:959 次  分类: 默认分类
1、封面介绍2、出版时间2016年10月3、推荐理由这是一个数据信息时代,每分每秒都在产生数不尽的数据。这些数据如何获取,有什么用途,如何与前沿的深度学习、机器学习等相结合,如何为我们所用,尽在本书中。本书从架构、业务、技术三个维度深入浅出地介绍了大数据处理领域端到端的知识。主要内容包括三部分:第一部分从数据的产生、采集、计算、存储、消费端到端的角[...]

撰写于    浏览:1179 次  分类: 默认分类
1、封面介绍2、出版时间2019年12月3、推荐理由本书由数据中台领域的领先企业数澜科技官方出品,数澜科技已经帮助万科、中信云网等百余家各行业头部企业建设和落地数据中台。7位作者都是有10年+经验的资深数据人,大部分作者来自原阿里数据中台团队和华为。本书得到了阿里巴巴集团联合创始人谢世煌、原阿里集团副总裁卜鹰等近10位行业专家的高度评价和推荐。本书[...]

撰写于    浏览:1646 次  分类: 默认分类
1、封面介绍2、出版时间2020年2月3、推荐理由目前国内大数据市场继续保持高速的发展态势,作者在与地方政府、证券金融公司的项目合作中发现,他们对大数据技术很感兴趣,并希望从大数据技术、采集、存储、访问、安全、分析与开发等方面得到指导和帮助。因此编写了这本大数据技术的入门书。本书共12章,以Hadoop和Spark框架为线索,比较全面地介绍了Had[...]

撰写于    浏览:2876 次  分类: 默认分类
1、封面介绍2、出版时间2020年7月3、推荐理由适读人群 :(1) 架构师:可提升对大数据平台的整体把控力;(2) 中高级开发人员:可深入学习原型项目代码;(3) CIO或数据团队的负责人:可参考数据中台战略、规划数据平台蓝图及组建数据团队。目前,在基于大数据技术的数据中台建设过程中,由于缺乏完备的架构参考和类似于“脚手架”的原型项目,很多IT团[...]

撰写于    浏览:2485 次  分类: 默认分类
1、封面介绍2、出版时间2018年3月3、推荐理由本书旨在最大限度提高对开发人员最重要的英文读解能力,培养能够快速阅读英文报道等IT相关文档的基本技能。书中借助最 新IT媒体风格的报道,提供有趣且有益的知识,详细解释英语技术术语。课后附有英文思维训练,内容和形式都贴合一线程序员需求,能够激发阅读兴趣。例文难易得当,结构安排合理,是技术学习与英语学习[...]

撰写于    浏览:954 次  分类: 默认分类
1、什么是VersionName?什么是VersionCode?VersionName指的是版本名字,而VersionCode指的是版本号,如同一个自然人既有自己的名字,也有自己的身份证号。虽然带着“名字”字眼,但是在很多情况下,版本名字还是以数字为主,例如:微信8.0,其中“8.0”就是版本名字。所以,版本名字和版本号常常让人感到迷惑。不过,也有[...]