撰写于    浏览:1099 次  分类: 强化学习
Ray简介Ray是一个开源的人工智能分布式框架,它的目标是让开发者仅需添加数行代码就能轻松转为适合于计算机集群运行的高性能分布式应用。今天的深度学习越来越需要计算资源,像笔记本电脑这样的单节点开发环境无法扩展以满足算力需求,Ray是将Python和AI应用程序从笔记本电脑扩展到集群的统一方法。使用Ray,您可以将相同的代码从笔记本电脑无缝扩展到集群[...]

撰写于    浏览:638 次  分类: 强化学习
REINFORCE介绍强化学习中的策略优化主要有两类:基于价值的方法和基于策略的方法(当然两者的结合产生了 Actor-Critic 等算法)。基于值函数的方法主要是学习值函数,然后根据值函数导出一个策略,学习过程中并不存在一个显式的策略;而基于策略的方法则是直接显式地学习一个目标策略。基于价值的方法主要有DQN,而基于策略的方法有REINFORC[...]

撰写于    浏览:1041 次  分类: 强化学习
强化学习中的策略优化主要有两类:基于value价值的方法和基于policy策略的方法(当然两者的结合产生了 Actor-Critic 等算法)。基于值函数的方法主要是学习值函数,然后根据值函数导出一个策略,学习过程中并不存在一个显式的策略;而基于策略的方法则是直接显式地学习一个目标策略。value-based方法是先通过计算出值函数,然后再求策略;[...]

撰写于    浏览:704 次  分类: 默认分类
多层感知机(MLP,Multilayer Perceptron)也叫人工神经网络(ANN,Artificial Neural Network),除了输入输出层,它中间可以有多个隐层,最简单的MLP只含一个隐层,即三层的结构,如下图: 从上图可以看到,多层感知机层与层之间是全连接的。多层感知机最底层是输入层,中间是隐藏层,最后是输出层。 需要注[...]

撰写于    浏览:447 次  分类: 图神经网络
Hungarian Algorithm(匈牙利算法) 由 Harold Kuhn 在1955年提出, 算法的命名是因为该算法很大程度上是基于两位匈牙利数学家的工作而来的.匈牙利算法主要用于解决一些与二分图匹配有关的问题。二分图(Bipartite graph)是一类特殊的图,它可以被划分为两个部分,每个部分内的点互不相连。下图是典型的二分图。可以看[...]

撰写于    浏览:498 次  分类: 图神经网络
1、什么是二分图?在一张图中,如果能够把全部的点分到两个集合中,保证两个集合内部没有任何边,图中的边 只存在于两个集合之间,这张图就是二分图。2、二分图常用算法有哪些呢?2.1、染色法(判断一个图是否为二分图)算法原理就是,用黑与白 这两种颜色对图中点染色(相当于给点归属一个集合),一个点显然不能同时具有两种颜色,若有,此图就不是二分图。2.2、匈[...]

撰写于    浏览:471 次  分类: 强化学习
马尔可夫决策过程简介马尔可夫决策过程(Markov Decision Processes,MDP)是对强化学习中环境的形式化的描述,或者说是对于智能体所处的环境的一个建模。在强化学习中,几乎所有的问题都可以形式化地表示为一个马尔可夫决策过程。本文以Frozen Lake游戏为例,介绍一下马尔可夫决策过程。Frozen Lake 游戏介绍Frozen[...]

撰写于    浏览:623 次  分类: 强化学习
当我们使用gym创建环境的时候:env = gym.make('CartPole-v0')返回的env其实并非CartPole类本身,而是一个经过包装的环境。包装的过程可以看这里:def make(self, path, **kwargs): spec = self.spec(path) env = spec.m[...]

撰写于    浏览:681 次  分类: 默认分类
AlphaGo是第一个击败人类职业围棋选手、第一个战胜围棋世界冠军的人工智能机器人,由谷歌(Google)旗下DeepMind公司开发。AlphaGo的辉煌战绩2016年3月,阿尔法围棋与围棋世界冠军、职业九段棋手李世石进行围棋人机大战,以4比1的总比分获胜;2016年末2017年初,该程序在中国棋类网站上以“大师”(Master)为注册账号与中日[...]

撰写于    浏览:792 次  分类: 默认分类
1、封面介绍2、出版时间2023年4月3、推荐理由人工智能(AI)时代已经来临,AIGC(人工智能生成内容)正在进一步激活人类的创造力。作为AIGC领域的标志性产品,ChatGPT问世即成为焦点,受到了市场广泛关注和赞誉。了解AI、AIGC,让我们从ChatGPT开始!本书从基础概念、技术原理、应用领域、未来展望四大维度深度阐述了ChatGPT“从[...]

撰写于    浏览:947 次  分类: 默认分类
1、封面介绍2、出版时间2023年4月3、推荐理由AIGC带来的生产力变革与每个人都息息相关,本书适合所有人阅读,特别是文本、图片、音视频等各类内容创作者,以及科技行业、金融行业的从业者和对AI领域感兴趣的读者。AIGC是2023年的热点话题,现在已经有很多成熟的应用,ChatGPT是其中比较典型的应用,由此引发了人们对失业问题的担心。本书介绍了A[...]

撰写于    浏览:1240 次  分类: 默认分类
1、封面介绍2、出版时间2023年5月3、推荐理由本书面向对人工智能及ChatGPT感兴趣的读者,特别是想要全面了解ChatGPT的读者。无论是从应用角度还是从技术原理角度,读者都能从本书中获益。本书以通俗易懂的语言对ChatGPT进行全面讲解。本书分为10章。第1章对ChatGPT及ChatGPT的创造者OpenAI进行初步讲解。第2章讲解Cha[...]

撰写于    浏览:983 次  分类: 默认分类
各位读者,大家好!本站是一个非盈利性网站,致力于给广大AI新人和爱好者提供学习资源。需要声明一点:本站所有的电子资源均是免费、公开分享,仅限于个人学习使用,请勿用于任何商业目的。想获取资源的读者,欢迎加入本站的技术社群。但是,为了避免不良用心的人或者电子书的二道贩子混入社群,所以先接受技术调查,请先回答下面几个问题,并发送给站长:(1)你的工作年限[...]

撰写于    浏览:854 次  分类: 图神经网络
1、封面介绍2、出版时间2021年12月3、推荐理由本书从基础知识开始,介绍深度学习与图神经网络相关的一系列技术与实现方法,主要内容包括PyTorch的使用、神经网络的原理、神经网络的基础模型、图神经网络的基础模型。书中侧重讲述与深度学习基础相关的网络模型和算法思想,以及图神经网络的原理,且针对这些知识点给出在PyTorch框架上的实现代码。本书适[...]

撰写于    浏览:830 次  分类: 图神经网络
1、封面介绍2、出版时间2021年4月3、推荐理由图神经网络(GNN)是基于深度学习的图数据处理方法,因其卓越的性能而受到广泛关注。本书全面介绍了GNN的基本概念、具体模型和实际应用。书中首先概述数学基础和神经网络以及图神经网络的基本概念,接着介绍不同种类的GNN,包括卷积图神经网络、循环图神经网络、图注意力网络、图残差网络,以及几个通用框架。此外[...]

飞燕网
专注于AI实习

    友情链接