会员
强化学习:原理与Python实战
更新时间:2023-10-19 17:44:38
最新章节:封底开会员,本书免费读 >
本书从原理和实战两个方面介绍了强化学习。原理方面,深入介绍了主流强化学习理论和算法,覆盖资格迹等经典算法和MuZero等深度强化学习算法;实战方面,每章都配套了编程案例,以方便读者学习。全书从逻辑上分为三部分。第1章:从零开始介绍强化学习的背景知识,介绍环境库Gym的使用。第2~15章:基于折扣奖励离散时间Markov决策过程模型,介绍强化学习的主干理论和常见算法。采用数学语言推导强化学习的基础理论,进而在理论的基础上讲解算法,并为算法提供配套代码实现。基础理论的讲解突出主干部分,算法讲解全面覆盖主流的强化学习算法,包括经典的非深度强化学习算法和近年流行的强化学习算法。Python实现和算法讲解一一对应,还给出了深度强化学习算法的TensorFlow和PyTorch对照实现。第16章:介绍其他强化学习模型,包括平均奖励模型、连续时间模型、非齐次模型、半Markov模型、部分可观测模型等,以便更好了解强化学习研究的全貌。
品牌:机械工业出版社
上架时间:2023-08-01 00:00:00
出版社:机械工业出版社
本书数字版权由机械工业出版社提供,并由其授权上海阅文信息技术有限公司制作发行
强化学习:原理与Python实战最新章节
查看全部- 封底
- 作者简介
- 16.8 练习与模拟面试
- 16.7 本章小结
- 16.6 案例:老虎
- 16.5 部分可观测Markov决策过程
- 16.4 半Markov决策过程
- 16.3 非齐次Markov决策过程
- 16.2 连续时间Markov决策过程
- 16.1 平均奖励离散时间Markov决策过程
同类热门书
最新上架
- 会员
大模型实战:微调、优化与私有化部署
本书深入浅出地介绍了现代大型人工智能(ArtificialIntelligence,AI)模型技术,从对话机器人的发展历程和人工智能的理念出发,详细阐述了大模型私有化部署过程,深入剖析了Transformer架构,旨在帮助读者领悟大模型的核心原理和技术细节。本书的讲解风格独树一帜,将深奥的技术术语转化为简洁明了的语言,案例叙述既严谨又充满趣味,让读者在轻松愉快的阅读体验中自然而然地吸收和理解AI计算机15.8万字 - 会员
华为MindSpore深度学习框架应用开发实战
全书从逻辑上共分3部分。第一部分由第1章和第2章组成,介绍深度学习的基础理论、MindSpore总体架构和编程基础。第二部分由第3~8章组成,介绍MindSpore框架各子系统的具体情况,包括数据处理、算子、神经网络模型开发、数据可视化组件MindInsight、推理、以及移动端AI框架MindSporeLite。第三部分由第9章和第10章组成,介绍使用MindSpore框架开发和训练的经典深度计算机13万字 - 会员
文心一言:人人都能上手的AI工具
本书作为文心一言的学习指南,全面、细致地介绍了文心一言PC端和App的各项功能和使用方法,力求通过简洁明了的语言和图文并茂的形式,让读者快速掌握文心一言的各项功能。全书共8章,首先简单介绍了人工智能发展的几个阶段及文心一言的相关研发背景;随后介绍了文心一言的基础页面及功能等内容,以及文心一言在学习、工作、生活娱乐方面的应用及相关案例;接着介绍了文心一言的插件,以及文心一言App的功能和使用技巧;最计算机10.7万字 - 会员
AI数字人原理与实现
本书是一部系统介绍AI数字人技术的专业著作,涵盖了数字人的定义、发展历程、关键技术及应用实践等内容,全书共分3部分。在技术基础部分,首先介绍了数字人的定义、发展历程、分类和应用场景,接着详细解析了数字人系统的架构设计、视觉算法和语音合成技术的原理,以及语义理解和知识表示技术如何提升数字人的智能和表现力。在应用实践部分,带领读者深入探索数字人的创作流程,从内容策划、角色建模到交互设计,每一步都进行了计算机26.2万字 - 会员
机器学习教程(微课视频版)
本书兼顾机器学习基础、经典方法和深度学习方法,对组成机器学习的基础知识和基本算法进行了比较细致的介绍,对广泛应用的经典算法如线性回归、逻辑回归、朴素贝叶斯、支持向量机、决策树和集成学习等算法都给出了深入的分析并讨论了无监督学习的基本方法,对深度学习和强化学习进行了全面的叙述,比较深入地讨论了反向传播算法、多层感知机、CNN、RNN和LSTM等深度神经网络的核心知识和结构;对于强化学习,不仅介绍了经计算机20.6万字 - 会员
超有趣的GPT:AI公子逆袭记
AI(ArtificialIntelligence,人工智能)是如何拥有创造力的?图像和文本生成如何做到以假乱真?什么是ChatGPT?人工智能的未来会怎样?这些问题都会在这个有趣的故事中被一一解答。本书讲述了AI公子为了在心爱的千金小姐的招亲大会中获胜而努力学习的幽默故事。本书讨论了AI与人类学习的相似性,结合AI公子的学习过程讲述ChatGPT核心技术的发展脉络。本书适合对ChatGPT感兴计算机2.9万字 - 会员
情感计算
在人工智能的研究中,既包括对于人类理性思维的模拟,还包括对人类感性思维的计算。本书重点讲述的文本情感分析技术就属于后者。该技术源于自然语言处理领域,但也有别于一般的自然语言处理任务。文本情感分析面向的处理对象是社交媒体中产生的用户评论文本,该文本的特点是带有大量的用户主观情感信息,因此该技术的核心是通过自动分析评论文本来进行情感的理解。文本情感分析技术已有20余年的研究历史,凝聚成了多项研究任务和计算机23.3万字 - 会员
机器学习的算法分析和实践
本书是一本全面介绍机器学习方法特别是算法的新书,适合初学者和有一定基础的读者。机器学习可以分成三大类别,监督式学习、非监督式学习和强化学习。三大类别背后的算法也各有不同。监督式学习使用了数学分析中函数逼近方法、概率统计中的极大似然方法。非监督式学习使用了聚类和贝叶斯算法。强化学习使用了马尔可夫决策过程算法。机器学习背后的数学部分来自概率、统计、数学分析以及线性代数等领域。虽然用到的数学较多,但是最计算机7.4万字 - 会员
机器学习中的统计思维(Python实现)
机器学习是人工智能的核心,而统计思维则是机器学习方法的核心:从随机性中寻找规律性。例如,利用损失最小化思想制定学习策略,采用概率最大化思想估计模型参数,利用方差对不确定性的捕捉构造k维树,采用贝叶斯公式构建分类决策模型,等等。只有树立正确的统计思维,才能准确高效地运用机器学习方法开展数据处理与分析。本书以统计思维的视角,揭示监督学习中回归和分类模型的核心思想,帮助读者构建理论体系。计算机18万字
同类书籍最近更新
- 会员
大模型实战:微调、优化与私有化部署
本书深入浅出地介绍了现代大型人工智能(ArtificialIntelligence,AI)模型技术,从对话机器人的发展历程和人工智能的理念出发,详细阐述了大模型私有化部署过程,深入剖析了Transformer架构,旨在帮助读者领悟大模型的核心原理和技术细节。本书的讲解风格独树一帜,将深奥的技术术语转化为简洁明了的语言,案例叙述既严谨又充满趣味,让读者在轻松愉快的阅读体验中自然而然地吸收和理解AI人工智能15.8万字 - 会员
基于信息增强的图神经网络学习方法研究
本书深入剖析了图神经网络领域所面临的两大核心挑战:深度加深模型退化和监督信息过度依赖。针对这两大挑战,本书提出了一系列解决思路,涵盖模型结构设计、训练策略优化等方面的内容。全书共7章,第1章主要介绍了图神经网络研究的背景与意义,阐述了近年来国内外网络表示学习与图神经网络的研究现状,分析了图神经网络当前面临的挑战及其主要问题等;第2章主要对图神经网络进行概要论述,包括基础的理论、典型的模型方法及应用人工智能8.1万字