
会员
深度强化学习实践(原书第2版)
更新时间:2021-08-18 17:40:31
最新章节:25.7 总结开会员,本书免费读 >
本书的主题是强化学习(ReinforcementLearning,RL),它是机器学习(MachineLearning,ML)的一个分支,强调如何解决在复杂环境中选择最优动作时产生的通用且极具挑战的问题。学习过程仅由奖励值和从环境中获得的观察驱动。该模型非常通用,能应用于多个真实场景,从玩游戏到优化复杂制造过程都能涵盖。
品牌:机械工业出版社
译者:林然 王薇
上架时间:2021-07-01 00:00:00
出版社:机械工业出版社
本书数字版权由机械工业出版社提供,并由其授权上海阅文信息技术有限公司制作发行
深度强化学习实践(原书第2版)最新章节
查看全部- 25.7 总结
- 25.6 相同actor之间的战斗
- 25.5 同时训练老虎和鹿
- 25.4 老虎的合作
- 25.3 老虎的深度Q-network
- 25.2 MAgent环境
- 25.1 多智能体RL的说明
- 第25章 多智能体强化学习
- 24.11 总结
- 24.10 进一步改进和实验
最新上架
- 会员
人工智能算法基础
本书分为4章,共20章。其中第1篇为基础算法篇,从第1章到第9章,讲述排序、查找、线性结构、树、散列、图、堆栈等基本数据结构算法;第2篇为机器学习算法篇,从第10章到第14章,讲述分类算法、回归算法、聚类算法、降维算法和集成学习算法;第3篇为强化学习算法篇,从第15章到第16章,讲述基于价值的强化学习算法和基于策略的强化学习算法;第4篇为深度学习算法篇,从第17章到第19章,讲述神经网络模型算法、计算机0字 - 会员
贝叶斯算法与机器学习
本书共分为10章,涵盖了贝叶斯概率、概率估计、贝叶斯分类、随机场、参数估计、机器学习、深度学习、贝叶斯网络、动态贝叶斯网络、贝叶斯深度学习等。本书涉及的应用领域包含机器学习、图像处理、语音识别、语义分析等。计算机0字 - 会员
硅基物语·AI写作高手:从零开始用ChatGPT学会写作
本书从写作与ChatGPT的基础知识讲起,结合创作者的实际写作经历与写作教学经历,介绍了用ChatGPT写作的基础技巧、进阶写作的方法、不同文体的写作方法、写作变现的秘诀,让读者理解写作技巧与变现思路。计算机14.7万字 - 会员
从零构建大模型
本书是关于如何从零开始构建大模型的指南,由畅销书作家塞巴斯蒂安·拉施卡撰写,通过清晰的文字、图表和实例,逐步指导读者创建自己的大模型。在本书中,读者将学习如何规划和编写大模型的各个组成部分、为大模型训练准备适当的数据集、进行通用语料库的预训练,以及定制特定任务的微调。此外,本书还将探讨如何利用人工反馈确保大模型遵循指令,以及如何将预训练权重加载到大模型中。计算机13.8万字 - 会员
AI时代架构师修炼之道:ChatGPT让架构师插上翅膀
本书以ChatGPT为核心工具,揭示了人工智能技术对架构师的角色和职责进行颠覆和重塑的关键点。全书通过共计13章的系统内容,探讨AI技术在架构设计中的应用,以及AI对传统架构师工作方式的影响,读者可以了解如何利用ChatGPT这一强大的智能辅助工具,提升架构师的工作效率和创造力。计算机7字 - 会员
人工智能数学基础与Python机器学习实战
本书分为3个部分:第1章和第2章是人工智能的数学基础,主要介绍了机器学习的概念、Python开发环境的搭建、机器学习bibei的数学知识,以及线性代数和概率论的相关知识;第3~12章主要介绍了回归模型、分类模型、聚类模型、半监督模型的建立和相关算法的理论,以及如何使用sklearn具体实现相关算法模型的搭建;第13章介绍了Spark机器学习,笔者认为对于机器学习,不能只限于Python中的skle计算机0字 - 会员
向AI提问的艺术:提示工程入门与应用
本书共十一章,主要包含四部分:第1章解读ChatGPT的基础原理和提示工程的基本概念;第2至5章介绍提示工程技巧,涵盖有效提示编写、针对复杂任务的提示设计技巧、对话中的提示设计技巧,以及提示的优化与迭代;第6章主要介绍当前ChatGPT推出的进阶功能;第7至11章结合教育领域、市场营销、新媒体运营、软件开发和数据分析实战展示提示工程技巧的应用。计算机12.9万字 - 会员
大模型工程化:AI驱动下的数据体系
大模型在众多领域得到了广泛应用,促进了AI技术的整合和创新。然而,在实际应用过程中,直接将大模型应用于特定行业常常难以达到预期效果。本书详细阐述如何在游戏经营分析场景中利用大模型实现数据体系的建设。本书分为6个部分,共16章。第1部分主要介绍大模型技术的发展与应用,从大模型的发展现状展开,重点介绍大模型与数据体系的相关知识。第2部分主要介绍大模型下的关键基础设施,涵盖湖仓一体引擎、湖仓的关键技术、计算机15.6万字 - 会员
DeepSeek原理与项目实战:大模型部署、微调与应用开发
DeepSeek是一种基于Transformer架构的生成式AI(ArtificialIntelligence)大模型,融合了MoE架构、混合精度训练、分布式优化等先进技术,具备强大的文本生成、多模态处理和任务定制化能力。本书系统性地介绍了开源大模型DeepSeek-V3的核心技术及其在实际开发中的深度应用。全书分三部分共12章,涵盖理论解析、技术实现和应用实践。本书通过深度讲解与实用案例相结合计算机17.1万字
同类书籍最近更新
- 会员
深入浅出人工智能:原理、技术与应用
本书旨在帮助读者从零开始学习人工智能,掌握人工智能的原理、技术和应用。本书共10章,首先是人工智能概述,接着深入浅出地讲解人工智能的原理和技术,包括数据预处理、数据可视化、机器学习基础、监督学习模型、无监督学习算法、神经网络基础、训练深度神经网络等内容,最后讲解人工智能的应用,包括智能对话和知识图谱。本书适合想要学习并掌握人工智能技术和应用的零基础读者阅读,还可以作为高等院校人工智能相关课程的教材人工智能11.3万字 - 会员
AIGC提示工程师精进之道
本书是一本关于AIGC提示工程师的实用指南,讲解了成为优秀AIGC提示工程师所需的技术特长和知识、沟通和协作能力、持续学习和自我提升方法等。本书分为3篇,共13章。第1篇为AIGC提示工程师基础,内容包括AI崛起下的新职业──AIGC提示工程师、设计高效提示的基本原则、常用的提示方法以及提示工程实践中的常见问题等;第2篇为提示进阶技巧,内容包括优化提示的除错过程、解决复杂问题的高级提示技巧、提升提人工智能12万字 - 会员
Joy RL:强化学习实践教程
本书是继《EasyRL:强化学习教程》(俗称“蘑菇书”)之后,为强化学习的读者专门打造的一本深入实践的全新教程。全书大部分内容基于3位作者的实践经验,涵盖马尔可夫决策过程、动态规划、免模型预测、免模型控制、深度学习基础、DQN算法、DQN算法进阶、策略梯度、Actor-Critic算法、DDPG与TD3算法、PPO算法等内容,旨在帮助读者快速入门强化学习的代码实践,并辅以一套开源代码框架“Joy人工智能7.8万字 - 会员
高效用DeepSeek:职场逆袭的实战指南
本书以DeepSeek应用为基础,讲解了DeepSeek在自媒体、咨询、营销、教育、翻译、职场、编程等多个领域的应用。书中通过丰富的案例和详细的指导,展示了DeepSeek如何帮助自媒体人打造“爆款”内容,如何为咨询提供高效决策支持,如何在营销中实现流量裂变,如何重塑未来学习范式,以及如何助力职场人和企业实现业务增效等。本书内容通俗易懂,案例丰富,无论是AI(ArtificialIntellig人工智能8.2万字