
会员
从零开始大模型开发与微调:基于PyTorch与ChatGLM
王晓华更新时间:2024-12-31 17:38:36
最新章节:18.5 本章小结开会员,本书免费读 >
大模型是深度学习自然语言处理皇冠上的一颗明珠,也是当前AI和NLP研究与产业中最重要的方向之一。本书使用PyTorch2.0作为学习大模型的基本框架,以ChatGLM为例详细讲解大模型的基本理论、算法、程序实现、应用实战以及微调技术,为读者揭示大模型开发技术。《从零开始大模型开发与微调:基于PyTorch与ChatGLM》共18章,内容包括人工智能与大模型、PyTorch2.0深度学习环境搭建、从零开始学习PyTorch2.0、深度学习基础算法详解、基于PyTorch卷积层的MNIST分类实战、PyTorch数据处理与模型展示、ResNet实战、有趣的词嵌入、基于PyTorch循环神经网络的中文情感分类实战、自然语言处理的编码器、预训练模型BERT、自然语言处理的解码器、强化学习实战、只具有解码器的GPT-2模型、实战训练自己的ChatGPT、开源大模型ChatGLM使用详解、ChatGLM高级定制化应用实战、对ChatGLM进行高级微调。《从零开始大模型开发与微调:基于PyTorch与ChatGLM》适合PyTorch深度学习初学者、大模型开发初学者、大模型开发人员学习,也适合高等院校人工智能、智能科学与技术、数据科学与大数据技术、计算机科学与技术等专业的师生作为教学参考书。
品牌:清华大学
上架时间:2023-11-01 00:00:00
出版社:清华大学出版社
本书数字版权由清华大学提供,并由其授权上海阅文信息技术有限公司制作发行
从零开始大模型开发与微调:基于PyTorch与ChatGLM最新章节
查看全部- 18.5 本章小结
- 18.4.3 Huggingface专用PEFT的使用
- 18.4.2 PEFT的使用与参数设计
- 18.4.1 PEFT技术详解
- 18.4 高级微调方法3——基于Huggingface的PEFT模型微调
- 18.3.5 基于基本原理的LoRA实现
- 18.3.4 基于自定义LoRA的模型推断
- 18.3.3 基于自定义LoRA的模型训练
- 18.3.2 自定义LoRA的使用方法
- 18.3.1 对ChatGLM进行微调的方法——LoRA
王晓华
主页
同类热门书
最新上架
- 会员
AIGC+智慧教育:Web 3.0时代的教育变革与转型
随着Web3.0时代的来临,我国教育领域迎来了一场全面而深刻的变革——AIGC、ChatGPT、大数据、云计算、物联网、数字孪生、元宇宙等新兴技术与教育行业的融合程度日益加深,AI驱动的教育新形态、新模式、新产品不断涌现,数字化、网络化、智能化逐渐成为引领我国教育变革与转型的重要方向。本书立足于全球范围内智慧教育领域的实践经验与前沿趋势,全面阐述AIGC、ChatGPT、元宇宙、数字孪生等新兴技计算机13.8万字 - 会员
AIGC驱动工业智能设备:系统设计与行业实践
(1)AI与AIGC基础知识:从基础入手,深入讲解AI技术的基本概念和原理。通过通俗易懂的讲解和示例,帮助读者建立坚实的理论基础,为后续章节的深入学习打下良好基础。(2)智能设备上的AIGC系统设计:详细介绍AIGC技术在实际应用过程中的各种功能设计和实现方法。内容涵盖算法选择、模型训练、系统集成等各个环节,通过丰富的技术细节和设计策略,帮助读者全面掌握AIGC技术的应用要点。(3)AIGC关键工计算机18万字 - 会员
法律人AI指南:大模型10倍提升工作效率的方法与技巧
本书系统地探讨了人工智能对法律行业的深远影响、法律人应该掌握的AI知识以及相关的法律AI工具。本书共14章,分为五部分。第一部分(第1章)介绍了大模型的基础知识以及AI在法律领域的应用趋势和场景,并深入探讨了AI对法律行业带来的影响等。第二部分(第2~6章)针对法律人的主要工作任务,包括类案检索、案情分析、法律咨询、法律文书写作、合同审查等,详细讲解了应该如何使用AI来提升工作效率。第三部分(第7计算机23.8万字 - 会员
AI智能写作:巧用AI大模型让新媒体变现插上翅膀
本书共分为8章,分别讲解了常见的人工智能以及人工智能影响下的广告流量变现、商业合作变现、直播变现、私域变现和IP变现等。此外,还对未来的人工智能与新媒体变现做了趋势分析。计算机10.5万字 - 会员
Keras深度学习与神经网络
本书从人工智能导论入手,阐述人工智能的发展及现状,重点介绍了机器学习和神经网络基础、反向传播原理、卷积神经网络和循环神经网络等内容。本书内容由浅入深,循序渐进,从神经元和感知机入手,逐步讲解深度学习中神经网络基础、反向传播以及更深层次的卷积神经网络、循环神经网络。本书知识体系完整,内容覆盖面广,介绍了深度学习中常用的模型和算法,助力读者多方位掌握深度学习的相关知识。本书可作为高等院校计算机等相关专计算机11万字 - 会员
高效用DeepSeek:职场逆袭的实战指南
本书以DeepSeek应用为基础,讲解了DeepSeek在自媒体、咨询、营销、教育、翻译、职场、编程等多个领域的应用。书中通过丰富的案例和详细的指导,展示了DeepSeek如何帮助自媒体人打造“爆款”内容,如何为咨询提供高效决策支持,如何在营销中实现流量裂变,如何重塑未来学习范式,以及如何助力职场人和企业实现业务增效等。本书内容通俗易懂,案例丰富,无论是AI(ArtificialIntellig计算机8.2万字 - 会员
Joy RL:强化学习实践教程
本书是继《EasyRL:强化学习教程》(俗称“蘑菇书”)之后,为强化学习的读者专门打造的一本深入实践的全新教程。全书大部分内容基于3位作者的实践经验,涵盖马尔可夫决策过程、动态规划、免模型预测、免模型控制、深度学习基础、DQN算法、DQN算法进阶、策略梯度、Actor-Critic算法、DDPG与TD3算法、PPO算法等内容,旨在帮助读者快速入门强化学习的代码实践,并辅以一套开源代码框架“Joy计算机7.8万字 - 会员
社交网络信息传播模型、算法及应用
本书系统地阐述信息传播问题中所涉及的各种传播模型、数学优化方法以及计算方法等,并通过对大量信息传播的实际问题进行了建模与分析。该著作将为人工智能、大数据、管理科学、运筹学、人文社会科学等领域开展相关研究的本科生、研究生以及学者提供重要的参考。计算机16万字 - 会员
AI时代产品经理升级之道:ChatGPT让产品经理插上翅膀
本书是一本面向产品经理的实用新书,分12章探讨如何用ChatGPT提升产品管理工作的效率和质量。第1章介绍了人工智能对产品管理的影响;第2章介绍用ChatGPT提高文档写作效率;第3章介绍用ChatGPT进行竞品和市场分析;第4章介绍用ChatGPT优化需求管理;第5章介绍用ChatGPT分析产品数据;第6章介绍用ChatGPT改进用户体验;第7章介绍用ChatGPT设计产品原型;第8章介绍用Ch计算机11.5万字