
会员
从零开始大模型开发与微调:基于PyTorch与ChatGLM
王晓华更新时间:2024-12-31 17:38:36
最新章节:18.5 本章小结开会员,本书免费读 >
大模型是深度学习自然语言处理皇冠上的一颗明珠,也是当前AI和NLP研究与产业中最重要的方向之一。本书使用PyTorch2.0作为学习大模型的基本框架,以ChatGLM为例详细讲解大模型的基本理论、算法、程序实现、应用实战以及微调技术,为读者揭示大模型开发技术。《从零开始大模型开发与微调:基于PyTorch与ChatGLM》共18章,内容包括人工智能与大模型、PyTorch2.0深度学习环境搭建、从零开始学习PyTorch2.0、深度学习基础算法详解、基于PyTorch卷积层的MNIST分类实战、PyTorch数据处理与模型展示、ResNet实战、有趣的词嵌入、基于PyTorch循环神经网络的中文情感分类实战、自然语言处理的编码器、预训练模型BERT、自然语言处理的解码器、强化学习实战、只具有解码器的GPT-2模型、实战训练自己的ChatGPT、开源大模型ChatGLM使用详解、ChatGLM高级定制化应用实战、对ChatGLM进行高级微调。《从零开始大模型开发与微调:基于PyTorch与ChatGLM》适合PyTorch深度学习初学者、大模型开发初学者、大模型开发人员学习,也适合高等院校人工智能、智能科学与技术、数据科学与大数据技术、计算机科学与技术等专业的师生作为教学参考书。
品牌:清华大学
上架时间:2023-11-01 00:00:00
出版社:清华大学出版社
本书数字版权由清华大学提供,并由其授权上海阅文信息技术有限公司制作发行
从零开始大模型开发与微调:基于PyTorch与ChatGLM最新章节
查看全部- 18.5 本章小结
- 18.4.3 Huggingface专用PEFT的使用
- 18.4.2 PEFT的使用与参数设计
- 18.4.1 PEFT技术详解
- 18.4 高级微调方法3——基于Huggingface的PEFT模型微调
- 18.3.5 基于基本原理的LoRA实现
- 18.3.4 基于自定义LoRA的模型推断
- 18.3.3 基于自定义LoRA的模型训练
- 18.3.2 自定义LoRA的使用方法
- 18.3.1 对ChatGLM进行微调的方法——LoRA
王晓华
主页
最新上架
- 会员
人工智能编程实践:Python编程5级
青少年人工智能编程水平测试涵盖从数学逻辑到计算思维、从拖曳程序模块到程序编写、从数学建模到算法设计等多学科知识,能够对学生的多学科知识综合运用能力做出评价;能够通过设计的具体解决方案,对学生的计算思维、创造性思维等能力做出评价;在具体的解决方案中,能够通过设计算法模型和实现算法,对学生掌握和运用编程的能力做出评价。本书将生活中的一些案例和程序算法相结合,深入浅出地为学生讲解不同进制之间的转换、函数计算机3.9万字 - 会员
贝叶斯算法与机器学习
本书共分为10章,涵盖了贝叶斯概率、概率估计、贝叶斯分类、随机场、参数估计、机器学习、深度学习、贝叶斯网络、动态贝叶斯网络、贝叶斯深度学习等。本书涉及的应用领域包含机器学习、图像处理、语音识别、语义分析等。计算机0字 - 会员
AI时代生存手册:零基础掌握DeepSeek
本书将带你深入探索AI“神器”——DeepSeek的无限潜能,带你从零开始,轻松掌握AI的核心应用。通过学习本书,你将轻松上手DeepSeek,开启智能生活新篇章;通过学习本书,你将学会用DeepSeek大幅提升工作效率;通过学习本书,你将学会如何让DeepSeek成为你的职场超级助手;通过学习本书,你将学会如何利用DeepSeek激发自己的创作灵感,打造爆款内容和个人品牌;通过学习本书,你将学会计算机7.2万字 - 会员
Keras深度学习与神经网络
本书从人工智能导论入手,阐述人工智能的发展及现状,重点介绍了机器学习和神经网络基础、反向传播原理、卷积神经网络和循环神经网络等内容。本书内容由浅入深,循序渐进,从神经元和感知机入手,逐步讲解深度学习中神经网络基础、反向传播以及更深层次的卷积神经网络、循环神经网络。本书知识体系完整,内容覆盖面广,介绍了深度学习中常用的模型和算法,助力读者多方位掌握深度学习的相关知识。本书可作为高等院校计算机等相关专计算机11万字 - 会员
科学仪器设备配置学:人工智能时代的界面管理
本书共八章,从高校资源配置的教育、科研、社会、经济规律视角,以建设卓越世界一流大学为导向,对高校科学仪器设备配置中的问题进行研究。计算机17.5万字 - 会员
预训练语言模型:方法、实践与应用
近年来,在自然语言处理领域,基于预训练语言模型的方法已形成全新范式。本书内容分为基础知识、预训练语言模型,以及实践与应用3个部分,共9章。第一部分全面、系统地介绍自然语言处理、神经网络和预训练语言模型的相关知识。第二部分介绍几种具有代表性的预训练语言模型的原理和机制(涉及注意力机制和Transformer模型),包括BERT及其变种,以及近年来发展迅猛的GPT和提示工程。第三部分介绍了基于Lang计算机12.7万字 制造业大模型的构建与实践
本书分两篇,为读者提供基于制造业视角的大模型理论与应用指南。基础篇深入大模型理论层面,主要介绍大模型的基础知识、构建路径、价值对齐策略,同时涉及多模态与AIGC技术、提示词工程的相关知识。应用篇则聚焦于大模型的实践应用层面,主要讲解垂直制造领域微调、RAG等构建技术,AIAgent的原理与应用,以及大模型压缩与部署策略,并且通过具体案例来展示大模型在工业制造及设备运维等方面的应用,最后对大模型进行计算机18.3万字- 会员
AI帮你赢:人人都能用的AI方法论
本书强调“把AI作为方法”(AI即ArtifcialIntelligence,人工智能)这一核心理念,旨在引导读者掌握与AI对话的关键技巧,并将AI融入工作和生活真正体验AI带给人类的高效与便捷。本书从技术的发展规律人手,探讨了把AI作为方法的必然性和必要性,进一步剖析了算法与哲学在内在逻辑上的贯通性。此外,本书通过丰富多样的案例展示了AI的强大魅力,通过一系列“召唤术”帮助读者运用AI创造性地计算机9.7万字 - 会员
AI训练师手册:算法与模型训练从入门到精通
本书共有10章,包括51个实操案例解析和80个行业案例分析。书中内容从技能线和案例线展开介绍。技能线:从人工智能的相关技术入手,不仅介绍了AI训练师的发展历程和行业动态,还重点讲述了AI训练师的职业技能提升方法。案例线:不仅涵盖了AI领域的各个方面,而且非常注重算法与模型的实际应用,通过分析大量的经典案例,可以让读者更好地掌握AI训练的相关技能。计算机11.6万字
同类书籍最近更新
- 会员
人工智能简史
2018年,原力觉醒,唤醒天赋的最佳礼物,文科生和青少年畅读无压力。《人工智能简史》从多个角度介绍人工智能的发展历史,重点介绍人工智能领域杰出的科学家,以及他们创造非凡成果的有趣故事。透过搜索引擎、网上购物、社交网络、智能家居等应用,人工智能已经开始影响所有人的工作和生活,未来这种影响还会越来越大,最终人工智能将会像电力一样,成为一个无所不在的基础设施。人工智能7.4万字 - 会员
这就是DeepSeek:普通人如何抓住AI红利
本书聚焦如何高效运用DeepSeek这一前沿AI工具,帮助读者在技术浪潮中把握机遇。全书从DeepSeek发展历程切入,系统解析DeepSeek在信息处理、创意生成与决策辅助中的核心能力,并结合生活管理、职场协作、学习优化、社交互动等场景,通过真实案例讲解其应用方法。同时,针对内容创作、自媒体运营、副业变现等需求,书中提供了可落地的策略与案例,助力读者实现效率提升与价值创造。书中不仅提供技术使用技人工智能5.5万字 - 会员
面向中国制造2025的智造观
本书提供了基于智造观的技术架构:提出实现智能制造的四部曲,即流程精益化、适应自动化、系统数字化以及信息云端化;分析产品生命周期管理导向的生产制造模式及实现方法,包括大数据的应用、互联网自动控制网络的应用、数字化与信息技术的深度融合。人工智能12.2万字 - 会员
智能制造时代的研发智慧:知识工程2.0
本书的副书名指出知识工程2.0是智能制造时代的研发智慧,书中的讨论对象和举例均以研发企业或研发过程为背景。但这只是因为研发过程是知识最密集、产出最丰富和应用最深入的过程,并不代表本书所提的方法不适用于非研发型企业。非研发型企业或非研发过程的知识工程方法是本书所提方法的子集,大部分方法进行适应性改造,即可适用于这些企业或过程。人工智能13.9万字