
会员
Joy RL:强化学习实践教程
江季 王琦 杨毅远更新时间:2025-05-19 16:15:54
最新章节:第12章开会员,本书免费读 >
本书是继《EasyRL:强化学习教程》(俗称“蘑菇书”)之后,为强化学习的读者专门打造的一本深入实践的全新教程。全书大部分内容基于3位作者的实践经验,涵盖马尔可夫决策过程、动态规划、免模型预测、免模型控制、深度学习基础、DQN算法、DQN算法进阶、策略梯度、Actor-Critic算法、DDPG与TD3算法、PPO算法等内容,旨在帮助读者快速入门强化学习的代码实践,并辅以一套开源代码框架“JoyRL”,便于读者适应业界应用研究风格的代码。与“蘑菇书”不同,本书对强化学习核心理论进行提炼,并串联知识点,重视强化学习代码实践的指导而不是对理论的详细讲解。本书适合具有一定编程基础且希望快速进入实践应用阶段的读者阅读。
品牌:人邮图书
上架时间:2025-04-01 00:00:00
出版社:人民邮电出版社
本书数字版权由人邮图书提供,并由其授权上海阅文信息技术有限公司制作发行
最新章节
江季 王琦 杨毅远
主页
同类热门书
最新上架
- 会员
大模型项目实战:Agent开发与应用
这是一本面向初中级读者的Agent学习指南,作者既是资深的AI技术专家,又是经验丰富的项目导师,融合作者亲身实践、培训反馈与官方资源,为Agent使用者和开发者提供了快速上手的实用指导。本书从基础知识、操作和应用开发3个维度循序渐进地讲解Agent实战技巧,分为三篇:基础篇(1~2章):介绍Agent定义、发展历程、常用开源技术、主要组件等基础知识和开发环境的搭建过程。应用篇(3~6章):从通用型计算机7.2万字 - 会员
科学仪器设备配置学:人工智能时代的界面管理
本书共八章,从高校资源配置的教育、科研、社会、经济规律视角,以建设卓越世界一流大学为导向,对高校科学仪器设备配置中的问题进行研究。计算机17.5万字 - 会员
AI高手速成:DeepSeek让你工作变轻松
这是一本全面介绍AI应用的实用工具书,旨在为不同行业的专业人士提供实用的AI使用方法和策略。本书用简单易懂的语言解释了AI的基本工作原理,详细介绍了20多个通用AI指令,并通过案例展示如何运用这些指令解决工作问题;提供了AI在文案写作、数据处理、编程、教学和科研等场景中的实战应用案例,同时还提供了商业级解决方案和企业应用案例。本书既有AI应用的通用原则和方法,又有具体的流程步骤和样例演示,还提供了计算机5.5万字 - 会员
揭秘大模型:从原理到实战
本书从技术角度深度解析大模型的原理,从大模型的基础概念及领域发展现状入手,概述大模型的理论基础,介绍OpenAIGPT、清华大学GLM、MetaLlama等主流大模型的技术原理,并从大模型参数高效微调、大模型指令微调、大模型训练优化和大模型推理优化等多角度解析大模型背后的技术,带领读者全方位掌握大模型的原理和实践方法。本书最后介绍私有大模型的构建,手把手指导读者做技术选型并搭建自己的私有大模型计算机12.2万字 - 会员
AI原生应用开发:提示工程原理与实战
本书结合AI原生应用落地的大量实践,系统讲解提示工程的核心原理、相关案例分析和实战应用,涵盖提示工程概述、结构化提示设计、NLP任务提示、内容创作提示、生成可控性提示、提示安全设计、形式语言风格提示、推理提示和智能体提示等内容。本书的初衷不是告诉读者如何套用各种预设的提示模板,而是帮助读者深入理解和应用提示设计技巧,以找到决定大语言模型输出的关键因子,进而将提示工程的理论知识应用到产品设计中。本书计算机18.2万字 - 会员
法律人AI指南:大模型10倍提升工作效率的方法与技巧
本书系统地探讨了人工智能对法律行业的深远影响、法律人应该掌握的AI知识以及相关的法律AI工具。本书共14章,分为五部分。第一部分(第1章)介绍了大模型的基础知识以及AI在法律领域的应用趋势和场景,并深入探讨了AI对法律行业带来的影响等。第二部分(第2~6章)针对法律人的主要工作任务,包括类案检索、案情分析、法律咨询、法律文书写作、合同审查等,详细讲解了应该如何使用AI来提升工作效率。第三部分(第7计算机23.8万字 - 会员
精通AI虚拟数字人制作与应用:直播主播+视频博主+营销推广+教育培训
本书内容从技能线和工具线展开介绍。其中,技能线介绍了虚拟数字人的技术原理、商业价值、创建工具等基础内容,以及AI文案、AI绘画、虚拟数字人及其直播、AI视频博主、AI带货主播、AI培训讲师等实操案例。工具线介绍了ChatGPT、StableDiffusion、腾讯智影、剪映等工具的使用方法,并通过实例介绍了使用这些工具制作数字人的技巧。计算机7.1万字 未来之地
在技术进步和经济不断发展的当下,越来越多的人开始思考这些问题:当机器人能够顺畅地处理大部分工作时,是否会导致人类大量失业?在大量失业的情况下,人们该如何获得收入,是否会因此感到人生毫无意义,丧失获得快乐的能力?假设人类安全地开发出了超级智能,对它进行了良好的管理,并很好地利用了这项技术所能释放的巨大经济潜力和神奇的变革力量。在这个世界中,人工智能可以做我们能做的一切,而且可以做得更好、更快,成本更计算机29.6万字- 会员
高效用DeepSeek:职场逆袭的实战指南
本书以DeepSeek应用为基础,讲解了DeepSeek在自媒体、咨询、营销、教育、翻译、职场、编程等多个领域的应用。书中通过丰富的案例和详细的指导,展示了DeepSeek如何帮助自媒体人打造“爆款”内容,如何为咨询提供高效决策支持,如何在营销中实现流量裂变,如何重塑未来学习范式,以及如何助力职场人和企业实现业务增效等。本书内容通俗易懂,案例丰富,无论是AI(ArtificialIntellig计算机8.2万字