Joy RL：强化学习实践教程最新章节全文无弹窗在线阅读-QQ阅读男频武侠网

QQ阅读历史男生网

历史男生网

达人推广书架浏览历史

登录 | 注册

书籍简介

本书是继《EasyRL：强化学习教程》（俗称“蘑菇书”）之后，为强化学习的读者专门打造的一本深入实践的全新教程。全书大部分内容基于3位作者的实践经验，涵盖马尔可夫决策过程、动态规划、免模型预测、免模型控制、深度学习基础、DQN算法、DQN算法进阶、策略梯度、Actor-Critic算法、DDPG与TD3算法、PPO算法等内容，旨在帮助读者快速入门强化学习的代码实践，并辅以一套开源代码框架“JoyRL”，便于读者适应业界应用研究风格的代码。与“蘑菇书”不同，本书对强化学习核心理论进行提炼，并串联知识点，重视强化学习代码实践的指导而不是对理论的详细讲解。本书适合具有一定编程基础且希望快速进入实践应用阶段的读者阅读。

品牌：人邮图书

上架时间：2025-04-01 00:00:00

出版社：人民邮电出版社

本书数字版权由人邮图书提供，并由其授权上海阅文信息技术有限公司制作发行

最新章节

最新上架

为人文赋理（通用人工智能的中国蓝图系列）
本书的主题是从通用人工智能的视角来诠释中国的思想。朱松纯教授致力于搭建人文社科与通用人工智能的双向连接，本书是为人文赋“理”，即以人工智能的数理与认知模型诠释中国思想，试图为中国优秀哲学思想构建严格的数理体系，以便中国思想可以在正在到来的智能时代指导社会治理与实践，从而转化成强大的生产力。为此，本书先从智能时代的文明与道路说起，基于文明起源与演化的历程指出演化的关键在于“心”的出现，探索“心”的构
朱松纯计算机13.7万字
人工智能与计算生物的未来
这是一本探讨人工智能与生物技术的融合颠覆传统医疗，并会对未来药物研发产生重大影响的书。作者凭借其在生物科学方面的专业背景，以及在生物技术和制药行业的从业经验，为读者呈现了对于医疗科技这一前沿领域的深刻见解。书中首先概述了数据科学方法的兴起以及生物学领域的范式转变，这一转变催生了计算生物学的革命，即通过计算机模拟进行生物实验和药物研发。作者详细介绍了人工智能和深度学习领域的重大突破，并探讨了这些技术
(美)布赖恩·希尔布什计算机18.6万字
会员
DeepSeek应用大全：从入门到精通的全方位案例解析
本书以国产自研的强大AI模型DeepSeek为核心，系统呈现了DeepSeek从基础操作到各领域应用的32个实战案例，旨在帮助读者快速掌握DeepSeek的用法。本书总计32章。第1章讲解DeepSeek的注册与使用，包括访问DeepSeek官网、熟悉DeepSeek的使用界面、本地部署DeepSeek、调用DeepSeekAPI等。第2章讲解提示词的使用技巧，深入讲解如何通过充分提供信息、用词
李艮基肖灵儿曹方咏峥计算机8.3万字
会员
揭秘大模型：从原理到实战
本书从技术角度深度解析大模型的原理，从大模型的基础概念及领域发展现状入手，概述大模型的理论基础，介绍OpenAIGPT、清华大学GLM、MetaLlama等主流大模型的技术原理，并从大模型参数高效微调、大模型指令微调、大模型训练优化和大模型推理优化等多角度解析大模型背后的技术，带领读者全方位掌握大模型的原理和实践方法。本书最后介绍私有大模型的构建，手把手指导读者做技术选型并搭建自己的私有大模型
文亮江维计算机12.2万字
心与芯：我们与机器人的无限未来
我们当下正在经历一场AI革命。现在有创纪录的310万个机器人在工厂工作，从事从组装电脑到包装货物以及监测空气质量等各种工作。数量庞大的智能机器以各种各样的方式影响着我们的生活，如提高外科医生的手术精确度，清洁我们的家等等，我们正处于机器智能带来的令人兴奋的可能性当中。下一个万亿规模的企业，也许正在AI机器人领域诞生。当下的机器人产业，远远超出常人的想象。你会看到全世界最先锋的机器人研究团队如何开发
(美)丹妮拉·鲁斯 (美)格雷戈里·莫内计算机13.5万字
会员
AI文案高手速成118例：提问生成+修改润色+热门模板+应用案例
全书通过118个实用技巧讲解+118集教学视频演示+160多个素材回复文件+144页PPT教学课件，通过“提问生成+修改润色+热门模板+应用案例”4大专项内容，帮助小白快速成为AI文案高手！本书具体内容包括16种AI提问技巧、13种指令优化技巧、11种高效提问技巧、9种文案修改技巧、7种文案润色方法、11类营销文案指令模板、12类办公文案指令模板、13类自媒体文案指令模板、12类教育学术文案指令模
AIGC文画学院编著计算机11.6万字
会员
大模型实战：从零实现RAG与Agent系统
本书深入探讨了RAG技术体系及其应用，内容涉及从基础概念到高级应用的各个方面。首先，解构了大模型应用的基本模式与局限性，并引入RAG作为增强生成能力的一种方法，讲解了RAG的核心概念、组成结构及应用场景，还涵盖了RAG的基础、高级、模块化和智能体形式的技术体系。其次，以LlamaIndex为工具，展示了如何实现RAG，包括提示词设计、文档与索引创建、上下文检索及查询引擎构建等具体步骤。最后，介绍了
郑天民计算机10万字
会员
DeepSeek提示词速查手册
本书是一本专为DeepSeek使用者打造的提示词速查手册，按照高频使用场景进行分类，精选了工作、学习、生活、社交、专业咨询等五大场景高频使用的高质量提示词，同时附赠全场景提示词电子版，让您能够随时随地调用适合当下需求的指令。每个提示词均附带场景介绍、使用说明及变体建议，帮助您更好地理解和灵活运用。同时，我们也提供了一系列高级技巧，帮助您掌握创建高效提示词的方法论。这不仅是一本指令集，更是提升AI协
贝拉计算机7.9万字
会员
人工智能算法基础
本书分为4章，共20章。其中第1篇为基础算法篇，从第1章到第9章，讲述排序、查找、线性结构、树、散列、图、堆栈等基本数据结构算法；第2篇为机器学习算法篇，从第10章到第14章，讲述分类算法、回归算法、聚类算法、降维算法和集成学习算法；第3篇为强化学习算法篇，从第15章到第16章，讲述基于价值的强化学习算法和基于策略的强化学习算法；第4篇为深度学习算法篇，从第17章到第19章，讲述神经网络模型算法、
唐宇迪史卫亚罗召勇李琳侯惠芳编著计算机0字

关于腾讯About Tencent服务协议开放平台广告服务腾讯招聘腾讯公益客服中心违规举报

达人推广合作：https://kol.yuewen.com

网站合作：傅女士 fuli.a@yuewen.com

双新用户（设备和账号都新为双新用户）下载并登录后1-20天最多可免费领取20本会员/单订书且可免费读10天

Copyright (C) 2025 ing.qq.com All Rights Reserved 上海阅文信息技术有限公司版权所有
粤公网安备 44030002000001号增值电信业务经营许可证：粤B2-20090059 互联网ICP备案号：粤B2-20090059-5 沪ICP备14016804号-3 举报电话：010-59357051 营业执照
网络文化经营许可证：沪网文 (2023) 3296-228号网络出版服务许可证：（署）网出证（沪）字第055号互联网宗教信息服务许可证：沪（2023）0000015