Joy RL:强化学习实践教程在线阅读
会员

Joy RL:强化学习实践教程

江季 王琦 杨毅远
开会员,本书免费读 >

计算机网络人工智能7.8万字

更新时间:2025-05-19 16:15:54 最新章节:第12章

立即阅读
加书架
下载
听书

书籍简介

本书是继《EasyRL:强化学习教程》(俗称“蘑菇书”)之后,为强化学习的读者专门打造的一本深入实践的全新教程。全书大部分内容基于3位作者的实践经验,涵盖马尔可夫决策过程、动态规划、免模型预测、免模型控制、深度学习基础、DQN算法、DQN算法进阶、策略梯度、Actor-Critic算法、DDPG与TD3算法、PPO算法等内容,旨在帮助读者快速入门强化学习的代码实践,并辅以一套开源代码框架“JoyRL”,便于读者适应业界应用研究风格的代码。与“蘑菇书”不同,本书对强化学习核心理论进行提炼,并串联知识点,重视强化学习代码实践的指导而不是对理论的详细讲解。本书适合具有一定编程基础且希望快速进入实践应用阶段的读者阅读。
品牌:人邮图书
上架时间:2025-04-01 00:00:00
出版社:人民邮电出版社
本书数字版权由人邮图书提供,并由其授权上海阅文信息技术有限公司制作发行

最新章节

最新上架

  • 本书的主题是从通用人工智能的视角来诠释中国的思想。朱松纯教授致力于搭建人文社科与通用人工智能的双向连接,本书是为人文赋“理”,即以人工智能的数理与认知模型诠释中国思想,试图为中国优秀哲学思想构建严格的数理体系,以便中国思想可以在正在到来的智能时代指导社会治理与实践,从而转化成强大的生产力。为此,本书先从智能时代的文明与道路说起,基于文明起源与演化的历程指出演化的关键在于“心”的出现,探索“心”的构
    朱松纯计算机13.7万字
  • 这是一本探讨人工智能与生物技术的融合颠覆传统医疗,并会对未来药物研发产生重大影响的书。作者凭借其在生物科学方面的专业背景,以及在生物技术和制药行业的从业经验,为读者呈现了对于医疗科技这一前沿领域的深刻见解。书中首先概述了数据科学方法的兴起以及生物学领域的范式转变,这一转变催生了计算生物学的革命,即通过计算机模拟进行生物实验和药物研发。作者详细介绍了人工智能和深度学习领域的重大突破,并探讨了这些技术
    (美)布赖恩·希尔布什计算机18.6万字
  • 会员
    本书以国产自研的强大AI模型DeepSeek为核心,系统呈现了DeepSeek从基础操作到各领域应用的32个实战案例,旨在帮助读者快速掌握DeepSeek的用法。本书总计32章。第1章讲解DeepSeek的注册与使用,包括访问DeepSeek官网、熟悉DeepSeek的使用界面、本地部署DeepSeek、调用DeepSeekAPI等。第2章讲解提示词的使用技巧,深入讲解如何通过充分提供信息、用词
    李艮基 肖灵儿 曹方咏峥计算机8.3万字
  • 会员
    本书从技术角度深度解析大模型的原理,从大模型的基础概念及领域发展现状入手,概述大模型的理论基础,介绍OpenAIGPT、清华大学GLM、MetaLlama等主流大模型的技术原理,并从大模型参数高效微调、大模型指令微调、大模型训练优化和大模型推理优化等多角度解析大模型背后的技术,带领读者全方位掌握大模型的原理和实践方法。本书最后介绍私有大模型的构建,手把手指导读者做技术选型并搭建自己的私有大模型
    文亮 江维计算机12.2万字
  • 我们当下正在经历一场AI革命。现在有创纪录的310万个机器人在工厂工作,从事从组装电脑到包装货物以及监测空气质量等各种工作。数量庞大的智能机器以各种各样的方式影响着我们的生活,如提高外科医生的手术精确度,清洁我们的家等等,我们正处于机器智能带来的令人兴奋的可能性当中。下一个万亿规模的企业,也许正在AI机器人领域诞生。当下的机器人产业,远远超出常人的想象。你会看到全世界最先锋的机器人研究团队如何开发
    (美)丹妮拉·鲁斯 (美)格雷戈里·莫内计算机13.5万字
  • 会员
    全书通过118个实用技巧讲解+118集教学视频演示+160多个素材回复文件+144页PPT教学课件,通过“提问生成+修改润色+热门模板+应用案例”4大专项内容,帮助小白快速成为AI文案高手!本书具体内容包括16种AI提问技巧、13种指令优化技巧、11种高效提问技巧、9种文案修改技巧、7种文案润色方法、11类营销文案指令模板、12类办公文案指令模板、13类自媒体文案指令模板、12类教育学术文案指令模
    AIGC文画学院编著计算机11.6万字
  • 会员
    本书深入探讨了RAG技术体系及其应用,内容涉及从基础概念到高级应用的各个方面。首先,解构了大模型应用的基本模式与局限性,并引入RAG作为增强生成能力的一种方法,讲解了RAG的核心概念、组成结构及应用场景,还涵盖了RAG的基础、高级、模块化和智能体形式的技术体系。其次,以LlamaIndex为工具,展示了如何实现RAG,包括提示词设计、文档与索引创建、上下文检索及查询引擎构建等具体步骤。最后,介绍了
    郑天民计算机10万字
  • 会员
    本书是一本专为DeepSeek使用者打造的提示词速查手册,按照高频使用场景进行分类,精选了工作、学习、生活、社交、专业咨询等五大场景高频使用的高质量提示词,同时附赠全场景提示词电子版,让您能够随时随地调用适合当下需求的指令。每个提示词均附带场景介绍、使用说明及变体建议,帮助您更好地理解和灵活运用。同时,我们也提供了一系列高级技巧,帮助您掌握创建高效提示词的方法论。这不仅是一本指令集,更是提升AI协
    贝拉计算机7.9万字
  • 会员
    本书分为4章,共20章。其中第1篇为基础算法篇,从第1章到第9章,讲述排序、查找、线性结构、树、散列、图、堆栈等基本数据结构算法;第2篇为机器学习算法篇,从第10章到第14章,讲述分类算法、回归算法、聚类算法、降维算法和集成学习算法;第3篇为强化学习算法篇,从第15章到第16章,讲述基于价值的强化学习算法和基于策略的强化学习算法;第4篇为深度学习算法篇,从第17章到第19章,讲述神经网络模型算法、
    唐宇迪 史卫亚 罗召勇 李琳 侯惠芳编著计算机0字