首页 3天快送 台湾图书 香港图书 中国简体 马新简体 生活時尚 休闲娱乐 文具手作 电子书
 

预购商品

看看更多

特价优品

看看更多

书目分类

特别推荐

新书排行
畅销排行
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
看看更多
 
動手做深度強化學習
Deep Reinforcement Learning Hands-On
       
 
ISBN: 9789864344307
定价: NT690
售价: RM107.80
优惠价: RM85.16 *
库存量: 海外库存
抱歉!此书没有开放空运服务,只能船运,需时约4个星期。
 
  放入下次购买清单
   
作者: Maxim Lapan
譯者: 劉立民
出版社: 博碩
出版日期: 2019-11-11
裝訂: 平裝. 單色印刷. 528 頁. 23.
 
 
 
       
  • 內容試閱
  • 作者簡介
     
 

  實作現代強化學習方法:深度Q網路、值迭代、策略梯度、TRPO、AlphaGo Zero…

  強化學習(RL)的最新發展,結合使用深度學習(DL),在訓練代理人「像人類一樣地」解決複雜問題這方面,取得了前所未有的進步。Google團隊利用演算法來玩知名的Atari街機遊戲,並擊敗了它們,這可以說是讓RL領域發光發熱的重要推手,而世界各地的研究人員正馬不停蹄地研發各種新的想法。

  《動手做深度強化學習》綜合性地介紹了最新的DL工具與它們的限制。讀者將評估包括交叉熵和策略梯度等方法,再把它們應用於真實的環境之中。本書使用Atari虛擬遊戲和一般家庭常玩的Connect4遊戲作為範例。除了介紹RL的基礎知識之外,作者亦詳述如何製作智慧型學習代理人等專業知識,讓讀者在面對一系列艱鉅的真實世界挑戰時,能游刃有餘。本書也會說明如何在網格世界(grid world)環境中實作Q學習、如何讓代理人學會買賣和交易股票,並學習聊天機器人是如何使用自然語言模型與人類對話的。

  在這本書中,你將學到:
  ・ 了解結合了RL的DL內容,並實作複雜的DL模型
  ・ 學習RL的基礎:馬可夫決策過程
  ・ 評估RL方法,包括交叉熵、DQN、Actor-Critic、TRPO、PPO、DDPG、D4PG…等等
  ・ 了解如何在各種環境中處理離散行動空間和連續行動空間 
  ・ 使用值迭代法來擊敗Atari街機遊戲 
  ・ 建立屬於自己的OpenAI Gym環境,來訓練股票交易代理人
  ・ 使用AlphaGo Zero演算法,教你的代理人玩Connect4
  ・ 探索最新的深度RL研究主題,包括AI驅動的聊天機器人等等

  下載範例程式檔案:
  本書的程式碼是由 GitHub 託管,可以在如下網址找到:github.com/PacktPublishing/Deep-Reinforcement-Learning-Hands-On。

  下載本書的彩色圖片:
  我們還提供您一個PDF檔案,其中包含本書使用的彩色螢幕截圖/彩色圖表,可以在此下載:static.packt-cdn.com/downloads/DeepReinforcementLearningHandsOn_ColorImages.pdf。
 

 
     
     
     

最近浏览商品

少年的你,如此美麗
少年的你,如此美麗
還有心跳怎會死?:重症醫師揭開死前N種徵兆
還有心跳怎會死?:重症醫師揭開死前N種徵兆
明天再糟,你還有我
明天再糟,你還有我
運動百憂解:克服哀傷的最佳處方箋
運動百憂解:克服哀傷的最佳處方箋

客服公告

1.
2.
3.
4.
5.
6.
看看更多
城邦阅读花园粉丝团
米娜马来西亚国际中文版粉丝团
PIXstyleMe Malaysia
城邦選物Cite Selection

订阅电子报

     

关于城邦  |  隐私权政策  |  购物指南  |  便利付款  |  商品寄送  |  售后服务  |  联系我们
客服专线:+603-9056 3833      传真:+603-9057 6622      电邮:services@cite.my
网购服务时间:周一至周五 9:00am – 5:30pm (假日除外)
门市营业时间:11:00am - 7:00pm(公共假期适逢周一至周五为休店日,若逢周六日则照常营业)

Copyright © 2020 Cite (M) Sdn Bhd (458372-U).    All Right Reserved.