|
|
|
|
|
|
|
|
ISBN |
9787115584700 |
定价 |
RMB99.80 |
售价 |
RM109.80 |
优惠价 |
RM82.35 * (-25%)
|
作者 |
王琦,楊毅遠,江季
|
出版社 |
人民郵電出版社
|
出版日期 |
2022-03-01 |
装订 |
平裝. 單色印刷. 245 页. 26. |
库存量 |
海外库存 下单时可选择“空运”或“海运”(空运和海运需独立下单)。空运费每本书/CD是RM31.50。 空运需时8-11个工作天,海运需时约30个工作天。 (以上预计时间不包括出版社调货的时间以及尚未出版的预购商品) |
|
有现货时通知我 |
|
放入下次购买清单 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
強化學習作為機器學習及人工智能領域的一種重要方法,在遊戲、自動駕駛、機器人路線規劃等領域得到了廣泛的應用。
本書結合了李宏毅老師的“深度強化學習”、周博磊老師的“強化學習綱要”、李科澆老師的“世界最強帶你從零實踐強化學習”公開課的精華內容,在理論嚴謹的基礎上深入淺出地介紹馬爾可夫決策過程、蒙特卡洛方法、時序差分方法、Sarsa、Q 學習等傳統強化學習算法,以及策略梯度、近端策略優化、深度Q 網絡、深度確定性策略梯度等常見深度強化學習算法的基本概念和方法,並以大量生動有趣的例子幫助讀者理解強化學習問題的建模過程以及核心算法的細節。
此外,本書還提供較為全面的習題解答以及Python 代碼實現,可以讓讀者進行端到端、從理論到輕鬆實踐的全生態學習,充分掌握強化學習算法的原理並能進行實戰。
|
|
|
|
|
|
|
|
|
|
|
|
購買中國簡體書籍請注意:
1. 因裝幀品質及貨運條件未臻完善,中國簡體書可能有出現磨痕、凹痕、折痕等問題,故簡體字館除封面破損、內頁脫落、缺頁等較嚴重的狀態外,其餘所有商品將正常出貨。
|
|
|
|
|
|
|
|
|
王琦 中國科學院大學碩士在讀,Datawhale成員。主要研究方向為深度學習、資料採擷。曾獲中國大學生電腦設計大賽二等獎、亞太地區大學生數學建模競賽 (APMCM)二等獎和“挑戰杯”競賽江蘇省選拔賽二等獎,發表 SCI/EI 論文3篇。
楊毅遠 清華大學碩士在讀, Datawhale成員。主要研究方向為時空資料採擷、智慧傳感系統、深度學習。曾獲全國大學生智慧汽車競賽總冠軍、中國國家獎學金,發表SCI/EI論文7篇,其中以作者身份在SCI的Q1區、Q2區及中國電腦學會(CCF)A、B類會議中發表論文4篇。
江季 北京大學碩士在讀, Datawhale成員。主要研究方向為強化學習、機器人。曾獲大學生電子設計競賽——2018年嵌入式系統專題邀請賽(英特爾杯)一等獎,發表頂會論文1篇、專利2項。
|
|
|
|
|
|
|
|
|
|
|
|