一般分類: 暢銷精選 > 科學科普 > 電腦 
 
動手做深度強化學習
編/著者: Maxim Lapan
出版社:博碩文化
出版日期:2019-11-01
ISBN:9789864344307
定價:690元 特價:85折!587
參考分類(CAT):
參考分類(CIP): 電腦科學

參考庫存 -  ? 

已售完,無法訂購



分享
  買了此商品的人,也買了....
  | 內容簡介 | 影音推薦 | 退換貨 | 團購說明 | 購物與運費 | 出貨流程與庫存查詢 |
內容簡介
  實作現代強化學習方法:深度Q網路、值迭代、策略梯度、TRPO、AlphaGo Zero…


  強化學習(RL)的最新發展,結合使用深度學習(DL),在訓練代理人「像人類一樣地」解決複雜問題這方面,取得了前所未有的進步。Google團隊利用演算法來玩知名的Atari街機遊戲,並擊敗了它們,這可以說是讓RL領域發光發熱的重要推手,而世界各地的研究人員正馬不停蹄地研發各種新的想法。


  《動手做深度強化學習》綜合性地介紹了最新的DL工具與它們的限制。讀者將評估包括交叉熵和策略梯度等方法,再把它們應用於真實的環境之中。本書使用Atari虛擬遊戲和一般家庭常玩的Connect4遊戲作為範例。除了介紹RL的基礎知識之外,作者亦詳述如何製作智慧型學習代理人等專業知識,讓讀者在面對一系列艱鉅的真實世界挑戰時,能游刃有餘。本書也會說明如何在網格世界(grid world)環境中實作Q學習、如何讓代理人學會買賣和交易股票,並學習聊天機器人是如何使用自然語言模型與人類對話的。


  在這本書中,你將學到:

  ・ 了解結合了RL的DL內容,並實作複雜的DL模型

  ・ 學習RL的基礎:馬可夫決策過程

  ・ 評估RL方法,包括交叉熵、DQN、Actor-Critic、TRPO、PPO、DDPG、D4PG…等等

  ・ 了解如何在各種環境中處理離散行動空間和連續行動空間 

  ・ 使用值迭代法來擊敗Atari街機遊戲 

  ・ 建立屬於自己的OpenAI Gym環境,來訓練股票交易代理人

  ・ 使用AlphaGo Zero演算法,教你的代理人玩Connect4

  ・ 探索最新的深度RL研究主題,包括AI驅動的聊天機器人等等


  下載範例程式檔案:

  本書的程式碼是由 GitHub 託管,可以在如下網址找到:github.com/PacktPublishing/Deep-Reinforcement-Learning-Hands-On。


  下載本書的彩色圖片:

  我們還提供您一個PDF檔案,其中包含本書使用的彩色螢幕截圖/彩色圖表,可以在此下載:static.packt-cdn.com/downloads/DeepReinforcementLearningHandsOn_ColorImages.pdf。
 
 
一般分類: 暢銷精選 > 科學科普 > 電腦 
動手做深度強化學習
分享  
編/著者:Maxim Lapan
出版社:博碩文化
出版日期:2019-11-01
ISBN:9789864344307
定價:690元 特價:85折!587
參考分類(CAT):
參考分類(CIP): 電腦科學
運送付款
一般訂單:超商取貨付款(全家、OK、萊爾富)
     宅配到府(信用卡、ATM轉帳)
內容簡介
  實作現代強化學習方法:深度Q網路、值迭代、策略梯度、TRPO、AlphaGo Zero…


  強化學習(RL)...