2023.6.29-30|迷宮尋寶,寓教于樂(lè):Python強(qiáng)化學(xué)習(xí)算法與應(yīng)用案例實(shí)踐培訓(xùn)班-肽度TIMEDOO

強(qiáng)化學(xué)習(xí)是近年來(lái)在人工智能技術(shù)中較高的一種研究方法,是一種接近人類及動(dòng)物在大自然中所表現(xiàn)出的學(xué)習(xí)方式,通過(guò)人們不斷實(shí)踐和總結(jié),形成了強(qiáng)化學(xué)習(xí)這一人工智能研究方法。

隨著深度學(xué)習(xí)技術(shù)的流行,深度學(xué)習(xí)中的一些主流技術(shù),如深度卷積神經(jīng)網(wǎng)絡(luò)、序列建模、記憶管理等與強(qiáng)化學(xué)習(xí)在許多應(yīng)用場(chǎng)景上出現(xiàn)了結(jié)合點(diǎn),例如使用DQN實(shí)現(xiàn)AI自動(dòng)玩FlappyBird。強(qiáng)化學(xué)習(xí)技術(shù)目前仍面臨訓(xùn)練環(huán)境與計(jì)算能力的瓶頸,相信隨著科技的進(jìn)一步發(fā)展,在未來(lái)十年它一定會(huì)成為人工智能領(lǐng)域的核心技術(shù)之一。本課程通過(guò)理論與案例實(shí)踐相結(jié)合的方法,讓學(xué)習(xí)者可以從最專業(yè)的角度來(lái)接觸強(qiáng)化學(xué)習(xí),學(xué)會(huì)使用這種先進(jìn)的人工智能技術(shù)來(lái)應(yīng)用于實(shí)際工作和學(xué)習(xí)中。

主辦單位:北京市計(jì)算中心有限公司

支持單位:
肽度TIMEDOO

舉 辦 地:北京市海淀區(qū)豐賢中路7號(hào)北科產(chǎn)業(yè)3號(hào)樓

課程安排:2023年6月29-30日周四-周五??上午9:30-11:30??下午13:30-17:00

日期 主題 內(nèi)容 案例實(shí)踐
第一天

上午

Python入門 1、Python基礎(chǔ) (1)Python下載

(2)Gym虛擬環(huán)境配置

(3)使用Gym搭建網(wǎng)格環(huán)境

2023.6.29-30|迷宮尋寶,寓教于樂(lè):Python強(qiáng)化學(xué)習(xí)算法與應(yīng)用案例實(shí)踐培訓(xùn)班-肽度TIMEDOO2023.6.29-30|迷宮尋寶,寓教于樂(lè):Python強(qiáng)化學(xué)習(xí)算法與應(yīng)用案例實(shí)踐培訓(xùn)班-肽度TIMEDOO

強(qiáng)化學(xué)習(xí)入門 2、強(qiáng)化學(xué)習(xí)基本概念

3、強(qiáng)化學(xué)習(xí)與其他機(jī)器學(xué)習(xí)的關(guān)系

4、Gym實(shí)驗(yàn)環(huán)境基礎(chǔ)知識(shí)

第一天

下午

強(qiáng)化學(xué)習(xí)算法入門 5、馬爾可夫決策過(guò)程

6、動(dòng)態(tài)規(guī)劃

7、蒙特卡洛方法

8、時(shí)序差分

(4)使用策略迭代方法求解迷宮尋寶問(wèn)題

(5)使用值迭代方法求解迷宮尋寶問(wèn)題

(6)蒙特卡洛模擬Monty Hall(娛樂(lè)節(jié)目抽獎(jiǎng)游戲)

(7)SARSA時(shí)序差分算法訓(xùn)練 CartPole

(8)Q-Learning算法求解復(fù)雜陷阱迷宮尋寶問(wèn)題

2023.6.29-30|迷宮尋寶,寓教于樂(lè):Python強(qiáng)化學(xué)習(xí)算法與應(yīng)用案例實(shí)踐培訓(xùn)班-肽度TIMEDOO2023.6.29-30|迷宮尋寶,寓教于樂(lè):Python強(qiáng)化學(xué)習(xí)算法與應(yīng)用案例實(shí)踐培訓(xùn)班-肽度TIMEDOO

第二天

上午

強(qiáng)化學(xué)習(xí)算法進(jìn)階 9、值函數(shù)逼近(DQN算法)

10、隨機(jī)策略梯度(REINFORCE算法)

11、確定性策略梯度(DDPG算法)

12、AC算法及變種

(9)DQN實(shí)現(xiàn)“CartPole”平衡控制

(10)使用DQN實(shí)現(xiàn)AI自動(dòng)玩FlappyBird

(11)REINFORCE訓(xùn)練小車爬坡

(12)DDPG算法訓(xùn)練機(jī)械臂抓取方塊

(13)AC算法實(shí)現(xiàn)“CartPole”平衡控制

(14)Mario-Ai:使用A3C算法實(shí)現(xiàn)Mario

2023.6.29-30|迷宮尋寶,寓教于樂(lè):Python強(qiáng)化學(xué)習(xí)算法與應(yīng)用案例實(shí)踐培訓(xùn)班-肽度TIMEDOO2023.6.29-30|迷宮尋寶,寓教于樂(lè):Python強(qiáng)化學(xué)習(xí)算法與應(yīng)用案例實(shí)踐培訓(xùn)班-肽度TIMEDOO2023.6.29-30|迷宮尋寶,寓教于樂(lè):Python強(qiáng)化學(xué)習(xí)算法與應(yīng)用案例實(shí)踐培訓(xùn)班-肽度TIMEDOO

第二天

下午

強(qiáng)化學(xué)習(xí)綜合實(shí)踐 13、博弈強(qiáng)化學(xué)習(xí)

14、蒙特卡洛樹(shù)搜索

15、AlphaGo基本原理

16、AlphaGo?Zero原理

(15)PyGame實(shí)現(xiàn)“五子棋”游戲環(huán)境

(16)蒙特卡洛樹(shù)搜索(MCTS)代碼實(shí)現(xiàn)

(17)AlphaGo Zero算法實(shí)現(xiàn)人機(jī)對(duì)弈

2023.6.29-30|迷宮尋寶,寓教于樂(lè):Python強(qiáng)化學(xué)習(xí)算法與應(yīng)用案例實(shí)踐培訓(xùn)班-肽度TIMEDOO2023.6.29-30|迷宮尋寶,寓教于樂(lè):Python強(qiáng)化學(xué)習(xí)算法與應(yīng)用案例實(shí)踐培訓(xùn)班-肽度TIMEDOO

注:內(nèi)容以實(shí)際發(fā)生為準(zhǔn);若調(diào),會(huì)提前通知。

報(bào)名費(fèi)用

注冊(cè)費(fèi):2800元/人(含當(dāng)期聽(tīng)課費(fèi)、資料費(fèi)、證書(shū)費(fèi)、考試費(fèi)(如有))。
提供當(dāng)期視頻回放以供復(fù)習(xí)使用(羽林學(xué)院平臺(tái))。
開(kāi)具增值稅發(fā)票,提供蓋章通知、結(jié)業(yè)證書(shū)等相關(guān)材料。

報(bào)名優(yōu)惠政策

1、3人以上團(tuán)體報(bào)名每人可減少300元;

2、4+1團(tuán)報(bào),可免費(fèi)贈(zèng)送一個(gè)名額;

3、上面優(yōu)惠政策不能同時(shí)享受,只能享受其中一種;

老學(xué)員參加及推薦學(xué)員參加均可額外優(yōu)惠200元。

掃碼報(bào)名

2023.6.29-30|迷宮尋寶,寓教于樂(lè):Python強(qiáng)化學(xué)習(xí)算法與應(yīng)用案例實(shí)踐培訓(xùn)班-肽度TIMEDOO

咨詢請(qǐng)聯(lián)系

李老師:vicolee2021(微信)

開(kāi)課前一周會(huì)發(fā)送郵件通知;若未接到郵件通知,請(qǐng)電話咨詢。