?">

岛国在线播放v片免费-岛国在线最新-第四色播日韩第一页-第四色视频-欧美在线黄-欧美在线观看你懂的

首頁  ?  科學  ?  科學探索

玩躲貓貓游戲 AI學會攻防術

2019-09-19 08:07:19

來源: 科技日報

??? 盡管機器學習在諸如圍棋和Dota?2等復雜游戲中取得了顯著進步,但在這些領域掌握的技能并不一定能推廣到真實場景中實際應用。越來越多的研究人員正在尋求建立一種機器智能,使其行為、學習和進化更像人類。

????總部位于舊金山的OpenAI公司近日發表的一篇新論文提出,在兒童的“躲貓貓”游戲中訓練模型,并在數以千萬計的競賽中使它們相互對抗,可導致模型自動發展出類似人類的行為,從而提高智力并改善后續行動的性能。

????為什么選擇躲貓貓?

????該論文的第一作者、OpenAI研究員博文·貝克認為,躲貓貓被選為一個有趣的起點,主要是因為其規則很簡單。所有游戲中的代理(Agent,也稱智能體,指能自主活動的軟件或硬件實體)都被模擬為球形對象,可執行3種類型的操作:導航、抓住并移動物體、鎖定對象,且只能由該代理的隊友解鎖。

????研究人員在模擬的、物理接地的環境中放置了1—3個“躲藏者”和1—3個“尋找者”,房間的邊界是靜態墻。環境中還包括不同尺寸的可移動箱子和可移動坡道。

????研究人員使用強化學習來訓練游戲代理,并遵循簡單的躲貓貓規則:隱藏者成功躲過尋找者的追逐,或是尋找者成功找到躲藏者。

????AI如何玩躲貓貓?

????在經過數億次的游戲后,AI代理經歷了幾個階段的策略發展過程。

????在初始階段,躲藏者(藍色)和尋找者(紅色)通過在空間中移動而不操縱任何物體,制定了非常粗糙的躲避和追逐策略。

????在經歷2500萬個回合后,游戲變得更加復雜。躲藏者學會了移動和鎖定在環境中的箱子和路障,以在自己周圍建立堡壘,這樣尋找者就永遠看不到它們了。不僅如此,他們還制定了協調戰略,例如相互傳遞物體,以加快建造堡壘的進程。

????然而,在游戲進行了7500萬回合之后,尋找者發現了一個反策略。他們學會了在躲藏者的要塞旁邊移動一個坡道,并用它來爬過墻壁。

????作為回應,躲藏者學會了將坡道移入他們的房間,因此尋找者無法用它來越過墻壁。

????隨著環境變得越來越復雜,躲藏者學會了使用細長箱子建造更強大的“堡壘”。雖然OpenAI認為這將是最終的策略,但在游戲進行到3.8億回合時,尋找者再次成功反擊,找出一種方法來跳到一個盒子上并利用動力在它上面“沖浪”,越過墻壁進入堡壘。

????在最后階段,躲藏者學會在建造堡壘之前鎖定所有箱子,以防止“箱子沖浪”。

????研究人員將這些不同策略的演變稱為“來自多智能體自動課程的緊急技能進展”。“自動課程”這一術語是今年由DeepMind創造的,適用于多個代理逐漸創造新任務以在特定環境中相互挑戰。OpenAI的研究人員認為,這個過程在自然選擇方面具有相似之處。

????這項研究為啥很重要?

????鑒于躲貓貓相對簡單的目標,通過競爭性自我游戲訓練的多個代理學會了使用工具,并采用人類相關技能來獲勝。OpenAI認為,這為未來的智能代理開發和部署提供了一個有前景的研究方向。OpenAI正在開源其代碼和環境,以鼓勵在該領域進一步研究。

????OpenAI的最終目標是構建能夠在一個通用系統中執行多項任務的人工通用智能(AGI)。雖然可能會有不同的目標,但OpenAI正在大力投資由大規模計算能力實現的強化學習研究。OpenAI最近與微軟簽署了一份價值10億美元的為期10年的計算合同。

????躲貓貓游戲研究也激發了OpenAI,因為隨著環境復雜性的增加,游戲中的代理不斷地通過新策略自我適應新的挑戰。貝克表示:“如果擴展像這樣的流程,并將其放入更復雜的環境中,那么你可能會得到足夠復雜的代理,以便為我們解決實際任務?!?/p>

????挑戰在哪里?

????游戲代理有時會表現出令人驚訝的行為。例如,躲藏者試圖完全逃離游戲區域,直到研究人員對此施加懲罰。

????其他挑戰可能歸因于模擬環境設計中的物理缺陷。例如,躲藏者了解到,如果他們在拐角處向墻壁推動斜坡,斜坡將由于某種原因穿過墻壁然后消失。這種“作弊”說明了算法的安全性如何在機器學習中發揮關鍵作用。研究人員說:“在它發生之前,你永遠不會知道。這類系統總是存在缺陷。我們所做的基本上是觀察,以便我們可以看到這種奇怪的事情發生,然后試著修復物理缺陷。”

  • 相關閱讀
  • 迎接“全屋智能”時代

      【現象】 ??? 近幾年,“全屋智能”的概念逐漸在家裝領域流行開來。顧名思義,所謂全屋智能,是指整體的智能家居系統,集智能照明、安防、影音、家電控制等于一體的整體家居解決方案?!叭葜悄堋睂崿F家居產...

    時間:09-20
  • 會員經濟,當以誠信為先

      近年來,聽歌、購物、旅游、點外賣……凡日常生活所能觸及的領域,各類互聯網平臺紛紛推出了各式各樣的會員制度,讓用戶目不暇接。為了享受更優惠的價格、更高品質的服務,辦理付費會員正在成為一種消費常態...

    時間:09-20
  • 共和國的故事·飛天記

      中國載人航天工程自1992年立項實施以來,從無人飛行到載人飛行,從一人一天到多人多天,從艙內實驗到出艙活動,從單船飛行到組合體穩定運行……在西方國家的技術封鎖和質疑聲中,我國先后突破掌握天地往返、...

    時間:09-19
  • 第六屆世界互聯網大會將于十月舉行

      國新辦18日舉行發布會,介紹第六屆世界互聯網大會有關情況及籌備工作。國家互聯網信息辦公室副主任劉烈宏宣布,由國家網信辦和浙江省人民政府共同舉辦的第六屆世界互聯網大會將于10月20日至22日在浙江烏鎮召...

    時間:09-19
  • 長江水下藏著一個超大管廊,能通電百萬伏

      橫亙在長江兩岸的蘇通大橋,車量川流不息;寬闊的江面上,舟楫如梭。上游一公里處,江水下深藏著一個超大管廊,長5468.5米,盾構直徑12.07米,能通百萬伏電。   這個超大管廊名為蘇通GIL管廊,連接蘇州和南...

    時間:09-19
  • 我國首片自主研發的8.5代TFT—LCD玻璃基板下線

      9月18日,我國首片8.5代TFT—LCD玻璃基板在安徽蚌埠下線。我國成為全球第三個掌握高世代TFT—LCD玻璃基板生產技術的國家。   TFT—LCD玻璃基板是液晶顯示面板的核心部件,是電子信息顯示產業的關鍵戰略材料...

    時間:09-19
  • 華為芯片全系列亮相

      昨日,華為副董事長胡厚昆在華為全聯接大會上展示了華為全系列處理器,包括支持通用計算的鯤鵬系列、支持AI的升騰系列、支持智能終端的麒麟系列和支持智慧屏的鴻鵠系列。2017年至今,四大系列共發布10款處理...

    時間:09-19
  • 中微子新質量上限“出爐”: 不超過一點一電子伏特

      中微子是自然界中迄今已知最“輕盈”的基本粒子,但其質量一直是個未解之謎?,F在,德國科學家對中微子的質量提出了新的限定值:不超過1.1電子伏特(eV),還不到單個電子質量的50萬分之一。新結果是以前質量...

    時間:09-19
  • 人工智能可提前一年半預測厄爾尼諾

      目前厄爾尼諾事件被認為無法準確預測,但據英國《自然》雜志18日發表的一項人工智能(AI)與氣候學研究,韓國科學家報告了一種可以提前一年半預測厄爾尼諾事件的深度學習方法,克服了該領域長期存在的一項挑...

    時間:09-19
免責聲明:本網對文中陳述、觀點判斷保持中立,不對所包含內容的準確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔全部責任。 本網站轉載圖片、文字之類版權申明,本網站無法鑒別所上傳圖片或文字的知識版權,如果侵犯,請及時通知我們,本網站將在第一時間及時刪除。
主站蜘蛛池模板: 久久国产精品系列| 无码精品A∨在线观看十八禁| 中文字幕亚洲乱伦精品中文字幕| 在线精品无码81| 亚洲国产精品久久无码在 | 大桥未久一级污片观看| 成人精品一区二区三区视频播放| AV无码区一区二区三| 一本久久精品久久综合桃色| 小米su7黄片欧美日韩一区二区三区| 四虎永久在线精品无码动漫| 日本欧美一二三区| 男人的天堂之五月天| 精品人妻无码人妻中出| 国产精品美女久久久久AV爽| 波多野结衣一本二本免费看| 亚洲日本国产精品| 无人区二区三区四区五区在线观看 | 国产一区二区视频免费看| 午夜伦理一区二区| 在线欧美日韩国产二区| 亚洲精品自产拍| 日韩一区二区三区成人| 女人射精免费视频| 国产一区二区三区免费视频| 成人乱一区二区在线| 永久域名高清无码| 五月伊人婷婷一区| 欧美人成成品视频| 精品久久久久久久久亚洲| 国产精品高潮浪潮AV无码| 1000千个又黄又爽的黄片没成年人的女生| 亚洲精品久久久中文字幕| 日韩午夜久久电影| 久久精品国产一区二区深喉| 国产凹凸在线一区二区色老头| 永久免费的成人电影一级毛片| 汤姆影院入口tom| 久久男人的免费视频| 国产国产精品久久久久| 中文字幕精品一二三四五六七八|