国产三级精品三级在线观看,国产高清无码在线观看,中文字幕日本人妻久久久免费,亚洲精品午夜无码电影网

今日Nature:深度強化學(xué)習讓AI自行成長!

排序或散列等基本算法,在任何一天都會被使用數(shù)萬億次。隨著計算需求的增長,這些算法的性能變得越來越重要。
盡管過去已經(jīng)取得了顯著的進步,但進一步提高這些程序的效率對人類科學(xué)家和計算方法來說都是一個挑戰(zhàn)。
在此,來自英國Deepmind公司的Daniel J. Mankowitz等研究者展示人工智能(AI)如何通過發(fā)現(xiàn)迄今未知的例程超越當前的藝術(shù)狀態(tài)。相關(guān)論文以題為“Faster sorting algorithms discovered using deep reinforcement learning”于2023年06月07日發(fā)表在Nature上。
今日Nature:深度強化學(xué)習讓AI自行成長!
與此同時,同期Nature專門發(fā)表了一篇Views,以說明該篇文章的重要性。
今日Nature:深度強化學(xué)習讓AI自行成長!
人類的直覺和專業(yè)知識,對改進算法至關(guān)重要。然而,許多算法已經(jīng)達到了人類專家無法進一步優(yōu)化它們的階段,導(dǎo)致了不斷增長的計算瓶頸。經(jīng)典程序綜合文獻中的工作跨越了幾十年,旨在使用延遲代理生成正確的程序和/或優(yōu)化程序。
這些包括枚舉搜索技術(shù)和隨機搜索,以及最近在程序合成中使用深度學(xué)習以生成正確程序的趨勢。使用深度強化學(xué)習(DRL),人們可以更進一步,通過優(yōu)化CPU指令級的實際測量延遲,與以往的工作相比,通過更有效地搜索和考慮正確和快速程序的空間,生成正確和高性能的算法。
計算機科學(xué)中的一個基本問題是如何對序列進行排序。這是在世界各地的初級計算機科學(xué)課程中教授的,并且在廣泛的應(yīng)用中無處不在。
幾十年來,計算機科學(xué)研究一直專注于發(fā)現(xiàn)和優(yōu)化排序算法。實際解決方案的一個關(guān)鍵組成部分是對短序列的元素進行小排序;在對使用分治法的大型數(shù)組進行排序時,會反復(fù)調(diào)用該算法。
在這項工作中,研究者重點研究了兩類小型排序算法:(1)固定排序和(2)變量排序。固定排序算法對固定長度的序列進行排序(例如,sort 3只能對長度為3的序列進行排序),而變量排序算法可以對大小不等的序列進行排序(例如,變量sort 5可以對1到5個元素的序列進行排序)。
在這里,研究者展示了人工智能如何通過發(fā)現(xiàn)迄今未知的例程超越當前的藝術(shù)狀態(tài)。為了實現(xiàn)這一點,研究者將尋找更好的排序程序作為單人游戲的任務(wù)。然后,研究者訓(xùn)練了一個新的深度強化學(xué)習代理AlphaDev來玩這個游戲。
AlphaDev從零開始發(fā)現(xiàn)了小型排序算法,這些算法的表現(xiàn)超過了之前已知的人類基準。這些算法已集成到LLVM標準C++排序庫中。對排序庫的這一部分的更改表示用使用強化學(xué)習自動發(fā)現(xiàn)的算法替換組件。研究者還提供了額外領(lǐng)域的結(jié)果,展示了該方法的通用性。
今日Nature:深度強化學(xué)習讓AI自行成長!
圖1. C++和匯編程序之間的關(guān)系
今日Nature:深度強化學(xué)習讓AI自行成長!
圖2. AssemblyGame和算法的正確性計算
今日Nature:深度強化學(xué)習讓AI自行成長!
圖3. AlphaDev發(fā)現(xiàn)的排序網(wǎng)絡(luò)和算法改進
今日Nature:深度強化學(xué)習讓AI自行成長!
圖4. AlphaDev發(fā)現(xiàn)的完全不同的算法
綜上所述,值得注意的是,AlphaDev理論上可以泛化到不需要對測試用例進行徹底驗證的函數(shù)。例如,哈希函數(shù)和加密哈希函數(shù)通過哈希沖突的次數(shù)來定義函數(shù)的正確性。因此,在這種情況下,AlphaDev可以優(yōu)化最小化沖突和延遲。
從理論上講,AlphaDev還可以在令人印象深刻的大型功能中優(yōu)化復(fù)雜的邏輯組件。研究者希望AlphaDev能夠在人工智能和程序合成社區(qū)提供有趣的見解并激發(fā)新的方法。
文獻信息
Mankowitz, D.J., Michi, A., Zhernov, A.?et al.?Faster sorting algorithms discovered using deep reinforcement learning.?Nature?618, 257–263 (2023). https://doi.org/10.1038/s41586-023-06004-9
原文鏈接:
https://www.nature.com/articles/s41586-023-06004-9

原創(chuàng)文章,作者:菜菜歐尼醬,如若轉(zhuǎn)載,請注明來源華算科技,注明出處:http://www.xiubac.cn/index.php/2024/01/04/a871fc594f/

(0)

相關(guān)推薦

台山市| 乐清市| 普洱| 台北县| 扬州市| 竹溪县| 祁阳县| 连州市| 井陉县| 平利县| 丹棱县| 陇川县| 汉寿县| 永济市| 沂南县| 广河县| 庆安县| 南城县| 邵阳县| 新邵县| 广安市| 沙坪坝区| 临洮县| 治多县| 简阳市| 炎陵县| 虹口区| 财经| 龙里县| 新郑市| 沧源| 新余市| 定边县| 罗山县| 利川市| 射洪县| 陕西省| 阿拉尔市| 祁阳县| 政和县| 诏安县|