国产三级精品三级在线观看,国产高清无码在线观看,中文字幕日本人妻久久久免费,亚洲精品午夜无码电影网

重磅Nature!GPT-4來搶“飯碗”了!

基于Transformer的大型語言模型正在各個領(lǐng)域取得重大進(jìn)展,如自然語言處理、生物、化學(xué)和計算機(jī)編程等。
在此,來自美國卡耐基梅隆大學(xué)Gabe Gomes研究者展示了Coscientist的發(fā)展和能力,這是一個由GPT-4驅(qū)動的人工智能系統(tǒng),通過結(jié)合互聯(lián)網(wǎng)和文檔搜索代碼執(zhí)行和實驗自動化等工具授權(quán)的大型語言模型,自主地設(shè)計、計劃和執(zhí)行復(fù)雜的實驗。相關(guān)論文以題為“Autonomous chemical research with large language models”于2023年12月20日發(fā)表在Nature上。
重磅Nature!GPT-4來搶“飯碗”了!
大型語言模型(LLMs),特別是基于Transformer的模型,近年來正經(jīng)歷快速發(fā)展。這些模型已成功應(yīng)用于各種領(lǐng)域,包括自然語言、生物和化學(xué)研究以及代碼生成。如OpenAI所示,模型的極端擴(kuò)展已經(jīng)導(dǎo)致了該領(lǐng)域的重大突破。此外,從人工反饋中強(qiáng)化學(xué)習(xí)等技術(shù)可以大大提高生成文本的質(zhì)量,以及模型在推理其決策的同時執(zhí)行不同任務(wù)的能力。
2023年3月14日,OpenAI發(fā)布了迄今為止最強(qiáng)大的LLM, GPT-414。盡管關(guān)于模型訓(xùn)練、大小和使用的數(shù)據(jù)的具體細(xì)節(jié)在GPT-4的技術(shù)報告中有所限制,但OpenAI研究人員已經(jīng)提供了大量證據(jù),證明該模型具有非凡的解決問題的能力。這些包括但不限于SAT和BAR考試的高分?jǐn)?shù),LeetCode挑戰(zhàn)和圖片的上下文解釋,包括小眾笑話。此外,技術(shù)報告提供了一個如何使用該模型解決化學(xué)相關(guān)問題的例子。
同時,化學(xué)研究的自動化也取得了重大進(jìn)展。例子從有機(jī)反應(yīng)的自主發(fā)現(xiàn)和優(yōu)化到自動化流程系統(tǒng)和移動平臺的開發(fā)。
實驗室自動化技術(shù)與強(qiáng)大的LLMs的結(jié)合,為自主設(shè)計和執(zhí)行科學(xué)實驗的受歡迎系統(tǒng)的開發(fā)打開了大門。為了實現(xiàn)這一點(diǎn),研究者打算解決以下問題。LLMs在科學(xué)過程中的能力是什么?研究者能獲得多大程度的自主?研究者如何理解自主智能體所做的決策?
在此,研究者提出一個基于multi-LLMs的智能代理(以下簡稱Coscientist),能夠自主設(shè)計、規(guī)劃執(zhí)行復(fù)雜的科學(xué)實驗。Coscientist可以使用工具瀏覽互聯(lián)網(wǎng)和相關(guān)文檔,使用機(jī)器人實驗應(yīng)用程序編程接口(APIs)并利用其他LLMs完成各種任務(wù)。這項工作是獨(dú)立完成的,并與自主代理的其他工作并行進(jìn)行,ChemCrow是化學(xué)領(lǐng)域的另一個例子。本文在六個任務(wù)中展示了聯(lián)合科學(xué)家的通用性和性能:(1)使用公開可用的數(shù)據(jù)規(guī)劃已知化合物的化學(xué)合成;(2)在大量硬件文檔中高效搜索和導(dǎo)航;(3)在云實驗室中使用文檔執(zhí)行高級命令;(4)低指令精確控制液體處理儀器;(5)解決需要同時使用多個硬件模塊和集成不同數(shù)據(jù)源的復(fù)雜科學(xué)任務(wù);(6)解決需要分析先前收集的實驗數(shù)據(jù)的優(yōu)化問題。
重磅Nature!GPT-4來搶“飯碗”了!
圖1. 系統(tǒng)的架構(gòu)
Coscientist通過與多個模塊交互(web和文檔搜索,代碼執(zhí)行)和執(zhí)行實驗來獲得解決復(fù)雜問題所需的知識。主模塊(‘ Planner ‘)具有規(guī)劃的目標(biāo),通過調(diào)用以下定義的命令來基于用戶輸入進(jìn)行規(guī)劃。規(guī)劃器是一個GPT-4聊天完成實例,充當(dāng)助手的角色。初始用戶輸入和命令輸出被視為發(fā)送給規(guī)劃器的用戶消息。規(guī)劃器的系統(tǒng)提示(定義LLMs目標(biāo)的靜態(tài)輸入)以模塊化方式設(shè)計,描述為定義動作空間的四個命令:`谷歌`,` PYTHON `, ` DOCUMENTATION `和` EXPERIMENT `。
計劃者根據(jù)需要調(diào)用這些命令來收集知識。谷歌命令負(fù)責(zé)使用` Web searcher `模塊搜索互聯(lián)網(wǎng),這是另一個LLM本身。PYTHON命令允許規(guī)劃器使用“代碼執(zhí)行”模塊執(zhí)行計算,為實驗做準(zhǔn)備。EXPERIMENT命令通過DOCUMENTATION模塊描述的API實現(xiàn)“自動化”。與谷歌一樣,DOCUMENTATION命令從源向主模塊提供信息,在本例中是關(guān)于所需API的文檔。本文展示了與Opentrons Python API和Emerald Cloud Lab (ECL)符號實驗室語言(SLL)的兼容性。這些模塊共同組成了Coscientist,它從用戶那里接收一個簡單的純文本輸入提示(例如,“執(zhí)行多個Suzuki反應(yīng)”)。這種架構(gòu)如圖1所示。
重磅Nature!GPT-4來搶“飯碗”了!
圖2. 協(xié)同科學(xué)家在化學(xué)合成計劃任務(wù)中的能力
為了演示W(wǎng)eb搜索模塊的功能之一,研究者設(shè)計了一個由7種化合物組成的測試集來合成,如圖2a所示。Web搜索器模塊的版本分別表示為` search-gpt-4 `和` search-gpt-3.5-turbo `。研究者的基線包括OpenAI的GPT-3.5和GPT-4, Anthropic的Claude 1.3和Falcon-40B-Instruct,根據(jù)OpenLLM排行榜,這些模型在實驗時被認(rèn)為是最好的開源模型之一。
研究者提示每個模型提供詳細(xì)的化合物合成,并將輸出按以下比例進(jìn)行排序(圖2):
  • 5非常詳細(xì)和化學(xué)精確的程序描述

  • 4用于詳細(xì)和化學(xué)準(zhǔn)確的描述,但沒有試劑的數(shù)量

  • 3一個正確的化學(xué)描述,不包括一步一步的過程

  • 2極其模糊或不可行的描述

  • 1不正確的回答或不遵守指示

由GPT-4驅(qū)動的Web搜索器在綜合規(guī)劃方面有顯著改進(jìn)。在對乙酰氨基酚、阿司匹林、硝基苯胺和酚酞的所有試驗中,它達(dá)到了最高得分(圖2b)。盡管它是唯一一個對布洛芬達(dá)到最低可接受分?jǐn)?shù)3的模型,但它對乙酸乙酯和苯甲酸的表現(xiàn)低于其他一些模型,可能是因為這些化合物的廣泛性質(zhì)。這些結(jié)果表明,讓LLMs擱淺以避免“幻覺”的重要性??偟膩碚f,支持GPT-3.5的Web搜索器的性能落后于它的GPT-4競爭對手,主要是因為它沒有遵循關(guān)于輸出格式的具體說明。
重磅Nature!GPT-4來搶“飯碗”了!
圖3. 文檔搜索概述
重磅Nature!GPT-4來搶“飯碗”了!
圖4. 機(jī)器人液體處理控制能力和與分析工具的集成
獲取文檔使人們能夠為聯(lián)合科學(xué)家在物理世界中進(jìn)行實驗提供足夠的信息。為了展開調(diào)查,研究者選擇了Opentrons OT-2,這是一個開源的液體處理程序,具有文檔齊全的Python API。文檔中的“入門”頁面在系統(tǒng)提示中提供給規(guī)劃師。其他頁面使用上述方法向量化。
重磅Nature!GPT-4來搶“飯碗”了!
圖5. 交叉耦合鈴木和Sonogashira反應(yīng)實驗由Coscientist設(shè)計和執(zhí)行
通過使用來自互聯(lián)網(wǎng)的數(shù)據(jù),執(zhí)行必要的計算,并最終為液體處理程序編寫代碼,評估了Coscientist計劃催化交叉耦合實驗的能力。為了增加復(fù)雜性,研究者要求Coscientist使用在GPT-4訓(xùn)練數(shù)據(jù)收集截止后發(fā)布的OT-2加熱-搖動模塊。提供給聯(lián)合科學(xué)家的可用命令和動作如圖5a所示。盡管研究者的設(shè)置還不是完全自動化的(板塊是手動移動的),但不涉及人工決策。
聯(lián)合科學(xué)家復(fù)雜化學(xué)實驗?zāi)芰Φ臏y試挑戰(zhàn)設(shè)計如下:(1) Coscientist提供一個配備有兩個微孔板(源板和目標(biāo)板)的液體處理器。(2)源板包含多種試劑的原液,包括苯乙炔和苯硼酸,多種芳基鹵化物偶聯(lián)劑,兩種催化劑,兩種堿和溶解樣品的溶劑(圖5b)。(3)靶板安裝在OT-2加熱-搖床模塊上(圖5c)。(4)聯(lián)合科學(xué)家的目標(biāo)是在現(xiàn)有資源的情況下,成功設(shè)計并執(zhí)行Suzuki-Miyaura和Sonogashira耦合反應(yīng)協(xié)議。
重磅Nature!GPT-4來搶“飯碗”了!
圖6.?化學(xué)推理能力
本研究通過Coscientist系統(tǒng)展示了在化學(xué)實驗設(shè)計中的高級推理能力。研究重點(diǎn)放在使用Coscientist優(yōu)化Pd催化反應(yīng)的多變量設(shè)計。
圖6a介紹了Suzuki反應(yīng)數(shù)據(jù)集的應(yīng)用,涉及不同配體、試劑和溶劑。圖6e則展示了Buchwald–Hartwig反應(yīng)數(shù)據(jù)集,記錄了配體、添加劑和堿的變化。Coscientist的測試被設(shè)計為一款游戲,目標(biāo)是最大化反應(yīng)產(chǎn)率。玩家需以JSON格式提供特定反應(yīng)條件和化學(xué)解釋。
圖6b使用歸一化優(yōu)勢度量來評估Coscientist的性能,顯示了其在每次迭代中的推理能力提高。圖6c對比了提供先驗信息與否的GPT-4和GPT-3.5的性能。結(jié)果表明,提供先驗信息的GPT-4在初始猜測上更優(yōu),但最終性能相同。
圖6d的導(dǎo)數(shù)圖表顯示輸入先驗信息與否之間沒有顯著差異。與標(biāo)準(zhǔn)的貝葉斯優(yōu)化相比,基于GPT-4的方法展示出更高的NMA和歸一化優(yōu)勢值。圖6e比較了沒有先驗信息的GPT-4在處理化合物名稱或SMILES字符串時的性能,兩種情況下性能相似。
總結(jié)來說,Coscientist在化學(xué)實驗設(shè)計和優(yōu)化中展現(xiàn)了出色的推理能力和數(shù)據(jù)處理方法,其性能在多個測試中得到了證實。
綜上,研究者提出了一個能夠(半)自主設(shè)計、規(guī)劃多步執(zhí)行科學(xué)實驗的人工智能代理系統(tǒng)概念證明。該系統(tǒng)展示了先進(jìn)的推理和實驗設(shè)計能力,解決了復(fù)雜的科學(xué)問題并生成了高質(zhì)量的代碼。當(dāng)LLMs獲得相關(guān)研究工具,如互聯(lián)網(wǎng)和文檔搜索、編碼環(huán)境和機(jī)器人實驗平臺時,這些能力就會出現(xiàn)。為LLMs開發(fā)更集成的科學(xué)工具有可能大大加速新發(fā)現(xiàn)。
未來,正在加速到來,留給“化學(xué)人”的時間不多了!
參考文獻(xiàn)
Boiko, D.A., MacKnight, R., Kline, B.?et al.?Autonomous chemical research with large language models.?Nature?624, 570–578 (2023). https://doi.org/10.1038/s41586-023-06792-0
原文鏈接:
https://www.nature.com/articles/s41586-023-06792-0

原創(chuàng)文章,作者:wdl,如若轉(zhuǎn)載,請注明來源華算科技,注明出處:http://www.xiubac.cn/index.php/2023/12/22/5c40600bef/

(0)

相關(guān)推薦

泽州县| 拉孜县| 金门县| 江达县| 营山县| 胶州市| 贵州省| 龙井市| 德阳市| 吉木乃县| 隆尧县| 察雅县| 凤凰县| 盐津县| 康保县| 庆城县| 远安县| 运城市| 郯城县| 东丽区| 枣阳市| 龙门县| 道孚县| 开原市| 宜阳县| 聂荣县| 罗城| 调兵山市| 镇远县| 常州市| 秦安县| 广元市| 东光县| 买车| 长宁县| 博爱县| 青川县| 托里县| 莆田市| 西安市| 虎林市|