硅谷對(duì)自動(dòng)化一切的追求是永無止境的,這解釋了它最近的癡迷:Auto-GPT。
本質(zhì)上,Auto-GPT 利用 OpenAI 最新 AI 模型的多功能性與在線軟件和服務(wù)進(jìn)行交互,使其能夠“自主”執(zhí)行 X 和 Y 等任務(wù)。但由于我們正在學(xué)習(xí)大型語言模型,這種能力似乎是像海洋一樣寬,但像水坑一樣深。
Auto-GPT——你最近可能已經(jīng)在社交媒體上看到了它——是一款開源應(yīng)用程序,由游戲開發(fā)商 Toran Bruce Richards 創(chuàng)建,它使用 OpenAI 的文本生成模型,主要是 GPT-3.5 和 GPT-4,“自主地”行動(dòng)”
這種自主性沒有任何魔力。Auto-GPT 只是處理對(duì) OpenAI 模型初始提示的跟進(jìn),詢問和回答它們,直到任務(wù)完成。
基本上,Auto-GPT 是 GPT-3.5 和 GPT-4 與指示 GPT-3.5 和 GPT-4 做什么的伴侶機(jī)器人配對(duì)。用戶告訴 Auto-GPT 他們的目標(biāo)是什么,然后機(jī)器人使用 GPT-3.5 和 GPT-4 以及幾個(gè)程序來執(zhí)行實(shí)現(xiàn)他們設(shè)定的任何目標(biāo)所需的每一步。
使 Auto-GPT 具有合理能力的是它能夠與在線和本地的應(yīng)用程序、軟件和服務(wù)(如網(wǎng)絡(luò)瀏覽器和文字處理器)進(jìn)行交互。例如,給出“幫助我發(fā)展我的花卉業(yè)務(wù)”這樣的提示,Auto-GPT 可以制定一個(gè)有點(diǎn)合理的廣告策略并建立一個(gè)基本的網(wǎng)站。
正如試驗(yàn)過 Auto-GPT 的軟件開發(fā)人員 Joe Koen 通過電子郵件向 TechCrunch 解釋的那樣,Auto-GPT 本質(zhì)上是自動(dòng)化多步驟項(xiàng)目,這些項(xiàng)目需要使用面向聊天機(jī)器人的 AI 模型來回提示,比如, , OpenAI 的 ChatGPT。
“Auto-GPT 定義了一個(gè)與 OpenAI 的 API 通信的代理,”Koen 說。“該代理的目標(biāo)是執(zhí)行 AI 為響應(yīng)代理請求而生成的各種命令。在代理開始執(zhí)行命令之前,系統(tǒng)會(huì)提示用戶輸入以指定 AI 的角色和目標(biāo)?!?
在終端中,用戶描述 Auto-GPT 代理的名稱、角色和目標(biāo),并指定最多五種實(shí)現(xiàn)該目標(biāo)的方法。例如:
名稱:智能手機(jī)-GPT
角色:旨在尋找最佳智能手機(jī)的人工智能
目標(biāo):找到市場上最好的智能手機(jī)
目標(biāo) 1:針對(duì)當(dāng)今市場上的不同智能手機(jī)進(jìn)行市場調(diào)查
目標(biāo) 2:獲得前五名的智能手機(jī)并列出它們的優(yōu)缺點(diǎn)
在幕后,Auto-GPT 依靠內(nèi)存管理等功能來執(zhí)行任務(wù),以及 GPT-4 和 GPT-3.5 用于文本生成、文件存儲(chǔ)和摘要。
Auto-GPT 還可以連接到語音合成器,例如ElevenLabs,這樣它就可以“撥打”電話。
Auto-GPT 在 GitHub 上公開可用,但它確實(shí)需要一些設(shè)置和專業(yè)知識(shí)才能啟動(dòng)和運(yùn)行。要使用它,Auto-GPT 必須安裝在像 Docker 這樣的開發(fā)環(huán)境中,并且必須使用來自 OpenAI 的 API 密鑰注冊——這需要一個(gè)付費(fèi)的 OpenAI 帳戶。
這可能是值得的——盡管還沒有定論。早期采用者已經(jīng)使用 Auto-GPT 來承擔(dān)更好地委托給機(jī)器人的各種平凡任務(wù)。例如,Auto-GPT 可以處理諸如調(diào)試代碼和寫電子郵件或更高級(jí)的事情,比如為新創(chuàng)業(yè)公司制定商業(yè)計(jì)劃。
技術(shù)咨詢公司 UST 的首席架構(gòu)師 Adnan Masood 表示:“如果 Auto-GPT 遇到任何障礙或無法完成任務(wù),它將開發(fā)新的提示來幫助它應(yīng)對(duì)這種情況并確定適當(dāng)?shù)暮罄m(xù)步驟。”一封電子郵件中的 TechCrunch?!按笮驼Z言模型擅長生成類似人類的響應(yīng),但依賴于用戶提示和交互來提供所需的結(jié)果。相比之下,Auto-GPT 利用 OpenAI API 的高級(jí)功能在無需用戶干預(yù)的情況下獨(dú)立運(yùn)行。”
最近幾周,出現(xiàn)了使 Auto-GPT 更易于使用的新應(yīng)用程序,例如AgentGPT和 GodMode,它們提供了一個(gè)簡單的界面,用戶可以在其中直接在瀏覽器頁面上輸入他們想要完成的內(nèi)容。請注意,與 Agent-GPT 一樣,兩者都需要來自 OpenAI 的 API 密鑰才能解鎖其全部功能。
然而,與任何強(qiáng)大的工具一樣,Auto-GPT 也有其局限性和風(fēng)險(xiǎn)。
根據(jù)工具提供的目標(biāo),Auto-GPT 可能會(huì)以非?!庀氩坏降姆绞竭\(yùn)行。一位 Reddit用戶聲稱,鑒于在服務(wù)器實(shí)例中花費(fèi) 100 美元的預(yù)算,Auto-GPT 創(chuàng)建了一個(gè)關(guān)于貓的維基頁面,利用實(shí)例中的一個(gè)缺陷獲得管理員級(jí)別的訪問權(quán)限,并接管了它所在的 Python 環(huán)境運(yùn)行 - 然后“殺死”自己。
還有 ChaosGPT,它是 Auto-GPT 的修改版,其任務(wù)是“毀滅人類”和“建立全球主導(dǎo)地位”等目標(biāo)。不出所料,ChaosGPT 并沒有帶來機(jī)器人世界末日——但它已經(jīng)在推特上相當(dāng)不客氣地談?wù)撊祟悺?
可以說,比 Auto-GPT 試圖“毀滅人類”更危險(xiǎn)的是,在其他完全正常的情況下可能會(huì)出現(xiàn)意想不到的問題。因?yàn)樗墙⒃?OpenAI 的語言模型之上的——像所有語言模型一樣,這些模型容易出錯(cuò)——它可能會(huì)出錯(cuò)。
這不是唯一的問題。成功完成一項(xiàng)任務(wù)后,Auto-GPT 通常不會(huì)回憶起如何執(zhí)行它以供以后使用,而且——即使它記得——它通常也不會(huì)記得使用該程序。Auto-GPT 還難以有效地將復(fù)雜任務(wù)分解為更簡單的子任務(wù),并且難以理解不同目標(biāo)如何重疊。
“Auto-GPT 說明了生成人工智能的力量和未知風(fēng)險(xiǎn),”Salesforce 的 Service Cloud 首席執(zhí)行官兼 Auto-GPT 愛好者 Clara Shih 通過電子郵件表示?!皩?duì)于企業(yè)而言,在開發(fā)和使用 Auto-GPT 等生成式 AI 技術(shù)時(shí),將人納入循環(huán)方法尤為重要?!?/div>