比GPT更狠的活來了,開發者們又搞出了新型AI助手
時間:2023-05-18 13:52:35  來源:引領外匯網  
1
聽新聞

我們似乎已經進入到了一個科技界前所未有的時期——人工智能變化的速度正在逐步脫離人們的想象。


(資料圖片僅供參考)

編者按:本文來自微信公眾號 RockFlow Universe(ID:RockFlowUniverse),作者:黃欣欣 編輯:海倫,創業邦經授權轉載。

劃重點

① 在ChatGPT向世界展示了智能聊天機器人強大的語音理解能力之后,“Auto-GPT”和“BabyAGI”等新型AI工具也在引起行業的關注,甚至被認為是人工智能的下一個突破點。

② Auto-GPT是一個實驗性的開源應用程序。該項目由GPT-4驅動,可以用作互聯網搜索、規劃、編碼的代理,甚至可以幫用戶運行一個自主在推特上發帖的程序。

③ BabyAGI是一種基于強化學習和深度學習的自主通用人工智能系統,可根據用戶需求進行學習和優化,實現更智能的操作。比如幫用戶計劃和自動執行一個活動,以增加社交平臺的粉絲數量,或創建和運營一個內容營銷業務等等。

④ AutoGPT和BabyAGI,雖然兩者都是自主代理程序,但區別在于它們實現相同目標的方法是不同。并且,兩者在對于任務的完成上,自主性遠超ChatGPT。

目錄

1. 新型AI工具來了!

2. Auto-GPT、BabyAGI VS ChatGPT

3. 可能被濫用的風險安全和隱患

4. 向通用人工智能邁進了重要一步?

目前,我們似乎已經進入到了一個科技界前所未有的時期——人工智能變化的速度正在逐步脫離人們的想象。

在ChatGPT向世界展示了智能聊天機器人強大的語音理解能力之后,“Auto-GPT”和“BabyAGI”等新型AI工具也在引起行業的關注,甚至被認為是繼GPT-4之后,人工智能的下一個突破點。

這些程序能夠為自己創建任務,完成任務,再創建新任務,甚至重新安排任務列表的優先次序。比如你想投資市場,或者想出一本書,甚至是需要管理社交媒體帳戶,AI自主代理可以被編程為幾乎任何類型的任務,協助你去管理。

雖然所有這些聽起來都像是來自未來主義的科幻片,但這一切在人工智能世界,正在發生。甚至有觀點認為,自主代理可能標志著我們正邁入這樣一個世界——只要人工智能驅動的系統足夠聰明,無需人類參與它們就能自主工作,由此,它將徹底改變行業,觸及數百萬人的生活。然而,這些人工智能工具遠比我們看到的要復雜。

1. 新型AI工具來了

Auto-GPT和BabyAGI,是目前互聯網世界中兩大火爆的自主代理。Auto-GPT上線兩周就在代碼托管平臺GitHub收獲 50k+ Star(Star指“收藏數”)而成功出圈,截至目前已有131k+Star。而BabyAGI,則因其獨特的名字和用戶友好的代碼而深受歡迎。

圖:Auto-GPT在GitHub上已獲131k+Star

Auto-GPT是一個實驗性的開源應用程序。該項目由GPT-4驅動,自主開發和管理業務以增加凈值。Auto-GPT可以用作互聯網搜索、規劃、編碼的代理,甚至可以運行一個自主在推特上發帖的程序。

Auto-GPT運用了OpenAI 最新 AI 模型的多功能性、與在線軟件和服務的交互性,基于對 OpenAI 模型初始的提示,不斷地跟進、詢問并回答它們,直到任務完成。通俗來說,如果你作為一名用戶,只需要告訴你的AI助理, Auto-GPT需要做什么。然后這個AI助手會使用 GPT-3.5 或 GPT-4, 以及幾個程序來執行實現設定目標所需的每一步。例如,如果你給出“幫助我發展我的花卉業務”這樣的提示,Auto-GPT 可以幫助用戶制定一個廣告策略,并建立用戶所需的一個初步搭建完整的網站。

甚至,近期有外國網友讓Auto-GPT 幫他建立一個app,在此過程中他什么都不需要做,一切都可以交由Auto-GPT完成。事后,他在自己的推特評論區中表示:“建議每個會寫代碼的人留出2個小時來嘗試Auto-GPT”。可見他對Auto-GPT的認可度是很高的。

對于Auto-GPT的發展史,來源一個開發者的故事。其實,創建全球首個Auto-GPT的人名叫Toran Bruce Richards。Richards是蘇格蘭愛丁堡的Significant Gravitas公司的創始人和首席開發者。最初開發的原因,是他想讓一個人工智能代理每天自動通過電子郵件向他發送人工智能新聞。但在這個過程中,他意識到,現有的大語言模型在“需要長期規劃的任務”中掙扎,或者“無法根據實時反饋自主地改進它們的方法”。

此種問題激發了他創建Auto-GPT的靈感。于是,他開發了一款實驗性開源應用程序,內置GPT-4語言模型,可以實現一定意義的自主運行,這也就是Auto-GPT的原型。他表示,Auto-GPT“可以將GPT4的推理應用于需要長期規劃和多個步驟的更廣泛、更復雜的問題”。

Richards在創建Auto-GPT后,于3月30日將其上傳到他的Github頁面。此后,許多其他開發人員紛紛創建了他們自己的版本。

曾有一段視頻演示了Auto-GPT如何完成開發人員給它設定的目標:展示其編碼能力、改進一段代碼、測試它、自行關閉并將其輸出寫入文件。該程序創建了一個待辦事項列表——將讀取代碼添加到其任務中,并在編寫輸出后關閉自己——然后逐一完成它們。Richards發布的另一段視頻則顯示,Auto-GPT在谷歌上搜索和吸收新聞文章,以更多地了解一個主題,以便開展可行的業務。

Auto-GPT 并不是唯一一個關于自動化代理的嘗試。在數千英里之外的西雅圖,風險投資公司中島洋平(Yohei Nakajima)也在研究最新的生成式人工智能工具,并創造了被命名為“BabyAGI”的東西。

BabyAGI,這個名字聽起來既可愛又可怕,有點像經典喜劇恐怖電影《小妖精》中的莫格威,但究竟什么是BabyAGI?實際上,它是一種基于強化學習和深度學習的自主通用人工智能系統,可以根據用戶需求進行學習和優化,實現更加智能的操作。

首先,盡管名字叫BabyAGI,但它不是真正的AGI(是人工通用智能的縮寫)。雖然不是全能型人工智能,但BabyAGI仍是人工智能世界中令人印象深刻的新成員。

圖源:twitter @BabyAGI

中島(也稱Nakajima)是一家小型風投公司“未開發資本”的合伙人。他最初打算建立一個代理,通過復制他自己的工作流程,將他作為風投公司研究新技術和新公司等日常任務自動化。他說:“我希望早上醒來,開始處理清單上的第一件事。此后一整天我都在增加新的任務。到了晚上,會再回顧我的任務,重新確定它們的優先級,然后決定第二天要做什么。”而他希望,BabyAGI可以幫他系統地完成、添加和重新確定GPT-4語言模型要完成的任務的優先級。

Nakajima意識到他的創造可應用于各種其他目標,他便將代理簡化為骨架(105行代碼),并將其上傳到GitHub上,供其他人用作他們自己代理的基礎。

與僅僅接收GPT-4提示的文本答案不同,有了BabyAGI,使用者可以做更多事情,比如計劃和自動執行一個活動以增加推特粉絲數量,或創建和運營一個內容營銷業務等等。此外,自主代理的其他一些例子包括AgentGPT、Godmode、Microsoft Jarvis、CAMEL等等。

Nakajima將“代理”描述為 AI 本身,而不僅僅是提示 LLM 的軟件程序。“如果你能讓兩個 ChatGPT 相互交談,只要有正確的指導,他們就可以永遠交談”,他說,“然后你可以把其中一個變成任務管理器來創建任務,另一個變成任務執行器。在您按下Go后,它們會繼續工作。”

到目前為止,所有這些提及的工具,包括Auto-GPT和BabyAGI,都可以免費使用和運行(盡管每次軟件調用OpenAI API時,用戶都要付費)。它們的開源性質可能會對一些備受矚目、資金雄厚的初創公司構成威脅,這些初創公司正試圖開發商業人工智能助手。

2. Auto-GPT、BabyAGI VS ChatGPT

可能很多人會有一些疑問:Auto-GPT、BabyAGI等自主代理程序,和ChatGPT究竟有何不同之處?

首先,我們來看Auto-GPT和BabyAGI兩者的區別:雖然兩者是自主代理程序,但它們實現相同目標的方法是不同的。Auto-GPT使用 GPT-4 生成代碼,可利用GPT-3.5作為虛擬人工內存空間。而Baby AGI 是基于 GPT-4、Pinecone (矢量數據庫開發商)和 LangChain (大語言模型應用開發)搭建的,可高效完成復雜任務的新代理程序。

BabyAGI 經過真實場景和模擬環境的訓練,可以更快、更準確地完成復雜任務。當配備相關數據時,BabyAGI 可能能夠更快地產生準確的結果,而不會失去對原始目標的關注。不過,它無法訪問互聯網上可用的應用程序和服務,因此其使用僅限于某些領域。

Auto-GPT可以訪問互聯網,這使得搜索信息變得更加容易。它可以從應用程序、網站、書籍、文檔和文章等互聯網服務收集數據,并使用它來完成實現目標所需的任務。Auto-GPT 在這方面有利有弊,因為附加數據可以使其創建更具描述性的內容,但也可能生成不太準確的結果,比如該工具可能會在沒有監督的情況下對從未標記的數據中提取內容。此外,由于它被設計為一次運行多個任務,Auto-GPT 有時會在完成其中一項生成的任務時無法跟蹤主要目標。

對于兩者究竟哪個更好用,目前行業內尚無定論,兩者各有利弊,畢竟兩者都還在發展的初期。具體來說,行業更加關注的是其和ChatGPT的對比———雖然像ChatGPT這樣的應用程序因其生成代碼的能力而聞名,但它們往往局限于相對簡短和簡單的編程和軟件設計。Auto-GPT建立在ChatGPT的基礎之上,但在自主性上遠超ChatGPT。

通常,我們在ChatGPT的文本窗口中輸入提示來與其交互,直到模型生成我們想要的結果。但不是所有人都有技巧和耐心可以坐下來一個提示接一個提示地與GPT互動,引導LLM回復雜的問題。正因如此,開發人員一直在考慮自動化大部分流程的方法,而這就是自主代理的用武之地。

盡管ChatGPT已是一個非常有能力的聊天機器人,但它只是一個聊天機器人,只能對立即提出的問題做出回應,因此只有通過人類的指導,它才能完成驚人的事情。但Auto-GPT的能力遠不止于此,它可以自主作出決策,自動生成和完成任務所需的每一個必要提示,你可以讓它完成一個你一無所知的任務,然后看著它為你完成所有的工作。

在過去的一段時間里,世界各地的開發人員已經開始構建“自主代理”,這些代理可以與大型語言模型一起工作,比如OpenAI的GPT-4,以解決復雜的問題。雖然還很新,但這種代理標志著LLM應用的一個重要里程碑。

想象一下,如果你的眼前出現了一個新的人工智能工具:你可以先設定一個自己想要完成的目標,即使像“創造世界上最好的冰淇淋”這樣模糊的目標,它也會擬出一個待辦事項列表,執行待辦事項,并根據進展來添加新的待辦事項,隨后它會繼續重復這個過程,直至完成目標。而這正是“自主代理程序”所做的事情。

自主代理將傳統的軟件界面添加到大型語言模型的前端,該界面可以使用眾所周知的軟件實踐(例如循環和函數)來指導語言模型完成一般目標(例如,“查找所有關于經濟大蕭條的YouTube視頻并提取關鍵點”)。有些人稱它們為“遞歸”代理,因為它們在循環中運行,向LLM提出問題,每個問題都基于最后一個問題的結果,直到模型產生完整的答案。

其實在早期,自主代理主要是實驗性的,它們有一些嚴重的限制,難以從大型語言模型中得到想要的東西。它們常常很難讓LLM專注于一個目標。畢竟,LLM不是很容易預測的。例如,如果兩個用戶在ChatGPT中編寫相同的提示,那么他們每次都會從模型得到不同的答案。

溫哥華的開發商薩利·奧馬爾(Sully Omar)此前開發了一個代理機構,他希望它能對防水鞋進行一些市場調查,但由于某種原因,LLM分心了,開始把注意力集中在鞋帶上。“它們被繞暈了”,奧馬爾說,“它們無法理解‘這一步驟我已經完成了——我需要進入下一個執行任務的循環。’”奧馬爾說,開發人員可能會找到新的方法,讓自主代理在LLM周圍設置“護欄”,這樣它們就可以繼續完成任務,而不會偏離軌道。

不過,自主代理在一個多星期前才開始出現在GitHub(和Twitter)上,考慮到圍繞生成式人工智能的能量和目前的發展速度,我們有理由相信智能體將克服它們早期的局限性。奧馬爾對此表示:“僅僅九天的時間意味著還有很多事情可能發生。”

3. 可能被濫用的風險安全和隱憂

從本質上講,自主代理是設計用于執行特定任務而無需人工干預的程序。用戶需要給自主代理一個目標,然后他們會去完成通向目標的任務。除了分析任務和創建新任務外,自主代理還具有各種各樣的功能。這些功能包括訪問互聯網和使用應用程序,控制計算機,訪問信用卡和其他與金融交易有關的信息。而隨著Auto-GPT的日益普及,人們對該工具可能被濫用的擔憂也在增加。

一些專家擔心,這款人工智能應用程序可能被惡意行為者用于不當目的,比如自主進行網絡攻擊。它們也可以用來制造虛假和誤導性的內容,并自動引導其在社交媒體上傳播,從而為錯誤信息流傳提供動力。

此外,這種自給自足的技術還存在運行僵化、不夠人性化的問題。比如在客戶服務設置中使用Auto GPT,并且它在沒有適當人工監督的情況下自行運行,它可以在短期內為客戶提供解決方案或查詢答案,但它可能會使用人類知道要避免的快捷方式。

以退貨為例,機器人可能會告訴客戶把包裹送到當地郵局,而不考慮是否有假期,也不會考慮退貨是否符合公司條款和條件。又比如,用戶可以要求Auto-GPT解決應用程序或游戲設計代碼中的問題,它可能會解決代碼中那個孤立部分的問題,但沒有考慮現在編輯或策劃的部分如何適應項目的其余部分,這可能會導致可怕的“面條式代碼”(spaghetti code,非結構化和難以維護的源代碼的貶義詞組)。

并且,還有一個關鍵問題在于這類AI工具尚且缺乏人際交往。擁有一個完全自動化的流程是很好的,但在將一切交給機器人的過程中,我們只知道它在完成任務后提示的做什么以及如何做,但結果生成的過程仍在黑箱之中。對Auto-GPT缺乏控制的結果是它常以我們意想不到的方式執行指令,這也引發了危險的“混沌模式”(Chaos mode)——允許Auto-GPT不請求提示的許可而自主行動。

一位Reddit用戶近期就聲稱,給定在一個服務器實例中花費100美元的預算,Auto-GPT創建了一個關于貓的wiki(維基百科詞條)頁面,利用實例中的一個漏洞獲得了管理員級別的訪問權限,并接管了運行它的Python環境——然后“殺死”了自己。而如果用戶在要求自動機器人做什么時沒有特別叮囑,它們最終可能會做一些用戶不想做的事情,比如購買物品或預約。

另一方面,財務風險也不容忽視。目前可用的大多數Auto-GPT都依賴于對OpenAI的昂貴API調用。Auto-GPT雖然在GitHub上是公開的,但它確實需要一些設置才能運行。例如,用戶需要安裝一些基本要求,如Python 3.8、OpenAI API密鑰和Pinecone API密鑰。為了獲得OpenAI API密鑰,用戶需要注冊一個付費的OpenAI帳戶。此外,Auto-GPTs在連續循環中運行,會向GPT-4運行多個提示鏈,因此它們會迅速使用OpenAI來支付大量費用。華盛頓大學名譽計算機科學家、西雅圖艾倫人工智能研究所的創始人兼首席執行官Oren Etzioni表示,目前最直接的風險是Auto-GPTs可能會意外地從OpenAI收取大筆費用。

此外,還有網絡攻擊和欺詐等惡意用例的可能性,人工智能代理的連續提示鏈迅速增加了OpenAI的大量賬單、自動機器人以用戶無意的方式采取行動的危險,包括購買物品、預約甚至出售股票等等,盡管目前的實例是有限的,但還有其他冰山之下的風險值得仔細評估。Stability AI前首席信息官、AI Infrastructure Alliance董事總經理丹Daniel Jeffries曾表示,“挑戰在于,我們并不真正知道錯誤是什么樣子的。目前Auto-GPT在推理中有15-30%的失敗率,我認為隨著它們變得更加自主,我們對錯誤的容忍度會降低。”

4. 向通用人工智能邁進了重要一步?

自生成式人工智能應用開始出現以來,很明顯,就人工智能將如何發展和影響我們的生活和社會而言,我們只是在漫長旅程的開始。

Auto-GPT和其他遵循相同原則的代理會是這一旅程的下一步嗎?這似乎是有可能的。當前人們對自主代理表現出的興趣與宣傳浪潮離不開對人工智能未來的無限想象,對此,行業專家提出只要人工智能驅動的系統足夠聰明,可以在不需要人類參與的情況下自行工作,而這是向通用人工智能(AGI)邁出的重要一步。

自主操作的人工智能是一個讓我們人類在幾乎本能的層面上感到緊張的概念。我們擔心未來人工智能系統開始以超出人類理解的速度協同工作,并朝著可能與我們自身利益不一致的目標前進。在每一條宣布一個新的自主代理的推文下,你會發現一些詢問代理和大語言模型失控并開始造成傷害可能性的評論留言。

然而,這似乎并沒有減緩開發人工智能代理工具的競爭。例如,上周,以其生成式人工智能寫作擴展而聞名的初創公司HyperWrite發布了一款實驗性人工智能代理,它可以像人類用戶一樣瀏覽網頁并與網站互動。HyperWrite首席執行官馬特?舒默表示,他的團隊非常關注安全問題。他說:“我們想找出正確的方法來做這件事,這是所有這一切的共同主題,我們正在花時間以正確的方式做這件事。”

Jay Scambler是一名顧問和策略師,為小企業和創意人士開發人工智能工具。近期,他在Twitter上表示,這些工具感覺像是改變了游戲規則。他說:“我不想說得太夸張,但我們現在有能力和責任毫不費力地管理一支協調一致的人工智能團隊。”“這個團隊沒有疲勞,執行代碼幾乎完美無缺(取決于你問誰),并且可以使用像LangChain這樣的工具找到幾乎任何問題的答案。”

其他人則不那么樂觀。英偉達人工智能科學家吉姆·范在推特上寫道:“正如作者所指出的那樣,我認為Auto-GPT是一個有趣的實驗。但僅此而已。原型并不意味著可以投入生產。不要讓媒體欺騙了你——大多數‘很酷的演示’都是經過精心挑選的。”

盡管自主代理很有前途,同時不知道當下還有多少種原始版本上的不同變異在悄然滋生,但它可能會讓人們更加相信,科技行業應該以某種方式“暫停”大型語言模型的開發,直到更好地理解可能的結果和風險。

Ref:

https://www.fastcompany.com/90880294/auto-gpt-and-babyagi-how-autonomous-agents-are-bringing-generative-ai-to-the-masses

https://finance.yahoo.com/news/babyagi-taking-silicon-valley-storm-121500747.html

https://indianexpress.com/article/technology/artificial-intelligence/what-are-autonomous-agents-autogpt-babyagi-8567255/

www.forbes.com

https://www.vice.com/en/article/epvdme/developers-are-connecting-multiple-ai-agents-to-make-more-autonomous-ai

https://www.business2community.com/tech-news/chatgpt-let-loose-new-sensational-app-auto-gpt-can-access-internet-tools-autonomously-02680332

https://venturebeat.com/ai/as-ai-agents-like-auto-gpt-speed-up-generative-ai-race-we-all-need-to-buckle-up-the-ai-beat/amp/

https://www.techradar.com/news/auto-gpt-will-supercharge-chatgpt-and-change-how-we-use-it-in-very-scary-ways

關鍵詞: