夢想很美好。
(資料圖)
編者按:本文來自微信公眾號全天候科技(ID:iawtmt),作者:于惠如,編輯:羅麗娟 ,創業邦經授權發布。
“認知大模型成為通用人工智能的曙光,科大訊飛有信心實現‘智能涌現’。”
5月6日,科大訊飛星火認知大模型揭開神秘面紗。發布會上,科大訊飛董事長劉慶峰、科大訊飛研究院院長劉聰在現場實測了訊飛星火在七大維度上的核心能力,包括多風格多任務長文本生成、語言理解、泛領域開放式知識問答、情境式思維鏈邏輯推理、多題型可解析數學、多功能多語言代碼,以及多模態輸入和表達等。
訊飛星火認知大模型發布的同時,科大訊飛也發布了基于該大模型的教育、辦公、汽車和數字員工等多個領域相關產品。
星火認知大模型始于2022年12月。彼時,科大訊飛啟動“1+N”大模型技術攻關,其中,“1”代表通用認知智能大模型算法研發及高效訓練方案底座平臺,“N”代表大模型在教育、辦公、汽車、人機交互等各個領域的落地。
“當前,在文本生成、知識問答、數學能力三大能力上,訊飛星火認知大模型已超ChatGPT。”劉慶峰在發布會上表示。
與此同時,劉慶峰還給出了訊飛星火的迭代時間表及每階段目標:第一階段,在6月9日,突破開放性問答,如實時問答;多輪對話能力再次升級;數學能力再上臺階。第二階段,在8月15日,突破代碼能力;多模態交互能力正式開放給客戶。 第三階段:10月24日,在通用大模型領域對標ChatGPT,其中中文能力超越后者,英文能力與后者相當。
此外,據劉慶峰透露,科大訊飛還將在今年推出醫療行業大模型。
發布會現場,劉慶峰用“最強”、“已超ChatGPT”、“遙遙領先”等詞形容訊飛星火認知大模型的部分能力,但他同時也承認訊飛星火仍然存在一些問題。比如:對新知識難以及時更新;事實類問答容易出現“張冠李戴”;史實、傳統典籍等容易“編造情節”等。
目前,星火認知大模型已對外開放測試。
01 現場實測七大核心能力與百度文心一言、阿里通議千問不同,訊飛星火沒有在發布會上使用提前錄好的demo版本,而是在現場實測了其七大核心能力。
從現場演示效果來看,星火認知大模型基本能夠流暢完成交付的各項任務。另外,訊飛星火體現了科大訊飛的一貫強項——語音能力,它可以通過語音轉文字進行問答,這也是其優勢所在。
演示中,劉聰讓星火認知大模型寫郵件、做方案、寫新聞通稿、生成英文宣傳文案等文本生成功能,訊飛星火均流暢地完成了任務。
現場演示的訊飛星火的語言理解能力也在線,它理解了特定的句子和場景含義,隨著問題的變化,也調整了自己的答案
在數學能力中,除了常規計算、幾何、情景應用等,訊飛星火解答了復雜的計算題答案。在劉慶峰看來,數理能力一定程度代表了一個大模型的聰明程度。“訊飛星火大模型不僅在國內系統中遙遙領先,也超過了ChatGPT。”
此外,劉聰還展示了大模型面向泛領域開放式知識問答能力、邏輯推理能力與代碼能力。在多模態能力方面,星火大模型能夠根據關鍵詞句生成語音、圖片、視頻等素材,并可生成虛擬人進行視頻展示。
不過,據官方介紹,訊飛星火的多模態能力目前還在測試中,最遲8月會提供給VIP客戶使用。
02 打通“大模型+產品”閉環生態訊飛星火認知大模型發布的當天,科大訊飛還同時發布了基于該大模型的教育、辦公、汽車和數字員工等多個領域相關產品。
以汽車為例,訊飛火星認知大模型與智慧座艙的結合,可以實現車內跨業務、跨場景人車自由交流。基于大模型的智能座艙將更自由、擬人化、更懂汽車、更開放。
在學習機中,新增talktalk功能,實現中英文對話,存量學習機可更新迭代。辦公本和錄音筆中,新增語篇規整、要點總結、一鍵成稿,存量產品也可更新使用。
基于自然語言生成業務流程和RPA,在“大模型+數字員工”應用場景,可以幫助企業員工完成大量重復性工作。
現場以公司招聘事項為例,輸入指令后,系統即可自動按照事先設計的RPA腳本,操作計算機中的相應軟件,實現業務流程的自動化操作并輸出結果,并進行數據分析。
劉慶峰透露,上述領域外,訊飛星火認知大模型還將賦能包括醫療、城市、政法、工業等在內的更多行業,滿足更多專業領域的需求,向更廣闊的產業領域延伸。
據了解,首批來自36個行業的3000余家企業開發者將接入星火大模型。
03 測試體驗星火大模型“成色”究竟如何?全天候科技親測了多個場景下的問題,不妨一起來看一看它回答的如何。
我們先讓星火大模型介紹了自己和競品。
很明顯,簡單介紹沒有問題,但當主語更復雜,需要理解時,它的理解能力“不在線”。
我們又讓訊飛星火展現了文字創作能力——根據要求寫一首詩。
這首詩基本涵蓋了端午節的要素:糯米、龍舟、艾草,還拓展了龍舟、艾草等元素的使用場景,也表達了對生活的美好祝愿。但整體而言,與其說是一首詩,它更像是一首缺少押韻、對仗、與美感的順口溜。
隨后,全天候科技針對一些時下正流行的網絡“熱梗”進行提問,看其是否有緊跟熱點的能力。
然而,對于“特種兵”式旅游這個網絡熱梗,訊飛星火知道一點,但知道的不多。不過,它的“態度”很好,當我們提出錯誤,它能認識到自己的錯誤,并且道歉。
在測試過程中,全天候科技發現,訊飛星火的部分語料庫并未更新至最新事件,對一些實事仍然給出錯誤答案。比如,當我們問“北京冬奧會自由式滑雪女子U型場地冠軍是誰”時,它給出的答案是:法國選手特蘭斯·勒貝克 (TraceLeBerque)。不過,當我們給出正確答案后,它又立馬承認自己的錯誤并道歉。
在數學推理能力方面,我們請訊飛星火做了幾道數學題。對于第一個題,訊飛星火不僅給出了正確答案,還做了延伸。而對于第二個題,它給出了詳細的解題步驟及正確答案。可以看出,它的簡單數學推理能力過關。
在多模態生成方面,訊飛星火的表現也不夠完美。
此前已經推出的百度文心一言、阿里通義千問等大模型均具備圖片生成的能力。當我們輸入“科大訊飛要開大模型發布會,請生成一張海報”時, 訊飛星火認知大模型告訴我們自己無法生成圖片,但是它還是給我們提供了一些信息和建議。
除了文字,訊飛星火具備在答案中融入emoji表情包能力,當我們讓它用emoji表情包介紹大模型發布會時,它給出了以下答案。
最后,訊飛火星究竟如何看待自己的能力?
我們拋出了劉慶峰對其已“超越ChatGPT”的夸贊,并讓它證明自己。它沒有承認,并已學會了“打太極”。