?撰文 | 龍 曦
題圖 | 騰訊音樂
在這個AIGC技術群“模”亂舞的時代,有人提出,所有的互聯網業務,都可以再基于新技術重做一遍。
(資料圖片)
話雖如此,但新技術真正能落地的要素,卻相當難以具備。如果說傳統意義上的“算法、算力和數據”是AI的基本要素,那么“高質量數據+高層次人才+高頻場景”的“三高要素”,才是技術能落地并推動行業解放生產力的關鍵。
從這個角度去看,騰訊音樂娛樂集團(下稱“騰訊音樂”)正在構建和完善自己的“三高要素”。事實上,這家領先的中國在線音樂與音頻娛樂平臺已經廣泛的在業務中使用AI技術,這次財報披露的信息也顯示,在較短時間內,騰訊音樂已基于數據和場景方面的優勢,在AIGC(人工智能原創內容)的產業化應用方面探索出了一條有差異化競爭力的新路。
一、音樂擁抱新技術:騰訊音樂的產業AIGC落地探索
ChatGPT引發的全球群“模”亂舞,使得AIGC備受關注。
事實上,除了強大的文本能力之外,圖像、音樂乃至一切可以用數字形式承載的“內容”,都可以用AIGC技術進行生成,所以在當下,該技術的應用也成為一個備受關注的方向。
由于世界上已經有很多開源數據集作為基礎,所以,僅僅就做出AIGC探索這件事本身而言,只要具有足夠的資金和人才資源,想要達到一定的參數量,并不是多么困難。這也是很多新創團隊在很短的時間內就宣布自己推出AIGC功能或產品的深層原因。
但用錢解決不了的問題是,如果不能具備實際的落地場景和商業價值,技術本身并不能產生價值,只能成為成本。
所以,要判斷技術應用能否落地,先要看看這一領域內是否已經有足夠的AI實踐。
從這個角度看過去,騰訊音樂在AIGC方面,已經有了諸多方面的領先嘗試。例如其最新一季財報中,就提到了其正在持續落地的多元應用,推出的一站式音樂服務平臺“騰訊音樂啟明星”與“音色制作人”不僅協助音樂人在作詞、作曲、音樂內容分析與剪輯等制作環節的效率提升,還可將用戶原聲與不同歌曲無縫融合,促進高質量內容的創作。甚至其財報視頻中的音樂,也由騰訊音樂領先的AIGC音頻技術協助創作完成。
有實踐就更容易用好相關技術,如果一個企業以前一點使用AI的積累都沒有,憑空宣布自己要深度切入前沿領域,大概率是為了講故事和畫餅充饑。
而騰訊音樂,在有諸多AI實踐經驗和場景、數據積累方面,都有充分的準備,這意味它的技術創新探索之路,已然會平坦許多。
二、騰訊音樂投入AIGC領域:基于行業需求的生產力布局
目前AIGC的通用玩法有兩種,第一是自建能力,另一個是利用已有的通用能力,做產業向的應用升級。
但是,無論如何,都有三個痛點不能忽視。
首先,需要有清晰的應用落點,而且要和技術的能力匹配。
騰訊音樂的業務焦點就是音樂等內容和音效、直播等音視頻技術,再加上其在用戶側的應用、互動、參與,這是突出且明確的剛需。所以從這個角度說,需求足夠明確,就有清晰的應用落點。
其次,是有足夠規模的預訓練數據集。
即使有了深度學習技術的加持,但經過人工精標的大規模訓練數據集,仍然是AIGC技術產業化應用的關鍵。
而騰訊音樂的其中一個核心優勢在于,其本身就具有大量的數字化內容。
例如,隨著多元化音效成為用戶音樂消費的“剛需”。第一季度,騰訊音樂將高品質音質進一步覆蓋至車載場景,其旗下QQ音樂的銀河音效可實現車載音響的最佳效果。酷狗音樂的蝰蛇音效也在滿足方便使用、好聽好玩的基礎功能之上,持續深耕,讓音效服務在聽感提升的同時,不斷更新各類玩法,以開放平臺打造UGC音效社區,成為國內首屈一指的音效品牌。
這里的重點是“UGC”。我們可以理解為,12萬條以上的音效中有相當部分,是用戶參與構建或打磨的,而這種“打磨”某種程度上就可以視為一種“數據標注”,這都是騰訊音樂可以復用的優質數據資源。
而隨著“騰訊音樂啟明星”不斷推出更多智能化輔助創作工具,使得大批音樂人加入、使用,驅使這部分數據的質量也在不斷提升,使得騰訊音樂的AIGC技術創新有了充足的數據燃料。
最后,技術的產業化落地還需要企業有足夠的垂直領域的數字化能力,很多傳統產業要邁過這一關并不容易。但這對于數字原生的騰訊音樂來說是一個天然利好,其不需要從底座就開始做,而是可以在已有深度積累的技術研發基礎上做私有化部署,并且結合垂直領域的數據和知識進行“微調”。這其中的道理,就像用電一樣,雖然家家都需要,但不需要家家都有發電廠。
因為,騰訊音樂的AI落地場景很多,對AIGC工具有切實的需求,所以很快就能用起來并產生商業和社會價值。對于騰訊音樂而言,AIGC不是噱頭、不是妝點,而是實實在在的生產力。
三、產業未來應用落地:技術即內容生產力
據了解,在ChatGPT出來之前,騰訊音樂就已經在AI領域投入了大量研發精力。從結果上看,確實落地也很快,這些嘗試也讓騰訊音樂頗具行業前瞻性地在AIGC技術的產業化落地方面積累了豐富的經驗。
那么,AIGC在騰訊音樂體系內的應用,結合其現有業務來看會如何落地和輸出價值呢?
在內容創作方向,在前文提到的“騰訊音樂啟明星”平臺,除了集合了QQ音樂銀河音效、MUSE引擎、TME天琴實驗室等各方面的技術外,騰訊AI Lab作為廣泛的騰訊生態中最重要的AI團隊,也為其提供了音樂分離聯合開發的音頻技術支持。
而旗下酷狗的“音色制作人”,其技術本質,是通過深度學習原理,可以通過學習人的聲音,經過AI智能化處理后生成專屬的音色音效,并以此來制作歌曲。
這些工具都極大的降低了音樂創作的門檻,其中,“騰訊音樂啟明星”新推出了可分離提取歌曲中的人聲和樂器的“音樂分離”、基于音樂內容理解識別各式歌曲要素的“MIR計算”等功能;以及音色制作人中的全新上線AI封面、AI寫真、AI幫唱、AI詞曲評估以及AI覓詞等五大功能,都實現了以科技來改變過去音樂制作存在的“不可能三角”——質量、速度、成本,令其能夠同時實現。
它們的價值體現在,對C端來說,從單純的音樂欣賞(單向傳播)變成了UGC、PUGC參與的可共創、可交互的系統,使得各種體驗和玩法得到極大的提升;從B端來說,由于用戶的廣泛參與,和未來生成能力的增強,將從根本上改變音樂行業的成本機構,而成本結構的改變是一切深層次產業變革的基礎。
“目前,中國已躍升成為全球第五大音樂市場。這意味著產業從業者們通過長期耕耘,正在持續推動著中華文化影響力的持續提升。而技術的進步,則能為音樂產業在數字化時代的發展提供更加夯實的基礎和更高的生產效率。”對于AIGC等前沿技術在音樂產業內的應用和發展趨勢,騰訊音樂娛樂集團QQ音樂技術副總裁、天琴實驗室負責人周文江表示,基于對行業發展痛點和用戶體驗需求的深度洞察,TME在前幾年已率先組建天琴實驗室等業內頂尖的技術研究團隊,各團隊技術人才結構和部分研究成果已達到行業領先水平,目前也正在持續推動文本、圖像、音視頻等多個維度的AIGC創新成果落地,“在為行業提供更全面的數據支撐的同時,也希望能為音樂產業的數字化升級和高質量發展注入新的活力。”
當音樂遇上AIGC,用技術為文化創造更多價值的未來已經近在眼前。騰訊音樂把技術轉化為實實在在的生產力,能夠為行業提供更多服務、為用戶提供革命性體驗,最終雙向奔赴,進而為行業創造更多增量,推動自身和行業的高質量增長,也為我們的精神生活增添更多的樂趣。