CMMLU中文向排名第一！快手自研大模型來了

來源： OFweek人工智能網2023-08-28 03:06:03

在國外微軟、谷歌和Meta因為AI打得不可開交的時候，國內的互聯網公司們也開始了新一輪的AI內卷。

一開始各家都想著自己要做出跟GPT一樣的大模型，比如百度、360等大廠。但是算力、算法、數據這三大項，在國內的情況都心知肚明，根本和國外沒得比。

盡管百度的文心一言、訊飛的星火還有360的智腦等等大模型都陸續上線，但是最后的效果都不怎么盡如人意?？吹絿鴥仁浊恢傅念^部大廠都只能做成這樣，一下子讓不少公司回過味兒來，只要大模型能達到自己的需求就成，不去盲目拼什么參數和成績，拼也拼不過。

(資料圖片僅供參考)

前段時間，字節跳動代號為Grace的對話式AI項目，開啟了內測。最近，這個名叫Grace的項目，改叫“豆包”了。在一眾不是神仙就是神獸的AI面前，“豆包”倒顯得有點可愛捏～

盡管字節的負責人說這個項目還不成熟，但是和抖音的結合還是值得期待。而另一邊的快手，似乎也等不及要秀秀肌肉了。

最近頻繁亮相的AI綜合中文評估基準CMMLU等榜單上，一個KwaiYii-13B的模型成績相當亮眼，更是一躍奪得CMMLU中文向排名第一！而這個KwaiYii-13B，就是來自快手的自研大模型“快意”(KwaiYii)。

異軍突起的“快意”

在CMMLU榜單中，KwaiYii-13B同時位列five-shot和zero-shot項目下的中文向第一名，在人文學科、中國特定主題等方面較強，平均分超61分。

根據GitHub的頁面顯示，“快意”是由快手 AI 團隊研發的大規模語言模型，而本次引發關注的正是其新版本 KwaiYii-13B。

目前，快意覆蓋了預訓練模型(KwaiYii-Base)、對話模型(KwaiYii-Chat)，主要特點包括：

1、KwaiYii-13B-Base預訓練模型具備優異的通用技術底座能力，在絕大部分權威的中/英文Benchmark上取得了同等模型尺寸下的State-Of-The-Art效果。

例如，KwaiYii-13B-Base預訓練模型在MMLU、CMMLU、C-Eval、HumanEval等Benchmark上目前處于同等模型規模的領先水平。

2、KwaiYii-13B-Chat對話模型具備出色的語言理解和生成能力，支持內容創作、信息咨詢、數學邏輯、代碼編寫、多輪對話等廣泛任務，人工評估結果表明KwaiYii-13B-Chat超過主流的開源模型，并在內容創作、信息咨詢和數學解題上接近ChatGPT(3.5)同等水平。

據透露，快意目前已開啟內測，并為業務團隊提供了標準 API 和定制化項目合作方案。至于目的，明顯是沖著字節的“豆包”去的。

哭死，這回豆包真成干糧了！

快手不光有“快意”

7 月 8 日，快手宣布正在內測智能問答產品。8月8日，快手就宣布“快手AI對話”開啟小范圍測試，而這倆其實都是基于“快意”大模型打造的對話式AI產品。

8 月 18 日，“快手AI對話”功能已經在快手 APP 安卓版本開放內測，成為短視頻直播首個基于大語言模型落地的對話式AI產品。

在推出“快手AI對話”的時候，快手高級副總裁、研發線負責人于冰表示，AI大模型作為當下最重要的革命性技術，進入爆發期，有望開啟AGI時代，而多模態內容生成與理解是其核心能力。

至于為什么要投入到這場AI大潮中去，于冰也有著這個行業的共同看法。他覺得短視頻、直播作為最典型的多模態媒介，快手也應該抓住平臺基因，在AI大模型領域重度投入，全方位探索技術突破。

他介紹說，目前，快手在AI大模型的布局體系分為三個層級：基于具備高性能、高并發、高算力的“大基建”，構建快手多模態的AI“大模型”，進而在搜廣推、內容創作、用戶增長、研發效能等領域內打造“大應用”。

有了AI輔助，影視創作的成本會明顯地降低，周期也會縮短，這不管是對創作者來說還是對平臺來說，都是好事，能形成良性循環。

短視頻雙雄的AI賽跑

字節有“豆包”，快手有“快意”。目前來看沒有誰比誰強，只是側重點相對不同。

“豆包”其實只是字節對外公開的AI對話大模型的一個模型而已，此外字節還提供“超愛聊天的小寧”“英語學習助手”“全能寫作助手”三個不同的AI對話角色。

豆包大體上就和百度的文心一言一樣，問答、續寫、解析、推理等基礎功能都有，主要還是內容生成服務。

而快手AI對話的功能主要是為用戶提供快速、簡便的查找功能，用戶可以通過對話的方式來快速查找自己感興趣的內容，也可以通過對話的方式找到對應的短視頻、達人或是其他內容。

說人話就是，“快手AI對話”其實更像Bingchat，更多的充當一個搜索引擎，讓用戶去搜索快手內容庫里的數據?？焓趾妥止澋牟町愔饕谟谒惴▋灮蛿祿柧氁幠＃柧殧祿蕉啵渲悄芑潭染驮礁?。

結語

短視頻平臺在走過AI算法推薦的路子之后，在生成式AI的加持下，到底能玩出什么花來呢？

而現在短視頻的同質化會不會因為AI的到來，有所改變，則是廣大用戶們更為關心的。

如果最后只是為了更方便直播帶貨，或者單純為了讓創作者更輕松，但不在乎質量，那這個AI，還不如沒有。

關鍵詞：

責任編輯：sdnew003

返回首頁返回金股首頁

CMMLU中文向排名第一！快手自研大模型來了

相關新聞

熱文排行

財經

綜合

黃金360

關注

熱門主題

綜合熱門

熱門主題

科技熱門

熱門主題

CMMLU中文向排名第一！快手自研大模型來了

相關新聞

熱文排行 財經 綜合 黃金360

關注 熱門主題

綜合熱門 熱門主題

科技熱門 熱門主題

CMMLU中文向排名第一！快手自研大模型來了

熱文排行

財經

綜合

黃金360

關注

熱門主題

綜合熱門

熱門主題

科技熱門

熱門主題