透視2025丨中國AI模型廠商已在特定領域形成一定優(yōu)勢

2024-12-26 19:18:24 中新經緯

　　編者按：2024漸行漸遠，2025源源而來。各行業(yè)如何應變局，如何開新局？中新經緯廣邀經濟學者，梳理過去關鍵事件，展望新年潛在機遇，以期為您提供有價值的參考。

　　中新經緯12月26日電 (袁媛)2024年被稱為AI(人工智能)元年。在這一年里，關于AI的大事件不絕于耳：諾貝爾物理學獎頒發(fā)給AI領域科學家，英偉達市值一度超越蘋果、微軟，蘋果推出Apple Intelligence AI系統(tǒng)等等。

　　而在AI大模型方面，最主要事件則是OpenAI推出多模態(tài)大模型ChatGPT-4o，這一版本具有實時處理和生成文本、音頻以及圖像等多種模態(tài)的能力，被譽為技術上一個巨大突破。

　　事實上，中國在AI大模型方面也已有足夠競爭力。有數據顯示，中國在2024年自然指數科學貢獻榜單上名列前茅，而且2014年至2023年，中國生成式AI專利申請量居全球第一。此外，2024年中國生成式AI領域的私人投資較上一年增長更為顯著。

　　而智源研究院近日發(fā)布最新一期FlagEval大模型評測。結果顯示，2024年下半年，國內大模型發(fā)展更聚焦綜合能力提升與實際應用，其中，多模態(tài)模型發(fā)展迅速，涌現了不少新的廠商與新模型。

　　國內廠商“全面開花”

　　對于國內大模型的發(fā)展趨勢，智源研究院智能評測組負責人楊熙表示，中國的AI模型廠商已經在特定領域形成了一定優(yōu)勢�！皣a模型在安全評測和用戶體驗優(yōu)化方面的表現尤為突出，尤其是在用戶意圖識別和適應性調整上，國內廠商具備較大的競爭力�！�

　　具體來看，語言模型主觀評測顯示，目前針對一般中文場景的開放式生成任務，各大模型表現已趨于飽和。字節(jié)跳動、百度等國產模型表現優(yōu)異。不過，在邏輯推理、觀點表達等維度，國內廠商仍需進一步與國際巨頭看齊。此外，多模態(tài)模型發(fā)展迅速，特別是在視覺語言模型和文生圖、文生視頻等方向上取得突破——開源模型如阿里巴巴的Qwen系列在某些任務上表現出色。

　　隨著AI模型能力的提升，隱私保護和安全問題日益成為業(yè)界關注的焦點。楊熙指出，在評測中，智源團隊特別設計了“引誘問題”，以測試模型在隱私保護和數據安全方面的表現，結果顯示，國產大模型在防護隱私數據方面表現較好。

　　值得注意的是，整體來看，復雜場景的表現依然是國內外所有模型的短板。而動態(tài)視頻場景中，模型普遍存在物體變形和物理規(guī)律認知不足的問題。

　　智源研究院副院長兼總工程師林詠華指出，未來的AI生態(tài)發(fā)展將更加注重應用落地與動態(tài)評測�！凹夹g的演進不只是能力的疊加，更需要通過實際應用場景反饋，促進模型能力的深度提升�！�

　　在她看來，商業(yè)化路徑也是模型發(fā)展中的一大難題。如何在確保開源精神的同時實現商業(yè)價值，是廠商必須面對的現實考驗。從技術開發(fā)到應用落地，這一過程需要更多的跨界合作和創(chuàng)新模式。

　　楊熙則談到，看未來趨勢，小模型和大模型的端云結合將成為重要的發(fā)展方向。“端側模型表現出色，而小模型通過精細化訓練可以在特定任務中表現更優(yōu)。端云結合的方式，不僅能降低算力成本，還能為用戶提供更加靈活和高效的解決方案�！�

　　模型測評的機遇與挑戰(zhàn)

　　近年來，大模型技術的廣泛應用催生了復雜的測評需求。從文本生成到圖像識別，從語音分析到多模態(tài)理解，模型測評正從學術研究走向產業(yè)化。上述智源研究院最新發(fā)布的FlagEval秋冬模型測評，評估了全球100多個開源和閉源模型的能力，并且首次加入了金融量化交易等應用場景的專項評測。這些多元化的測評結果，在一定程度上為AI模型的能力邊界提供了標尺。

　　模型測評市場為何能引發(fā)關注？林詠華認為，一方面，測評為企業(yè)提供了清晰的技術能力對比，有助于優(yōu)化資源配置。另一方面，測評結果為資本選擇投資對象提供了有力依據。在資本密集型的AI行業(yè)中，測評已成為“資本看得懂”的標準工具。此外，模型參與者格局日趨復雜，從傳統(tǒng)的學術機構到全球科技巨頭，從互聯(lián)網大廠到創(chuàng)業(yè)公司，競爭的廣度和深度都在加劇。

　　然而，模型測評也面臨多重挑戰(zhàn)。首先是數據問題。測評結果的準確性和可信度，依賴于高質量、多樣化的數據集。然而，數據孤島和數據泄露問題限制了評測的深度和廣度。此外，缺乏統(tǒng)一的評測標準，也讓不同機構的評測結果缺乏可比性。林詠華在談及這一問題時表示，“評測體系的開放性和科學性是關鍵，要實現統(tǒng)一標準，仍需克服多方利益博弈的障礙�！�

　　在林詠華看來，隨著技術的不斷發(fā)展，單一任務測評正向多任務和多模態(tài)評測轉型。而隨著AI在醫(yī)療、教育、金融等領域的深度滲透，垂直領域的專項評測需求也在快速增長。(中新經緯APP)

責任編輯：張芷菡

來源：中新經緯

編輯：王永樂

廣告等商務合作，請點擊這里

未經過正式授權嚴禁轉載本文，侵權必究

關注中新經緯微信公眾號(微信搜索“中新經緯”或“jwview”)，看更多精彩財經資訊。

今日推薦