分享
國家互聯(lián)網(wǎng)信息辦公室準許從事互聯(lián)網(wǎng)新聞信息服務業(yè)務的網(wǎng)站
互聯(lián)網(wǎng)新聞信息服務許可證編號:10120220005
中新經(jīng)緯>>科技>>正文

DeepSeek把自己誤認成了ChatGPT?分析人士:或用了GPT生成文本做訓練數(shù)據(jù)

2025-01-02 18:58:55 澎湃新聞

  DeepSeek把自己誤認成了ChatGPT?分析人士:或用了GPT生成文本做訓練數(shù)據(jù)

  記者 喻琰

  DeepSeek新發(fā)布的AI模型會“報錯家門”?日前,有網(wǎng)友發(fā)現(xiàn),在向DeepSeek-V3模型提問“你是誰”時,DeepSeek-V3似乎將自己識別為ChatGPT。

  在進一步提問DeepSeek API的問題,它回答也是如何使用OpenAI API的說明,甚至講了一些與GPT-4一模一樣的笑話。有網(wǎng)友發(fā)出疑問,“DeepSeek是否在ChatGPT生成的文本上進行了訓練?”

  DeepSeek-V3是由國內(nèi)知名量化資管巨頭幻方量化創(chuàng)立的杭州深度求索人工智能基礎技術研究有限公司(以下簡稱“深度求索”)最新發(fā)布的全新系列模型,由于這款模型總訓練成本低,性價比高,發(fā)布后不少網(wǎng)友稱其為“國產(chǎn)之光”,且有“AI界的拼多多”之稱。但在發(fā)布后的一天,便出現(xiàn)了上述疑似“翻車”現(xiàn)象。

  截至發(fā)稿前,深度求索公司尚未對此進行回應。但目前再次向DeepSeek-V3模型提問“你是誰”時,模型問答已恢復正常。

  DeepSeek-V3并不是第一個混淆自己的模型?萍济襟wTechCrunch報道,此前谷歌的AI模型Gemini在被使用中文提問你是誰時,也回答自己是百度的文心一言。

  國內(nèi)一家智能科技公司的技術負責人向澎湃科技記者分析時認為,DeepSeek-V3有可能直接將在ChatGPT生成的文本上作為訓練基礎,在訓練過程中,該模型可能已經(jīng)記住了一些GPT-4的輸出,并正在逐字復述這些內(nèi)容。

  另有業(yè)內(nèi)人士指出,目前互聯(lián)網(wǎng)大模型優(yōu)質(zhì)數(shù)據(jù)訓練集有限,訓練過程中不可能沒有重合,但是否構(gòu)成抄襲也很難定義。即便“站在了ChatGPT巨人肩膀上,但成本降下來是真的”。

  不過,直接在ChatGPT生成的文本上訓練DeepSeek-V3也并不奇怪,前述智能科技公司技術負責人指出,拿GPT的回答作為數(shù)據(jù)集訓練自有模型在國內(nèi)很常見,“這種不用抓取數(shù)據(jù),并且能夠額外做數(shù)據(jù)處理,能節(jié)省時間、人力和訓練成本!庇柧氁粋大模型需要吞噬海量數(shù)據(jù),耗盡了世界上所有容易獲取的數(shù)據(jù)。

  TechCrunch在報道中分析認為,造成這類現(xiàn)象的原因在于,目前互聯(lián)網(wǎng)(AI公司獲取大量訓練數(shù)據(jù)的地方)正充斥著AI垃圾。生成式人工智能大模型在互聯(lián)網(wǎng)數(shù)據(jù)上進行訓練,而這些數(shù)據(jù)雖然信息豐富,但也充斥著不準確的內(nèi)容,其中不乏“胡言亂語”。ChatGPT、Copilot和Gemini等AI工具都會為用戶提供看似真實但卻是捏造的數(shù)據(jù)。

  另據(jù)歐洲聯(lián)盟執(zhí)法機構(gòu)的一份報告指出,到2026年,網(wǎng)絡內(nèi)容中可能有90%是由人工合成生成的。報告預測,這種數(shù)據(jù)“污染”,使得從訓練數(shù)據(jù)中徹底過濾AI生成內(nèi)容變得非常困難。

來源:澎湃新聞

編輯:張嘉怡

廣告等商務合作,請點擊這里

本文為轉(zhuǎn)載內(nèi)容,授權事宜請聯(lián)系原著作權人

中新經(jīng)緯版權所有,未經(jīng)書面授權,任何單位及個人不得轉(zhuǎn)載、摘編或以其它方式使用。
關注中新經(jīng)緯微信公眾號(微信搜索“中新經(jīng)緯”或“jwview”),看更多精彩財經(jīng)資訊。
關于我們  |   About us  |   聯(lián)系我們  |   廣告服務  |   法律聲明  |   招聘信息  |   網(wǎng)站地圖

本網(wǎng)站所刊載信息,不代表中新經(jīng)緯觀點。 刊用本網(wǎng)站稿件,務經(jīng)書面授權。

未經(jīng)授權禁止轉(zhuǎn)載、摘編、復制及建立鏡像,違者將依法追究法律責任。

[京B2-20230170]  [京ICP備17012796號-1]

違法和不良信息舉報電話:18513525309 報料郵箱(可文字、音視頻):zhongxinjingwei@chinanews.com.cn

Copyright ©2017-2025 jwview.com. All Rights Reserved


北京中新經(jīng)聞信息科技有限公司