<ul id="ouw02"></ul>
  • 首頁 > 技術 > 正文

    聊天機器人ChatGPT能力波動:質數識別準確率下降

    2023-09-08 08:04:14來源:中關村在線  


    (資料圖)

    斯坦福大學的一項新研究發現,熱門生成式人工智能(AI)聊天機器人ChatGPT的能力在幾個月內有所波動。研究人員評估了ChatGPT在幾個月內如何處理不同的任務,發現ChatGPT的能力隨時間推移而出現不一致。目前,ChatGPT有兩個版本,免費的GPT-3.5模型和更智能、更快速的付費GPT-4版本。研究人員發現,GPT-4在3月份能夠有效地解決數學問題,識別質數的準確率為97.6%。但三個月后,其準確率下降到了2.4%。而另一方面,GPT-3.5卻變得更好,從7.4%的準確率提高到了86.8%。研究人員還注意到,在編寫代碼和視覺推理方面也有類似的波動。斯坦福大學計算機科學教授James Zou表示:“當我們調整一個大型語言模型來提高它在某些任務上的表現時,那可能會有很多意想不到的后果,可能會損害這個模型在其他任務上的表現……這個模型回答問題的方式有各種各樣的相互依賴性,這可能導致我們觀察到的一些惡化行為?!毖芯咳藛T認為,結果并不能真正反映ChatGPT性能的準確性狀態,而是顯示了微調模型帶來的意外后果。本質上,當修改模型的一部分來改善一個任務時,其他任務可能會受到影響。為什么會這樣很難確定,因為沒有人知道ChatGPT是如何運作的,而且它的代碼也不是開源的。隨著時間的推移,研究人員注意到,ChatGPT的回答不僅變得不太準確,而且還停止了解釋其推理過程。由于ChatGPT的運作方式,要研究和衡量其表現可能很困難。這項研究強調了觀察和評估驅動ChatGPT等工具的大型語言模型(LLM)性能變化的必要性。該研究已經在arXiv上發布,并正在等待同行評審。

    標簽:

    相關閱讀

    精彩推薦

    相關詞

    推薦閱讀

    国产AⅤ无码专区亚洲AV| 亚洲精品国产成人| 久久久久亚洲av无码专区| 相泽亚洲一区中文字幕| 精品亚洲一区二区三区在线观看 | 国产精品亚洲精品久久精品| 亚洲久悠悠色悠在线播放| 亚洲ts人妖网站| 国产成人精品日本亚洲专一区| 亚洲一欧洲中文字幕在线| 亚洲伊人精品综合在合线| 亚洲婷婷第一狠人综合精品| 国产成人亚洲综合一区| 亚洲中文字幕久久久一区| 亚洲日韩精品国产3区| 亚洲国产精品嫩草影院| 久久亚洲AV成人无码国产电影| 国产精品亚洲AV三区| 亚洲?v女人的天堂在线观看| 亚洲AV中文无码乱人伦在线视色 | 久久夜色精品国产噜噜亚洲AV| 在线观看亚洲人成网站| 亚洲的天堂av无码| 色天使亚洲综合在线观看| 日韩国产欧美亚洲v片 | 夜色阁亚洲一区二区三区| 亚洲国产成人精品久久久国产成人一区二区三区综 | 国产精品亚洲片在线| 亚洲国产高清在线| 亚洲国产精品日韩在线| 中文字幕精品三区无码亚洲| 日韩成人精品日本亚洲| 国产精品亚洲w码日韩中文| 九月丁香婷婷亚洲综合色| 内射干少妇亚洲69XXX| 亚洲va在线va天堂成人| 色天使色婷婷在线影院亚洲| 国产成人精品久久亚洲高清不卡 国产成人精品久久亚洲 | 亚洲国产精品线观看不卡| 亚洲人成网站免费播放| 亚洲国产人成精品|