ChatGPT-4震撼發布 準確性提高,能在SAT上能擊敗90%人類
摘要: 3月15日消息,美國當地時間周二,人工智能研究公司OpenAI發布了其下一代大型語言模型GPT-4,這是其支持ChatGPT和新必應等應用程序的最新AI大型語言模型。該公司表示,該模型在許多專業測試中的表現超出了“人類水平”。
3月15日消息,美國當地時間周二,人工智能研究公司OpenAI發布了其下一代大型語言模型GPT-4,這是其支持ChatGPT和新必應等應用程序的最新AI大型語言模型。該公司表示,該模型在許多專業測試中的表現超出了“人類水平”。
OpenAI聲稱,ChatGPT-4比迭代前的GPT-3.5更大,這意味著它接受了更多的數據訓練,模型文件中有更多的權重(參數),這也使得它的運行成本更高。該公司聲稱,該模型“比以往任何時候都更具創造性和協作性”,“可以更準確地解決難題”。它可以解析文本和圖像輸入,盡管它只能通過文本進行響應。
目前,該領域的許多研究人員認為,AI最近取得的許多進步來自于在數千臺超級計算機上運行越來越大的模型,訓練過程可能耗資數千萬美元。GPT-4就是以“擴大規模”為中心以達到更好結果的例證。
OpenAI承認,該公司使用了微軟云計算平臺Azure來訓練其模型,微軟已經向OpenAI投資了數十億美元。OpenAI以競爭為由,沒有公布具體的模型大小或用于訓練它的硬件等細節,這些細節可以用來重建模型。
OpenAI的GPT大型語言模型支持許多AI演示,這些演示在過去六個月里始終令科技行業的人們驚嘆不已,包括必應的AI聊天機器人和ChatGPT。
ChatGPT-4是對語言模型取得最新進展的預覽,這些新進展可能會在未來幾周開始向下滲透到聊天機器人等消費產品中。微軟周二表示,必應的AI聊天機器人使用GPT-4模型。
OpenAI聲稱,新模型將產生更少的事實錯誤答案,更少偏離話題,更少談論被禁止的話題,甚至在許多標準化考試中表現得比人類更好。
該公司舉例說,GPT-4在模擬律師考試中的成績在所有考生中列于前10%,在SAT閱讀考試中進入了前7%,在SAT數學考試中進入前11%。
然而,OpenAI警告說,新模型還不夠完美,在許多情況下它的能力不如人類。例如,GPT-4仍然存在所謂的“幻覺”或編造故事等問題,而且在事實上并不可靠。當它犯錯的時候,它仍然傾向于堅持自己是正確的。OpenAI首席執行官薩姆·阿爾特曼(Sam Altman)在推特上表示,GPT-4“仍然有缺陷,有很大局限性”,但“它在首次使用時仍然能給你留下深刻印象。”
OpenAI在博客文章中表示:“GPT-4仍有許多已知的局限性,我們正在努力解決,如社交偏見、幻覺和敵意回復等。在一次隨意的談話中,GPT-3.5和GPT-4之間的區別很小。而當任務的復雜性達到足夠的閾值時,差異就會顯現出來:GPT-4比GPT-3.5更可靠、更有創造力,并且能夠處理更多細微差別的指令。”
OpenAI表示,該公司已經與多家公司合作以將GPT-4整合到他們的產品中,包括Duolingo、Stripe和Khan Academy等。這款新模型通過OpenAI每月20美元的ChatGPT訂閱服務ChatGPT Plus向用戶開放,并為微軟的必應聊天機器人提供動力。同時,GPT-4也將作為API的一部分提供,該API允許程序員將AI集成到自己的應用程序中。
GPT,模型,OpenAI