昨夜有多少人熬夜了?
等了一年多,北京時間8月8日凌晨1點多,在全球矚目中,OpenAI終于正式發(fā)布新一代大語言模型 GPT-5,并破天荒地向所有用戶免費開放基礎(chǔ)版。
OpenAI CEO 山姆·奧特曼在發(fā)布會上表示:“如果說 GPT-4 還只是大學(xué)生,GPT-5 就是一位真正的專家。” 他將這次升級比作“讓我再也回不去”的技術(shù)飛躍,就像第一款配備視網(wǎng)膜屏的 iPhone 帶來的體驗一樣。
與以往不同,GPT-5是一個統(tǒng)一系統(tǒng),不再分為常規(guī)模型和單獨的推理模型,而是由三個核心部分構(gòu)成:一個智能高效的基礎(chǔ)模型,能夠回答大多數(shù)問題;一個用于解決更復(fù)雜問題的深度推理模型(GPT?5 Thinking);以及一個實時路由器(智能分流系統(tǒng)),可根據(jù)對話類型、復(fù)雜度、工具需求以及用戶的明確指示(例如提示中寫道“請深入思考這個問題”)快速判斷應(yīng)使用哪個模型。

OpenAI稱,這是迄今為止最強大的 AI 系統(tǒng),在編程、數(shù)學(xué)、寫作、醫(yī)療、視覺感知等多個領(lǐng)域都實現(xiàn)了重大飛躍。
只是發(fā)布會剛剛結(jié)束,全網(wǎng)似乎罵聲不少,眾望所歸的“GPT5時代”,就這?

硅谷又有人要失業(yè)了?
依舊是熟悉的“屠榜”。
在最新的數(shù)學(xué)推理測試 AIME 2025 中,GPT-5 無工具模式得分高達 94.6%,接近人類頂尖水平;在 SWE-Bench 編程驗證測試中得分74.9%,大幅超越上一代模型;在多模態(tài)理解的 MMMU 基準(zhǔn)中更是達到 84.2%,證明它不僅能讀懂文字,還能深入理解圖片、圖表、視頻等多模態(tài)內(nèi)容。

圖|GPT-5編程得分
新版本引入“實時路由器”技術(shù),能根據(jù)任務(wù)復(fù)雜度自動選擇推理模式,既保證深度,又減少算力浪費。簡單說,GPT-5學(xué)會了“先想清楚,再動手干”,效率與精度雙贏。
奧特曼在發(fā)布會上也表示:“GPT-5真的讓我第一次覺得,我們的主力模型已經(jīng)達到了可以讓你向一位真正的專家、一位博士級專家提出任何問題。”并且他還稱“它最酷的能力之一,就是能即時為你寫出高質(zhì)量軟件。按需軟件這個概念,將會成為GPT-5時代的標(biāo)志性特征之一。”
它的編程能力官方堪稱史上最強。奧特曼表示,GPT-5是“全球最強的編程與寫作模型”。
在OpenAI的測試中,該模型在基準(zhǔn)測試SWE-Bench、SWE-Lancer和 Aider Polyglot中的編程表現(xiàn)優(yōu)于所有其他模型。在真實世界編程測試中,GPT-5在SWE-bench Verified中的得分為74.9%,在Aider Polyglot中的得分為88%。
在發(fā)布會上,OpenAI負(fù)責(zé)后訓(xùn)練工作的負(fù)責(zé)人揚·杜布瓦(Yann Dubois)現(xiàn)場演示了如何用GPT-5生成一個帶有互動游戲的法語學(xué)習(xí)網(wǎng)站。
短短幾秒內(nèi),GPT-5就寫出了數(shù)百行代碼,并生成了該網(wǎng)站的前端界面。杜布瓦簡單點擊瀏覽了網(wǎng)站的各個功能,發(fā)現(xiàn)一切似乎都按預(yù)期正常運行。

在朝著“微信”進化了
OpenAI此次為GPT-5加入了4種交互人格——憤世嫉俗者、機器人、傾聽者、書呆子。這意味著,用戶不僅能得到精準(zhǔn)答案,還能體驗不同的溝通風(fēng)格。據(jù)測試,這一改進讓“諂媚式回答”減少了 60% 以上,讓對話更真實、更有棱角。
這次GPT或許要朝著“微信”的方向進化了。

它現(xiàn)在支持用戶自主定制聊天窗口的色彩風(fēng)格,還具備了長期對話記憶的集成能力。更厲害的是,新功能還能直接與谷歌郵箱、日歷無縫對接。
如此一來,ChatGPT就能全方位融入生活與工作,為用戶精準(zhǔn)規(guī)劃日程,貼心提醒重要紀(jì)念日。
在醫(yī)療健康領(lǐng)域,GPT-5也有顯著進步。
HealthBench 測試得分 46.2%,可解析復(fù)雜醫(yī)療報告并提供實用建議,為遠(yuǎn)程醫(yī)療、健康咨詢帶來新可能。
微軟、Cursor等平臺已在第一時間接入GPT-5,編程輔助工具市場或?qū)⒂瓉硇乱惠喯磁啤>W(wǎng)友預(yù)測,GPT-5的普及會讓更多人輕松寫出高質(zhì)量代碼,甚至可能讓部分初級程序員失業(yè)。與此同時,教育、科研、設(shè)計等行業(yè)的AI滲透速度也會加快。

急著賺錢的OpenAI,走向平庸
OpenAI的此次更新之所以招致如此大的吐槽,本質(zhì)上還在于一個以“顛覆式創(chuàng)新”引領(lǐng)市場的佼佼者,直接走上“平庸”之路。
此次模型更新不置可否的是提升巨大,值得褒獎,無論是幻覺率的大幅下降,還是人人都免費的態(tài)度,都可以看出OpenAI此舉意在讓更多人用上好用的大模型。
背后也是OpenAI的野心,根據(jù)其8月5日的最新官方公告,ChatGPT的周活躍用戶將達到7億,每天處理的用戶消息量已突破30億條。從活躍用戶數(shù)來看,僅過去兩個月,就增長了2億。作為對比,谷歌AI搜索摘要(AI Overviews)月活約20億,Gemini聊天機器人月活超4.5億。截至Q1,微信合并WeChat全球月活則是14.02億。
OpenAI的商業(yè)化也在提速,其付費用戶數(shù)從2025年6月的300萬增至目前的500萬,年化收入(ARR)從6月的100億美元增至 130億美元,預(yù)計年底突破200億美元。
對商業(yè)乃至更大用戶群體的圖謀,讓OpenAI的考量變得復(fù)雜。

今年5月,山姆·奧特曼還任命了一位新CEO——菲吉·西莫(Fidji Simo),作為“應(yīng)用CEO”(CEO of Applications),她負(fù)責(zé)領(lǐng)導(dǎo)OpenAI的產(chǎn)品、業(yè)務(wù)和其他職能,向奧特曼匯報。這位女將曾在Facebook任職十余年,來OpenAI顯然是為下一階段ChatGPT的增長和商業(yè)化負(fù)責(zé)。雖然彼時奧特曼曾稱,他將更專注于研究、計算和安全系統(tǒng)。但從GPT5交出的作業(yè)來說,奧特曼的表現(xiàn)很難打出高分。
頗為有意思的是,曾幾何時,賺錢和商業(yè)化,從1到100的大規(guī)模落地應(yīng)用曾是中國公司的主戰(zhàn)場,中國有全球發(fā)達的互聯(lián)網(wǎng),有繁榮的用戶生態(tài)。
但今天,越來越多中國公司在AI上,暫時放棄了商業(yè)化。轉(zhuǎn)而去追求模型能力的提升,當(dāng)然,當(dāng)前仍未有太多業(yè)績成果交付。
今年7月時,360公司董事長周鴻祎在2025中國互聯(lián)網(wǎng)大會上曾表示,DeepSeek創(chuàng)始人梁文鋒一門心思做AGI,根本沒有想做一個App。
周鴻祎還稱,梁文鋒是一個有夢想的人,不屑于做App,不在乎日活、融資和收費的問題。一個最了不起的地方是:DeepSeek是世界第一個把大模型免費、開源的,這對中國大模型產(chǎn)業(yè)的發(fā)展做出了很大的貢獻。