
還記得“文轉(zhuǎn)工”的復(fù)旦女生徐凝雨嗎?三年前她從中國(guó)語(yǔ)言文學(xué)系畢業(yè),以?xún)?yōu)異成績(jī)直博計(jì)算機(jī)科學(xué)技術(shù)學(xué)院(現(xiàn)為計(jì)算與智能創(chuàng)新學(xué)院)。

就在幾天前,她作為計(jì)算與智能創(chuàng)新學(xué)院2022級(jí)博士生以獨(dú)立第一作者身份在國(guó)際權(quán)威期刊《美國(guó)科學(xué)院院刊》(PNAS)發(fā)表論文,揭示大語(yǔ)言模型中的類(lèi)人概念表征。復(fù)旦大學(xué)自然語(yǔ)言處理實(shí)驗(yàn)室黃萱菁教授、邱錫鵬教授,現(xiàn)代語(yǔ)言學(xué)研究院、智能復(fù)雜體系實(shí)驗(yàn)室張夢(mèng)翰研究員共同擔(dān)任通訊作者。從打破專(zhuān)業(yè)界限到實(shí)現(xiàn)學(xué)科交叉深入探索,在復(fù)旦,徐凝雨找到了自己的學(xué)術(shù)方向,也用行動(dòng)詮釋了不受定義的發(fā)展可能。
交叉研究背后的深度思考
2022年底,ChatGPT橫空出世,人們驚嘆于其強(qiáng)大的能力。
“它不只有語(yǔ)言能力,還展現(xiàn)出了很強(qiáng)的認(rèn)知能力?!碑?dāng)時(shí),剛成為直博生的徐凝雨,敏銳地捕捉到了這一現(xiàn)象背后的學(xué)術(shù)價(jià)值。
在深入研究過(guò)程中,她發(fā)現(xiàn),要探究人工智能模型產(chǎn)生特定行為的原因,就必須打破“黑盒”的壁壘。而認(rèn)知科學(xué),這門(mén)探究人類(lèi)思維奧秘的學(xué)科,似乎成為了解鎖AI行為機(jī)制的關(guān)鍵鑰匙。
基于自己在概念可解釋性方向的學(xué)習(xí)研究,她開(kāi)始思考,能否從概念層面,將認(rèn)知科學(xué)、語(yǔ)言學(xué),甚至神經(jīng)科學(xué),同人工智能緊密串聯(lián)起來(lái),構(gòu)建一個(gè)跨學(xué)科的研究框架。
她不僅請(qǐng)教了自己的導(dǎo)師黃萱菁教授及同為自然語(yǔ)言處理實(shí)驗(yàn)室教授的邱錫鵬等,也與現(xiàn)代語(yǔ)言學(xué)研究院、智能復(fù)雜體系實(shí)驗(yàn)室研究員張夢(mèng)翰等不同學(xué)科領(lǐng)域?qū)<疫M(jìn)行了深入探討。
“隨著AI的發(fā)展,大模型是否具備概念學(xué)習(xí)和概念表征能力引發(fā)了激烈的爭(zhēng)論。雖然這表面上是一個(gè)關(guān)于模型能力的問(wèn)題,但在探討其定義時(shí),我們發(fā)現(xiàn)這并非單純的技術(shù)問(wèn)題,而是一個(gè)涉及到心理學(xué)、認(rèn)知科學(xué)等多學(xué)科交叉的基礎(chǔ)問(wèn)題?!痹趶垑?mèng)翰看來(lái),如果未來(lái)人工智能想更趨近人類(lèi),那就應(yīng)弄清楚它和人在概念涌現(xiàn)、表征和學(xué)習(xí)上有多大的距離。
語(yǔ)言模型是否能形成概念表示?語(yǔ)言模型提取的概念表示是否以及在多大程度上與人類(lèi)對(duì)齊?語(yǔ)言模型提取的概念表示是否具有生物學(xué)基礎(chǔ)?又能否映射到人類(lèi)大腦的神經(jīng)活動(dòng)?……一系列關(guān)鍵問(wèn)題,也在交流中浮出水面。

以問(wèn)題為導(dǎo)向,徐凝雨在不同學(xué)科專(zhuān)家指導(dǎo)下,結(jié)合認(rèn)知科學(xué)、人工智能和神經(jīng)科學(xué)等領(lǐng)域的理論與方法,基于大語(yǔ)言模型的預(yù)測(cè)行為及內(nèi)部表示,深入剖析了模型概念空間的構(gòu)建方式,系統(tǒng)揭示出大語(yǔ)言模型能夠接近并再現(xiàn)人類(lèi)概念的關(guān)鍵特征。
這一研究結(jié)果表明,“預(yù)測(cè)下一個(gè)詞”的訓(xùn)練能夠讓大語(yǔ)言模型在缺乏現(xiàn)實(shí)世界聯(lián)結(jié)(real-world grounding)的情況下學(xué)習(xí)到和人類(lèi)相似的概念表示。這種概念表示成功融合了人類(lèi)概念的關(guān)鍵屬性,能夠有效解釋人類(lèi)行為以及大腦中的概念編碼,為解決人類(lèi)概念是如何表征和組織的這一核心認(rèn)知問(wèn)題提供了新的假設(shè)和啟發(fā)。
通過(guò)與人類(lèi)行為及腦成像數(shù)據(jù)的比較,研究也發(fā)現(xiàn),和人類(lèi)概念相比,大語(yǔ)言模型的概念表示在捕捉與感知經(jīng)驗(yàn)相關(guān)的特征(如顏色、形狀、紋理)方面存在不足,這提示僅依賴(lài)語(yǔ)言輸入可能難以學(xué)習(xí)到相關(guān)信息。
獨(dú)立一作是種學(xué)習(xí)方式
從確定研究問(wèn)題,到論文發(fā)表,徐凝雨在這項(xiàng)略顯“小眾”的交叉研究上投入了近兩年時(shí)間。
在此之前,她曾兩次以獨(dú)立一作身份,在國(guó)際會(huì)議“自然語(yǔ)言處理經(jīng)驗(yàn)方法會(huì)議(Conference on Empirical Methods in Natural Language Processing)”發(fā)文。相比之下,她此次作為獨(dú)立一作在PNAS發(fā)文,所用的時(shí)間精力都超過(guò)之前。

于她而言,獨(dú)立一作更像是一種學(xué)習(xí)方式。徐凝雨坦言,相比本科就學(xué)習(xí)計(jì)算機(jī)相關(guān)專(zhuān)業(yè)的同學(xué),自己的基礎(chǔ)“不算特別扎實(shí)”。成為獨(dú)立一作,則讓她得到了更系統(tǒng)全面的科研訓(xùn)練,“一方面可以鍛煉獨(dú)立科研的能力,一方面也可以打好計(jì)算機(jī)方面的基礎(chǔ)。”
實(shí)際上,學(xué)科交叉并非單純的“加法”。研究者需要掌握不同學(xué)科的體系框架和研究方法,同時(shí)將各學(xué)科有機(jī)融合。這也正是交叉研究的難點(diǎn)所在。
正因如此,這一研究起初的投稿過(guò)程并不算順利?!皩徃迦思扔衅?jì)算機(jī)領(lǐng)域的,也有偏認(rèn)知科學(xué)領(lǐng)域的,他們都從自己的專(zhuān)業(yè)角度提出了意見(jiàn)。當(dāng)時(shí)我們的實(shí)驗(yàn)可能還沒(méi)有辦法解決他們的疑問(wèn)?!闭勂鸪跗诘木芨褰?jīng)歷,徐凝雨記憶猶新。
壓力之下,她沒(méi)有選擇放棄,而是充分吸收了審稿人的建設(shè)性意見(jiàn)。這恰恰對(duì)后續(xù)完善論文起到了關(guān)鍵幫助,“我覺(jué)得解決這些問(wèn)題,對(duì)論文有很大提升?!?/strong>
在完善研究的過(guò)程中,徐凝雨試圖從多學(xué)科視角出發(fā),深入探討語(yǔ)言模型與人腦在語(yǔ)言理解上是否存在相似現(xiàn)象,并致力于分析和解釋其背后的機(jī)制。這也使得此次的論文作者中既有計(jì)算機(jī)、語(yǔ)言學(xué)領(lǐng)域的專(zhuān)家,也有神經(jīng)科學(xué)、認(rèn)知科學(xué)方向的學(xué)者。
通過(guò)這一過(guò)程,她也對(duì)開(kāi)展交叉學(xué)科研究有了更深入的認(rèn)識(shí),“要對(duì)不同學(xué)科都有比較深的掌握,否則你可能都找不到一個(gè)好的問(wèn)題。”徐凝雨說(shuō),“講清楚你的研究對(duì)不同學(xué)科的意義,也是比較重要的?!?/strong>
人才培養(yǎng)與學(xué)科發(fā)展的更多可能
談到自己的博士生涯,徐凝雨對(duì)指導(dǎo)自己開(kāi)展研究的老師們充滿(mǎn)感激。這其中既有她所在的自然語(yǔ)言處理實(shí)驗(yàn)室黃萱菁、邱錫鵬、張奇等人工智能領(lǐng)域?qū)<遥灿袕氖挛睦斫徊媲把匮芯康膹垑?mèng)翰等學(xué)者,還有多位來(lái)自認(rèn)知科學(xué)研究領(lǐng)域的研究者。
在她看來(lái),能有機(jī)會(huì)開(kāi)展這樣的跨學(xué)科合作,不僅得益于復(fù)旦綜合型大學(xué)的多學(xué)科優(yōu)勢(shì),也因?qū)燑S萱菁的包容支持。
“黃老師給了我很大的自由度,讓我能夠自主地去探索研究方向?!?/strong>徐凝雨說(shuō),即使在論文被拒的低谷期,導(dǎo)師黃萱菁也依然給予她鼓勵(lì)和支持。
她坦言,與其他計(jì)算機(jī)專(zhuān)業(yè)的同學(xué)相比,自己發(fā)表論文的速度并不算快,“但黃老師從未因此給我施加壓力,而是讓我按照自己的興趣和節(jié)奏去探索。這種支持和信任,對(duì)我來(lái)說(shuō)意義非凡?!?/p>

徐凝雨(左)與導(dǎo)師黃萱菁(右)
從中文到人工智能,再到如今的交叉學(xué)科前沿,徐凝雨的成長(zhǎng)軌跡讓黃萱菁看到了人才培養(yǎng)的更多可能。
“那時(shí)候,還沒(méi)有‘漢語(yǔ)言+人工智能’‘外語(yǔ)+計(jì)算機(jī)’這樣的雙學(xué)位項(xiàng)目。這些項(xiàng)目為學(xué)生提供了明確的跨學(xué)科學(xué)習(xí)路徑,包括該學(xué)哪些數(shù)學(xué)、計(jì)算機(jī)課程,但凝雨那時(shí)候更多是靠自己摸索?!秉S萱菁說(shuō)。
為了夯實(shí)數(shù)理基礎(chǔ),徐凝雨在本科階段主動(dòng)增加了數(shù)學(xué)課程的學(xué)習(xí)。這份主動(dòng)性與學(xué)習(xí)能力,給黃萱菁留下深刻印象。
在她看來(lái),復(fù)旦計(jì)算機(jī)領(lǐng)域交叉人才培養(yǎng)當(dāng)時(shí)還處在探索階段,而如今的培養(yǎng)路徑則更加多元完善,“這給了學(xué)生們更體系化的培養(yǎng),為他們的未來(lái)創(chuàng)造了更多的可能?!?/strong>
徐凝雨在學(xué)科交叉領(lǐng)域的探索,對(duì)于張夢(mèng)翰而言,也是復(fù)旦發(fā)展“新文科”的有益嘗試。“大家一直在討論‘新文科’應(yīng)該做什么,我覺(jué)得這其實(shí)是一個(gè)路徑,當(dāng)然也不是唯一的路徑?!?/strong>
他所在的現(xiàn)代語(yǔ)言學(xué)研究院,如今匯聚了一批交叉學(xué)科領(lǐng)域的杰出青年學(xué)者。作為復(fù)旦探索學(xué)科交叉的一塊“試驗(yàn)田”,該研究院近年來(lái)已在校級(jí)層面開(kāi)展了多項(xiàng)人文學(xué)科與其他學(xué)科的交叉研究工作。

談及未來(lái),徐凝雨的眼中閃爍著憧憬。她期待沿著自己的研究方向繼續(xù)深入,去探尋那些關(guān)鍵問(wèn)題的答案,讓思想的種子最終長(zhǎng)成一片新綠。








