你是否想象過(guò)平行時(shí)空的存在?復(fù)旦大學(xué)大數(shù)據(jù)學(xué)院副教授魏忠鈺帶領(lǐng)的Fudan DISC團(tuán)隊(duì),以現(xiàn)實(shí)為鏡,構(gòu)建出由大模型智能體驅(qū)動(dòng)的“硅基人社會(huì)”。這個(gè)模擬世界,由超千萬(wàn)的真實(shí)用戶(hù)池支撐,能夠模擬社會(huì)群體活動(dòng),傾聽(tīng)世界各地、各行各業(yè)的聲音,輔助政府、企業(yè)做出更科學(xué)的決策。這就是他們研發(fā)的大模型驅(qū)動(dòng)的社會(huì)模擬器——SocioVerse。
從社交媒體傳播模擬到服務(wù)社會(huì)決策,千萬(wàn)“硅基人”社會(huì)如何構(gòu)建?
參與過(guò)社會(huì)實(shí)踐或行業(yè)調(diào)研的人,大多經(jīng)歷過(guò)這樣的場(chǎng)景:在各個(gè)群里發(fā)放問(wèn)卷,請(qǐng)求填寫(xiě),甚至附上紅包。一番辛苦后,往往也只能拿到幾百份結(jié)果。
而在更為廣泛的社會(huì),政府如何制定政策?公司如何優(yōu)化迭代產(chǎn)品?投資顧問(wèn)如何預(yù)測(cè)行業(yè)趨勢(shì)?這些決策都離不開(kāi)大規(guī)模的社會(huì)調(diào)查,過(guò)程更是費(fèi)時(shí)費(fèi)力。
能否建構(gòu)一個(gè)由大模型智能體驅(qū)動(dòng)的“硅基人”社會(huì),面向社會(huì)調(diào)查的需求,實(shí)現(xiàn)有問(wèn)必答、有求必應(yīng),想要多少數(shù)據(jù)就有多少數(shù)據(jù)的理想調(diào)查平臺(tái)呢?DISC團(tuán)隊(duì)推出的社會(huì)模擬世界模型——SocioVerse,正是面向這一需求而生。

魏忠鈺在國(guó)際會(huì)議上介紹Socioverse

Fudan DISC團(tuán)隊(duì)共同參加國(guó)際會(huì)議
成立于2016年的DISC團(tuán)隊(duì),并不是第一個(gè)想到用大模型來(lái)進(jìn)行社會(huì)模擬的課題組。斯坦福大學(xué)、加州大學(xué)和清華大學(xué)等高校早已有學(xué)者開(kāi)展過(guò)相關(guān)研究。然而,構(gòu)建一個(gè)真正可信的“模擬社會(huì)”,始終面臨著一個(gè)核心挑戰(zhàn):如何讓虛擬與現(xiàn)實(shí)對(duì)齊?
DISC團(tuán)隊(duì)的答案,便是SocioVerse的核心理念:通過(guò)社會(huì)環(huán)境引擎、用戶(hù)引擎、場(chǎng)景引擎和行為引擎,使得模擬社會(huì)始終跟隨著真實(shí)世界動(dòng)態(tài)更新。
其中,社會(huì)環(huán)境引擎負(fù)責(zé)實(shí)時(shí)向模擬社會(huì)注入現(xiàn)實(shí)里的最新資訊(例如新規(guī)出臺(tái)、油價(jià)調(diào)整等);用戶(hù)引擎則提供真實(shí)世界人群畫(huà)像,提供個(gè)體模擬的種子信息;場(chǎng)景引擎將現(xiàn)實(shí)社會(huì)互動(dòng)抽象為標(biāo)準(zhǔn)化的模板,如問(wèn)卷調(diào)查、深度訪(fǎng)談、社交媒體互動(dòng)等;行為引擎是框架的大腦,負(fù)責(zé)綜合信息,驅(qū)動(dòng)智能體行動(dòng)。

在社會(huì)模擬器的搭建過(guò)程中團(tuán)隊(duì)遇到了很多的技術(shù)攻關(guān)難題,其中核心的兩個(gè)挑戰(zhàn)在于,如何設(shè)計(jì)好的行為引擎,降低大規(guī)模個(gè)體模擬的推理成本?如何搭建用戶(hù)引擎,達(dá)成規(guī)?;母呔葌€(gè)體模擬?
團(tuán)隊(duì)在社會(huì)模擬方面的兩項(xiàng)研究基礎(chǔ)為此鋪平了道路。早在2024年初,DISC 團(tuán)隊(duì)便提出了使用LLM和ABM進(jìn)行混合智能體搭建,降低模擬成本的思路。他們將目標(biāo)群體分成核心用戶(hù)和普通用戶(hù),采用“LLM→核心用戶(hù)、ABM→普通用戶(hù)”的分層驅(qū)動(dòng)機(jī)制設(shè)計(jì)行為引擎,并推出了國(guó)內(nèi)首個(gè)開(kāi)源的社交媒體仿真平臺(tái)HiSim。該平臺(tái)復(fù)現(xiàn)了X社交平臺(tái)的互動(dòng)環(huán)境與消息機(jī)制,支持公共與私域雙通道信息傳遞、真實(shí)時(shí)間推動(dòng)與離線(xiàn)事件觸發(fā),實(shí)現(xiàn)對(duì)用戶(hù)互動(dòng)、態(tài)度演化與群體行為擴(kuò)散的動(dòng)態(tài)仿真。

2024年底的DISC Open Day開(kāi)放日交流會(huì)合影
平臺(tái)針對(duì)1000個(gè)真實(shí)的社交媒體用戶(hù)搭建孿生智能體,并進(jìn)行了為期14天的行為預(yù)測(cè),在三個(gè)真實(shí)事件構(gòu)成的數(shù)據(jù)集上驗(yàn)證模擬表現(xiàn),實(shí)驗(yàn)結(jié)果表明,模擬平臺(tái)在用戶(hù)行為一致性、情緒態(tài)度變化趨勢(shì)等多項(xiàng)指標(biāo)上,與真實(shí)行為數(shù)據(jù)高度吻合。研究成果在自然語(yǔ)言處理領(lǐng)域的頂級(jí)會(huì)議ACL 2024發(fā)表。

用戶(hù)引擎中的種子用戶(hù)建構(gòu)是整個(gè)框架與現(xiàn)實(shí)人群對(duì)齊的核心驅(qū)動(dòng)力,設(shè)計(jì)基礎(chǔ)來(lái)自于團(tuán)隊(duì)開(kāi)發(fā)的用于政治選情預(yù)測(cè)的ElectionSim框架。在該工作中,他們便開(kāi)始了百萬(wàn)規(guī)模人口池的設(shè)計(jì)。
“我們從推特平臺(tái)上大規(guī)模采集了用戶(hù)的公開(kāi)歷史發(fā)言信息,并開(kāi)發(fā)一個(gè)語(yǔ)言模型對(duì)他們進(jìn)行了性別、年齡、種族等多個(gè)維度的人口學(xué)標(biāo)簽自動(dòng)標(biāo)注?!盓lectionSim項(xiàng)目核心成員、2024級(jí)統(tǒng)計(jì)學(xué)博士生林嘉昱介紹。ElectionSim通過(guò)構(gòu)建34萬(wàn)智能體,在2016/2020/2024三屆美國(guó)大選的平均預(yù)測(cè)準(zhǔn)確率在90%以上,在搖擺州得票率預(yù)測(cè)上相比ABM等傳統(tǒng)方法的性能提升達(dá)到34%。在該項(xiàng)研究中,他們還揭示了隨著采樣人口比例的提升,模擬的誤差會(huì)隨之降低,驗(yàn)證了大規(guī)模個(gè)體建構(gòu)的必要性。

實(shí)驗(yàn)驗(yàn)證了社會(huì)模擬的規(guī)模定律:隨著規(guī)模擴(kuò)大,模擬精度提升、誤差逐漸收斂。同時(shí)在1/10,000同等采樣率下,ElectionSim的預(yù)測(cè)誤差是權(quán)威民調(diào)ANES的一半
HiSim和ElectionSim的成功讓魏忠鈺意識(shí)到,社會(huì)模擬不應(yīng)止步于一兩個(gè)特定的應(yīng)用場(chǎng)景,而應(yīng)該拓展到更多領(lǐng)域、更大規(guī)模的社會(huì)科學(xué)研究。
“我學(xué)生時(shí)代的導(dǎo)師們雖然都是工科出身,但對(duì)社會(huì)動(dòng)態(tài)都有著極高的關(guān)注。所以我自己做研究時(shí),也會(huì)常常思考如何讓研究真正賦能民生和社會(huì)服務(wù)?!蔽褐意暦窒怼3耸谴髷?shù)據(jù)學(xué)院副教授,他還是上海創(chuàng)智學(xué)院全時(shí)導(dǎo)師和復(fù)旦-中電金信智能金融科技聯(lián)合研究中心主任。
經(jīng)過(guò)數(shù)月攻關(guān),SocioVerse上線(xiàn)。用戶(hù)池?cái)?shù)量從百萬(wàn)躍升為千萬(wàn),覆蓋中英雙語(yǔ)用戶(hù),標(biāo)簽維度擴(kuò)展至15項(xiàng),包括年齡、性別、職業(yè)、收入、教育水平、居住類(lèi)型、地區(qū)、就業(yè)狀態(tài)、婚姻狀況和興趣愛(ài)好等。這意味著模型不僅能夠模擬更復(fù)雜的社會(huì)環(huán)境,同時(shí)也能提供更精細(xì)的個(gè)體數(shù)據(jù),更有效支撐社科專(zhuān)業(yè)研究的開(kāi)展。
SocioVerse集成了新聞傳播效果、選情預(yù)測(cè)、國(guó)民經(jīng)濟(jì)調(diào)查、社會(huì)科學(xué)研究智能體等多項(xiàng)應(yīng)用示例,在多個(gè)場(chǎng)景的驗(yàn)證中均取得了出色的成績(jī)。

↑代表指標(biāo)越高越好,↓代表指標(biāo)越低越好。團(tuán)隊(duì)研發(fā)的Socioverse平臺(tái)在不同的社會(huì)模擬場(chǎng)景下實(shí)現(xiàn)了和真實(shí)世界的高度對(duì)齊,采用DeepSeek-V3作為行為引擎在平均效果上有最好的表現(xiàn)。
項(xiàng)目核心成員、2023級(jí)博士生張辛農(nóng)表示,Socioverse的推進(jìn)離不開(kāi)復(fù)旦大學(xué)人文社科學(xué)者的共同參與?!鞍讶宋纳缈频难芯糠妒饺谌階I是一個(gè)很困難的過(guò)程。整個(gè)項(xiàng)目是不同學(xué)科背景的學(xué)者不斷碰撞,迭代優(yōu)化的產(chǎn)物。復(fù)旦大學(xué)新聞學(xué)院、社會(huì)科學(xué)高等研究院、經(jīng)濟(jì)學(xué)院、國(guó)際關(guān)系與公共事務(wù)學(xué)院,美國(guó)羅切斯特大學(xué)等機(jī)構(gòu)的學(xué)者對(duì)平臺(tái)的完善都提供了寶貴建議?!彼f(shuō)。

魏忠鈺與他指導(dǎo)的第一屆博士畢業(yè)生合影
“復(fù)旦完整的學(xué)科體系,為我們推進(jìn)AI交叉研究提供了絕佳的環(huán)境?!蔽褐意暩锌梢暂p松找到不同專(zhuān)業(yè)的頂尖學(xué)者進(jìn)行交流,“是件很幸福的事”。
目前,SocioVerse已開(kāi)源100萬(wàn)英文社交媒體平臺(tái)的用戶(hù)池,推出“眾生?SocioVerse”社會(huì)調(diào)查模擬平臺(tái),提供在線(xiàn)社會(huì)模擬仿真服務(wù),支持交叉學(xué)科研究,包括央視新媒體中心在內(nèi)的100多家機(jī)構(gòu)已在平臺(tái)上完成了超過(guò)一萬(wàn)次交互。

校企合作,技術(shù)向善讓AI成為促進(jìn)健康的基礎(chǔ)設(shè)施
除了關(guān)注宏大的社會(huì)議題,DISC團(tuán)隊(duì)還把目光投向人們的日常生活和工作,為不同職業(yè)和場(chǎng)景“量身定制”AI工具。醫(yī)療健康正是團(tuán)隊(duì)重點(diǎn)發(fā)力的應(yīng)用方向之一。
2023年9月1日,F(xiàn)udan-DISC團(tuán)隊(duì)發(fā)布了自研醫(yī)療大模型DISC-MedLLM,并開(kāi)源47萬(wàn)微調(diào)數(shù)據(jù),引起了華為公司的關(guān)注。雙方交流后,決定開(kāi)展運(yùn)動(dòng)健康A(chǔ)I助手的技術(shù)合作。
如今,這一技術(shù)已經(jīng)成功落地在華為首款鴻蒙AI智能手表Watch 5上的“腕上小藝”運(yùn)動(dòng)健康模塊。

“小藝小藝,我這幾天睡覺(jué)總做夢(mèng),醒來(lái)總覺(jué)得沒(méi)歇夠似的。”
“剛看了下您的睡眠數(shù)據(jù),最近深睡時(shí)間有點(diǎn)短,而且睡得偏晚啦。試試規(guī)律作息,睡眠質(zhì)量會(huì)好很多呢!”
只需與“小藝”聊上幾句,你便能獲得親切而不失專(zhuān)業(yè)的建議。目前“小藝”已實(shí)現(xiàn)包含心率、睡眠和運(yùn)動(dòng)等200項(xiàng)健康數(shù)據(jù)的深度解讀,以及針對(duì)20余種運(yùn)動(dòng)類(lèi)型的具體分析。
“腕上小藝”的背后,是DISC團(tuán)隊(duì)打造的業(yè)內(nèi)首個(gè)面向運(yùn)動(dòng)健康的因果知識(shí)圖譜推理系統(tǒng)。這一系統(tǒng)名為“Expert-In-The-Loop”,有著雙層結(jié)構(gòu):一層收集用戶(hù)運(yùn)動(dòng)數(shù)據(jù)和身體指標(biāo),另一層連接海量醫(yī)學(xué)知識(shí),雙網(wǎng)融合實(shí)現(xiàn)科學(xué)推理。
在開(kāi)發(fā)過(guò)程中,受隱私協(xié)議限制,團(tuán)隊(duì)無(wú)法直接調(diào)用用戶(hù)數(shù)據(jù)。此時(shí),組內(nèi)同時(shí)進(jìn)行的SocioVerse研發(fā)給了團(tuán)隊(duì)啟發(fā):何不自己構(gòu)建模擬的醫(yī)療健康交互場(chǎng)景,把大模型生成的合成對(duì)話(huà)數(shù)據(jù)用作訓(xùn)練語(yǔ)料呢?最終,團(tuán)隊(duì)?wèi){借自身深厚的技術(shù)積累,達(dá)成了項(xiàng)目目標(biāo)。

這一成功的合作,有哪些值得借鑒的經(jīng)驗(yàn)?魏忠鈺表示,高校學(xué)者應(yīng)保持學(xué)術(shù)獨(dú)立,自信面對(duì)企業(yè)需求,“我們要學(xué)會(huì)將實(shí)際問(wèn)題轉(zhuǎn)化為研究課題,實(shí)現(xiàn)科研與產(chǎn)業(yè)的雙向促進(jìn)?!毙F蠛献魍瑯邮且粋€(gè)技術(shù)與社會(huì)互動(dòng)的過(guò)程,“AI要深植社會(huì)土壤,融合臨床經(jīng)驗(yàn)與真實(shí)需求,政府監(jiān)管與公眾認(rèn)知也是其健康發(fā)展的關(guān)鍵要素。”
深度參與校企協(xié)作的真實(shí)場(chǎng)景,對(duì)于學(xué)生而言也是非常好的鍛煉?!罢嬲难芯柯涞夭皇前颜撐陌徇M(jìn)產(chǎn)品,而是把場(chǎng)景帶回研究中:在學(xué)術(shù)與工程之間,我們?cè)斓氖且蛔苓B接難題與需求的橋?!表?xiàng)目核心成員、統(tǒng)計(jì)學(xué)2024級(jí)博士生保智杰說(shuō)。
DISC團(tuán)隊(duì)多年致力于讓AI服務(wù)于人的健康管理,與華為的合作只是其一。他們還曾聯(lián)合伊利集團(tuán)打造國(guó)內(nèi)首個(gè)營(yíng)養(yǎng)健康智能體,并實(shí)現(xiàn)規(guī)?;涞?;與復(fù)旦循證護(hù)理中心合作研發(fā)首個(gè)面向護(hù)士的智能問(wèn)答模型EviNurse,推動(dòng)護(hù)理智能化發(fā)展;聯(lián)合多家醫(yī)院共同研發(fā)“普衛(wèi)思PIORS”健康醫(yī)療導(dǎo)診助手,提升導(dǎo)診精準(zhǔn)性。

魏忠鈺在學(xué)術(shù)會(huì)議上介紹Socioverse
魏忠鈺認(rèn)為,未來(lái)AI會(huì)是我們生活中的基礎(chǔ)設(shè)施,功能會(huì)越來(lái)越強(qiáng)大,使用門(mén)檻也會(huì)越來(lái)越低?!拔覀円伎嫉?,就是如何讓AI提升人類(lèi)社會(huì)的幸福指數(shù)。這也是驅(qū)動(dòng)我持續(xù)研究深耕的源動(dòng)力?!?/p>
Socioverse項(xiàng)目地址:www.fudan-disc.com/socioverse








