亚洲中文字幕乱码亚洲-蜜桃成熟视频在线观看-免费中文字幕视频在线-中国五十路熟妇洗澡视频-亚洲av伊人啪啪c-国产精品成人一区二区-国产自拍视频一区在线观看-成人一区不卡二区三区四区-亚洲情精品中文字幕99在线

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

人工智能社會化:內(nèi)容生成與符號重塑

0
分享至



劉河慶

華中科技大學(xué)

社會學(xué)院

教授

人工智能社會化:內(nèi)容生成與符號重塑

來源 | 《社會學(xué)研究》2026年第2期

作者 | 劉河慶

責(zé)任編輯 |趙夢瑤

大語言模型作為準(zhǔn)社會主體融入社會生活,正在重塑社會互動模式與社會秩序。基于人工智能社會化視角,本研究使用四個(gè)大語言模型模擬不同角色對“知乎”平臺上的海量提問進(jìn)行回答,進(jìn)而對大語言模型的行為特征及其對內(nèi)容生態(tài)的沖擊等進(jìn)行分析。研究發(fā)現(xiàn),大語言模型在互動中兼具精確性與機(jī)械性:它們能靈活識別場景,但在輸出中會機(jī)械地強(qiáng)化性別、年齡等方面的角色刻板印象。同時(shí),大語言模型生成的內(nèi)容語義高度集中,趨近于中立或高點(diǎn)贊的人類回答,進(jìn)而可能引發(fā)社會符號系統(tǒng)的收縮和同質(zhì)化。研究人工智能參與社會互動及內(nèi)容生成的過程,為理解數(shù)智時(shí)代社會形態(tài)的變遷提供了重要視角。

一、引言

生成式人工智能的迅速崛起不僅標(biāo)志著一場技術(shù)革命,也是一個(gè)重要的社會和文化現(xiàn)象。以大語言模型為代表的生成式人工智能,憑借其對于多模態(tài)內(nèi)容的生成能力,正在重塑知識的生產(chǎn)和獲取方式,還展現(xiàn)出日益顯著的社會化潛能,這類模型以前所未有的方式滲透進(jìn)人類社會生活(Gabriel,2020),逐漸超越單純工具的范疇,成為復(fù)雜場景中主動的互動參與者、意義構(gòu)建者乃至社會符號系統(tǒng)的形塑力量(Lotman,1990;Bisconti,2024),這一轉(zhuǎn)變對社會學(xué)傳統(tǒng)意義上的互動模式與社會化過程產(chǎn)生了深遠(yuǎn)影響。

經(jīng)典社會化理論側(cè)重個(gè)體如何通過家庭、學(xué)校、同伴群體等社會化載體習(xí)得社會規(guī)范和價(jià)值觀念(米德,2018;Guhin et al.,2021),然而,以ChatGPT、DeepSeek為代表的大語言模型在海量場景中與人類開展互動、協(xié)作甚至競爭,對傳統(tǒng)社會化理論形成了挑戰(zhàn)。一方面,人工智能扮演著虛擬伴侶、內(nèi)容生產(chǎn)者等角色,逐漸成長為具備一定自主性和創(chuàng)造性的準(zhǔn)社會主體(伊德,2012;邱澤奇,2024a;Bisconti et al.,2024);另一方面,作為社會文化技術(shù)(Farrell et al.,2025),大語言模型通過大規(guī)模內(nèi)容生成直接作用于人類的語言、認(rèn)知和價(jià)值體系,承擔(dān)起“智力物替”這一全新功能(王寧,2025),進(jìn)而動搖了傳統(tǒng)社會化視角下相對靜態(tài)、固化的社會符號系統(tǒng)(Guhin et al.,2021)。在此背景下,系統(tǒng)分析人工智能如何在多元場景中承載不同社會角色,以及如何沖擊以平臺內(nèi)容生態(tài)為代表的社會符號系統(tǒng),成為理解數(shù)智時(shí)代人工智能如何推動社會形態(tài)與社會秩序整體演變的關(guān)鍵所在。

相關(guān)研究的難點(diǎn)在于應(yīng)對人工智能所具有的高度實(shí)踐性和生成性。基于人類已有書面知識訓(xùn)練而成的大語言模型能夠?qū)W習(xí)專業(yè)知識、互動規(guī)則和價(jià)值偏好,進(jìn)而根據(jù)用戶的不同需求生成海量內(nèi)容(這些內(nèi)容出現(xiàn)在論文、政策報(bào)告、短視頻等諸多載體中)。首先,這體現(xiàn)了人工智能的高度實(shí)踐性,即與已有文獻(xiàn)中技術(shù)作為相對固定工具的角色(芬伯格,2005;Matthewman,2017)不同,人工智能已廣泛融入人類社會生活與專業(yè)領(lǐng)域(邱澤奇,2024a;王寧,2025),在社會互動中表現(xiàn)出高度的情境適應(yīng)性和角色轉(zhuǎn)換能力,能夠應(yīng)對多樣乃至沖突的社會需求,并在與人類互動過程中動態(tài)調(diào)整自身的角色、偏好乃至價(jià)值觀。其次,大語言模型的內(nèi)容生成能力,特別是對觀念、偏好的生成能力,打破了經(jīng)典社會化理論中相對清晰的宏微觀界限(個(gè)體通過社會化機(jī)構(gòu)學(xué)習(xí)相對固定的社會規(guī)范和價(jià)值觀)。大語言模型在社會互動中生成的海量內(nèi)容不僅直接沖擊平臺現(xiàn)有的內(nèi)容生態(tài),也通過模型迭代持續(xù)影響后續(xù)的人機(jī)互動。上述大語言模型在不同場景、時(shí)間與提示條件下所呈現(xiàn)的復(fù)雜行為差異及其生成能力,直接挑戰(zhàn)了將人工智能技術(shù)僅視為工具或客體,進(jìn)而探討用戶接受度或社會后果等的傳統(tǒng)分析路徑。

因此,要考察大語言模型在數(shù)智時(shí)代的具體角色,必須超越僅將其視為工具并進(jìn)行“技術(shù)能力評估”的分析框架,轉(zhuǎn)而關(guān)注其作為符號學(xué)意義上的行動者,如何在復(fù)雜社會場景中參與內(nèi)容生產(chǎn)與觀念輸出。本文提出“人工智能社會化”視角,將大語言模型視為具有一定自主性與創(chuàng)造性的“準(zhǔn)社會主體”,聚焦其最突出的內(nèi)容生成能力,試圖回答以下問題。第一,大語言模型在不同場景中生成的內(nèi)容,與人類用戶基于不同經(jīng)歷和傾向所產(chǎn)生的內(nèi)容有何異同?其內(nèi)容輸出是否會強(qiáng)化某些特定內(nèi)容或視角?這些異同反映了大語言模型對既有語言特征、偏好乃至社會規(guī)范的什么學(xué)習(xí)模式?第二,大語言模型在模擬不同社會角色時(shí)生成的內(nèi)容存在何種差異,這體現(xiàn)了它對不同社會角色怎樣的理解?第三,大語言模型在短時(shí)間內(nèi)生成的海量內(nèi)容的語義分布與人類用戶在長期復(fù)雜互動中生成內(nèi)容的語義分布有何不同?這些生成內(nèi)容如何影響平臺內(nèi)容生態(tài)?為回答上述問題,本研究采用計(jì)算實(shí)驗(yàn)方法,使用四個(gè)國內(nèi)外大語言模型(DeepSeek、ChatGPT、Qwen、豆包)模擬不同社會角色對“知乎”平臺上30余萬個(gè)提問進(jìn)行回答,并與原有人類用戶的回答進(jìn)行比較,以探索大語言模型生成內(nèi)容的場景化特征。同時(shí),通過考察人工智能生成內(nèi)容與用戶生成內(nèi)容在語義分布上的差異,本研究將進(jìn)一步探討大語言模型的海量內(nèi)容生成能力對社會符號系統(tǒng)的潛在影響。

二、文獻(xiàn)述評

(一)人工智能作為準(zhǔn)社會主體

技術(shù)與社會的關(guān)系,尤其是技術(shù)發(fā)展與社會結(jié)構(gòu)、社會觀念之間的復(fù)雜互動一直是社會學(xué)的核心議題(芬伯格,2005;Matthewman,2017)。在該領(lǐng)域的長期研究中,一個(gè)關(guān)鍵難題在于如何理解技術(shù)自身的高度變動性與復(fù)雜性。技術(shù)往往處于持續(xù)演進(jìn)的狀態(tài),且其用途和意義具有多重可能性(Matthewman,2017)。基于技術(shù)決定論和社會建構(gòu)論視角的研究大多仍從技術(shù)的工具屬性出發(fā),探討技術(shù)如何“增強(qiáng)”社會或社會如何形塑技術(shù)(芬伯格,2005)。而有關(guān)技術(shù)社會化的文獻(xiàn)則側(cè)重于技術(shù)在社會中被接受并擴(kuò)散的過程(陳凡,1992)。這些視角因?qū)⒓夹g(shù)視為相對固定的工具或客體,難以充分解釋技術(shù)與社會之間動態(tài)交織的復(fù)雜關(guān)系。后續(xù)研究開始倡導(dǎo)一種“分散的能動性”,強(qiáng)調(diào)人類和技術(shù)都具有主體性和能動性(伊德,2012;拉圖爾,2022)。例如伊德(Don Ihde)指出,在人類與技術(shù)互動的體驗(yàn)的過程中存在他異性關(guān)系(alterity relations),技術(shù)在此關(guān)系中表現(xiàn)出一定的獨(dú)立性與互動性,成為“準(zhǔn)他者”(伊德,2012)。數(shù)智時(shí)代人工智能在各社會領(lǐng)域的廣泛應(yīng)用進(jìn)一步印證了同時(shí)關(guān)注人類和技術(shù)能動性的必要性。有研究提出,隨著人工智能技術(shù)深度融入社會,傳統(tǒng)的人類中心主義視角需要被重新審視,人工智能不再只是工具,而是具備一定自主性和適應(yīng)性的“準(zhǔn)社會主體”,能夠在社會中承擔(dān)重要角色(Bisconti et al.,2024)。

因此,探究人工智能扮演何種社會角色,其作為“準(zhǔn)社會主體”具有哪些特征,已成為理解數(shù)智時(shí)代技術(shù)與社會關(guān)系,乃至思考“數(shù)智社會可以可能”的關(guān)鍵(西蒙東,2024)。事實(shí)上,使人工智能具備參與社會互動的能力,特別是擁有足夠的社會智能,一直是該領(lǐng)域發(fā)展的重要目標(biāo)(Suchman,2007;Bates,2024)。研究者將社會智能定義為“人工智能根據(jù)人類的標(biāo)準(zhǔn)對外在刺激和社會場景的要求作出自動化響應(yīng)”,并已在此方向展開諸多探索(Fogg,1998;Bates,2024)。例如,福格(Brian J. Fogg)關(guān)注計(jì)算機(jī)的說服能力,認(rèn)為作為社會行動者的計(jì)算機(jī)可通過建立社會規(guī)范、提供社會支持等方式影響人類態(tài)度(Fogg,1998)。然而,計(jì)算機(jī)科學(xué)對社會智能的追求在很長時(shí)期內(nèi)未達(dá)預(yù)期,一個(gè)重要原因在于傳統(tǒng)機(jī)器學(xué)習(xí)依賴于編碼和明確的規(guī)則,而現(xiàn)實(shí)中大量的社會場景運(yùn)行于隱性知識與非明文的規(guī)則之上(史密斯,2022),這使得只依靠固定、明確規(guī)則的計(jì)算機(jī)難以實(shí)現(xiàn)真正意義上的社會智能。

以大語言模型為代表的生成式人工智能的迅速崛起和廣泛應(yīng)用,大大推進(jìn)了人工智能的社會化進(jìn)程及其社會智能的實(shí)現(xiàn)。ChatGPT、DeepSeek等大語言模型通常具備數(shù)十億參數(shù),其訓(xùn)練數(shù)據(jù)覆蓋了人類已記錄知識的絕大部分。除了數(shù)據(jù)規(guī)模龐大以外,這類模型在獲取人類隱性知識和規(guī)則方面尤其有效,它們通過學(xué)習(xí)示例,在無明確指令的情況下習(xí)得和掌握未被預(yù)先設(shè)計(jì)的能力(Autor,2024)。這種脫離固定腳本和顯性規(guī)則、依賴訓(xùn)練數(shù)據(jù)即時(shí)決策和互動的能力,使大語言模型能夠廣泛融入各類社會場景,承擔(dān)如虛擬伴侶等多種社會角色(邱澤奇,2024b)。

盡管大語言模型有潛力成為廣泛存在于社會中的準(zhǔn)社會主體,但其與具有特定成長經(jīng)歷、相對穩(wěn)定的價(jià)值觀、個(gè)性、知識和能力的人類個(gè)體存在本質(zhì)差異(米德,2018)。大語言模型并未經(jīng)歷人類成長過程中的“場景嵌入”,而是通過學(xué)習(xí)海量文本、圖像等人類知識,融合各類價(jià)值觀、知識及能力,從而表現(xiàn)出高度依賴上下文的價(jià)值觀和人格特征。根據(jù)不同的提示詞,它可以模擬多種角色,表達(dá)并迅速切換不同的價(jià)值觀(Collins,2025)。這意味著,生成式人工智能并不具備人類主體那樣相對穩(wěn)定的偏好(Guhin et al.,2021),也不存在戈夫曼(Erving Goffman)所論述的“前臺”“后臺”的切換和張力(戈夫曼,2008),而是在海量社會互動中,高度依賴即時(shí)語境輸出相應(yīng)的價(jià)值觀(Li et al.,2024)。值得注意的是,盡管大語言模型可以表達(dá)并快速轉(zhuǎn)換多種視角,但與數(shù)字平臺上用戶開放式的表達(dá)和討論不同,它往往以某種權(quán)威姿態(tài)將多元視角壓縮為單一視角參與社會互動(胡安寧、周森,2024;Collins,2025)。因此,探究以下問題至關(guān)重要:大語言模型在不同場景中輸出何種內(nèi)容和視角?哪些視角或觀念更容易被激活并輸出,哪些則容易被抑制或忽略?模型在模擬不同社會角色時(shí)所輸出的內(nèi)容有何差異?回答這些問題是理解大語言模型如何在多樣場景中進(jìn)行互動并生成內(nèi)容的關(guān)鍵。

綜上所述,大語言模型在不同社會場景中生成內(nèi)容與價(jià)值偏好的能力,使其日益成為數(shù)智社會中不可忽視的準(zhǔn)社會主體。面對快速迭代、種類眾多,以及與海量用戶高頻互動生成巨量內(nèi)容的大語言模型,我們可從以下幾個(gè)方面深化對大語言模型作為準(zhǔn)社會主體的認(rèn)識。第一,在研究視角上,相較于從擬人化的視角關(guān)注大語言模型“知道什么”,更應(yīng)關(guān)注其在符號學(xué)意義上的行動能力(Picca,2025)。大語言模型的社會化能力,關(guān)鍵不在于是否擁有意識或意圖,而在于其作為社會符號系統(tǒng)中的動態(tài)操作者,能夠通過海量內(nèi)容輸出影響甚至塑造價(jià)值觀的信息。換言之,大語言模型自身雖然不會思考,卻持續(xù)通過內(nèi)容輸出影響人類的思考過程。第二,已有研究多基于實(shí)驗(yàn)室環(huán)境或理想化數(shù)據(jù)集分析生成式人工智能在預(yù)設(shè)場景中的表現(xiàn)(Li et al.,2024),而讓模型參與真實(shí)社會場景中的觀點(diǎn)表達(dá)等任務(wù),并將其輸出結(jié)果與人類生成內(nèi)容進(jìn)行對比,更有助于揭示其在現(xiàn)實(shí)互動中的行為特征。第三,由于大語言模型的價(jià)值觀和人格特征高度依賴上下文,我們不應(yīng)將其視作固定統(tǒng)一的整體,而應(yīng)考察其在模擬不同社會角色時(shí)的具體生成特征,進(jìn)而檢驗(yàn)?zāi)P蛯Σ煌鐣巧睦斫獬潭取?傊挥凶尨笳Z言模型以各種社會角色與真實(shí)社會場景相遇,才能在理論構(gòu)想“大語言模型應(yīng)做什么”的基礎(chǔ)上,系統(tǒng)考察實(shí)踐中“不同模型實(shí)際生成什么”,進(jìn)而深化對人工智能社會化進(jìn)程的理解。

(二)人工智能如何影響社會符號系統(tǒng)

在將人工智能視為準(zhǔn)社會主體、探討其如何在具體場景中參與社會互動的同時(shí),我們也需將其置于更廣闊的社會符號系統(tǒng)重組進(jìn)程中,從宏觀層面考察具有海量內(nèi)容生成能力的大語言模型對既有社會符號系統(tǒng)的潛在沖擊。單個(gè)大語言模型在具體互動場景中快速生成的內(nèi)容看似隨機(jī),但這些內(nèi)容匯聚后可能呈現(xiàn)某種特定的偏好結(jié)構(gòu),進(jìn)而形成新的話語結(jié)構(gòu)與觀念體系,并沖擊已有內(nèi)容。與此同時(shí),大語言模型生成的海量內(nèi)容又能以訓(xùn)練語料等形式迅速反饋至后續(xù)場景,從而影響微觀層面的具體互動。這種宏觀與微觀之間的循環(huán)互構(gòu)關(guān)系意味著,我們需要同時(shí)從兩個(gè)層面進(jìn)行分析和比較,方能更深入地把握人工智能社會化的實(shí)質(zhì)。

在對經(jīng)典社會化理論的反思中,一個(gè)關(guān)鍵批評指向其對個(gè)體社會化過程的理解:個(gè)體在社會化中所學(xué)習(xí)和適應(yīng)的并非靜態(tài)的社會規(guī)范和價(jià)值觀(Guhin et al.,2021),而是一個(gè)由語言、符號、行為與規(guī)范等多種資源構(gòu)成的高度復(fù)雜的社會符號系統(tǒng)。這一系統(tǒng)在社會成員的持續(xù)互動和歷史變遷中不斷重組和更新(Swidler,1986;Lotman,1990;Gelfand et al.,2024)。以數(shù)字平臺的興起為例,平臺內(nèi)部復(fù)雜多變的話語風(fēng)格、價(jià)值取向與行為規(guī)范已成為顯性且可觀測的社會符號系統(tǒng)。當(dāng)數(shù)字平臺逐漸成為社會符號系統(tǒng)的重要生成空間時(shí),符號生產(chǎn)的主體也從專家轉(zhuǎn)變?yōu)閺V大普通用戶(趙一璋、王明玉,2023;張茂元、邱澤奇,2024),算法則成為影響內(nèi)容生產(chǎn)的關(guān)鍵機(jī)制,原本相對穩(wěn)定的社會符號系統(tǒng)因此變得更加碎片化和動態(tài)化(喬天宇、向靜林,2022;劉河慶、梁玉成,2023)。數(shù)字平臺不僅帶來了社會符號數(shù)量的增加,也引發(fā)了話語意義維度的變化。例如,貝爾(Christopher A. Bail)等人引入“理性—感性”分析框架,發(fā)現(xiàn)數(shù)字平臺上公開的討論并未如哈貝馬斯(Jürgen Habermas)所預(yù)期的那樣推動理性話語數(shù)量的增長,反而促使感性話語數(shù)量的明顯增加(Bail et al.,2017)。這些在數(shù)字平臺中不斷生成的話語風(fēng)格、價(jià)值傾向以及行為規(guī)范,已然成為數(shù)智時(shí)代重要的社會化環(huán)境(Gelfand et al.,2024;Tsvetkova et al.,2024),個(gè)體在此環(huán)境中持續(xù)創(chuàng)造并適應(yīng)不斷迭代的符號系統(tǒng),從而在虛擬層面不斷進(jìn)行著社會化的過程。

大語言模型具有加速數(shù)字平臺中的話語風(fēng)格、價(jià)值觀以及行為規(guī)范等社會符號系統(tǒng)演化的潛力(Gelfand et al.,2024;Floridi,2024)。生成式人工智能極大提升了內(nèi)容生產(chǎn)效率,能夠快速生成海量語義制品(馬文、陳云松,2024;Floridi,2024;Farrell et al.,2025),成為數(shù)智時(shí)代重要的“意義制造者”。關(guān)于大語言模型如何具體沖擊以平臺內(nèi)容為代表的社會符號系統(tǒng),已有研究從生成內(nèi)容的語言特征、潛在社會偏見、多樣性程度等多方面進(jìn)行了考察(周旅軍、呂鵬,2024)。有研究發(fā)現(xiàn),與人類文本相比,大語言模型表現(xiàn)出與之相似甚至更強(qiáng)的社會偏見(Pawar et al.,2024)。也有研究認(rèn)為,需要重視大語言模型生成價(jià)值觀的復(fù)雜性,其高度靈活的視角輸出使其常常成為不同價(jià)值觀相互競爭的隱蔽場所(Bisconti et al.,2024;Collins,2025)。近期的研究開始將大語言模型生成內(nèi)容與人類生成內(nèi)容進(jìn)行多維度綜合比較(龔為綱、黃思源,2025;胡安寧,2025;王元超等,2025),尤其關(guān)注大語言模型如何選擇性再現(xiàn)不同社會主體的觀點(diǎn)和語言風(fēng)格。例如,胡安寧(2025)指出,大語言模型在輸出時(shí)面臨“正確”與“多樣”的兩難:大語言模型通過學(xué)習(xí)海量資料輸出的結(jié)果看似最優(yōu),實(shí)際上可能僅代表特定人群的觀點(diǎn)。還有研究則發(fā)現(xiàn),大語言模型能夠再現(xiàn)不同社會群體的視角和語言風(fēng)格,但仍面臨輸出偏見、同質(zhì)性強(qiáng)、內(nèi)容虛化等問題(Kozlowski & Evans,2025)。

總之,已有文獻(xiàn)關(guān)注到大語言模型的內(nèi)容生成能力對社會符號系統(tǒng)的沖擊,但受分析視角和研究設(shè)計(jì)所限,仍留下了若干尚未得到系統(tǒng)回答的重要問題。例如,盡管大語言模型本身高度靈活且可快速模擬不同角色和視角生成內(nèi)容,但其輸出結(jié)果能否反映人類觀點(diǎn)的真實(shí)分布,是否會系統(tǒng)性強(qiáng)化某些視角并壓縮其他內(nèi)容?從分析視角看,已有研究多從能力評估角度分析大語言模型存在的不足(Li et al.,2024;Messeri & Crockett,2024;Sourati et al.,2025)。本文認(rèn)為,除了評估單個(gè)模型輸出內(nèi)容的正確性和局限性外,我們更應(yīng)關(guān)注大語言模型作為宏觀內(nèi)容生態(tài)塑造者的角色,考察其如何通過海量內(nèi)容輸出影響符號系統(tǒng)。在研究設(shè)計(jì)方面,現(xiàn)有研究多基于實(shí)驗(yàn)室環(huán)境或理想化數(shù)據(jù)集(Pawar et al.,2024),且往往缺少對大語言模型生成內(nèi)容與人類真實(shí)觀點(diǎn)的比較。因此,深入理解大語言模型對社會符號系統(tǒng)的潛在沖擊,需要以人類用戶基于自身經(jīng)驗(yàn)和社會場景所形成的多樣化回答為參照,探究大語言模型作為準(zhǔn)社會主體如何在多元社會場景中快速生成內(nèi)容,進(jìn)而重塑社會符號系統(tǒng)(Farrell et al.,2025)。

綜上,本文嘗試提出“人工智能社會化”的視角,聚焦大語言模型最為突出的內(nèi)容生成能力,通過構(gòu)建不同模型在海量社會場景中的回答數(shù)據(jù),挖掘其多維度語義特征,并將其與人類用戶的回答進(jìn)行系統(tǒng)比較。本研究旨在從微觀層面分析不同大語言模型在模擬各類社會角色、應(yīng)對多元社會場景時(shí)的內(nèi)容生成特征,同時(shí)在宏觀層面探討大語言模型的興起對數(shù)字平臺整體內(nèi)容生態(tài)的潛在影響。

三、研究設(shè)計(jì)

(一)數(shù)據(jù)收集和處理

為了分析大語言模型在不同社會場景中的內(nèi)容生成行為及其對平臺內(nèi)容生態(tài)的潛在影響,首先需構(gòu)建接近真實(shí)的社會場景并獲取可供對比的人類生成內(nèi)容。

為此,本研究選取“知乎”問答平臺構(gòu)建研究場景和數(shù)據(jù)來源。“知乎”作為一個(gè)廣受歡迎的問答平臺,匯集了大量用戶在科學(xué)技術(shù)、人際關(guān)系等多元話題下的真實(shí)互動,能較全面地反映不同場景中用戶的具體回答和潛在偏好。這為本文提供了相對自然和真實(shí)的、長時(shí)段的數(shù)字平臺內(nèi)容生產(chǎn)和用戶互動場景,契合本文的研究目的。

在“知乎”平臺上,每個(gè)問題附有多個(gè)標(biāo)簽以標(biāo)明所屬領(lǐng)域。為確保問題樣本的覆蓋面,在數(shù)據(jù)收集過程中,筆者首先通過“知乎”的話題樹功能獲取盡可能廣泛的種子話題(涵蓋社會、科技等領(lǐng)域),并采集各話題下的問題及其所有回答。隨后,本研究以第一輪收集到的回答者為節(jié)點(diǎn),進(jìn)一步爬取其關(guān)注和回答的所有問題及相關(guān)回答,最終獲取了約1200萬條以“社會”“科技”“家庭”“文化”等為標(biāo)簽的問題(時(shí)間跨度為2011—2022年)。為提高問答數(shù)據(jù)的質(zhì)量,本研究篩選了回答數(shù)不少于10個(gè)的提問作為初始數(shù)據(jù),并利用基于雙向編碼表示(Bidirectional Encoder Representations from Transformers,簡稱BERT)模型的主題模型(BERTopic)對這些問題進(jìn)行議題分類。在此基礎(chǔ)上,本研究剔除了事實(shí)類、技能操作類、概念解釋類、娛樂類等較少涉及觀點(diǎn)表達(dá)的問題,重點(diǎn)保留了觀點(diǎn)評價(jià)類(如對特定現(xiàn)象或事件的看法)提問,去除重復(fù)問題后共得到301459個(gè)有效提問,并收集了相關(guān)提問者、提問時(shí)間、問題關(guān)注度、每個(gè)提問下點(diǎn)贊量前十的用戶回答及其點(diǎn)贊量等信息,從而構(gòu)建了覆蓋多場景的“知乎”平臺問答互動數(shù)據(jù)庫。

基于上述30余萬條問題,筆者進(jìn)一步選取ChatGPT、DeepSeek、Qwen、豆包等四個(gè)國內(nèi)外的代表性大語言模型,調(diào)用其應(yīng)用程序接口,將問題輸入并獲取各模型對應(yīng)的回答。此外,本研究還設(shè)定了性別(男/女)、年齡(青年/老年)、回答風(fēng)格(理性/感性)三個(gè)社會角色維度來引導(dǎo)各模型在生成回答時(shí)模擬不同角色。每個(gè)“知乎”問題最終對應(yīng)生成32條不同角色條件下的模型回答。通過上述流程,本研究共收集了來自四個(gè)大語言模型、模擬八種具體身份、針對30余萬條問題的964余萬條回答大數(shù)據(jù)。

(二)測量

1.因變量

本研究致力于考察大語言模型與“知乎”用戶在不同場景中內(nèi)容生成模式的差異,而準(zhǔn)確測量二者生成內(nèi)容的特征和差異是推進(jìn)本研究的關(guān)鍵。已有研究主要基于毒性評分(Toxicity Score)(Pawar et al.,2024)等指標(biāo)來評估大語言模型輸出內(nèi)容的語義特征。上述指標(biāo)雖有助于識別內(nèi)容中明顯有害的表達(dá),但對于更普遍、無明顯錯誤卻蘊(yùn)含特定偏好與價(jià)值判斷的內(nèi)容,其測度能力有限。為彌補(bǔ)這一不足,本研究嘗試同時(shí)構(gòu)建兩個(gè)維度的測量:一是大語言模型回答與人類用戶回答的內(nèi)容相似度,二是大語言模型回答在理性—感性軸上的偏向程度。通過這種方式,本研究力求更系統(tǒng)地考察不同大語言模型在多樣化場景中內(nèi)容生成的具體特征。

具體而言,本研究使用BERT模型對301459個(gè)提問中的人類回答及大語言模型生成回答進(jìn)行文本嵌入,將結(jié)果映射到統(tǒng)一的語義向量空間,從而使兩類回答處于可比較的語義環(huán)境中。以“知乎”問題中的人類用戶回答為基準(zhǔn),本研究計(jì)算其與對應(yīng)各人工智能回答的余弦相似度,進(jìn)而在問題層面上構(gòu)建每個(gè)問題中人工智能回答與人類用戶回答的內(nèi)容相似度指標(biāo)。

本文聚焦于理性—感性維度,分析大語言模型與人類用戶在內(nèi)容生成中的理性—感性偏向。具體而言,筆者基于框架軸(FrameAxis)模型,利用一組具有方向性的理性和感性種子詞對,構(gòu)建一個(gè)指向性語義空間,在此空間中,每個(gè)人類回答與人工智能回答均可獲得在理性—感性軸上的語義位置。本研究通過計(jì)算每個(gè)回答在該軸上的得分,生成“理性—感性偏向”變量,得分越高,表明回答的理性程度越高。

2.主要解釋變量

本研究的主要解釋變量為“知乎”問題所屬的場景,即問題討論的主要領(lǐng)域。為識別不同問題涉及的場景,筆者使用BERTopic模型對30余萬條問題文本進(jìn)行主題歸類,并對模型輸出結(jié)果進(jìn)行合并,最終識別出以下五類主要討論領(lǐng)域:文化場景,涵蓋教育、藝術(shù)、科技、知識生產(chǎn)等相關(guān)議題的問題數(shù)量占比28.53%;政治場景,主要涉及國際關(guān)系、公共政策等議題的問題數(shù)量占比11.67%;經(jīng)濟(jì)場景,主要包括職業(yè)評價(jià)、消費(fèi)行為等相關(guān)討論的問題數(shù)量占比15.95%;社會生活場景,涉及婚姻家庭、性別角色、代際差異等議題的問題數(shù)量占比39.82%;其他未能明確歸入以上類別的問題數(shù)量占比4.03%。

此外,本研究同時(shí)關(guān)注大模型類別及其模擬的不同社會角色對內(nèi)容生成的影響。模型類別指研究所使用的大語言模型,包括ChatGPT、DeepSeek、Qwen、豆包共四款國內(nèi)外代表性模型。大語言模型模擬的不同社會角色變量則是分析模型對社會角色的理解以及模型行為特征和社會化模式的關(guān)鍵變量。在研究中,筆者通過提示詞設(shè)定,引導(dǎo)各模型基于性別(男/女)、年齡(青年/老年)、回答風(fēng)格(理性/感性)三類社會維度生成回答。據(jù)此,每個(gè)語言大模型共模擬8種具體身份角色進(jìn)行回答。基于此流程,本研究構(gòu)建了以下分類變量:大語言模型具體類別、模擬性別群體、模擬年齡群體以及模擬回答風(fēng)格。

3.控制變量

控制變量包括“知乎”問題的提問年份、問題長度、問題關(guān)注量、問題網(wǎng)友回答的平均點(diǎn)贊量以及問題網(wǎng)友回答的平均理性程度。問題提問年份為分類變量,時(shí)間跨度為2011—2022年。問題長度取“知乎”問題文本長度的對數(shù)值。問題關(guān)注量取平臺上該問題被網(wǎng)友關(guān)注數(shù)量的對數(shù)值。問題網(wǎng)友回答的平均點(diǎn)贊量為每個(gè)問題下點(diǎn)贊量最高的前十條網(wǎng)友回答的點(diǎn)贊數(shù)均值,并取對數(shù)值。問題網(wǎng)友回答的平均理性程度為每個(gè)問題下點(diǎn)贊量最高的前十條網(wǎng)友回答的理性得分均值。

(三)分析方法

在微觀層面,本文關(guān)注人工智能作為“準(zhǔn)社會主體”在不同社會場景下生成的內(nèi)容與人類用戶生成內(nèi)容之間的總體相似度,以及大語言模型生成內(nèi)容在理性—感性維度上的取值,二者均為連續(xù)變量。針對這兩個(gè)指標(biāo),本文采用多元線性回歸模型進(jìn)行分析(使用穩(wěn)健標(biāo)準(zhǔn)誤)。

在宏觀層面,筆者首先使用BERT模型對所有收集到的人類用戶回答和不同大模型生成的回答進(jìn)行編碼,提取每個(gè)回答的高維語義向量;筆者隨后將所有回答投射至同一嵌入空間,通過比較人類回答與不同大語言模型回答在語義空間中的語義分布特征,探討人工智能的海量內(nèi)容生成能力對已有平臺內(nèi)容生態(tài)的潛在影響。

四、大語言模型模擬不同角色在不同場景中的生成內(nèi)容特征

(一)大模型與人類用戶回答總體相似度分析

本節(jié)首先分析不同角色設(shè)定下的大語言模型在面對海量“知乎”問題時(shí),其生成回答與人類用戶回答的相似度。表1的基礎(chǔ)模型結(jié)果顯示,問題回答的平均點(diǎn)贊量、問題長度及問題關(guān)注量系數(shù)均顯著為正,表明網(wǎng)友回答越受歡迎、問題越具體或問題關(guān)注度越高,大語言模型生成回答與網(wǎng)友回答的相似度也越高。此外,問題提問時(shí)間的結(jié)果表明,以2017年左右為界,對于2017年之前年份的問題,大語言模型生成的回答與已有網(wǎng)友回答相似度較低;而對于2017年之后新提出的問題,大語言模型生成的回答與已有網(wǎng)友回答的相似度則相對較高。

表1中的問題場景模型進(jìn)一步檢驗(yàn)了不同問題涉及的社會場景的影響,這一維度在已有文獻(xiàn)中較少被關(guān)注。結(jié)果顯示,當(dāng)“知乎”問題涉及經(jīng)濟(jì)場景時(shí),大語言模型對該類問題的回答與人類用戶回答的相似度明顯高于其他三類場景(文化、政治、社會)。相對而言,大語言模型在政治場景和社會場景中生成的回答與人類回答的相似度則明顯較低。

表1還重點(diǎn)考察了不同大語言模型及其模擬角色對內(nèi)容生成的影響。從各模型的表現(xiàn)差異來看,豆包大模型與“知乎”用戶回答內(nèi)容的相似度最高,DeepSeek和ChatGPT模型次之,Qwen模型與用戶回答的內(nèi)容相似度相對最低。這一結(jié)果反映出不同大語言模型在多樣場景中的適應(yīng)性差異。鑒于“知乎”作為大眾化問答平臺的屬性,更側(cè)重于日常對話互動與創(chuàng)作的豆包大模型的生成內(nèi)容與用戶回答更為接近。

此外,表1考察了大語言模型模擬不同角色時(shí)的內(nèi)容生成差異。結(jié)果顯示,與模擬女性角色相比,當(dāng)大語言模型模擬男性角色時(shí),其生成內(nèi)容與“知乎”用戶回答的相似度更高;與模擬老年群體相比,模擬青年時(shí)的相似度更高;與感性風(fēng)格相比,模擬理性風(fēng)格時(shí)的相似度更高。


為深入探究不同大語言模型及其模擬的社會角色在不同問題場景下的回答模式,筆者在表1全模型的基礎(chǔ)上,分別加入以下四個(gè)交互項(xiàng):大語言模型類別與問題場景、模擬性別與問題場景、模擬年齡與問題場景、模擬回答風(fēng)格與問題場景。圖1通過四個(gè)子圖分別展示了上述交互項(xiàng)對總體內(nèi)容相似度的邊際效應(yīng)。結(jié)果顯示,無論是不同大語言模型,還是不同大語言模型模擬的角色,其表現(xiàn)均呈現(xiàn)精確性與機(jī)械性并存的特征。一方面,不同大語言模型及其模擬的角色能夠較為精確地區(qū)分不同問題場景。如圖1所示,不論是模型類別差異,還是其模擬的三類角色,大語言模型在經(jīng)濟(jì)場景中生成的內(nèi)容與人類用戶回答相似度最高,而在政治和社會場景中相似度較低,表明大語言模型能夠區(qū)分不同場景的差異和特性。另一方面,大語言模型在理解社會角色時(shí)表現(xiàn)出明顯的機(jī)械性。以模擬性別為例,在四種不同問題場景中,大語言模型模擬男性角色時(shí)生成的內(nèi)容與人類用戶回答的相似度均高于女性角色。簡言之,大語言模型對不同問題場景展現(xiàn)出較強(qiáng)的區(qū)分能力,但在模擬不同社會角色時(shí),卻呈現(xiàn)明顯的模式化傾向。


上述結(jié)果初步揭示了大語言模型在內(nèi)容生成方面的基本特征。正如已有文獻(xiàn)指出,大語言模型的一個(gè)重要優(yōu)化目標(biāo)是生成準(zhǔn)確且符合主流價(jià)值觀的回答(Li et al.,2024),即兼顧輸出內(nèi)容的準(zhǔn)確性和多場景的適應(yīng)性。從這一角度來看,大語言模型的確表現(xiàn)出較強(qiáng)的社會化能力,能夠生成較為貼合不同場景的內(nèi)容。然而,當(dāng)要求大語言模型模擬不同性別、年齡群體或輸出風(fēng)格時(shí),其生成內(nèi)容卻表現(xiàn)出高度一致且相對刻板的特征,不同角色之間的輸出結(jié)果差異展現(xiàn)出一種“機(jī)器制造”般的精準(zhǔn)分化。需要說明的是,上述結(jié)果僅為對大語言模型生成內(nèi)容模式的初步測量,總體相似度的高低既受大語言模型自身生成特征的影響,也取決于“知乎”用戶回答的構(gòu)成。因此,下文將聚焦感性—理性這一具體維度進(jìn)一步探討大語言模型的內(nèi)容生成模式。

(二)大語言模型回答中的理性—感性偏向分析

本小節(jié)進(jìn)一步聚焦于理性—感性維度,考察不同大語言模型生成回答在理性程度上的偏向。與表1類似,表2的基礎(chǔ)模型首先分析了控制變量對大語言模型生成內(nèi)容理性程度的影響。結(jié)果顯示,若一個(gè)問題下網(wǎng)友回答的平均點(diǎn)贊量較高,則大語言模型對該問題的回答理性程度相對較低;若一個(gè)問題下網(wǎng)友回答的理性程度均值較高,大語言模型生成回答的理性程度也相應(yīng)較高。此外,問題受關(guān)注程度越高或問題內(nèi)容越具體,大語言模型回答的理性程度越高。提問年份變量的影響表明,大語言模型對年份較近問題回答的理性程度有所下降。

表2中的問題場景模型進(jìn)一步考察了問題場景對大語言模型回答理性程度的影響。結(jié)果顯示,大語言模型對經(jīng)濟(jì)場景問題的回答理性程度最高,政治場景次之,社會場景較低,文化場景則最低。


表2同時(shí)分析了不同大語言模型及模擬角色對理性程度的影響。從模型類別來看,Qwen大模型生成回答的理性程度最高,ChatGPT次之,DeepSeek再次之,豆包大模型生成回答的理性程度相對最低。

在不同角色設(shè)定方面,相較于模擬女性角色,大語言模型在模擬男性角色時(shí)生成回答的理性程度更高。相較于模擬老年群體,大語言模型在模擬青年群體時(shí)生成回答的理性程度更高。相較于感性風(fēng)格,大語言模型在模擬理性風(fēng)格時(shí)生成回答的理性程度更高。不同風(fēng)格之間理性程度的巨大差異,既體現(xiàn)了理性—感性維度測量指標(biāo)的有效性,也再次印證了大語言模型在內(nèi)容生成中表現(xiàn)出的精確性。

與上一節(jié)類似,筆者在表2全模型的基礎(chǔ)上,分別加入大語言模型類別與問題場景、模擬性別與問題場景、模擬年齡群體與問題場景、模擬回答風(fēng)格與問題場景四個(gè)交互項(xiàng)。圖2通過四個(gè)子圖展示了上述交互項(xiàng)對大語言模型生成回答在理性—感性維度上偏向的邊際效應(yīng)。


圖2顯示,當(dāng)聚焦于理性—感性偏向時(shí),大語言模型的輸出結(jié)果同樣呈現(xiàn)精確性與機(jī)械性并存的特征。一方面,大語言模型能夠根據(jù)不同場景與角色精準(zhǔn)調(diào)整其價(jià)值傾向,如幾乎所有模型及其模擬的不同角色,均在經(jīng)濟(jì)場景表現(xiàn)出最高的理性程度;另一方面,在模擬性別、年齡等社會角色時(shí),大語言模型展現(xiàn)出連貫且穩(wěn)定的刻板印象,即在所有場景中,模擬男性與青年角色生成的內(nèi)容更為理性,而模擬女性與老年角色生成的內(nèi)容更為感性。這種對群體的機(jī)械理解或刻板印象,并非偶然產(chǎn)生,而是大語言模型在學(xué)習(xí)人類語料過程中對既有社會偏見的精準(zhǔn)復(fù)現(xiàn)和再生產(chǎn)。大語言模型的這一內(nèi)容生產(chǎn)特征引發(fā)了如下隱憂:不同于日常社會互動中碎片化、偶發(fā)式的刻板表達(dá),本文實(shí)證結(jié)果表明,大語言模型對不同社會角色的刻板理解具有穩(wěn)定性與精準(zhǔn)性。作為具有海量內(nèi)容生產(chǎn)能力的準(zhǔn)社會主體,大語言模型這種連貫且精確的內(nèi)容輸出,可能在公共討論場域持續(xù)強(qiáng)化不同社會角色間的刻板印象。同時(shí),這些生成內(nèi)容可能成為后續(xù)大語言模型迭代的訓(xùn)練語料,形成自我強(qiáng)化的反饋循環(huán),進(jìn)一步固化偏見。

與個(gè)體在家庭、學(xué)校以及社會中逐步展開的社會化過程不同,大語言模型并不具備個(gè)體成長過程中持續(xù)的情境參與能力。它通過學(xué)習(xí)海量人類知識,以概率建模方式在多樣場景中生成內(nèi)容,進(jìn)而進(jìn)入社會互動空間。在這一過程中,大語言模型如何與廣大用戶保持一致、如何理解不同社會角色、在不同場景中輸出何種內(nèi)容,是我們理解其社會化特征的關(guān)鍵。上述結(jié)果揭示出,大語言模型在社會互動中同時(shí)表現(xiàn)出精確性與機(jī)械性。它以權(quán)威和中立形象(胡安寧、周森,2024)將用戶在“知乎”平臺上大量的討論、思辨和爭議壓縮為單一輸出結(jié)果。這種輸出結(jié)果雖然能夠精準(zhǔn)區(qū)分海量場景的差異,卻在持續(xù)的內(nèi)容生成中機(jī)械地強(qiáng)化不同社會角色間的刻板印象。

五、大語言模型如何重塑平臺社會符號系統(tǒng)

為探究大語言模型生成的海量內(nèi)容對“知乎”平臺內(nèi)容生態(tài)的實(shí)際影響,筆者使用BERT模型對所有收集的人類用戶回答和不同大語言模型生成的全部回答進(jìn)行編碼,獲取每個(gè)回答的768維語義向量,隨后通過對這些高維語義向量降維并將其投射至低維空間,直觀呈現(xiàn)并比較大語言模型生成內(nèi)容與人類回答在語義分布上的特征。


圖3展示了經(jīng)主成分分析降維后文檔向量在二維平面上的分布,并以不同顏色和形狀區(qū)分了回答主體,圖中點(diǎn)的距離表示語義相似度,距離越近代表回答內(nèi)容的語義越相似。令人驚訝的是,盡管大語言模型的回答數(shù)量遠(yuǎn)高于人類用戶,且模型訓(xùn)練主要基于人類的書面知識,但其語義分布并未完全覆蓋人類用戶回答的語義空間。具體來看,四個(gè)大語言模型的回答在語義空間中高度重疊,集中于特定區(qū)域,人類用戶的回答則分布得更為分散和多元。雖然大語言模型能在不同場景中生成看似精確的回答,并能模擬不同角色和視角,但從宏觀語義分布來看,其輸出結(jié)果仍表現(xiàn)出高度集中和同質(zhì)化的特征。換言之,盡管大語言模型能較好地區(qū)分海量社會場景,模仿人類生成大量符合場景要求的回答,卻難以替代人類在多元社會場景中基于不同生活經(jīng)歷、價(jià)值偏好和視角所形成的豐富、發(fā)散且充滿可能性的表達(dá)。

為進(jìn)一步量化不同回答主體的回答在語義空間中的重疊程度,筆者采用核函數(shù)估計(jì)方法來計(jì)算各主體回答分布的重疊比例。首先,筆者排除各主體回答分布中5%特別離散的點(diǎn),確定其主要分布區(qū)域,然后計(jì)算兩兩主體間回答的重疊部分占各自主要分布區(qū)域的比例,結(jié)果見表3。表3右上部分和左下部分分別展示重疊部分占不同主體回答分布的比例,如表中0.908表示ChatGPT與人類回答重疊部分占ChatGPT回答總分布的比例,而0.254則表示該重疊部分占人類用戶回答總分布的比例。表3的結(jié)果驗(yàn)證了上述分析,即四個(gè)大語言模型回答的語義分布與人類回答分布重疊程度較低,但大語言模型之間的回答分布重疊度則相對較高。


為進(jìn)一步分析大語言模型生成內(nèi)容與人類回答的重疊特征,筆者分別以“知乎”問題回答的平均理性程度、平均點(diǎn)贊量以及問題所屬場景為例,比較大語言模型與人類回答重疊的內(nèi)容,以及人類回答獨(dú)特內(nèi)容(未被大語言模型回答覆蓋的部分)在上述三個(gè)變量上的分布差異。由圖4可見,人類回答獨(dú)特內(nèi)容更多集中在坐標(biāo)軸兩端,即用戶回答感性或理性程度較高的問題,而大語言模型與人類回答重疊的內(nèi)容則主要分布于坐標(biāo)軸中部,即回答中理性或感性傾向較弱。這意味著,大語言模型生成的內(nèi)容更多覆蓋的是“知乎”用戶回答中立場相對中性的內(nèi)容,而較少覆蓋具有較強(qiáng)理性或感性色彩的回答。


圖5和圖6進(jìn)一步展示了兩類內(nèi)容在“知乎”問題回答的平均點(diǎn)贊量及問題場景兩個(gè)變量上的分布情況。由圖5可見,人類回答獨(dú)特內(nèi)容更多集中于回答平均點(diǎn)贊量較低的問題,而大語言模型與人類回答重疊的內(nèi)容則相對更集中于回答平均點(diǎn)贊量較高的問題。從問題場景的分布差異來看(圖6),人類回答獨(dú)特內(nèi)容在社會問題場景中的比例高于大語言模型與人類重疊的內(nèi)容。


綜上所述,盡管大語言模型在短時(shí)間內(nèi)生成的回答數(shù)量遠(yuǎn)超“知乎”平臺用戶回答總量,但從宏觀語義分布來看,大量人類用戶生成的內(nèi)容并未被大語言模型的回答覆蓋,這部分內(nèi)容主要集中在具有較高理性程度或較強(qiáng)感性色彩點(diǎn)贊量較少的問題上;相比之下,容易被大語言模型覆蓋的是那些立場相對中性或點(diǎn)贊量較高的回答。從生成機(jī)制來看,大語言模型訓(xùn)練中常用的自注意力機(jī)制,傾向于對訓(xùn)練語料中高頻共現(xiàn)的模式賦予更高權(quán)重,這往往對應(yīng)平臺上的主流表達(dá)和立場。在內(nèi)容輸出方面,這一機(jī)制可能會在無形中強(qiáng)化主流話語模式、削弱邊緣和差異化表達(dá),從而導(dǎo)致語義空間呈現(xiàn)集中化分布。此外,當(dāng)前大語言模型多采用人類反饋的強(qiáng)化學(xué)習(xí)算法,以使其輸出結(jié)果和人類高評價(jià)回答對齊。這一方法雖有助于提升回答的精確性和共鳴度,但也使模型在接觸海量平臺資料的同時(shí),逐漸喪失輸出多元化內(nèi)容的能力。這導(dǎo)致的結(jié)果是,大模型生成的內(nèi)容在語義空間中趨于集中和單一,難以有效覆蓋人類多元化的表達(dá)。

考慮到表1和表2所用回歸模型的樣本量較大,為檢驗(yàn)研究結(jié)果的穩(wěn)健性,本文根據(jù)問題的提問年份對數(shù)據(jù)進(jìn)行劃分,并分年度重新進(jìn)行回歸分析。結(jié)果顯示,分年度回歸結(jié)果與表1和表2的主要發(fā)現(xiàn)基本一致。此外,為考察大語言模型溫度參數(shù)設(shè)置對結(jié)果的可能影響,筆者將各大模型溫度設(shè)置為0,并按照前述研究設(shè)計(jì)重新收集數(shù)據(jù),再次對人類用戶回答和大模型生成內(nèi)容進(jìn)行比較分析。從結(jié)果來看,當(dāng)溫度設(shè)置為0時(shí),大語言模型生成內(nèi)容和人類用戶生成內(nèi)容之間的差異模式與圖3所示基本一致,與表3中關(guān)于語義分布重疊程度的實(shí)證結(jié)果也基本吻合。

六、結(jié)論與討論

人工智能在不同社會場景中的廣泛應(yīng)用對經(jīng)典社會化理論的解釋力提出了挑戰(zhàn)。本研究提出“人工智能社會化”這一視角,重點(diǎn)關(guān)注大語言模型作為符號學(xué)意義上的重要行動者,如何通過在不同場景中生成海量內(nèi)容,參與“知乎”平臺互動并沖擊平臺內(nèi)容生態(tài)。與傳統(tǒng)社會化理論強(qiáng)調(diào)個(gè)體學(xué)習(xí)相對固定的社會規(guī)范進(jìn)而實(shí)現(xiàn)社會融入不同,人工智能的社會化主要表現(xiàn)為以多場景內(nèi)容生成為核心的復(fù)雜符號參與機(jī)制。

從大語言模型在豐富社會場景中的內(nèi)容生成實(shí)踐來看,大語言模型并非功能固定、“未社會化”的技術(shù)客體,其輸出內(nèi)容在各類場景中均傾向于接近相對主流、具備一定共識的表達(dá)。就此而言,大語言模型可被視為數(shù)智時(shí)代高度社會化的準(zhǔn)社會主體。然而,區(qū)別于具有不同成長經(jīng)歷,在社會化過程中形成個(gè)體價(jià)值觀,進(jìn)而在網(wǎng)絡(luò)平臺中進(jìn)行討論和爭鳴的人類用戶,大語言模型作為準(zhǔn)社會主體在社會互動中存在精確性與機(jī)械性并存的特點(diǎn),其以權(quán)威和中立的姿態(tài),將用戶在“知乎”問題中豐富、多元的討論、思辨和爭議壓縮為相對單一視角的輸出結(jié)果。大語言模型雖然能精準(zhǔn)區(qū)分不同場景的差異,但在內(nèi)容生成過程中,卻會機(jī)械地強(qiáng)化性別、年齡等社會角色的刻板印象。

本文嘗試揭示,大語言模型的海量輸出結(jié)果如何在宏觀語義層面改變以“知乎”內(nèi)容為代表的社會符號系統(tǒng)的分布形態(tài),從而將“人工智能如何重塑人類社會”這一命題具體化為可觀測的社會與技術(shù)互動過程。從研究結(jié)果來看,盡管大語言模型可以靈活模擬不同社會角色并隨時(shí)切換視角,但其輸出結(jié)果傾向于再現(xiàn)主流表達(dá)而壓縮邊緣、多元或感性的視角。換言之,具備靈活模擬能力的大語言模型,反而可能導(dǎo)致社會符號系統(tǒng)的趨同化,削弱其豐富性和多樣性。值得注意的是,這種趨同化并非指向中立的語義中心,而是趨向于那些獲得點(diǎn)贊數(shù)量較多、較少帶有情緒色彩的回答。

上述發(fā)現(xiàn)表明,大語言模型作為準(zhǔn)社會主體可能會帶來深遠(yuǎn)的社會影響。其一,在大語言模型沖擊下,平臺內(nèi)容生態(tài)可能會迅速同質(zhì)化,語言和價(jià)值觀的多樣性進(jìn)而被削弱,這不僅可能會影響人類互動的豐富性,也可能會抑制群體層面的創(chuàng)新能力。其二,大語言模型作為準(zhǔn)社會主體對人類自主性有雙重影響:一方面,大語言模型在提升信息獲取效率、擴(kuò)展認(rèn)知邊界、促進(jìn)知識平權(quán)等方面具有積極作用;另一方面,當(dāng)人類過度依賴大模型完成信息搜索、生成等認(rèn)知任務(wù),從多元互動與深入分析轉(zhuǎn)向獲取單一視角的快捷回復(fù)時(shí),這可能會導(dǎo)致人類認(rèn)知能力逐漸退化,侵蝕人類自主性并加劇人工智能的可控性難題。其三,從知識生產(chǎn)角度看,當(dāng)前中文語料在規(guī)模等方面仍相對弱于英文,大語言模型傾向于強(qiáng)化主流內(nèi)容的生成機(jī)制可能會進(jìn)一步放大英文語料及相關(guān)視角的中心地位,壓制其他語言與文化視角的表達(dá)。因此,如何有效介入人工智能主導(dǎo)的知識生成和符號重組過程,已成為數(shù)智時(shí)代人工智能治理的重要議題。

不同于將大語言模型僅視為工具來評估其能力或缺陷的研究取向,人工智能社會化視角更關(guān)注大語言模型的生成性和實(shí)踐性,將其置于具體的互動場景和社會符號生成過程中加以考察(Brey,2005)。該視角揭示出,大語言模型并非被動應(yīng)答的技術(shù)工具,而是通過快速、跨場景的海量內(nèi)容生成,主動重塑社會符號系統(tǒng)的分布形態(tài),并深刻地影響人類獲取信息、生成內(nèi)容及參與互動的方式。因此,除關(guān)注模型輸出的正確性和偏向外,我們更應(yīng)持續(xù)追蹤不同大語言模型在海量社會場景中的互動實(shí)踐,從而深入地理解其對于人機(jī)互動模式、社會符號系統(tǒng)的動態(tài)塑造,以及對人類自主性的長遠(yuǎn)影響。

作為一項(xiàng)探索性研究,本文還存在若干可深化之處。首先,“知乎”平臺數(shù)據(jù)僅反映該平臺用戶群體的觀點(diǎn),與全體網(wǎng)民的觀點(diǎn)存在差異,未來研究可進(jìn)一步比較大語言模型與其他網(wǎng)民之間的內(nèi)容輸出差異。其次,可納入更多國內(nèi)外不同類型、不同版本的大語言模型,系統(tǒng)考察其在不同時(shí)間、參數(shù)設(shè)置下的內(nèi)容生成特征。最后,未來研究還可結(jié)合用戶在數(shù)字平臺的互動和行為反應(yīng)數(shù)據(jù),分析人類與機(jī)器生成內(nèi)容的互動,從而更全面地理解人工智能社會化的機(jī)制及潛在影響。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
為什么最后一批特赦國民黨戰(zhàn)犯時(shí),有13個(gè)人堅(jiān)決不能放出來?

為什么最后一批特赦國民黨戰(zhàn)犯時(shí),有13個(gè)人堅(jiān)決不能放出來?

賤議你讀史
2026-03-21 07:30:03
英超最新積分戰(zhàn)報(bào):熱刺慘遭絕平,切爾西0-1曼聯(lián),紐卡被絕殺

英超最新積分戰(zhàn)報(bào):熱刺慘遭絕平,切爾西0-1曼聯(lián),紐卡被絕殺

足球狗說
2026-04-19 05:15:52
快訊!伊朗大概率又要挨揍了!

快訊!伊朗大概率又要挨揍了!

達(dá)文西看世界
2026-04-19 09:06:22
Taylor Swift 霉霉在健身房,鍛煉健康體格

Taylor Swift 霉霉在健身房,鍛煉健康體格

下水道男孩
2026-04-11 23:22:29
被困霍爾木茲海峽的中國船已通知船員“做好走的準(zhǔn)備”

被困霍爾木茲海峽的中國船已通知船員“做好走的準(zhǔn)備”

魯中晨報(bào)
2026-04-18 12:08:04
1976年誰為周總理致悼詞?江青推薦一人,葉劍英搖頭拒絕:不合適

1976年誰為周總理致悼詞?江青推薦一人,葉劍英搖頭拒絕:不合適

雍親王府
2026-03-30 10:55:03
霍啟剛假期帶子女出游,才發(fā)現(xiàn)仨娃名字暗藏深意,字字都有來頭

霍啟剛假期帶子女出游,才發(fā)現(xiàn)仨娃名字暗藏深意,字字都有來頭

喜歡歷史的阿繁
2026-04-19 02:13:38
湖人3將身價(jià)暴漲!肯納德進(jìn)攻天賦盡顯,艾頓統(tǒng)治內(nèi)線,八村精準(zhǔn)

湖人3將身價(jià)暴漲!肯納德進(jìn)攻天賦盡顯,艾頓統(tǒng)治內(nèi)線,八村精準(zhǔn)

籃球資訊達(dá)人
2026-04-19 13:54:56
ASML總裁炮轟中國:若再繼續(xù)自主研究光刻機(jī),將會破壞全球產(chǎn)業(yè)鏈

ASML總裁炮轟中國:若再繼續(xù)自主研究光刻機(jī),將會破壞全球產(chǎn)業(yè)鏈

虎哥閑聊
2026-04-19 08:54:56
關(guān)曉彤最新代言視頻,穿安踏運(yùn)動套裝,穿搭一言難盡臉也腫的厲害

關(guān)曉彤最新代言視頻,穿安踏運(yùn)動套裝,穿搭一言難盡臉也腫的厲害

小徐講八卦
2026-04-16 06:24:29
車輛卸沙現(xiàn)場一男性尸體隨沙料傾瀉而出,僅露出褲腿和雙腳,官方公布事故調(diào)查報(bào)告:生產(chǎn)主管違規(guī)進(jìn)入鏟車作業(yè)區(qū)域,被連人帶沙鏟入斗中,大量沙土掩埋窒息身亡

車輛卸沙現(xiàn)場一男性尸體隨沙料傾瀉而出,僅露出褲腿和雙腳,官方公布事故調(diào)查報(bào)告:生產(chǎn)主管違規(guī)進(jìn)入鏟車作業(yè)區(qū)域,被連人帶沙鏟入斗中,大量沙土掩埋窒息身亡

觀威海
2026-04-19 15:24:03
日本軍艦闖臺海后,美國接到通知,中國東海劃5處警戒區(qū),有動作

日本軍艦闖臺海后,美國接到通知,中國東海劃5處警戒區(qū),有動作

肖茲探秘說
2026-04-19 16:35:16
侃爺夫婦:一個(gè)不穿鞋賣鞋,一個(gè)敢穿到出圈,畫風(fēng)絕了

侃爺夫婦:一個(gè)不穿鞋賣鞋,一個(gè)敢穿到出圈,畫風(fēng)絕了

述家娛記
2026-02-23 21:23:16
一戰(zhàn)定冠軍!決戰(zhàn)曼城前夕,阿爾特塔一句話點(diǎn)燃阿森納全員斗志

一戰(zhàn)定冠軍!決戰(zhàn)曼城前夕,阿爾特塔一句話點(diǎn)燃阿森納全員斗志

夜白侃球
2026-04-19 19:31:47
街拍實(shí)拍:淺藍(lán)緊身喇叭褲,美腿背后的“一線天”尷尬

街拍實(shí)拍:淺藍(lán)緊身喇叭褲,美腿背后的“一線天”尷尬

只要高興就好
2026-04-17 23:56:37
拼多多的傲慢,不是一天養(yǎng)成的

拼多多的傲慢,不是一天養(yǎng)成的

智趣財(cái)經(jīng)
2026-04-19 10:12:19
女人好色起來會有多恐怖?男人只能求饒

女人好色起來會有多恐怖?男人只能求饒

那年秋天
2026-04-12 18:30:03
特朗普稱美伊20日將在伊斯蘭堡舉行談判

特朗普稱美伊20日將在伊斯蘭堡舉行談判

財(cái)聯(lián)社
2026-04-19 20:21:04
旅行后,你對哪個(gè)城市祛魅了?網(wǎng)友:異域風(fēng)情哈爾濱

旅行后,你對哪個(gè)城市祛魅了?網(wǎng)友:異域風(fēng)情哈爾濱

夜深愛雜談
2026-04-17 17:29:36
意外!鄭州40歲女子患肝癌,臨終前懇求前夫接走女兒,前夫回復(fù)!

意外!鄭州40歲女子患肝癌,臨終前懇求前夫接走女兒,前夫回復(fù)!

青梅侃史啊
2026-04-17 19:48:25
2026-04-19 21:20:49
社會學(xué)研究雜志 incentive-icons
社會學(xué)研究雜志
《社會學(xué)研究》官方帳號
1100文章數(shù) 954關(guān)注度
往期回顧 全部

科技要聞

50分26秒破人類紀(jì)錄!300臺機(jī)器人狂飆半馬

頭條要聞

半年下沉22厘米 女子家中坐擁價(jià)值上億別墅卻沒法住人

頭條要聞

半年下沉22厘米 女子家中坐擁價(jià)值上億別墅卻沒法住人

體育要聞

湖人1比0火箭:老詹比烏度卡像教練

娛樂要聞

張?zhí)鞇墼u論區(qū)淪陷!被曝卷入小三風(fēng)波

財(cái)經(jīng)要聞

華誼兄弟,8年虧光85億

汽車要聞

29分鐘大定破萬 極氪8X為什么這么多人買?

態(tài)度原創(chuàng)

教育
時(shí)尚
家居
親子
旅游

教育要聞

高考綜合改革成績突出!綿陽5家單位、12名個(gè)人獲得表彰

裝修“精神角落”,就是這么上癮

家居要聞

法式線條 時(shí)光靜淌

親子要聞

也不曉得哪里學(xué)來的

旅游要聞

豐臺王佐這片花海,真的藏不住了!春天必沖的打卡地標(biāo)

無障礙瀏覽 進(jìn)入關(guān)懷版