網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

人工智能社會化：內(nèi)容生成與符號重塑

2026-04-13 18:29:35　來源: 社會學(xué)研究雜志

北京舉報

分享至

劉河慶

華中科技大學(xué)

社會學(xué)院

教授

人工智能社會化：內(nèi)容生成與符號重塑

來源 | 《社會學(xué)研究》2026年第2期

作者 | 劉河慶

責(zé)任編輯 |趙夢瑤

大語言模型作為準(zhǔn)社會主體融入社會生活，正在重塑社會互動模式與社會秩序。基于人工智能社會化視角，本研究使用四個大語言模型模擬不同角色對“知乎”平臺上的海量提問進行回答，進而對大語言模型的行為特征及其對內(nèi)容生態(tài)的沖擊等進行分析。研究發(fā)現(xiàn)，大語言模型在互動中兼具精確性與機械性：它們能靈活識別場景，但在輸出中會機械地強化性別、年齡等方面的角色刻板印象。同時，大語言模型生成的內(nèi)容語義高度集中，趨近于中立或高點贊的人類回答，進而可能引發(fā)社會符號系統(tǒng)的收縮和同質(zhì)化。研究人工智能參與社會互動及內(nèi)容生成的過程，為理解數(shù)智時代社會形態(tài)的變遷提供了重要視角。

一、引言

生成式人工智能的迅速崛起不僅標(biāo)志著一場技術(shù)革命，也是一個重要的社會和文化現(xiàn)象。以大語言模型為代表的生成式人工智能，憑借其對于多模態(tài)內(nèi)容的生成能力，正在重塑知識的生產(chǎn)和獲取方式，還展現(xiàn)出日益顯著的社會化潛能，這類模型以前所未有的方式滲透進人類社會生活（Gabriel,2020），逐漸超越單純工具的范疇，成為復(fù)雜場景中主動的互動參與者、意義構(gòu)建者乃至社會符號系統(tǒng)的形塑力量（Lotman,1990；Bisconti,2024），這一轉(zhuǎn)變對社會學(xué)傳統(tǒng)意義上的互動模式與社會化過程產(chǎn)生了深遠影響。

經(jīng)典社會化理論側(cè)重個體如何通過家庭、學(xué)校、同伴群體等社會化載體習(xí)得社會規(guī)范和價值觀念（米德，2018；Guhin et al.，2021），然而，以ChatGPT、DeepSeek為代表的大語言模型在海量場景中與人類開展互動、協(xié)作甚至競爭，對傳統(tǒng)社會化理論形成了挑戰(zhàn)。一方面，人工智能扮演著虛擬伴侶、內(nèi)容生產(chǎn)者等角色，逐漸成長為具備一定自主性和創(chuàng)造性的準(zhǔn)社會主體（伊德，2012；邱澤奇，2024a；Bisconti et al.，2024）；另一方面，作為社會文化技術(shù)（Farrell et al.，2025），大語言模型通過大規(guī)模內(nèi)容生成直接作用于人類的語言、認(rèn)知和價值體系，承擔(dān)起“智力物替”這一全新功能（王寧，2025），進而動搖了傳統(tǒng)社會化視角下相對靜態(tài)、固化的社會符號系統(tǒng)（Guhin et al.，2021）。在此背景下，系統(tǒng)分析人工智能如何在多元場景中承載不同社會角色，以及如何沖擊以平臺內(nèi)容生態(tài)為代表的社會符號系統(tǒng)，成為理解數(shù)智時代人工智能如何推動社會形態(tài)與社會秩序整體演變的關(guān)鍵所在。

相關(guān)研究的難點在于應(yīng)對人工智能所具有的高度實踐性和生成性。基于人類已有書面知識訓(xùn)練而成的大語言模型能夠?qū)W習(xí)專業(yè)知識、互動規(guī)則和價值偏好，進而根據(jù)用戶的不同需求生成海量內(nèi)容（這些內(nèi)容出現(xiàn)在論文、政策報告、短視頻等諸多載體中）。首先，這體現(xiàn)了人工智能的高度實踐性，即與已有文獻中技術(shù)作為相對固定工具的角色（芬伯格，2005；Matthewman,2017）不同，人工智能已廣泛融入人類社會生活與專業(yè)領(lǐng)域（邱澤奇，2024a；王寧，2025），在社會互動中表現(xiàn)出高度的情境適應(yīng)性和角色轉(zhuǎn)換能力，能夠應(yīng)對多樣乃至沖突的社會需求，并在與人類互動過程中動態(tài)調(diào)整自身的角色、偏好乃至價值觀。其次，大語言模型的內(nèi)容生成能力，特別是對觀念、偏好的生成能力，打破了經(jīng)典社會化理論中相對清晰的宏微觀界限（個體通過社會化機構(gòu)學(xué)習(xí)相對固定的社會規(guī)范和價值觀）。大語言模型在社會互動中生成的海量內(nèi)容不僅直接沖擊平臺現(xiàn)有的內(nèi)容生態(tài)，也通過模型迭代持續(xù)影響后續(xù)的人機互動。上述大語言模型在不同場景、時間與提示條件下所呈現(xiàn)的復(fù)雜行為差異及其生成能力，直接挑戰(zhàn)了將人工智能技術(shù)僅視為工具或客體，進而探討用戶接受度或社會后果等的傳統(tǒng)分析路徑。

因此，要考察大語言模型在數(shù)智時代的具體角色，必須超越僅將其視為工具并進行“技術(shù)能力評估”的分析框架，轉(zhuǎn)而關(guān)注其作為符號學(xué)意義上的行動者，如何在復(fù)雜社會場景中參與內(nèi)容生產(chǎn)與觀念輸出。本文提出“人工智能社會化”視角，將大語言模型視為具有一定自主性與創(chuàng)造性的“準(zhǔn)社會主體”，聚焦其最突出的內(nèi)容生成能力，試圖回答以下問題。第一，大語言模型在不同場景中生成的內(nèi)容，與人類用戶基于不同經(jīng)歷和傾向所產(chǎn)生的內(nèi)容有何異同？其內(nèi)容輸出是否會強化某些特定內(nèi)容或視角？這些異同反映了大語言模型對既有語言特征、偏好乃至社會規(guī)范的什么學(xué)習(xí)模式？第二，大語言模型在模擬不同社會角色時生成的內(nèi)容存在何種差異，這體現(xiàn)了它對不同社會角色怎樣的理解？第三，大語言模型在短時間內(nèi)生成的海量內(nèi)容的語義分布與人類用戶在長期復(fù)雜互動中生成內(nèi)容的語義分布有何不同？這些生成內(nèi)容如何影響平臺內(nèi)容生態(tài)？為回答上述問題，本研究采用計算實驗方法，使用四個國內(nèi)外大語言模型（DeepSeek、ChatGPT、Qwen、豆包）模擬不同社會角色對“知乎”平臺上30余萬個提問進行回答，并與原有人類用戶的回答進行比較，以探索大語言模型生成內(nèi)容的場景化特征。同時，通過考察人工智能生成內(nèi)容與用戶生成內(nèi)容在語義分布上的差異，本研究將進一步探討大語言模型的海量內(nèi)容生成能力對社會符號系統(tǒng)的潛在影響。

二、文獻述評

（一）人工智能作為準(zhǔn)社會主體

技術(shù)與社會的關(guān)系，尤其是技術(shù)發(fā)展與社會結(jié)構(gòu)、社會觀念之間的復(fù)雜互動一直是社會學(xué)的核心議題（芬伯格，2005；Matthewman,2017）。在該領(lǐng)域的長期研究中，一個關(guān)鍵難題在于如何理解技術(shù)自身的高度變動性與復(fù)雜性。技術(shù)往往處于持續(xù)演進的狀態(tài)，且其用途和意義具有多重可能性（Matthewman,2017）。基于技術(shù)決定論和社會建構(gòu)論視角的研究大多仍從技術(shù)的工具屬性出發(fā)，探討技術(shù)如何“增強”社會或社會如何形塑技術(shù)（芬伯格，2005）。而有關(guān)技術(shù)社會化的文獻則側(cè)重于技術(shù)在社會中被接受并擴散的過程（陳凡，1992）。這些視角因?qū)⒓夹g(shù)視為相對固定的工具或客體，難以充分解釋技術(shù)與社會之間動態(tài)交織的復(fù)雜關(guān)系。后續(xù)研究開始倡導(dǎo)一種“分散的能動性”，強調(diào)人類和技術(shù)都具有主體性和能動性（伊德，2012；拉圖爾，2022）。例如伊德（Don Ihde）指出，在人類與技術(shù)互動的體驗的過程中存在他異性關(guān)系（alterity relations），技術(shù)在此關(guān)系中表現(xiàn)出一定的獨立性與互動性，成為“準(zhǔn)他者”（伊德，2012）。數(shù)智時代人工智能在各社會領(lǐng)域的廣泛應(yīng)用進一步印證了同時關(guān)注人類和技術(shù)能動性的必要性。有研究提出，隨著人工智能技術(shù)深度融入社會，傳統(tǒng)的人類中心主義視角需要被重新審視，人工智能不再只是工具，而是具備一定自主性和適應(yīng)性的“準(zhǔn)社會主體”，能夠在社會中承擔(dān)重要角色（Bisconti et al.，2024）。

因此，探究人工智能扮演何種社會角色，其作為“準(zhǔn)社會主體”具有哪些特征，已成為理解數(shù)智時代技術(shù)與社會關(guān)系，乃至思考“數(shù)智社會可以可能”的關(guān)鍵（西蒙東，2024）。事實上，使人工智能具備參與社會互動的能力，特別是擁有足夠的社會智能，一直是該領(lǐng)域發(fā)展的重要目標(biāo)（Suchman,2007；Bates，2024）。研究者將社會智能定義為“人工智能根據(jù)人類的標(biāo)準(zhǔn)對外在刺激和社會場景的要求作出自動化響應(yīng)”，并已在此方向展開諸多探索（Fogg,1998；Bates，2024）。例如，福格（Brian J. Fogg）關(guān)注計算機的說服能力，認(rèn)為作為社會行動者的計算機可通過建立社會規(guī)范、提供社會支持等方式影響人類態(tài)度（Fogg,1998）。然而，計算機科學(xué)對社會智能的追求在很長時期內(nèi)未達預(yù)期，一個重要原因在于傳統(tǒng)機器學(xué)習(xí)依賴于編碼和明確的規(guī)則，而現(xiàn)實中大量的社會場景運行于隱性知識與非明文的規(guī)則之上（史密斯，2022），這使得只依靠固定、明確規(guī)則的計算機難以實現(xiàn)真正意義上的社會智能。

以大語言模型為代表的生成式人工智能的迅速崛起和廣泛應(yīng)用，大大推進了人工智能的社會化進程及其社會智能的實現(xiàn)。ChatGPT、DeepSeek等大語言模型通常具備數(shù)十億參數(shù)，其訓(xùn)練數(shù)據(jù)覆蓋了人類已記錄知識的絕大部分。除了數(shù)據(jù)規(guī)模龐大以外，這類模型在獲取人類隱性知識和規(guī)則方面尤其有效，它們通過學(xué)習(xí)示例，在無明確指令的情況下習(xí)得和掌握未被預(yù)先設(shè)計的能力（Autor,2024）。這種脫離固定腳本和顯性規(guī)則、依賴訓(xùn)練數(shù)據(jù)即時決策和互動的能力，使大語言模型能夠廣泛融入各類社會場景，承擔(dān)如虛擬伴侶等多種社會角色（邱澤奇，2024b）。

盡管大語言模型有潛力成為廣泛存在于社會中的準(zhǔn)社會主體，但其與具有特定成長經(jīng)歷、相對穩(wěn)定的價值觀、個性、知識和能力的人類個體存在本質(zhì)差異（米德，2018）。大語言模型并未經(jīng)歷人類成長過程中的“場景嵌入”，而是通過學(xué)習(xí)海量文本、圖像等人類知識，融合各類價值觀、知識及能力，從而表現(xiàn)出高度依賴上下文的價值觀和人格特征。根據(jù)不同的提示詞，它可以模擬多種角色，表達并迅速切換不同的價值觀（Collins，2025）。這意味著，生成式人工智能并不具備人類主體那樣相對穩(wěn)定的偏好（Guhin et al.，2021），也不存在戈夫曼（Erving Goffman）所論述的“前臺”“后臺”的切換和張力（戈夫曼，2008），而是在海量社會互動中，高度依賴即時語境輸出相應(yīng)的價值觀（Li et al.，2024）。值得注意的是，盡管大語言模型可以表達并快速轉(zhuǎn)換多種視角，但與數(shù)字平臺上用戶開放式的表達和討論不同，它往往以某種權(quán)威姿態(tài)將多元視角壓縮為單一視角參與社會互動（胡安寧、周森，2024；Collins，2025）。因此，探究以下問題至關(guān)重要：大語言模型在不同場景中輸出何種內(nèi)容和視角？哪些視角或觀念更容易被激活并輸出，哪些則容易被抑制或忽略？模型在模擬不同社會角色時所輸出的內(nèi)容有何差異？回答這些問題是理解大語言模型如何在多樣場景中進行互動并生成內(nèi)容的關(guān)鍵。

綜上所述，大語言模型在不同社會場景中生成內(nèi)容與價值偏好的能力，使其日益成為數(shù)智社會中不可忽視的準(zhǔn)社會主體。面對快速迭代、種類眾多，以及與海量用戶高頻互動生成巨量內(nèi)容的大語言模型，我們可從以下幾個方面深化對大語言模型作為準(zhǔn)社會主體的認(rèn)識。第一，在研究視角上，相較于從擬人化的視角關(guān)注大語言模型“知道什么”，更應(yīng)關(guān)注其在符號學(xué)意義上的行動能力（Picca,2025）。大語言模型的社會化能力，關(guān)鍵不在于是否擁有意識或意圖，而在于其作為社會符號系統(tǒng)中的動態(tài)操作者，能夠通過海量內(nèi)容輸出影響甚至塑造價值觀的信息。換言之，大語言模型自身雖然不會思考，卻持續(xù)通過內(nèi)容輸出影響人類的思考過程。第二，已有研究多基于實驗室環(huán)境或理想化數(shù)據(jù)集分析生成式人工智能在預(yù)設(shè)場景中的表現(xiàn)（Li et al.，2024），而讓模型參與真實社會場景中的觀點表達等任務(wù)，并將其輸出結(jié)果與人類生成內(nèi)容進行對比，更有助于揭示其在現(xiàn)實互動中的行為特征。第三，由于大語言模型的價值觀和人格特征高度依賴上下文，我們不應(yīng)將其視作固定統(tǒng)一的整體，而應(yīng)考察其在模擬不同社會角色時的具體生成特征，進而檢驗?zāi)Ｐ蛯Σ煌鐣巧睦斫獬潭取？傊挥凶尨笳Z言模型以各種社會角色與真實社會場景相遇，才能在理論構(gòu)想“大語言模型應(yīng)做什么”的基礎(chǔ)上，系統(tǒng)考察實踐中“不同模型實際生成什么”，進而深化對人工智能社會化進程的理解。

（二）人工智能如何影響社會符號系統(tǒng)

在將人工智能視為準(zhǔn)社會主體、探討其如何在具體場景中參與社會互動的同時，我們也需將其置于更廣闊的社會符號系統(tǒng)重組進程中，從宏觀層面考察具有海量內(nèi)容生成能力的大語言模型對既有社會符號系統(tǒng)的潛在沖擊。單個大語言模型在具體互動場景中快速生成的內(nèi)容看似隨機，但這些內(nèi)容匯聚后可能呈現(xiàn)某種特定的偏好結(jié)構(gòu)，進而形成新的話語結(jié)構(gòu)與觀念體系，并沖擊已有內(nèi)容。與此同時，大語言模型生成的海量內(nèi)容又能以訓(xùn)練語料等形式迅速反饋至后續(xù)場景，從而影響微觀層面的具體互動。這種宏觀與微觀之間的循環(huán)互構(gòu)關(guān)系意味著，我們需要同時從兩個層面進行分析和比較，方能更深入地把握人工智能社會化的實質(zhì)。

在對經(jīng)典社會化理論的反思中，一個關(guān)鍵批評指向其對個體社會化過程的理解：個體在社會化中所學(xué)習(xí)和適應(yīng)的并非靜態(tài)的社會規(guī)范和價值觀（Guhin et al.，2021），而是一個由語言、符號、行為與規(guī)范等多種資源構(gòu)成的高度復(fù)雜的社會符號系統(tǒng)。這一系統(tǒng)在社會成員的持續(xù)互動和歷史變遷中不斷重組和更新（Swidler,1986；Lotman,1990；Gelfand et al.，2024）。以數(shù)字平臺的興起為例，平臺內(nèi)部復(fù)雜多變的話語風(fēng)格、價值取向與行為規(guī)范已成為顯性且可觀測的社會符號系統(tǒng)。當(dāng)數(shù)字平臺逐漸成為社會符號系統(tǒng)的重要生成空間時，符號生產(chǎn)的主體也從專家轉(zhuǎn)變?yōu)閺V大普通用戶（趙一璋、王明玉，2023；張茂元、邱澤奇，2024），算法則成為影響內(nèi)容生產(chǎn)的關(guān)鍵機制，原本相對穩(wěn)定的社會符號系統(tǒng)因此變得更加碎片化和動態(tài)化（喬天宇、向靜林，2022；劉河慶、梁玉成，2023）。數(shù)字平臺不僅帶來了社會符號數(shù)量的增加，也引發(fā)了話語意義維度的變化。例如，貝爾（Christopher A. Bail）等人引入“理性—感性”分析框架，發(fā)現(xiàn)數(shù)字平臺上公開的討論并未如哈貝馬斯（Jürgen Habermas）所預(yù)期的那樣推動理性話語數(shù)量的增長，反而促使感性話語數(shù)量的明顯增加（Bail et al.，2017）。這些在數(shù)字平臺中不斷生成的話語風(fēng)格、價值傾向以及行為規(guī)范，已然成為數(shù)智時代重要的社會化環(huán)境（Gelfand et al.，2024；Tsvetkova et al.，2024），個體在此環(huán)境中持續(xù)創(chuàng)造并適應(yīng)不斷迭代的符號系統(tǒng)，從而在虛擬層面不斷進行著社會化的過程。

大語言模型具有加速數(shù)字平臺中的話語風(fēng)格、價值觀以及行為規(guī)范等社會符號系統(tǒng)演化的潛力（Gelfand et al.，2024；Floridi,2024）。生成式人工智能極大提升了內(nèi)容生產(chǎn)效率，能夠快速生成海量語義制品（馬文、陳云松，2024；Floridi,2024；Farrell et al.，2025），成為數(shù)智時代重要的“意義制造者”。關(guān)于大語言模型如何具體沖擊以平臺內(nèi)容為代表的社會符號系統(tǒng)，已有研究從生成內(nèi)容的語言特征、潛在社會偏見、多樣性程度等多方面進行了考察（周旅軍、呂鵬，2024）。有研究發(fā)現(xiàn)，與人類文本相比，大語言模型表現(xiàn)出與之相似甚至更強的社會偏見（Pawar et al.，2024）。也有研究認(rèn)為，需要重視大語言模型生成價值觀的復(fù)雜性，其高度靈活的視角輸出使其常常成為不同價值觀相互競爭的隱蔽場所（Bisconti et al.，2024；Collins,2025）。近期的研究開始將大語言模型生成內(nèi)容與人類生成內(nèi)容進行多維度綜合比較（龔為綱、黃思源，2025；胡安寧，2025；王元超等，2025），尤其關(guān)注大語言模型如何選擇性再現(xiàn)不同社會主體的觀點和語言風(fēng)格。例如，胡安寧（2025）指出，大語言模型在輸出時面臨“正確”與“多樣”的兩難：大語言模型通過學(xué)習(xí)海量資料輸出的結(jié)果看似最優(yōu)，實際上可能僅代表特定人群的觀點。還有研究則發(fā)現(xiàn)，大語言模型能夠再現(xiàn)不同社會群體的視角和語言風(fēng)格，但仍面臨輸出偏見、同質(zhì)性強、內(nèi)容虛化等問題（Kozlowski & Evans,2025）。

總之，已有文獻關(guān)注到大語言模型的內(nèi)容生成能力對社會符號系統(tǒng)的沖擊，但受分析視角和研究設(shè)計所限，仍留下了若干尚未得到系統(tǒng)回答的重要問題。例如，盡管大語言模型本身高度靈活且可快速模擬不同角色和視角生成內(nèi)容，但其輸出結(jié)果能否反映人類觀點的真實分布，是否會系統(tǒng)性強化某些視角并壓縮其他內(nèi)容？從分析視角看，已有研究多從能力評估角度分析大語言模型存在的不足（Li et al.，2024；Messeri & Crockett,2024；Sourati et al.，2025）。本文認(rèn)為，除了評估單個模型輸出內(nèi)容的正確性和局限性外，我們更應(yīng)關(guān)注大語言模型作為宏觀內(nèi)容生態(tài)塑造者的角色，考察其如何通過海量內(nèi)容輸出影響符號系統(tǒng)。在研究設(shè)計方面，現(xiàn)有研究多基于實驗室環(huán)境或理想化數(shù)據(jù)集（Pawar et al.，2024），且往往缺少對大語言模型生成內(nèi)容與人類真實觀點的比較。因此，深入理解大語言模型對社會符號系統(tǒng)的潛在沖擊，需要以人類用戶基于自身經(jīng)驗和社會場景所形成的多樣化回答為參照，探究大語言模型作為準(zhǔn)社會主體如何在多元社會場景中快速生成內(nèi)容，進而重塑社會符號系統(tǒng)（Farrell et al.，2025）。

綜上，本文嘗試提出“人工智能社會化”的視角，聚焦大語言模型最為突出的內(nèi)容生成能力，通過構(gòu)建不同模型在海量社會場景中的回答數(shù)據(jù)，挖掘其多維度語義特征，并將其與人類用戶的回答進行系統(tǒng)比較。本研究旨在從微觀層面分析不同大語言模型在模擬各類社會角色、應(yīng)對多元社會場景時的內(nèi)容生成特征，同時在宏觀層面探討大語言模型的興起對數(shù)字平臺整體內(nèi)容生態(tài)的潛在影響。

三、研究設(shè)計

（一）數(shù)據(jù)收集和處理

為了分析大語言模型在不同社會場景中的內(nèi)容生成行為及其對平臺內(nèi)容生態(tài)的潛在影響，首先需構(gòu)建接近真實的社會場景并獲取可供對比的人類生成內(nèi)容。

為此，本研究選取“知乎”問答平臺構(gòu)建研究場景和數(shù)據(jù)來源。“知乎”作為一個廣受歡迎的問答平臺，匯集了大量用戶在科學(xué)技術(shù)、人際關(guān)系等多元話題下的真實互動，能較全面地反映不同場景中用戶的具體回答和潛在偏好。這為本文提供了相對自然和真實的、長時段的數(shù)字平臺內(nèi)容生產(chǎn)和用戶互動場景，契合本文的研究目的。

在“知乎”平臺上，每個問題附有多個標(biāo)簽以標(biāo)明所屬領(lǐng)域。為確保問題樣本的覆蓋面，在數(shù)據(jù)收集過程中，筆者首先通過“知乎”的話題樹功能獲取盡可能廣泛的種子話題（涵蓋社會、科技等領(lǐng)域），并采集各話題下的問題及其所有回答。隨后，本研究以第一輪收集到的回答者為節(jié)點，進一步爬取其關(guān)注和回答的所有問題及相關(guān)回答，最終獲取了約1200萬條以“社會”“科技”“家庭”“文化”等為標(biāo)簽的問題（時間跨度為2011—2022年）。為提高問答數(shù)據(jù)的質(zhì)量，本研究篩選了回答數(shù)不少于10個的提問作為初始數(shù)據(jù)，并利用基于雙向編碼表示（Bidirectional Encoder Representations from Transformers，簡稱BERT）模型的主題模型（BERTopic）對這些問題進行議題分類。在此基礎(chǔ)上，本研究剔除了事實類、技能操作類、概念解釋類、娛樂類等較少涉及觀點表達的問題，重點保留了觀點評價類（如對特定現(xiàn)象或事件的看法）提問，去除重復(fù)問題后共得到301459個有效提問，并收集了相關(guān)提問者、提問時間、問題關(guān)注度、每個提問下點贊量前十的用戶回答及其點贊量等信息，從而構(gòu)建了覆蓋多場景的“知乎”平臺問答互動數(shù)據(jù)庫。

基于上述30余萬條問題，筆者進一步選取ChatGPT、DeepSeek、Qwen、豆包等四個國內(nèi)外的代表性大語言模型，調(diào)用其應(yīng)用程序接口，將問題輸入并獲取各模型對應(yīng)的回答。此外，本研究還設(shè)定了性別（男/女）、年齡（青年/老年）、回答風(fēng)格（理性/感性）三個社會角色維度來引導(dǎo)各模型在生成回答時模擬不同角色。每個“知乎”問題最終對應(yīng)生成32條不同角色條件下的模型回答。通過上述流程，本研究共收集了來自四個大語言模型、模擬八種具體身份、針對30余萬條問題的964余萬條回答大數(shù)據(jù)。

（二）測量

1.因變量

本研究致力于考察大語言模型與“知乎”用戶在不同場景中內(nèi)容生成模式的差異，而準(zhǔn)確測量二者生成內(nèi)容的特征和差異是推進本研究的關(guān)鍵。已有研究主要基于毒性評分（Toxicity Score）（Pawar et al.，2024）等指標(biāo)來評估大語言模型輸出內(nèi)容的語義特征。上述指標(biāo)雖有助于識別內(nèi)容中明顯有害的表達，但對于更普遍、無明顯錯誤卻蘊含特定偏好與價值判斷的內(nèi)容，其測度能力有限。為彌補這一不足，本研究嘗試同時構(gòu)建兩個維度的測量：一是大語言模型回答與人類用戶回答的內(nèi)容相似度，二是大語言模型回答在理性—感性軸上的偏向程度。通過這種方式，本研究力求更系統(tǒng)地考察不同大語言模型在多樣化場景中內(nèi)容生成的具體特征。

具體而言，本研究使用BERT模型對301459個提問中的人類回答及大語言模型生成回答進行文本嵌入，將結(jié)果映射到統(tǒng)一的語義向量空間，從而使兩類回答處于可比較的語義環(huán)境中。以“知乎”問題中的人類用戶回答為基準(zhǔn)，本研究計算其與對應(yīng)各人工智能回答的余弦相似度，進而在問題層面上構(gòu)建每個問題中人工智能回答與人類用戶回答的內(nèi)容相似度指標(biāo)。

本文聚焦于理性—感性維度，分析大語言模型與人類用戶在內(nèi)容生成中的理性—感性偏向。具體而言，筆者基于框架軸（FrameAxis）模型，利用一組具有方向性的理性和感性種子詞對，構(gòu)建一個指向性語義空間，在此空間中，每個人類回答與人工智能回答均可獲得在理性—感性軸上的語義位置。本研究通過計算每個回答在該軸上的得分，生成“理性—感性偏向”變量，得分越高，表明回答的理性程度越高。

2.主要解釋變量

本研究的主要解釋變量為“知乎”問題所屬的場景，即問題討論的主要領(lǐng)域。為識別不同問題涉及的場景，筆者使用BERTopic模型對30余萬條問題文本進行主題歸類，并對模型輸出結(jié)果進行合并，最終識別出以下五類主要討論領(lǐng)域：文化場景，涵蓋教育、藝術(shù)、科技、知識生產(chǎn)等相關(guān)議題的問題數(shù)量占比28.53%；政治場景，主要涉及國際關(guān)系、公共政策等議題的問題數(shù)量占比11.67%；經(jīng)濟場景，主要包括職業(yè)評價、消費行為等相關(guān)討論的問題數(shù)量占比15.95%；社會生活場景，涉及婚姻家庭、性別角色、代際差異等議題的問題數(shù)量占比39.82%；其他未能明確歸入以上類別的問題數(shù)量占比4.03%。

此外，本研究同時關(guān)注大模型類別及其模擬的不同社會角色對內(nèi)容生成的影響。模型類別指研究所使用的大語言模型，包括ChatGPT、DeepSeek、Qwen、豆包共四款國內(nèi)外代表性模型。大語言模型模擬的不同社會角色變量則是分析模型對社會角色的理解以及模型行為特征和社會化模式的關(guān)鍵變量。在研究中，筆者通過提示詞設(shè)定，引導(dǎo)各模型基于性別（男/女）、年齡（青年/老年）、回答風(fēng)格（理性/感性）三類社會維度生成回答。據(jù)此，每個語言大模型共模擬8種具體身份角色進行回答。基于此流程，本研究構(gòu)建了以下分類變量：大語言模型具體類別、模擬性別群體、模擬年齡群體以及模擬回答風(fēng)格。

3.控制變量

控制變量包括“知乎”問題的提問年份、問題長度、問題關(guān)注量、問題網(wǎng)友回答的平均點贊量以及問題網(wǎng)友回答的平均理性程度。問題提問年份為分類變量，時間跨度為2011—2022年。問題長度取“知乎”問題文本長度的對數(shù)值。問題關(guān)注量取平臺上該問題被網(wǎng)友關(guān)注數(shù)量的對數(shù)值。問題網(wǎng)友回答的平均點贊量為每個問題下點贊量最高的前十條網(wǎng)友回答的點贊數(shù)均值，并取對數(shù)值。問題網(wǎng)友回答的平均理性程度為每個問題下點贊量最高的前十條網(wǎng)友回答的理性得分均值。

（三）分析方法

在微觀層面，本文關(guān)注人工智能作為“準(zhǔn)社會主體”在不同社會場景下生成的內(nèi)容與人類用戶生成內(nèi)容之間的總體相似度，以及大語言模型生成內(nèi)容在理性—感性維度上的取值，二者均為連續(xù)變量。針對這兩個指標(biāo)，本文采用多元線性回歸模型進行分析（使用穩(wěn)健標(biāo)準(zhǔn)誤）。

在宏觀層面，筆者首先使用BERT模型對所有收集到的人類用戶回答和不同大模型生成的回答進行編碼，提取每個回答的高維語義向量；筆者隨后將所有回答投射至同一嵌入空間，通過比較人類回答與不同大語言模型回答在語義空間中的語義分布特征，探討人工智能的海量內(nèi)容生成能力對已有平臺內(nèi)容生態(tài)的潛在影響。

四、大語言模型模擬不同角色在不同場景中的生成內(nèi)容特征

（一）大模型與人類用戶回答總體相似度分析

本節(jié)首先分析不同角色設(shè)定下的大語言模型在面對海量“知乎”問題時，其生成回答與人類用戶回答的相似度。表1的基礎(chǔ)模型結(jié)果顯示，問題回答的平均點贊量、問題長度及問題關(guān)注量系數(shù)均顯著為正，表明網(wǎng)友回答越受歡迎、問題越具體或問題關(guān)注度越高，大語言模型生成回答與網(wǎng)友回答的相似度也越高。此外，問題提問時間的結(jié)果表明，以2017年左右為界，對于2017年之前年份的問題，大語言模型生成的回答與已有網(wǎng)友回答相似度較低；而對于2017年之后新提出的問題，大語言模型生成的回答與已有網(wǎng)友回答的相似度則相對較高。

表1中的問題場景模型進一步檢驗了不同問題涉及的社會場景的影響，這一維度在已有文獻中較少被關(guān)注。結(jié)果顯示，當(dāng)“知乎”問題涉及經(jīng)濟場景時，大語言模型對該類問題的回答與人類用戶回答的相似度明顯高于其他三類場景（文化、政治、社會）。相對而言，大語言模型在政治場景和社會場景中生成的回答與人類回答的相似度則明顯較低。

表1還重點考察了不同大語言模型及其模擬角色對內(nèi)容生成的影響。從各模型的表現(xiàn)差異來看，豆包大模型與“知乎”用戶回答內(nèi)容的相似度最高，DeepSeek和ChatGPT模型次之，Qwen模型與用戶回答的內(nèi)容相似度相對最低。這一結(jié)果反映出不同大語言模型在多樣場景中的適應(yīng)性差異。鑒于“知乎”作為大眾化問答平臺的屬性，更側(cè)重于日常對話互動與創(chuàng)作的豆包大模型的生成內(nèi)容與用戶回答更為接近。

此外，表1考察了大語言模型模擬不同角色時的內(nèi)容生成差異。結(jié)果顯示，與模擬女性角色相比，當(dāng)大語言模型模擬男性角色時，其生成內(nèi)容與“知乎”用戶回答的相似度更高；與模擬老年群體相比，模擬青年時的相似度更高；與感性風(fēng)格相比，模擬理性風(fēng)格時的相似度更高。

為深入探究不同大語言模型及其模擬的社會角色在不同問題場景下的回答模式，筆者在表1全模型的基礎(chǔ)上，分別加入以下四個交互項：大語言模型類別與問題場景、模擬性別與問題場景、模擬年齡與問題場景、模擬回答風(fēng)格與問題場景。圖1通過四個子圖分別展示了上述交互項對總體內(nèi)容相似度的邊際效應(yīng)。結(jié)果顯示，無論是不同大語言模型，還是不同大語言模型模擬的角色，其表現(xiàn)均呈現(xiàn)精確性與機械性并存的特征。一方面，不同大語言模型及其模擬的角色能夠較為精確地區(qū)分不同問題場景。如圖1所示，不論是模型類別差異，還是其模擬的三類角色，大語言模型在經(jīng)濟場景中生成的內(nèi)容與人類用戶回答相似度最高，而在政治和社會場景中相似度較低，表明大語言模型能夠區(qū)分不同場景的差異和特性。另一方面，大語言模型在理解社會角色時表現(xiàn)出明顯的機械性。以模擬性別為例，在四種不同問題場景中，大語言模型模擬男性角色時生成的內(nèi)容與人類用戶回答的相似度均高于女性角色。簡言之，大語言模型對不同問題場景展現(xiàn)出較強的區(qū)分能力，但在模擬不同社會角色時，卻呈現(xiàn)明顯的模式化傾向。

上述結(jié)果初步揭示了大語言模型在內(nèi)容生成方面的基本特征。正如已有文獻指出，大語言模型的一個重要優(yōu)化目標(biāo)是生成準(zhǔn)確且符合主流價值觀的回答（Li et al.，2024），即兼顧輸出內(nèi)容的準(zhǔn)確性和多場景的適應(yīng)性。從這一角度來看，大語言模型的確表現(xiàn)出較強的社會化能力，能夠生成較為貼合不同場景的內(nèi)容。然而，當(dāng)要求大語言模型模擬不同性別、年齡群體或輸出風(fēng)格時，其生成內(nèi)容卻表現(xiàn)出高度一致且相對刻板的特征，不同角色之間的輸出結(jié)果差異展現(xiàn)出一種“機器制造”般的精準(zhǔn)分化。需要說明的是，上述結(jié)果僅為對大語言模型生成內(nèi)容模式的初步測量，總體相似度的高低既受大語言模型自身生成特征的影響，也取決于“知乎”用戶回答的構(gòu)成。因此，下文將聚焦感性—理性這一具體維度進一步探討大語言模型的內(nèi)容生成模式。

（二）大語言模型回答中的理性—感性偏向分析

本小節(jié)進一步聚焦于理性—感性維度，考察不同大語言模型生成回答在理性程度上的偏向。與表1類似，表2的基礎(chǔ)模型首先分析了控制變量對大語言模型生成內(nèi)容理性程度的影響。結(jié)果顯示，若一個問題下網(wǎng)友回答的平均點贊量較高，則大語言模型對該問題的回答理性程度相對較低；若一個問題下網(wǎng)友回答的理性程度均值較高，大語言模型生成回答的理性程度也相應(yīng)較高。此外，問題受關(guān)注程度越高或問題內(nèi)容越具體，大語言模型回答的理性程度越高。提問年份變量的影響表明，大語言模型對年份較近問題回答的理性程度有所下降。

表2中的問題場景模型進一步考察了問題場景對大語言模型回答理性程度的影響。結(jié)果顯示，大語言模型對經(jīng)濟場景問題的回答理性程度最高，政治場景次之，社會場景較低，文化場景則最低。

表2同時分析了不同大語言模型及模擬角色對理性程度的影響。從模型類別來看，Qwen大模型生成回答的理性程度最高，ChatGPT次之，DeepSeek再次之，豆包大模型生成回答的理性程度相對最低。

在不同角色設(shè)定方面，相較于模擬女性角色，大語言模型在模擬男性角色時生成回答的理性程度更高。相較于模擬老年群體，大語言模型在模擬青年群體時生成回答的理性程度更高。相較于感性風(fēng)格，大語言模型在模擬理性風(fēng)格時生成回答的理性程度更高。不同風(fēng)格之間理性程度的巨大差異，既體現(xiàn)了理性—感性維度測量指標(biāo)的有效性，也再次印證了大語言模型在內(nèi)容生成中表現(xiàn)出的精確性。

與上一節(jié)類似，筆者在表2全模型的基礎(chǔ)上，分別加入大語言模型類別與問題場景、模擬性別與問題場景、模擬年齡群體與問題場景、模擬回答風(fēng)格與問題場景四個交互項。圖2通過四個子圖展示了上述交互項對大語言模型生成回答在理性—感性維度上偏向的邊際效應(yīng)。

圖2顯示，當(dāng)聚焦于理性—感性偏向時，大語言模型的輸出結(jié)果同樣呈現(xiàn)精確性與機械性并存的特征。一方面，大語言模型能夠根據(jù)不同場景與角色精準(zhǔn)調(diào)整其價值傾向，如幾乎所有模型及其模擬的不同角色，均在經(jīng)濟場景表現(xiàn)出最高的理性程度；另一方面，在模擬性別、年齡等社會角色時，大語言模型展現(xiàn)出連貫且穩(wěn)定的刻板印象，即在所有場景中，模擬男性與青年角色生成的內(nèi)容更為理性，而模擬女性與老年角色生成的內(nèi)容更為感性。這種對群體的機械理解或刻板印象，并非偶然產(chǎn)生，而是大語言模型在學(xué)習(xí)人類語料過程中對既有社會偏見的精準(zhǔn)復(fù)現(xiàn)和再生產(chǎn)。大語言模型的這一內(nèi)容生產(chǎn)特征引發(fā)了如下隱憂：不同于日常社會互動中碎片化、偶發(fā)式的刻板表達，本文實證結(jié)果表明，大語言模型對不同社會角色的刻板理解具有穩(wěn)定性與精準(zhǔn)性。作為具有海量內(nèi)容生產(chǎn)能力的準(zhǔn)社會主體，大語言模型這種連貫且精確的內(nèi)容輸出，可能在公共討論場域持續(xù)強化不同社會角色間的刻板印象。同時，這些生成內(nèi)容可能成為后續(xù)大語言模型迭代的訓(xùn)練語料，形成自我強化的反饋循環(huán)，進一步固化偏見。

與個體在家庭、學(xué)校以及社會中逐步展開的社會化過程不同，大語言模型并不具備個體成長過程中持續(xù)的情境參與能力。它通過學(xué)習(xí)海量人類知識，以概率建模方式在多樣場景中生成內(nèi)容，進而進入社會互動空間。在這一過程中，大語言模型如何與廣大用戶保持一致、如何理解不同社會角色、在不同場景中輸出何種內(nèi)容，是我們理解其社會化特征的關(guān)鍵。上述結(jié)果揭示出，大語言模型在社會互動中同時表現(xiàn)出精確性與機械性。它以權(quán)威和中立形象（胡安寧、周森，2024）將用戶在“知乎”平臺上大量的討論、思辨和爭議壓縮為單一輸出結(jié)果。這種輸出結(jié)果雖然能夠精準(zhǔn)區(qū)分海量場景的差異，卻在持續(xù)的內(nèi)容生成中機械地強化不同社會角色間的刻板印象。

五、大語言模型如何重塑平臺社會符號系統(tǒng)

為探究大語言模型生成的海量內(nèi)容對“知乎”平臺內(nèi)容生態(tài)的實際影響，筆者使用BERT模型對所有收集的人類用戶回答和不同大語言模型生成的全部回答進行編碼，獲取每個回答的768維語義向量，隨后通過對這些高維語義向量降維并將其投射至低維空間，直觀呈現(xiàn)并比較大語言模型生成內(nèi)容與人類回答在語義分布上的特征。

圖3展示了經(jīng)主成分分析降維后文檔向量在二維平面上的分布，并以不同顏色和形狀區(qū)分了回答主體，圖中點的距離表示語義相似度，距離越近代表回答內(nèi)容的語義越相似。令人驚訝的是，盡管大語言模型的回答數(shù)量遠高于人類用戶，且模型訓(xùn)練主要基于人類的書面知識，但其語義分布并未完全覆蓋人類用戶回答的語義空間。具體來看，四個大語言模型的回答在語義空間中高度重疊，集中于特定區(qū)域，人類用戶的回答則分布得更為分散和多元。雖然大語言模型能在不同場景中生成看似精確的回答，并能模擬不同角色和視角，但從宏觀語義分布來看，其輸出結(jié)果仍表現(xiàn)出高度集中和同質(zhì)化的特征。換言之，盡管大語言模型能較好地區(qū)分海量社會場景，模仿人類生成大量符合場景要求的回答，卻難以替代人類在多元社會場景中基于不同生活經(jīng)歷、價值偏好和視角所形成的豐富、發(fā)散且充滿可能性的表達。

為進一步量化不同回答主體的回答在語義空間中的重疊程度，筆者采用核函數(shù)估計方法來計算各主體回答分布的重疊比例。首先，筆者排除各主體回答分布中5%特別離散的點，確定其主要分布區(qū)域，然后計算兩兩主體間回答的重疊部分占各自主要分布區(qū)域的比例，結(jié)果見表3。表3右上部分和左下部分分別展示重疊部分占不同主體回答分布的比例，如表中0.908表示ChatGPT與人類回答重疊部分占ChatGPT回答總分布的比例，而0.254則表示該重疊部分占人類用戶回答總分布的比例。表3的結(jié)果驗證了上述分析，即四個大語言模型回答的語義分布與人類回答分布重疊程度較低，但大語言模型之間的回答分布重疊度則相對較高。

為進一步分析大語言模型生成內(nèi)容與人類回答的重疊特征，筆者分別以“知乎”問題回答的平均理性程度、平均點贊量以及問題所屬場景為例，比較大語言模型與人類回答重疊的內(nèi)容，以及人類回答獨特內(nèi)容（未被大語言模型回答覆蓋的部分）在上述三個變量上的分布差異。由圖4可見，人類回答獨特內(nèi)容更多集中在坐標(biāo)軸兩端，即用戶回答感性或理性程度較高的問題，而大語言模型與人類回答重疊的內(nèi)容則主要分布于坐標(biāo)軸中部，即回答中理性或感性傾向較弱。這意味著，大語言模型生成的內(nèi)容更多覆蓋的是“知乎”用戶回答中立場相對中性的內(nèi)容，而較少覆蓋具有較強理性或感性色彩的回答。

圖5和圖6進一步展示了兩類內(nèi)容在“知乎”問題回答的平均點贊量及問題場景兩個變量上的分布情況。由圖5可見，人類回答獨特內(nèi)容更多集中于回答平均點贊量較低的問題，而大語言模型與人類回答重疊的內(nèi)容則相對更集中于回答平均點贊量較高的問題。從問題場景的分布差異來看（圖6），人類回答獨特內(nèi)容在社會問題場景中的比例高于大語言模型與人類重疊的內(nèi)容。

綜上所述，盡管大語言模型在短時間內(nèi)生成的回答數(shù)量遠超“知乎”平臺用戶回答總量，但從宏觀語義分布來看，大量人類用戶生成的內(nèi)容并未被大語言模型的回答覆蓋，這部分內(nèi)容主要集中在具有較高理性程度或較強感性色彩點贊量較少的問題上；相比之下，容易被大語言模型覆蓋的是那些立場相對中性或點贊量較高的回答。從生成機制來看，大語言模型訓(xùn)練中常用的自注意力機制，傾向于對訓(xùn)練語料中高頻共現(xiàn)的模式賦予更高權(quán)重，這往往對應(yīng)平臺上的主流表達和立場。在內(nèi)容輸出方面，這一機制可能會在無形中強化主流話語模式、削弱邊緣和差異化表達，從而導(dǎo)致語義空間呈現(xiàn)集中化分布。此外，當(dāng)前大語言模型多采用人類反饋的強化學(xué)習(xí)算法，以使其輸出結(jié)果和人類高評價回答對齊。這一方法雖有助于提升回答的精確性和共鳴度，但也使模型在接觸海量平臺資料的同時，逐漸喪失輸出多元化內(nèi)容的能力。這導(dǎo)致的結(jié)果是，大模型生成的內(nèi)容在語義空間中趨于集中和單一，難以有效覆蓋人類多元化的表達。

考慮到表1和表2所用回歸模型的樣本量較大，為檢驗研究結(jié)果的穩(wěn)健性，本文根據(jù)問題的提問年份對數(shù)據(jù)進行劃分，并分年度重新進行回歸分析。結(jié)果顯示，分年度回歸結(jié)果與表1和表2的主要發(fā)現(xiàn)基本一致。此外，為考察大語言模型溫度參數(shù)設(shè)置對結(jié)果的可能影響，筆者將各大模型溫度設(shè)置為0，并按照前述研究設(shè)計重新收集數(shù)據(jù)，再次對人類用戶回答和大模型生成內(nèi)容進行比較分析。從結(jié)果來看，當(dāng)溫度設(shè)置為0時，大語言模型生成內(nèi)容和人類用戶生成內(nèi)容之間的差異模式與圖3所示基本一致，與表3中關(guān)于語義分布重疊程度的實證結(jié)果也基本吻合。

六、結(jié)論與討論

人工智能在不同社會場景中的廣泛應(yīng)用對經(jīng)典社會化理論的解釋力提出了挑戰(zhàn)。本研究提出“人工智能社會化”這一視角，重點關(guān)注大語言模型作為符號學(xué)意義上的重要行動者，如何通過在不同場景中生成海量內(nèi)容，參與“知乎”平臺互動并沖擊平臺內(nèi)容生態(tài)。與傳統(tǒng)社會化理論強調(diào)個體學(xué)習(xí)相對固定的社會規(guī)范進而實現(xiàn)社會融入不同，人工智能的社會化主要表現(xiàn)為以多場景內(nèi)容生成為核心的復(fù)雜符號參與機制。

從大語言模型在豐富社會場景中的內(nèi)容生成實踐來看，大語言模型并非功能固定、“未社會化”的技術(shù)客體，其輸出內(nèi)容在各類場景中均傾向于接近相對主流、具備一定共識的表達。就此而言，大語言模型可被視為數(shù)智時代高度社會化的準(zhǔn)社會主體。然而，區(qū)別于具有不同成長經(jīng)歷，在社會化過程中形成個體價值觀，進而在網(wǎng)絡(luò)平臺中進行討論和爭鳴的人類用戶，大語言模型作為準(zhǔn)社會主體在社會互動中存在精確性與機械性并存的特點，其以權(quán)威和中立的姿態(tài)，將用戶在“知乎”問題中豐富、多元的討論、思辨和爭議壓縮為相對單一視角的輸出結(jié)果。大語言模型雖然能精準(zhǔn)區(qū)分不同場景的差異，但在內(nèi)容生成過程中，卻會機械地強化性別、年齡等社會角色的刻板印象。

本文嘗試揭示，大語言模型的海量輸出結(jié)果如何在宏觀語義層面改變以“知乎”內(nèi)容為代表的社會符號系統(tǒng)的分布形態(tài)，從而將“人工智能如何重塑人類社會”這一命題具體化為可觀測的社會與技術(shù)互動過程。從研究結(jié)果來看，盡管大語言模型可以靈活模擬不同社會角色并隨時切換視角，但其輸出結(jié)果傾向于再現(xiàn)主流表達而壓縮邊緣、多元或感性的視角。換言之，具備靈活模擬能力的大語言模型，反而可能導(dǎo)致社會符號系統(tǒng)的趨同化，削弱其豐富性和多樣性。值得注意的是，這種趨同化并非指向中立的語義中心，而是趨向于那些獲得點贊數(shù)量較多、較少帶有情緒色彩的回答。

上述發(fā)現(xiàn)表明，大語言模型作為準(zhǔn)社會主體可能會帶來深遠的社會影響。其一，在大語言模型沖擊下，平臺內(nèi)容生態(tài)可能會迅速同質(zhì)化，語言和價值觀的多樣性進而被削弱，這不僅可能會影響人類互動的豐富性，也可能會抑制群體層面的創(chuàng)新能力。其二，大語言模型作為準(zhǔn)社會主體對人類自主性有雙重影響：一方面，大語言模型在提升信息獲取效率、擴展認(rèn)知邊界、促進知識平權(quán)等方面具有積極作用；另一方面，當(dāng)人類過度依賴大模型完成信息搜索、生成等認(rèn)知任務(wù)，從多元互動與深入分析轉(zhuǎn)向獲取單一視角的快捷回復(fù)時，這可能會導(dǎo)致人類認(rèn)知能力逐漸退化，侵蝕人類自主性并加劇人工智能的可控性難題。其三，從知識生產(chǎn)角度看，當(dāng)前中文語料在規(guī)模等方面仍相對弱于英文，大語言模型傾向于強化主流內(nèi)容的生成機制可能會進一步放大英文語料及相關(guān)視角的中心地位，壓制其他語言與文化視角的表達。因此，如何有效介入人工智能主導(dǎo)的知識生成和符號重組過程，已成為數(shù)智時代人工智能治理的重要議題。

不同于將大語言模型僅視為工具來評估其能力或缺陷的研究取向，人工智能社會化視角更關(guān)注大語言模型的生成性和實踐性，將其置于具體的互動場景和社會符號生成過程中加以考察（Brey，2005）。該視角揭示出，大語言模型并非被動應(yīng)答的技術(shù)工具，而是通過快速、跨場景的海量內(nèi)容生成，主動重塑社會符號系統(tǒng)的分布形態(tài)，并深刻地影響人類獲取信息、生成內(nèi)容及參與互動的方式。因此，除關(guān)注模型輸出的正確性和偏向外，我們更應(yīng)持續(xù)追蹤不同大語言模型在海量社會場景中的互動實踐，從而深入地理解其對于人機互動模式、社會符號系統(tǒng)的動態(tài)塑造，以及對人類自主性的長遠影響。

作為一項探索性研究，本文還存在若干可深化之處。首先，“知乎”平臺數(shù)據(jù)僅反映該平臺用戶群體的觀點，與全體網(wǎng)民的觀點存在差異，未來研究可進一步比較大語言模型與其他網(wǎng)民之間的內(nèi)容輸出差異。其次，可納入更多國內(nèi)外不同類型、不同版本的大語言模型，系統(tǒng)考察其在不同時間、參數(shù)設(shè)置下的內(nèi)容生成特征。最后，未來研究還可結(jié)合用戶在數(shù)字平臺的互動和行為反應(yīng)數(shù)據(jù)，分析人類與機器生成內(nèi)容的互動，從而更全面地理解人工智能社會化的機制及潛在影響。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.