![]()
![]()
摘要
【目的/意義】本研究利用BERTopic模型實現對青少年健康需求的主題挖掘,可為相關政府部門、醫療機構開展健康需求服務提供參考和依據。【過程/方法】本研究以知乎平臺中有關青少年健康問題下方的回答數據為研究對象,通過BERTopic建模提取主題及主題詞,進行主題詞優化和主題命名后,結合馬斯洛需求層次理論對青少年健康需求進行演化分析,梳理各需求層次對應的文檔數量分布,并深入探究青少年健康需求的時間演化路徑,為滿足青少年的健康需求,給予青少年更多的支持和關注。【結果/結論】研究結果表明,青少年健康需求包含了心理調適、世界和平、游戲娛樂、傷痛文學、心理治療、體像認知、文娛作品、就業形勢、頭發保養、法律法規、消極思想、地域文化12個主題。主題演化與突發公共衛生事件、國家政策出臺密切相關,并存在時間特性。【創新/局限】本研究將BERTopic模型與知乎平臺數據相結合,探索青少年健康需求。未來可拓展多源數據,進一步深入挖掘青少年健康需求的具體側重點。
關鍵詞
馬斯洛需求層次理論;青少年健康需求;主題詞分析;主題演化;BERTopic模型
Abstract
[Purpose/Significance] This study uses the BERTopic model to realize the theme mining of adolescent health needs, which can provide reference and basis for relevant government departments and medical institutions to carry out health needs services. [Process/Method] The research object of this study is the answer data under the health problems of teenagers in Zhihu platform. The topic and keywords are extracted through BERTopic modeling, and the topic words are optimized and named. Combined with Maslow’s hierarchy of needs theory, this study analyzes the evolution of teenagers’ health needs, sorts out the total number of documents corresponding to each level of needs, and deeply explores the time evolution path of teenagers’ health needs, so as to give more support and attention to teenagers in order to meet their health needs. [Result/Conclusion] The research results showed that the health needs of adolescents included 12 themes, including psychological adjustment, world peace, game and entertainment, literature on trauma, psychotherapy, body image cognition, entertainment works, employment situation, hair maintenance, laws and regulations, negative thoughts, and regional culture. Theme evolution is closely related to public health emergencies and national policies, and has time characteristics. [Innovation/Limitations] This study combines the BERTopic model with Zhihu platform data to explore the health needs of adolescents. It is expected to further explore the specific focus of adolescent health needs from more data sources.
Keywords
Maslow’s hierarchy of needs theory; adolescent health needs; keywords analysis; theme evolution; BERTopic model
1 引言
我國青少年人口基數龐大,是國家發展的中堅力量[1]。青少年時期作為個體身心發展的關鍵階段,其健康狀況影響個體終身發展,攸關國家長遠競爭力。黨中央、國務院高度重視青少年健康成長[2],并印發《中長期青年發展規劃(2016—2025年)》[3]和《“十四五”國民健康規劃》[4]明確要求加強青少年健康促進工作。
伴隨社會經濟的發展和信息技術的滲透,青少年的健康觀念和信息獲取渠道呈現出新的特征。然而,當前關于青少年健康需求的研究,較多聚焦于心理健康、近視防控等特定議題,對青少年在網絡表達的健康需求及其演變規律的挖掘仍顯不足。基于此,本研究以知乎為例,獲取并分析該平臺青少年健康相關問題的回答文本,運用BERTopic模型進行主題挖掘,識別青少年健康討論中的核心議題及其演變趨勢,為相關部門制定健康促進政策、優化健康服務提供決策和參考。
2相關理論和文獻綜述
2.1 馬斯洛需求層次理論及應用
馬斯洛需求層次理論由馬斯洛于1943年首次系統提出,人類需求被劃分為生理需求、安全需求、社交與歸屬感需求、尊重需求、自我實現需求五個遞進層次[5]。
該理論為理解人類行為動機提供了重要框架,被學界廣泛運用。國內學者將該理論應用于老年人在數字時代的適應問題[6]、急診科護士工作滿意度提升[7]、災后心理危機干預模式構建[8]、月球人類棲息地建設規劃[9]、檔案館用戶需求服務[10]、城鄉居民文化消費差異[11]以及農民工信息需求分析[12]等方面。
國外學者則將其與住宅福祉框架構建[13]、老年人對社交輔助機器人的需求分析[14]、低碳出行方式選擇[15]、家庭能源系統優化調度[16]以及水資源管理框架改進[17]相結合。這表明該理論為解決不同層面的個體與群體問題提供適應性的理論基礎。
2.2 青少年健康需求相關研究
青少年健康需求研究更側重于其多方面的具體需求:
燕凌等基于社會行動理論視角,關注體衛融合對青少年健康促進的影響[18]。汪瑞等系統梳理了藝術教育視域下青少年健康研究的核心理論,揭示了藝術教育對青少年健康的作用機制[19]。儲莉婷等利用群組軌跡模型研究健康生活方式對青少年超重/肥胖及近視共患的影響[20]。徐結晶等運用結構方程模型探究校園環境對青少年健康促進的影響,結果顯示影響青少年健康促進的校園環境包括環境品質、功能服務、活動支持三方面[21]。劉爽等探討青少年體育活動與健康狀況的關系及學業壓力和睡眠質量的中介作用,揭示了學業壓力和睡眠質量對健康狀況的作用機制[22]。孫浩等從電子競技行為入手探究其對青少年健康的影響[23]。喻晶等則探討青少年體育參與中家長教育的內涵與價值[24]。
國外方面,Han等研究識別了青春期后期情緒障礙的預測性生物標志物[25]。Fassi等揭示了青少年社交媒體使用模式因其心理健康狀況而異[26]。Hirshberg等提出數字技術為促進青少年健康提供了潛在途徑[27]。Wang等揭示健康風險行為與多種心理癥狀呈顯著正相關[28]。Hu等研究發現熱浪暴露與青少年抑郁、焦慮癥狀呈顯著相關[29]。
綜上所述,關于馬斯洛需求層次理論的研究,主要是其跨學科的廣泛應用與實證檢驗。關于青少年健康需求的研究,呈現出多維度、跨因素的特點,涉及心理、行為及社會環境對健康的綜合影響。
3 研究設計BERTopic主題建模和數據搜集
3.1 BERTopic主題建模流程
BERTopic是一種基于預訓練語言模型的主題建模方法,結合深度學習語義理解和傳統聚類算法,能夠高效地從大規模文本數據中提取語義相關的主題[30]。其核心優勢在于利用深度學習模型理解上下文語義,同時生成可解釋的主題。建模流程如圖1所示:
![]()
(1)詞嵌入生成
采用all-MiniLM-L12-v2預訓練語言模型生成文檔語義嵌入向量。該模型基于Transformer架構,在語義表征能力、計算效率和通用性之間取得良好平衡[31]。
(2)降維處理
采用UMAP算法將文檔嵌入降至二維空間,該算法可在降低數據集的維度時保留數據集的局部和全局結構[32]。研究表明UMAP在靈活性、適應性、計算效率以及泛化能力方面,顯示出相較于PCA、LLE、LPP等常用降維方法的顯著優越[33]。
(3)聚類分析
選用HDBSCAN算法進行聚類,該算法是DBSCAN算法[34]的擴展和改進,可基于密度與層次結構進行聚類,能自動確定簇數量并處理噪聲點與離群值[35]。
(4)主題建模與加權
采用改進的c-TF-IDF加權方法,該算法是對TF-IDF算法[36]的改進,表征了特征詞在技術主題中的相關性,c-TF-IDF得分越高表示該特征詞的語義信息越相關[37]。
(5)主題詞優化
運用KeyBERT[38]和MMR[39]對主題詞進行優化。二者在本次研究中用于提升主題詞的多樣性,減少重疊內容。
(6)數據可視化
對主題詞優化后,根據主題詞表生成主題條形圖,展示各主題內最具代表性的詞匯及其得分。
(7)主題詞分析和主題演化
對得到的主題詞進行分析,并利用搜集到的數據繪制DTM圖,探究各主題文檔數量隨時間演變趨勢。
3.2數據搜集和預處理
3.2.1 數據搜集
本研究選取知乎作為數據來源,以“青少年健康”為關鍵詞,通過爬蟲技術獲取該平臺相關問題下方的回答數據共18169條,采集內容包括回答內容和發布時間。
3.2.2 數據預處理
數據預處理包括去除停用詞、特殊字符、數字等步驟。本研究對獲取的數據進行預處理,刪除與研究無關的數據信息,通過Python中的Jieba庫進行分詞,并利用百度停用詞表結合自定義停用詞過濾低信息密度詞匯。
4BERTopic主題模型分析
4.1青少年健康需求主題詞分析
4.1.1 主題詞分析
本研究識別出青少年健康需求的12個主題,使用c-TF-IDF算法評估主題詞重要性,提取各主題核心主題詞并統計文檔數量,結果如表1所示。從文檔數量分布來看,主題0、主題1、主題2熱度最高,均超過1000條;主題9、主題10、主題11相對較少,均未超過100條。
![]()
4.1.2 主題詞優化和主題提煉
為了優化主題解釋性和主題表征多樣性,將表1中的主題詞視為候選主題詞,在BERTopic模型實例化時,增加representation_model的設置,通過KeyBERT和MMR對主題詞進行微調。微調后的結果如表2所示。
基于微調后的結果,對每個主題下概率排在前五的主題詞進行可視化,得到主題詞—概率分布(見圖2)。相較于表2,圖2更直觀地展示了各主題的核心主題詞及其貢獻率。
根據原始主題詞和微調后主題詞,可提煉出每個主題的表示,主題0為心理調適,主題1為世界和平,主題2為游戲娛樂,主題3為傷痛文學,主題4為心理治療,主題5為體像認知,主題6為文娛作品,主題7為就業形勢,主題8為頭發保養,主題9為法律法規,主題10為消極思想,主題 11 為地域文化。可見,各個主題意義分明,涵蓋青少年身心發展、文化娛樂等多個健康需求方面。
![]()
![]()
4.2青少年健康需求層次分析
馬斯洛需求層次理論屬于基礎性理論,可以在一定程度上解釋和歸納青少年健康需求,本文識別的主題與馬斯洛需求層次的對應關系如表3所示。
![]()
生理需求是人進行正常生活的基礎生物需求[40]。對應本研究的主題為頭發保養。安全需求是避免痛苦、得到保護的需求[41]。對應本研究主題為心理治療、就業形勢、消極思想。社會認同理論認為,個體通過對自我和已有群體成員的特性認知,會自動歸屬到具有相似特性的群體中,并做出類似于該群體成員的行為[42]。傷痛文學、游戲娛樂、文娛作品增強個人的社會性關聯和群體分享,地域文化提升群體凝聚力和民族自豪感,心理調適驅動個體調節情緒以適應群體,五者被劃分為社交與歸屬感需求。社會成員的尊重需求得到滿足,會有更多責任感[43]。體像認知體現了尋求外在認可的內心需求,歸屬于尊重需求。自我實現需求,其往往在于實現自我理想抱負,發揮個人價值等目標[44]。對應本研究的主題為世界和平和法律法規。
由表3可知,各需求層次對應的文檔總數差異顯著。社交與歸屬感需求最為強烈;自我實現需求次之;安全需求和尊重需求居中;生理需求最弱。這表明青少年在知乎平臺上的健康討論主要圍繞社交互動、群體歸屬和心理調適展開,同時對世界和平、法律法規等宏觀議題保持較高關注。
4.3青少年健康需求主題演化
根據所收集數據繪制DTM圖,分析各主題文檔數量隨時間演變趨勢。在整個演化過程中,不同主題呈現出差異化的發展軌跡。
社交需求相關的主題中,主題0“心理調適”頻率波動最為顯著:初始階段保持增長,于2021年達到局部高點,2022年有所下降,隨后兩年急劇上升,于2024年突破600篇。主題2“游戲娛樂”整體處于上升趨勢,2019年至2022年間持續增長,隨后保持平穩并再次小幅上升。主題3“傷痛文學”僅2022年出現顯著峰值,隨后兩年持續下降。主題6“文娛作品”和主題11“地域文化”變化相對平緩。
自我實現需求方面,主題1“世界和平”呈現持續穩定增長態勢,2022年至2023年增長近200篇;主題9“法律法規”頻率始終穩定且偏低。安全需求中,主題7“就業形勢”自2022年起出現穩定上升態勢;主題4“心理治療”和主題10“消極思想”變化相對平穩。尊重需求對應的主題5“體像認知”和生理需求對應的主題8“頭發保養”整體波動不大。
![]()
主題演化與突發公共衛生事件、國家政策出臺密切相關。2022年末公共衛生事件對青少年學習和生活產生重大影響,導致部分青少年出現心理健康問題[45]。不僅如此,調查顯示,我國初中生的自殺意念檢出率高達18.81%,學齡兒童心理問題發生率為5%~30%[46]。在此背景下,國家衛生健康委員會等部門強調要落實《健康中國行動——兒童青少年心理健康行動方案》,旨在加強兒童青少年心理健康工作,促進其心理健康和全面素質發展[47]。這解釋了主題0“心理調適”在2022年后顯著增長的現象。主題2“游戲娛樂”盡管略有起伏但整體處于上升趨勢。截至2023年6月,我國網絡游戲用戶達5.50億人,占整體網民的51.0%[48]。為預防青少年沉迷虛網絡,國家于2021年出臺《關于進一步嚴格管理切實防止未成年人沉迷網絡游戲的通知》[49]。2025年開始實行《信息技術 網絡游戲未成年人監護系統技術要求》,加強對未成年人保護[50]。主題7“就業形勢”盡管變化幅度不大,但在近些年出現增長苗頭。“十四五”時期我國就業形勢基本穩定,但仍存在青年失業率偏高、結構性就業矛盾突出等挑戰[51]。國務院于2021年發布《“十四五”就業促進規劃》,推動實現更加充分、更加高質量的就業[52]。
新型冠狀病毒肺炎疫情相關壓力使得全球青少年焦慮、抑郁、創傷后應激障礙的患病率和嚴重程度增加[53],關注青少年情緒狀態和心理健康、提供合理的發泄渠道非常必要。同時,要保障青少年德智體美勞全面發展,不斷完善青少年健康需求服務。
5 結論
本研究利用BERTopic模型挖掘知乎平臺青少年健康需求主題,探索其演化規律,為相關部門開展健康服務提供依據。研究發現青少年健康需求涵蓋12個主題,基于馬斯洛需求層次理論可將其劃分為五個層次,其中社交與歸屬感需求最為強烈。主題演化存在時間特性,與突發公共衛生事件、國家政策出臺密切相關。
青少年健康發展狀況直接關系國家長遠競爭力。未來需持續關注青少年健康需求,尤其是心理健康方面,構建支持青少年健康發展的友好環境。同時也期待其他學者從更多數據來源進一步深入挖掘青少年健康需求的具體側重點。
作者信息
曹傳穎 管理學院管理科學與工程專業碩士研究生
參考文獻
![]()
![]()
![]()
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.