![]()
張延吉
探索街景圖像大數(shù)據(jù)中的社會事實
作者 |張延吉
作者單位 |福州大學(xué)
原文 |
《中國城市社會空間分異的現(xiàn)狀、變遷及影響因素——基于街景深度學(xué)習(xí)方法》一文有幸在《社會學(xué)研究》2026年第1期發(fā)表。應(yīng)編輯部邀請,撰寫這篇作者手記,我想從交叉學(xué)科如何切入社會學(xué)研究的角度分享這篇論文的成稿過程。
社會空間分異是各類社會分層現(xiàn)象在空間上的投射,可從兩個視角進行考察:一是關(guān)注不同群體在城市內(nèi)部空間分布上的差異;二是關(guān)注社會環(huán)境、空間品質(zhì)、公服資源在城市內(nèi)部的非均質(zhì)分布。肇始于芝加哥學(xué)派,歐美社會學(xué)界對城市社會空間分異的量化方法、發(fā)展趨勢、形成機制、社會效應(yīng)開展了大量研究。可惜的是,鮮見涵蓋中國所有城市的社會空間分異狀況及其演進規(guī)律的研究,主要原因在于數(shù)據(jù)可得性。與量化收入或財富差距可依賴抽樣調(diào)查數(shù)據(jù)不同,對社會空間分異的測度需要小尺度空間單元(如社區(qū)、1km×1km單元網(wǎng)格)的社會經(jīng)濟地位(SES)指標(biāo),而后者在數(shù)據(jù)獲取上存在障礙。
為了探究中國城市的社會空間分異狀況,我們開展了一些前期研究,它們構(gòu)成了本文的基礎(chǔ)。2022年我在Journal of Transport Geography發(fā)表Temporal variation in activity-space-based segregation: A case study of Beijing using location-based service data一文。該文利用手機信令大數(shù)據(jù),估計了北京市某一工作日和休息日每小時的社會空間分異程度。這項工作突破了只從居住地的靜態(tài)視角探討社會空間分異的局限。以此為基礎(chǔ),我在Annals of the American Association of Geographers發(fā)表From residential neighborhood to activity space: The effects of educational segregation on crime and their moderation by social context一文,探討了社會空間分異對犯罪活動的影響機制。遺憾的是,手機信令等大數(shù)據(jù)獲取昂貴、推斷社區(qū)SES指標(biāo)的AI算法存在黑箱,致使這項工作僅限于北京,無法拓展到更多城市。
2023年賀瓊博士(現(xiàn)任教于香港大學(xué))給我推薦了一篇Leckie(2012)的論文,該文巧妙地使用多層模型在各層的隨機效應(yīng)量化特定尺度上的社會空間分異程度,借此繞開需要全域覆蓋、小微尺度SES指標(biāo)的數(shù)據(jù)要求,轉(zhuǎn)而可用抽樣調(diào)查數(shù)據(jù)測度城市社會空間分異。受此啟發(fā),我們運用某項全國社會調(diào)查在區(qū)縣、街道鄉(xiāng)鎮(zhèn)、居委村委三個尺度上對中國各地級市的社會空間分異狀況進行了測度和解釋。詳見2025年我們在Applied Geography發(fā)表的Understanding multi-scale educational and hukou segregation in urban China: A multilevel modeling approach一文。但該文的不足在于樣本的代表性問題,國內(nèi)常用的CGSS、CSS調(diào)查數(shù)據(jù)樣本僅在全國尺度具有代表性,人口普查微觀調(diào)查數(shù)據(jù)只在地級市及以上尺度具有代表性。受成本所限,社會抽樣調(diào)查很難在街道鄉(xiāng)鎮(zhèn)、社區(qū)等中微觀尺度上具有樣本代表性,這也制約了社會空間分異研究結(jié)論的可靠性。
2023年我和我的碩士生(也是本文的第二作者)游永熠同學(xué)在完成由我主持的有關(guān)犯罪社會學(xué)的國家社科基金項目過程中,開始學(xué)習(xí)街景圖像挖掘和計算機視覺算法,為本研究儲備了所需數(shù)據(jù)和方法。我們的第一項工作是探究破窗效應(yīng)對犯罪活動的影響,破窗理論特別提及物理失序(physical disorder)概念,將其定義為城市景觀中的雜亂破敗現(xiàn)象及衰退失控信號,如垃圾、涂鴉、建筑破敗。一個社區(qū)的物理失序程度是該地社會經(jīng)濟地位的晴雨表,這為我們將物理失序作為社區(qū)SES代理變量,進而測度社會空間分異埋下了種子。在2024年發(fā)表的《物理失序?qū)ΡI竊犯罪的影響及其在3D建成環(huán)境影響中的調(diào)節(jié)作用——基于街景圖像深度學(xué)習(xí)的上海案例》一文中,我們以上海為案例,掌握了街景圖像獲取方法和目標(biāo)檢測算法,由訓(xùn)練而得的目標(biāo)檢測模型可對全域大規(guī)模街景圖像中的物理失序現(xiàn)象進行高效率、高精度的自動識別。
我們的第二項工作受到MIT Place Pulse項目的啟發(fā),在對訓(xùn)練集中街景圖像的主觀感知(如安全感、富裕感)完成標(biāo)注后,執(zhí)行圖像回歸的深度學(xué)習(xí)任務(wù),可對全域大規(guī)模街景圖像中的主觀感知水平實現(xiàn)高效率、高精度的自動識別。我們首先將這一思路運用于犯罪恐懼感(fear of crime)的測度,并在北京完成首次嘗試。詳見2024年發(fā)表的《犯罪恐懼感的空間格局、影響因素及其與犯罪活動的異同》。社研論文中富裕感知的測度也遵循了上述思路。
這兩項探索性研究的成功促使我回到社會空間分異議題。我意識到,通過結(jié)合街景圖像大數(shù)據(jù)與深度學(xué)習(xí)方法,可望在全國所有城市實現(xiàn)跨時期、廣覆蓋、小尺度、高精度、低成本的社會環(huán)境測度,能在一定程度上克服長期以來社會空間分異研究中存在的數(shù)據(jù)局限。2023年春,我和幾位學(xué)生一起開始進行全國街景圖像收集、物理失序數(shù)據(jù)集標(biāo)注、感知水平數(shù)據(jù)集標(biāo)注等工作,歷時大半年。宋廣文教授以及游永熠、莊宇丹、黃宏祥、黃佳玲、葉誠楷、潘振宇等學(xué)生參與其中。借此機會對他們的貢獻深表感謝!
2025年秋,我們收到編輯部發(fā)來的外審專家意見。意見詳實、尖銳、富有建設(shè)性,其中最具挑戰(zhàn)性的兩條意見涉及概念界定和解釋框架。在概念界定方面,本文分別采用各城市中各社區(qū)物理失序面積或富裕感知得分的
Gini指數(shù)和空間
Gini指數(shù)測度社會空間分異。審稿人指出,兩者的區(qū)別應(yīng)在概念命名上有所體現(xiàn)。我聯(lián)想到,用以測度多人群空間分布差異的D指數(shù)(Dissimilarity Index)在提出之初,僅考慮城市內(nèi)部各地理單元人群構(gòu)成比例的相似性,即使各地理單元位置有變,也不會改變D指數(shù)大小,因此被認為是不具有空間性質(zhì)的社會空間分異指標(biāo)(aspatial index),其特征類似于測度單一經(jīng)濟社會變量在各地理單元之間差異性的
Gini指數(shù)。后續(xù)學(xué)者提出的空間D指數(shù)則在考慮本地理單元人群構(gòu)成的基礎(chǔ)上,也考慮周邊地理單元的人群構(gòu)成,以從空間視角反映社會空間分異(spatial index),其特征類似于測度單一經(jīng)濟社會變量在局部鄰里環(huán)境中分異狀況的空間
Gini指數(shù)。可惜的是,既有文獻并未統(tǒng)一兩者命名,若將其分別稱之為“非空間社會空間分異”和“空間社會空間分異”容易產(chǎn)生混淆。我草擬了幾個概念的提法,聽取了芝加哥大學(xué)社會學(xué)系蔡樑博士的意見,最終我們決定將兩者分別命名為“社會空間全域分異”和“社會空間鄰域分異”。全域分異反映資源稟賦及社會環(huán)境在城市內(nèi)部各地理單元間的離散程度,屬于非空間性概念,可用D指數(shù)、
Gini指數(shù)測量;鄰域分異聚焦個體在小尺度局部相鄰環(huán)境中體驗到的社會空間分化,屬于空間性概念,可用空間D指數(shù)、空間
Gini指數(shù)測量。為便于理解兩者的意涵及其差異,我們還在修改稿中新增了示意圖進行解讀(圖1)。希望學(xué)界對我們的這一概念分析框架提出批評建議。
![]()
圖1 城市社會空間結(jié)構(gòu)的模擬示意
關(guān)于解釋框架,寫作初稿時我們引入西方文獻中提及的幾個經(jīng)典理論,試圖檢驗中國城市社會空間分異的影響因素。這些理論包括:①全球城市理論,強調(diào)城市嵌入國際分工體系的影響;②空間同化理論,強調(diào)貧富差距的影響;③福利國家理論,強調(diào)政府再分配政策的影響。審稿人指出,這些理論關(guān)注的影響因素并無空間屬性,用非空間因素解釋社會空間分異存在不足。受此啟發(fā),我們提出了市場-政府“雙主體”與宏觀環(huán)境-微觀空間“雙視角”的解釋框架(圖2),該框架既可把現(xiàn)有理論囊括在內(nèi),也能補充市場主體和政府政策的微觀空間特征。為此,我們增補了外企與本土企業(yè)空間分布的相似性指數(shù)、外來人口與本地人口分布的孤立指數(shù)、公共設(shè)施的空間集聚度、紳士化與郊區(qū)化程度等空間類指標(biāo),以充實解釋框架的內(nèi)容。這些空間類變量的測量需要用到各種大數(shù)據(jù),如居住人數(shù)來自WorldPop數(shù)據(jù)庫(https://hub.worldpop.org)、土地出讓數(shù)據(jù)來自土地市場網(wǎng)(https://www.landchina.com)、企業(yè)數(shù)據(jù)來自工商企業(yè)注冊數(shù)據(jù)庫(https://shiming.gsxt.gov.cn/corp-query-homepage)、POI取自高德地圖(https://lbs.amap.com)、道路矢量地圖取自O(shè)penStreetMap。要在一個月的返修期內(nèi)完成對全國范圍內(nèi)大量數(shù)據(jù)的收集、整理、清洗、計算是一大挑戰(zhàn)。除游永熠同學(xué)的辛勞工作外,碩士生潘振宇同學(xué)在AI指導(dǎo)下編寫了用以數(shù)據(jù)整理和變量測量的Python代碼,這一創(chuàng)新極大提高了工作效率,特此感謝!
![]()
圖2 “雙主體-雙視角”解釋框架示意圖
最后,我要感謝外審專家、編輯部各位老師在本文修改中提出的真知灼見!感謝政光景老師在三輪校稿過程中對本文進行的細致修改!感謝《社會學(xué)研究》對交叉研究的支持和對青年學(xué)人的勉勵!也要特別感謝福州大學(xué)社會學(xué)系和城鄉(xiāng)規(guī)劃系,福州大學(xué)允許我同時在兩個專業(yè)招收碩士研究生、給兩個專業(yè)的同學(xué)上課,這使我的小團隊中始終充滿多學(xué)科交叉氛圍,各位同學(xué)在互學(xué)所長、追求前沿的過程中獲得進步,也令這項具有空間視角、融合計算機前沿方法的社會學(xué)研究成為可能。在本文寫作期間,我迎來了女兒的誕生,由衷感謝家人們的高效協(xié)作和互相支持,讓我能有比較充足的時間和精力投入研究。熱切期待各位學(xué)界前輩和同仁對本文提出批評建議,來信可發(fā)送至chairman7up@126.com。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.