探求真理 發展學術 服務社會
        歡迎訪問深圳市社會科學網 今天是

        學術研究

        計算社會科學的發展理路

         日期:2021-04-28   來源:中國社會科學網-中國社會科學報

          社會科學和計算機科學與工程領域的結合產生了一個新的研究領域:計算社會科學。該領域將計算方法應用于新的數字數據來源(如社交媒體、行政記錄和歷史檔案)以發展人類行為理論。2020年4月,伯爾尼大學阿奇姆·埃德爾曼(Achim Edelmann),杜克大學湯姆·沃爾夫(TomWolff)、丹妮爾·蒙塔涅(Danielle Montagne)和克里斯托弗·貝爾(Christopher A. Bail)在《社會學年鑒》(Annual Review of Sociology)上發表題為《計算社會科學與社會學》(Computational Social Science and Sociology)的文章,通過文獻計量學分析了在社會學領域中計算社會科學的演變,并深入分析了七個迅速發展的分支領域。

          1.社會網絡分析與群體形成。計算社會科學在社會學中出現的第一個領域是社會網絡分析與群體形成。互聯網、社交媒體平臺和電信數據的發展啟發了首批人口層面的研究,比如2004年,瓦特(Watts)及其同事利用電子郵件數據來演示和闡述數字空間中的核心社會科學理論。近年來,越來越多的研究使用數字數據來檢驗復雜的傳播性在社交網絡中的擴散。例如,森托拉(Centola)創建了一個可以控制社交網絡拓撲結構的在線社區,在其2010年發表的成果中展示了不同網絡內部的擴散性。此外,社交媒體和電信數據也使規模空前的網絡分析成為可能。2017年,貝爾等人利用臉書(Facebook)的數據確定了在一個討論公共衛生問題的大型網絡中,情感傳播和理性交流方式之間的協同作用。另一系列研究通過在線游戲或測試來研究網絡動態,斯基拉多和克里斯塔基斯(Shirado & Christakis)在2017年發表論文,通過引入機器人參與在矩陣中協調顏色的游戲來增強人類群體的集體表現。網絡測試在研究群體智慧和政治信仰方面也具有重要影響力。吉爾伯特(Guilbeault)等人在2018年發表論文,使用亞馬遜的“土耳其機器人”(Mechanical Turk)進行了一項在線實驗,測試保守派和自由派的社會網絡差異如何影響受試者對美國宇航局(NASA)氣候通訊的解讀。

          2.集體行動與政治社會學。計算社會科學激發了大量關于集體行為和政治的研究。尤其是來自社交媒體和其他交流平臺的數據,進一步促進了對集體行為的研究。圖菲克西(Tufekci)和威爾遜(Wilson) 2012年的研究顯示,在埃及革命和“占領華爾街”運動中,數字工具在抗議活動中發揮著核心作用,由這些工具生成的數據可以為集體政治的研究提供信息。計算技術也幫助研究者發展了社會運動中動員和行為改變的相關理論。2015年,瓦西(Vasi)等人利用來自社交媒體和谷歌的數據展示了在放映紀錄片的社區中,在線討論和反對這種做法的動員是如何增加的。另外,文本數據的增加啟發了政治話語方面的新研究。貝爾在2015年以及博尼科夫斯基(Bonikowski)和德倫(Gidron)在2016年通過分析話語領域內行動者的社會地位及其語言的情感價值,論證了邊緣話語是如何進入主流的。在這一領域,許多研究使用在線數據、自動文本分析、實驗和基于主體的建模來研究政治極化和說服。2017年,布蒂琳和威勒(Boutyline&Willer)基于網絡的研究表明,兩極分化源于保守派和極端主義者之間的同質性。

          3.知識社會學。計算社會科學已經成為知識社會學的中心部分。這一領域的研究主要利用引文數據來研究科學內部共識的形成。文本分析的進步幫助學者繪制和建模整個科學領域的成長過程,也使學者們能夠闡明學科之間的異同。比如,2007年,伍奇(Wuchty)等人的研究發現,在社會科學領域,團隊合作的傾向在過去50年里增加了一倍多。2018年,麥克馬漢和埃文斯(McMahan & Evans)開發了一種方法來捕捉科學文章中語言的模糊性,以區分自然學科以及人文學科的差異。還有一些研究考察了學術工作如何獲得影響和聲望。2013年,烏齊(Uzzi)的研究表明,高影響力的出版物建立在先前卓著的工作基礎上,同時又具有不同尋常和新穎的組合。計算方法也揭示了科學發現如何被單個科學家的選擇及其組織背景驅動。2015年,熱采斯基(Rzhetsky)等人確定了生物醫學科學家在選擇要研究的分子之間的關系時所遵循的策略。這一領域的另一系列研究是利用計算技術來研究科學的公眾形象以及科學如何與工業相結合。2015年,什維德(Shwed)展示了煙草業阻礙科學探究的嘗試反而使科學家發現了吸煙危害的悖論。最后,計算技術更普遍地揭示了科學和在線知識表征中的性別不對稱和不平等。2013年,懷特(West)等人追溯了自1545年以來,自然科學、社會科學和人文學科學術作者中的性別不平等現象。

          4.文化社會學、社會心理學和情感學。計算社會科學也出現在文化社會學、社會心理學和情感學的研究中。在文化社會學中,部分研究考察了文化變遷的廣泛過程。2015年,貝爾展示了自動文本分析如何被用來檢驗話語場的轉變以發展一個系統的共鳴理論。以文本為基礎的數據的增長也開啟了關于文化信息如何表達的研究新領域。2011年,戈德和梅西(Golder&Macy)利用數以百萬計的推特公開信息數據,確定了全球不同文化中個體層面上的晝夜和季節性情緒節奏。除了文本分析,學者們還率先使用虛擬現實來進一步研究社會心理學的核心問題。2018年,范·隆(Van Loon)等人讓被試者執行合作任務,但將其中一半人隨機分配到一種治療條件中,使用虛擬現實技術獲取其他研究參與者的觀點。

          5.文化的生產。計算技術經常被用來研究人們如何評價以音樂、電影為代表的文化產品。2006年,薩爾加尼克(Salganik)等人創建了一個在線“音樂實驗室”,研究同伴如何影響新藝術家的音樂偏好。計算技術也被用來衡量文化產品中主題的組合如何塑造其接受度。最近的研究探討了性別、階級和政治身份如何塑造文化產品生產方面的問題。2016年,陳云松和嚴飛利用谷歌圖書大數據來研究經濟發展與階級關注度之間的關系,這是唯一被引用的中國大陸學者文章。

          6.經濟社會學與組織。計算技術和網絡方法的交叉也在經濟社會學中蓬勃發展。網絡數據不僅對研究交流和職業成果有用,而且對研究組織文化也有用。2016年,戈德堡(Goldberg)等人分析了大公司內部的電子郵件信息,以衡量員工的溝通是否符合慣常的規范和行為方式。研究發現,除了網絡數據,文本通信的數字化記錄提供了對文化和情感在市場中作用的更豐富的理解。2011年,薩韋德拉(Saavedra)等人通過文本分析揭示了市場波動如何影響交易者討論當前或未來的條件,以及這些變化如何影響交易行為。

          7.人口統計與人口研究。計算社會科學在人口統計學中出現的時間相對較晚,但迅速流行。計算技術在這一領域最常用于產生高質量的人口估計。例如,手機數據被用于產生更具動態性的人口估計,特別是在國家統計數據不可靠的地區(塞薩爾等,2018年;英格麗特 ,2010年;帕爾梅雷特  ,2013年)。人口統計學家也使用計算技術來探索人口變動過程的微觀動力學,最近的幾項研究使用來自一個大型網絡約會平臺的數據,研究了人際關系是如何跨越種族和民族差異形成的。人口統計學家所做的計算社會科學研究的最后一部分是使用數字數據源來研究對社會有害的健康行為,并列舉難以獲取的人口資料。例如,2016年,卡什雅普(Kashyap) 和比亞維森西奧(Villavicencio)使用谷歌搜索數據來研究印度選擇性墮胎的流行情況。受數據科學領域慣例的啟發,其他學者開發了全新的人口研究模型。在這些領域中,通常會創建一個競賽,多個團隊通過競爭建立模型以獲得現金獎勵。一個典型例子就是網飛(Netflix)公司的競賽,競賽獎項會頒發給數據科學家團隊建立的模型,而這一模型要為網飛用戶可能喜歡看的節目提供最優質的推薦。

          正如該文所說的,計算社會科學正在向許多諸如社會網絡分析、知識社會學等以往未涉足的全新領域擴展,以至于任何文獻綜述都會在短時間內過時。盡管計算社會科學在推進社會學理論方面有著巨大的潛力,但也帶來了許多緊迫的挑戰,比如從倫理道德到數字空間數據生產的日益不透明等。作者認為,未來研究中計算社會科學對分支領域還有更大的滲透潛力,并呼吁增加計算社會科學與其他社會科學領域的互動,以確保計算社會科學繼續擴展到主流社會學當中。

          (南京大學社會學院 許子妍/編譯)