開放科學增強心理學研究包容性
日期:2021-03-18 來源:中國社會科學網
2011年至2012年,社會心理學領域先后出現了幾件讓研究者震驚的事情。先是康奈爾大學的社會心理學家貝姆(Bem)在頂級社會心理學期刊上發表論文“證明”人們可以預測未來,且p<0.05,一時受到了眾多研究者的質疑。荷蘭社會心理學家斯塔佩爾(Stapel)被舉報其在Science雜志上發表的論文存在數據造假,隨后的調查表明,斯塔佩爾進行了大規模的數據造假,造假發表的論文高達58篇。此后,耶魯大學心理學教授巴奇(Bargh)的經典實驗——老年啟動實驗不能被重復,而巴奇對重復研究過激的批評更是引起了眾多研究者的關注。
這些事件的發酵,讓社會心理學界、心理學界乃至整個科學界都開始關注一個問題——已發表的研究有多少能被重復呢?心理學界對可重復性問題的關注與安尼迪斯(Ioannidis)等對生物醫學中可重復性的重視通過網絡社交平臺而匯聚,引發了大量的討論。在近十年的討論中,國際學界不僅形成了關于可重復性的基本共識,也在網絡上發起了一場“開放科學”運動(Open Science Movement),對基礎科學的實踐產生了重要的影響。這場由可重復性問題帶來的開放科學運動,給研究者帶來了新的機遇和挑戰。
探索開放科學新研究實踐
開放科學運動中產生的一系列新研究實踐,通過學術協會、出版集團、學術期刊以及基金會的政策而發揮作用。這些新實踐都旨在增強基礎研究中的開放性、透明性、可重復性和包容性。以下將對一些較為重要且被廣泛采用的新實踐加以簡要說明。
一是預注冊(preregistration),即將研究方案在特定的網站上進行登記并公開的做法。通過記錄研究者初始的研究方法、研究假設、數據分析方案等,能夠避免研究者后續因各種偏見而修改研究假設、分析方案等。一種常見的偏見是:根據結果是否顯著而修改數據分析方法和收集數據的樣本量等。讓初始的研究方案保持透明有助于其他研究者更加明晰整個研究的過程。除了研究者自己公開注冊外,有的期刊也接受注冊報告,即研究者將自己的研究方案提交給期刊,期刊對方案本身的科學性進行評審,如果評審認為研究問題重要且方法得當,則原則上接受該研究。然后,作者進行數據收集,并分析數據、撰寫文章。如果后續的數據收集與分析沿著預注冊方案的思路完成,則期刊將發表該論文,而不論其結果是否支持研究者所期望的假設。
二是預印本(preprint),即在文章完成后即將其存放于特定的網站上進行公開。預印本可以避免因為審稿周期長而帶來的問題,也可以解決首發權的爭議。隨著開放科學運動的發展,越來越多的研究者傾向于將自己的論文在成文后存放于預印本服務上,如arXiv、bioRxiv、PsyarXiv等;中國科學院圖書館也發展了中文的預印本平臺Chinaxiv.org。通過比較有預印本和無預印本論文的引用率,研究者發現有預印本的論文會更多地被引用。
三是開放獲取(Open access),即無須付費便可閱讀學術論文。其本質在于使基礎研究成果——學術論文實現其原有的目的,即讓普通公眾受益。絕大部分的基礎研究是為了拓展人類的知識,其資助方往往是政府或慈善機構。政府資金本質上是納稅人所納稅款的一部分。在傳統的西方科學出版模式中,出版集團提供平臺,科研工作者提供論文和同行評審,論文經出版集團排版整理后統一出售,研究機構或者大學圖書館再花費巨資來購買。也就是說,公共資金所資助的研究成果,被出版集團經過簡單包裝和整理后,再次由公共資金購買。在這種模式下,科研工作者在完成同行之間學術交流的同時,順便將大量納稅人的錢從政府轉移到了出版商的口袋,而出版商所提供的服務則主要局限于排版、印刷或者電子資源的聚合等。由此,不少研究者指出應該采用更加合理的方法,避免出版商不當獲利,提倡讓公共資金資助的科研成果——科學論文為公眾免費獲取。
四是開放數據(Open Data),即將研究相關的數據進行公開,以方便其他研究重復使用數據或者對論文中的數據分析結果進行重復,檢驗其可重復性。由于不同研究領域涉及的數據不同,公開的程度也會有所區別。在公開數據的過程中,需要注意個人隱私與數據可及性之間的權衡。也就是說,數據的開放并非是與否的二分,而是一個從完全不公開到完全公開的連續譜。開放數據的好處是可以使數據得以再利用,使研究者能夠更有效地利用已有資源,加速研究的進展。
五是開放研究材料(Open Materials),即將研究相關的材料進行公開。不同研究領域所使用的實驗材料可能千差萬別,但從可重復性的角度來講,如果實驗材料未能開放,研究者可能很難真正地檢驗研究的方法,從而增加后續研究進行重復驗證的困難。
六是開放代碼(Open Code),即將數據分析的代碼開放。由于數據分析日益復雜,研究者很難詳盡地描述其所進行的所有分析,比如許多方法可以通過不同的代碼來實驗,不同的代碼可能會產生不同的結果,因此是否能夠重復也很難確定。
七是鼓勵重復驗證性研究,即學術組織和期刊鼓勵直接重復的研究,將此類研究作為對先前結果的檢驗。其目的在于避免直接重復被忽略而導致科學界失去自我校正的機制。一些心理學期刊,如Psychological Science,已經開始鼓勵進行注冊的直接重復研究。
八是增強可推廣性和樣本代表性。這一點主要是在不同的群體中檢驗某效應是否可以推廣。這對于心理學研究尤其重要,因為國際心理學界長期以歐美尤其是北美白人大學生為被試,顯然不足以代表全人類的情況。
開放科學有益于基礎研究
提高研究效率。由于數據、材料、代碼等均可以被重復使用,研究者能夠更快地檢驗自己的研究假設,不同的研究者可以從不同的角度去挖掘同一批數據,新手可以更快地學習,這大大加速了基礎研究的進度。同時,開放獲取讓信息流動加速,能夠更快地形成更嚴謹的做法。
提高研究質量。由于開放數據、開放材料和開放代碼意味著更加嚴格的同行評估,研究者本身也會更加嚴謹,原有作者團隊的數據、材料或者代碼中的不足也更容易被發現和改進,因此研究的質量也會提高。對直接重復實驗的強調,也有助于直接對原有研究進行檢驗,從而提高研究的質量。
讓研究更經濟。數據開放增加了數據的再利用率,減少了收集數據的成本。而增強可重復性的要求,使不可重復的研究避免被當作事實,進而有助于減少后續研究者的跟進和資源投入。
讓研究者更健康。加強基礎研究的開放性和可重復性,有助于提高研究者的心理健康水平。開放科學強調以批判的精神來看待已發表的研究,使得研究者尤其是職業發展早期的研究者在面臨重復失敗時出現抑郁和沮喪情緒;而增強可重復性有助于降低研究者重復失敗的可能性,從而避免不必要的失敗和挫折。
開放科學運動給發展中國家帶來了機遇。一方面,在開放科學這種新的科研模式上,發展中國家與發達國家同在一條起跑線上,從而在實踐上能夠快速采用新的科研方式。另一方面,開放科學意味著大量數據與資源的開放,發展中國家可以更方便地獲取資源和科學論文,避免信息和數據不均衡帶來的弊端。
開放科學帶來新挑戰
基礎設施。開放科學意味著研究者需要統一的平臺來存放數據、材料和代碼等電子資源,需要便于使用的基礎設施。目前,國際上已經有OSF、INDI、Openneuro、Dataverse等多個針對單個領域的數據平臺。如何建設方便研究者使用、提交、維護的公開平臺,是基礎領域的研究者尤其是發展中國家的研究者面臨的挑戰,否則只能將本國的數據上傳于國際平臺。
安全與隱私。開放數據、材料與代碼需要考慮保護隱私與保證數據安全的問題。雖然絕大部分公開的數據已經做了匿名化處理,但是隨著技術的進步,這些匿名數據有可能在未來不再匿名。如何保證數據的安全性,保護數據提供者的隱私,是數字化時代科學研究者與其他社會成員面臨的共同問題,需要在政策和法律層面予以明確規定。
思維定式。開放科學對研究者的思維方式形成了挑戰。在傳統的研究中,數據收集者傾向于認為自己是數據的擁有者。但實際上,數據的擁有者是數據提供者(受試者)或者提供收集數據資金的資助方(政府或者其他基金)。傳統基礎研究中,對數據的所有權并沒有進行明晰的劃分,開放科學時代需要進一步明確數據的歸屬和公開方式,需要政策上的進一步探索。
評價和獎勵體系。開放科學需要新的評價和獎勵體系。傳統的研究體系中,重視“新”有余而重視“可靠”不足,因此傾向于發表新異的研究,不鼓勵重復研究。同時,在對研究者個人的獎勵中,重視發表文章而不重視文章背后研究本身的意義。傳統研究中的這些做法均與可重復性危機密切相關。開放科學運動需要改變這些做法,這將是一個嚴峻的挑戰。
訓練體系。開放科學需要全新的研究實踐,這些實踐目前還處于探索中。大部分基礎科研工作者同時也在訓練下一代的研究者,因此如何進行培訓也將是一個挑戰。
總之,開放科學運動帶來的系統性反思,給基礎研究帶來了重大變化,這些變化對基礎研究來說是巨大的契機,也是巨大的挑戰。基礎研究中的科研工作者,需要積極地迎接挑戰,把握契機,做出更好的研究。
(作者單位:南京師范大學心理學院)