大資料助力政治學研究

隨著資訊科技迅猛發展,新型資訊分析技術被應用到政治學研究中來。許多政治學研究者採用當前比較成熟的大資料爬取、大資料文字分析等技術,獲取新的研究素材並進行分析整理。同時,以億萬為量級單位的大資料本身就具有政治學研究價值。可以說,大資料為政治學帶來研究方法上的創新,也進一步拓展了政治學研究領域。

基於大資料對網路民意進行研究。網路上有許多現成資料可以用於對網路民意和政府部門迴應進行研究。一些政治學研究者常把兩類網路大資料用作分析素材:一類是政府網路問政平臺上的群眾留言及相關部門回覆資訊,另一類是主流媒體網站以及微博、微信等社交媒體平臺上的網民發帖資訊。這些資料都可透過資料爬取技術直接獲取。第一類資料經過分析處理後,可以反映群眾關注的議題型別分佈、政府相關部門迴應的特點和問題解決程度。還可以進一步分析特定型別群體在什麼時期大致提出哪些型別的訴求。第二類資料主要用於分析網民對某一具體事件的看法和態度。對微博等社交媒體的資料分析,不僅關注具體話題,還將話題和情感、偏好等因素分析相結合,呈現網路民意對某個具體事件的態度演變過程及影響網路民意變化的具體因素。可以說,網路大資料的應用極大豐富了政治學對網路民意的研究方式。

對文字轉換後的大資料進行分析。在網路大資料之後,研究者嘗試挖掘其他非現成的、更具獨特性的大資料資訊。這類資訊主要有兩種,一種是從公開平臺獲取的大資料文字。這類資料透過資料爬取技術獲得,但釋出這些資料的平臺並非人人皆知,需要研究者去搜尋。目前,政治學研究者較多關注並取得研究進展的大資料主要有:從裁判文書網獲取的司法大資料,從人大代表的議案建議庫和政協委員的提案庫中獲得的文字大資料等。隨著政府資訊公開力度加大,這類可供研究的資訊資源會越來越豐富。另一種資料需要先進行文字轉換才可使用,如對歷史資料的研究。相當數量的歷史資料是以圖片形式而非文字形式存在的,這就需要透過識別技術將圖片資訊轉換為文字文字,然後進行大資料分析。這類資料的獲取難度較高,不過一旦形成資料庫,對政治學研究則有較大幫助。

大資料為政治學提供新的研究素材和分析技術,但並未改變政治學研究的本質。面對層出不窮的新素材和新工具,政治學研究者需要保持清醒頭腦,不能陷入對資料和方法的盲目追求中。同時,應結合政治學研究本身的特點,發揮大資料技術優勢,推動資訊科技在政治學研究應用中取得更多突破。一是開發更多樣化的大資料型別。目前,政治學研究分析的大多是文字形式的大資料。文字資訊只是浩瀚資訊世界中的一種,還有圖片、音訊、影片等大量資訊型別有待開發利用。這些型別的大資料有的在商業領域已有較成熟的應用,研究者可考慮以合適方式將其應用於政治學研究。二是探索更前沿的大資料分析技術。現有的分析技術還離不開人工標註,需要政治學研究者從大資料中抽出很小一部分,對這部分資料進行人工閱讀和標註,然後利用機器學習的方法,讓計算機基於人工標註的資料去分析剩下的大量資料,嘗試得出相應結論。由於人工標註的數量不等,分析的效果也參差不齊。在文字挖掘上,需要進一步開發更先進的技術。三是實現更復雜的大資料分析目標。現有的大資料分析主要是對資料所體現的政治現象進行描述,尚未具備解釋政治現象、發現執行規律以及進行預測的功能,這需要更進一步的技術支援和研究突破。從這個角度看,大資料的開發利用在政治學研究領域還有更為廣闊的發展前景。

(作者為中山大學政治與公共事務管理學院教授)

《 人民日報 》( 2021年10月25日 09 版)