随着信息技术迅猛发展,新型信息分析技术被应用到政治学研究中来。许多政治学研究者采用当前比较成熟的大数据爬取、大数据文本分析等技术,获取新的研究素材并进行分析整理。同时,以亿万为量级单位的大数据本身就具有政治学研究价值。可以说,大数据为政治学带来研究方法上的创新,也进一步拓展了政治学研究领域。
基于大数据对网络民意进行研究。网络上有许多现成数据可以用于对网络民意和政府部门回应进行研究。一些政治学研究者常把两类网络大数据用作分析素材:一类是政府网络问政平台上的群众留言及相关部门回复信息,另一类是主流媒体网站以及微博、微信等社交媒体平台上的网民发帖信息。这些数据都可通过数据爬取技术直接获取。第一类数据经过分析处理后,可以反映群众关注的议题类型分布、政府相关部门回应的特点和问题解决程度。还可以进一步分析特定类型群体在什么时期大致提出哪些类型的诉求。第二类数据主要用于分析网民对某一具体事件的看法和态度。对微博等社交媒体的数据分析,不仅关注具体话题,还将话题和情感、偏好等因素分析相结合,呈现网络民意对某个具体事件的态度演变过程及影响网络民意变化的具体因素。可以说,网络大数据的应用极大丰富了政治学对网络民意的研究方式。
对文本转换后的大数据进行分析。在网络大数据之后,研究者尝试挖掘其他非现成的、更具独特性的大数据信息。这类信息主要有两种,一种是从公开平台获取的大数据文本。这类数据通过数据爬取技术获得,但发布这些数据的平台并非人人皆知,需要研究者去搜寻。目前,政治学研究者较多关注并取得研究进展的大数据主要有:从裁判文书网获取的司法大数据,从人大代表的议案建议库和政协委员的提案库中获得的文本大数据等。随着政府信息公开力度加大,这类可供研究的信息资源会越来越丰富。另一种数据需要先进行文本转换才可使用,如对历史资料的研究。相当数量的历史资料是以图片形式而非文本形式存在的,这就需要通过识别技术将图片信息转换为文字文本,然后进行大数据分析。这类数据的获取难度较高,不过一旦形成数据库,对政治学研究则有较大帮助。
大数据为政治学提供新的研究素材和分析技术,但并未改变政治学研究的本质。面对层出不穷的新素材和新工具,政治学研究者需要保持清醒头脑,不能陷入对数据和方法的盲目追求中。同时,应结合政治学研究本身的特点,发挥大数据技术优势,推动信息技术在政治学研究应用中取得更多突破。一是开发更多样化的大数据类型。目前,政治学研究分析的大多是文本形式的大数据。文本信息只是浩瀚信息世界中的一种,还有图片、音频、视频等大量信息类型有待开发利用。这些类型的大数据有的在商业领域已有较成熟的应用,研究者可考虑以合适方式将其应用于政治学研究。二是探索更前沿的大数据分析技术。现有的分析技术还离不开人工标注,需要政治学研究者从大数据中抽出很小一部分,对这部分数据进行人工阅读和标注,然后利用机器学习的方法,让计算机基于人工标注的数据去分析剩下的大量数据,尝试得出相应结论。由于人工标注的数量不等,分析的效果也参差不齐。在文本挖掘上,需要进一步开发更先进的技术。三是实现更复杂的大数据分析目标。现有的大数据分析主要是对数据所体现的政治现象进行描述,尚未具备解释政治现象、发现运行规律以及进行预测的功能,这需要更进一步的技术支持和研究突破。从这个角度看,大数据的开发利用在政治学研究领域还有更为广阔的发展前景。
(作者为中山大学政治与公共事务管理学院教授)
来源:人民日报
编辑:杜莉
审核:张瑞华
三审:郑海兵