人民论坛:从舆情监测升级为舆情预警的思路研究

人民论坛:从舆情监测升级为舆情预警的思路研究
05/20/2022 No Comments 舆情行业新闻 admin

【摘要】网络舆情监测手段的滞后,会在一定程度上制约网络舆情监测评价的效果和引导作用的发挥。因此,相关部门要立足于网络舆情监测发展现状和面临的问题,创新监测视角和监测内容,促进网络舆情监测系统升级;从更新监测内容、建立危机事件大数据库、舆情预案大数据等方面构建起协调一致的舆情预警系统,实现对网络舆情的预警处理,有效应对网络舆情危机。

【关键词】网络舆情 监测 预警 社会情绪

虽然网络舆情堪称中国社会的晴雨表,但是发展到今天,网络舆情的监测手段却比较滞后,使其不能很好地起到评价和引导作用。一是监测数据具有滞后性,监测到的数据量的大小和未来舆情走势之间不必然形成对应关系,无法为下一步舆情走势提供判断依据;二是监测范围有限、监测内容维度单一,往往只是媒体发表或转发的数据,无法提供更多有价值的信息;三是监测结果的处理简单机械,无法提供有科学价值的决策参考意见。因此,要立足于网络舆情监测发展现状和面临的问题,构建新一代网络舆情预警系统,有效应对网络舆情危机。

舆情监测升级首要考虑因素:监测视角和监测内容的创新

自互联网媒体在中国兴起以来,民众的网络话语表达能力得以加强,社会矛盾开始聚焦到网络上,因而舆情监测显得尤为重要。传统的网络舆情监测主要对网站、社交媒体、论坛等某一主题的新闻或者贴文的数量进行统计。这种统计数据尽管可以结合一些算法或者模型,给出一些具有参考价值的信息,如发文数量、趋势、地理分布等,甚至能够计算舆情热度,但实际上比较机械,并不能进行更深层次的分析,如反映了哪些社会阶层的话语权、契合了怎样的社会心态等。因此,舆情监测方法的升级换代,首先要考虑的是监测视角和监测内容的创新。具体来说,就是要增加社会情绪、文本价值、社会阶层话语权等指标的测量内容。这些指标的测量,可以通过算法在监测舆情文本的同时自动标注,后期形成更加科学和深入的预警模型。

首先,舆情监测应增加社会情绪的监测内容。社会情绪其实本身就是舆论的重要组成部分,而且是影响网民直接卷入的最重要因素。随着新媒介技术的发展,人们在互联网上表现情绪的手段越来越丰富,如表情包、短视频、漫画、配音等,人们可以自由表达情绪,有的网络新生代甚至感觉比当面交流更能表现自己的情感。此外,新闻配合各种能够唤起情绪的表现形式成为社交媒体热帖的流行样板。同时,社会情绪本身还是一种信息,可以独立传播,并且情绪比事实具有更强的感染力和传播力。我们可以清晰地发现,在传播速度和次序上:“情绪”传播最快,其次是“事实”,最后才是“道理”。其实舆情发展到“事实”这一阶段传达到民众的时候就开始销声匿迹了,政府希望在“事实”基础上再进行总结引导,说说“道理”的时候,民众的触及率已经很低了。因此,在舆情监测的内容中,亟需增加对社会情绪传播的监测。

社交媒体时代的每一天都在产生海量的情绪信息,而这种信息的表现形式往往是非结构化或半结构化的文本,在对这些数据进行深入挖掘和分析时,信息科学的相关学科可以为舆论研究提供更好的支持。当前通常采取的研究路径主要是:通过信息技术快速进行文本的预处理,抓取含有情绪表达的文本并拆分,接下来通过人工建立语料库进而训练机器学习实现对情绪的标注和分类判别。当然,还有一种路径是建构情绪情感词典,以此作为基准使用机器进行编码。两者的分歧主要在于人工介入的环节和程度,特别是在汉语情境下,情绪判断常常还需要结合具体的语境。总体而言,学界普遍认为前者的准确率要高于后者。

其次,舆情监测需要对监测文本的价值类型进行标注。传统的舆情监测方式只是统计到了有关舆情的文本数量,实质上对于文本的性质、价值类别都没有作更深入的分析。文本属性对于后期的舆情研判也有特别重要的意义。按照舆情监测的不同需要,文本的价值至少分为主流正面、中性、反主流负面、边缘性价值等相互独立的指标。而实际上,对于文本价值(学术研究中主要集中于新闻价值)可以进行更多的分类,对于后期研判舆情有着非常重要的意义。我国传统的对于新闻文本价值的分类,有的已经过时了,如“及时性”“接近性”。这些在传统媒体垄断新闻传播的时代具有一定的参考价值,而在互联网时代早已突破时空的局限,“及时”和“接近”已经变得毫无意义。而结合最新的一些国际研究成果,对文本的离奇性、重要性、趣味性、互动性进行分析和标注无疑可以为后期的舆情研判提供足够多的参考价值。对这些文本尤其是高转发量文本的价值进行监测和捕捉,有利于后期同其他指标一起形成有参考价值的模型。

最后,舆情监测的内容要加入社会阶层话语权的分类标注。网络舆情的监测和引导本质上是化解社会矛盾的手段,而从根本上化解社会矛盾,还要从社会阶层的利益和诉求出发,在舆情监测的同时按照一定的算法捕捉和标注高转发量文本的社会阶层话语权指标,即每一个高转发量的文本所代表的是哪个社会阶层的话语权,这不但有利于了解具体事件中的社会深层次矛盾,而且有利于国家的长治久安。通过人工标注部分内容,然后根据这些人工标注内容让计算机进行“机器学习”以获得自动识别算法,再将捕捉到的高转发量文本进行社会阶层话语分类标注,这会为后期分析舆情的深层次矛盾提供有力帮助,也可以真正将社会矛盾分析和网络舆情分析有机衔接起来。

实现预警的关键环节:建立危机事件大数据库,实现自动匹配识别功能

简单来说,仅仅依靠舆情监测系统抓取到的某个舆情事件在互联网上传播的数量并不能判断这个舆情的大小。因为有的文本虽然当时转发数量大,但它并没有触及真正的社会矛盾,也许用不了多久就会自动湮灭;但有的文本虽然当时转发数量小,但它触及到了某个在社会中压抑、酝酿已久的矛盾,也许若干小时以后就会成为刷屏的大热帖,成为重大的舆情事件。而当前我们多数的舆情监测系统只能做到简单抓取相关文本的数量,对舆情的下一步走势不能作出任何有价值的判断。一个舆情事件爆发的能量从根本上讲是它在社会中长期酝酿的、累计的冲突势能,能够爆发的大的舆情事件一定是在过去的社会运行中蓄积了能量,而突发事件仅仅是它的导火索。因此要判断一个突发事件会发展成为多大的舆情事件,也就是实现舆情的预警,最关键的是要能够判断它已经在社会中酝酿了多大的冲突势能。

传统的舆情监测体系中对舆情的走势判断都靠人力来做,但是局限性非常大。首先是时间滞后,效率比较低。当舆情分析者看到相关舆情后,最先引起重视的是转发量比较高的文本。这就需要甄别处理,转发量高的未必有价值,但又不得不引起重视。当对转发量低但是有价值的舆情事件给予重视的时候,往往已经不是第一时间了。同时靠人力判断也非常耗时,容易漏掉重要内容。这些都导致决策缓慢、效率低下。其次是容易误判。因为人为判断缺乏科学依据,仅凭经验和直觉,不敢轻易下结论,或者下的结论非常保守,在一定程度上丧失了准确性。

因此,舆情监测体系能否真正升级成为舆情预警体系的关键在于,能否自动化、全方位、科学地判断一项舆情事件蕴含的冲突势能的大小。而这需要判断者具有非常高的科学素养和政治素养,将希望寄托在计算机的逻辑推理上基本上是不可能的。如何才能在舆情预警系统中实现这项判断,解放人力呢?采用大数据的“配对”思维来解决这一难题是科学和可行的。即我们预先根据建设系统单位的需求建立起一定范围内的相关危机事件大数据库,将对现在还有影响的发生过的危机事件分门别类收集起来,并作出级别大小、已解决程度、涉及利益人群、判断关键词、敏感时间等标注。一个大的舆情事件的发生,总有它的历史和现实原因,是一个深层次社会矛盾的反映。如果新发生的舆情事件和危机库中的历史事件是相匹配的“相关事件”,那么所涉及的深层次社会矛盾就会触发,而根据之前所发生的危机事件及其已经解决的程度、涉及的人群范围等情况,就可以判断现在发生的舆情事件所蕴含的冲突势能的大小。那就是,以往事件越是矛盾特别大、涉及人数多、还没有解决好,新的触发它的事件所蕴含的冲突势能就越大。一旦监测到这个文本,即使当时的文本数量还非常小,仍可以判断舆情的级别比较高。这样就真正实现了舆情预警系统的预警功能。

舆情应对的关键环节:加载舆情预案数据库

能够预判舆情事件的大小,对于舆情处理工作来说,还是不完整的。舆情处理工作中最大的挑战是第一时间作出最好的反应。舆情出现后,往往发展迅猛、涉及问题非常复杂,而留给相关部门准备的时间又非常短暂,如果不能在第一时间作出很好的回应,就会陷入被动。因此,好的舆情预警系统还应该帮助决策者在回应的质量上和时效上提供有力的支持。而解决这一问题的唯一出路就在于做好预案。如果没有预案,单纯地追求“快”反而会增大出错的几率。因此完善的舆情预警系统还应该包含如何回应和引导舆论的预案系统。

要根据危机数据库中所涉及到的危机事件,分门别类地建立相应的预案。预案应由专家组逐个论证后建立,根据以往情况和具体国情,什么类型的危机事件应该实施怎样的应对策略,或者采取怎样的回应方式,都应有较为详细的可实施措施。预案库的意义在于,在事件发生前有专家组做了深入的、冷静的分析,当舆情事件出现时,尽管事件可能会同预案中的事件有所不同,但是相关或者类似事件的预案会给决策者提供极大的参考信息。

最终在系统中呈现的解决方案还应包含前期舆情数据抓取中获得的相关指标,对涉及到的社会阶层、社会情绪、文本的价值,以及相对应的历史上危机事件的相关度,都有科学的分析。再根据以上综合情况,给出一个解决模型或思路。这样的舆情预警系统才会智能化,才能最大限度地体现当下社会科学和自然科学的水平。

舆情预警的实现:整体监测体系的协调一致

要实现舆情监测系统的更新换代,构建完整的舆情预警体系,就要在实施过程中体现出系统建设的思路。既要在系统建设的过程中尽量使之科学、智能、准确,同时还要考虑系统的可实施性。这一系统建设思路基本上可以概括为三个阶段:首先是舆情文本抓取,指标标注;其次是危机事件大数据库匹配定级;最后是预案库根据前面两步提供的数据给出预案建议。这个思路在目前计算机科学和社会科学发展阶段应该是可行的、能够实现的。此外,根据不同单位的需求,舆情预警体系数据库建设是可大可小的,前期监测内容的变量也可以作相应调整。建立这样的系统至少还应该注意以下几个方面:

首先,监测变量的确定、抓取方法要科学、准确。本文提供的是一个建立社会普遍层面的舆情预警体系的设计思路,具体到某一个单位,还应根据本单位情况对监测的内容作适当调整。社会情绪的变量可根据不同的单位性质作粗犷或者精细的调整,如粗犷的设计,则可以简单地分为积极、消极、中性的;如果需要精细化,则可以根据心理学上的分类,最细可将社会情绪分为欢喜、愤怒、悲哀、同情、感动等32种。文本的价值分类也可以根据实际情况作出相应的调整。最关键的是,要对这些变量的调整作出科学的判断,否则会导致后续模型的精确度降低。

其次,要对本单位的历史作系统的梳理。数据库的建设是一个巨大的工程,甚至涉及到建设单位的敏感事件和机密,但是为了实现系统预警功能,要对本单位的历史作系统的梳理。数据库的建设一定要全面、准确、细致,建设的过程可采取一定的保密措施。一个单位的舆情还会受到相关行业舆情事件的影响,因此危机事件案例库的建设还需充分考虑这些情况,将所有可能涉及的危机事件都纳入大数据库,将可能出现的危机事件都进行预案建设。这样才能确保一旦舆情事件触发,能够在第一时间准确、科学地提供判断和指导,尤其是使危机事件的数据库具有“大数据”的性质,以更好发挥系统效能。

最后,舆情预警体系建成后,要确保各个环节有机衔接,并维持实时更新状态。舆情预警体系的三个环节运行后,应该是浑然一体的,前期指标的统计和标注对后期的判断起着至关重要的作用,即前后期的指标应该标准化,整个过程算法要确保系统协调一致。此外,社会无时无刻不在运行,任何体系都是一个动态的平衡,因此要定时对系统的危机事件大数据库、预案库作更新处理,尤其是一个单位的舆情事件还会受到社会大环境舆情事件的影响,致使新情况层出不穷,而实时做好两个数据库的更新,虽然工作繁琐,但是才能真正做到防患于未然。

总之,本文在建立舆情预警系统基础上,从社会矛盾的分析入手判断舆情事件蕴含的冲突“势能”,进而提出科学的舆情应对模型或方案。这一思路是政治学分析社会矛盾的方式同计算机技术的有机衔接,是大数据思维在舆情预警系统上的应用。

(作者为中国人民大学新闻学院副院长、教授)

About The Author

Leave a reply

您的电子邮箱地址不会被公开。 必填项已用*标注