什么叫做网络舆情监测?

什么叫做网络舆情监测?
11/19/2019 No Comments 行业新闻 admin

海量原始数据的实时存储:为了实现一套完整的民意系统,需要采集上游原始输出,即爬虫系统。爬虫需要从各种门户网站和媒体收集Web内容。抓取前需要进行加权,抓取后还需要进行分析提取,如抓取子页。

原始网页数据处理:无论是主流门户还是自媒体网页信息,都需要抓取后做一些数据提取。我们需要将原始网页内容转换为结构化数据,如文章标题、摘要等。如果是商品评论信息,我们还需要提取有效的评论。

结构化数据的舆论分析:当各种原始输出成为结构化数据时,需要有一个实时计算产品,对各种输出进行合理的分类,并在情感上对分类后的内容进行进一步的标注。根据业务需要,可能会有不同的输出,如品牌是否有热门话题、舆论影响分析、传播路径分析、参与用户统计和肖像、舆论情绪分析或是否有重大预警。

在舆论分析系统中存储中间数据和结果数据,进行交互分析和查询:从清理网页原始数据到最终舆论表,数据种类繁多。其中一些数据将提供给数据分析学生,以优化民意分析系统,一些数据将提供给业务部门,以根据民意结果做出决策。这些查询可能很灵活,要求我们的存储系统具有全文检索、多字段组合的灵活交互分析功能。

重大舆论事件的实时预警:除了对舆论结果的正常搜索和显示需要外,还需要能够在重大事件发生时进行实时预警。

About The Author

Leave a reply

您的电子邮箱地址不会被公开。 必填项已用*标注