星光舆情
西安舆情监测系统 西安舆情监测公司
说到舆情监测软件,很多人误以为只可以监测网络上面的文字信息,但是大家却忽略了图片识别还可以监测图片上面的文字信息,利用的是OCR图片识别技术,这个不是一个什么有难度的技术。那么小编来跟大家讲下什么是OCR技术吧。
OCR (Optical Character Recognition,光学字符识别)是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程;即,针对印刷体字符,采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工的技术。如何除错或利用辅助信息提高识别正确率,是OCR最重要的课题,ICR(Intelligent Character Recognition)的名词也因此而产生。衡量一个OCR系统性能好坏的主要指标有:拒识率、误识率、识别速度、用户界面的友好性,产品的稳定性,易用性及可行性等。
那么小编来跟大家详细讲下舆情监测软件里面加入了图片识别有什么弊端,首先舆情监测软件是可以实现全网图片识别的,但是很多网络舆情监测软件却没有这样做,主要是因为图片识别需要时间,这样会影响到网络舆情监测软件的采集速度。特别是一些长文的文章,需要特别多的时间来识别里面的文字。还有就是舆情监测软件如果要图片识别会占用很大的服务器内存。这样一般舆情监测软件厂商只需要几十台服务器就可以完成的工作,如果加入了图片识别,可能还得加很多服务器到这个舆情监测工作中。而且图片识别对用户的需求不是很大,但是成本高,所以很多舆情监测软件厂商就不用图片识别或者在软件中只识别部分网址里面的图片上面的文字。
所以说:目前国内没有任何一家舆情监测软件厂商有把图片识别放入到所有的系统中,只是部分网址有做了图片识别技术。