随着互联网的快速发展,网络媒体作为一种新的信息传播形式,已深入人们的日常生活。网友言论活跃已达到前所未有的程度,不论是国内还是国际重大事件,都能马上形成网上舆论,通过这种网络来表达观点、传播思想,进而产生巨大的舆论压力,达到任何部门、机构都无法忽视的地步。可以说,互联网已成为思想文化信息的集散地和社会舆论的放大器。
在谷尼大数据成立11年周年来临之际,据国家版权局颁发的著作权证书上我们看到谷尼的第一套舆情系统产生的时间为2007年10月22日,名称叫“Gooniespider互联网舆情与情报信息监控系统V2.0[简称:Gooniespider互联网舆情监控系统]”,截止到2018年8月1日已经超过十年,目前的应用的客户超了500个。
Gooniespider互联网舆情监控系统依托自主研发的搜索引擎技术和文本挖掘技术,通过网页内容的自动采集处理、敏感词过滤、智能聚类分类、主题检测、专题聚焦、统计分析,实现各单位对自己相关网络舆情监督管理的需要,最终形成舆情简报、舆情专报、分析报告、移动快报,为决策层全面掌握舆情动态,做出正确舆论引导,提供分析依据。
系统结构
功能特点
l 元数据自动识别、无需模板配置
互联网舆情监控系统可自动识别抽取文章标题、发布时间、作者、摘要、正文关键元数据,无需单独配置模板标签。
l 支持两微一端信息监测
互联网舆情监测系统支持新闻APP、微信、微博以及境外Twitter监测采集。
l 自定义URL来源及采集频率
舆情监测系统用户可以设定采集的栏目、URL、更新时间、扫描间隔等,系统的扫描间隔最小可以设置成1分钟,即每隔一分钟,系统将自动扫描目标信息源,以便及时发现目标信息源的最新变化,并以最快的速度采集到本地。
l 支持多种网页格式
互联网舆情监测系统可以采集常见的静态网页(HTML/HTM/SHTML)和动态网页(ASP/PHP/JSP),还可以采集网页中包含的图片信息。
l 支持多种字符集编码
网络舆情系统采集子系统能够自动识别多种字符集编码,包括中文、英文、中文简体、中文繁体等,并可以统一转换为GBK编码格式。
l 支持全网关键词采集
舆情软件元搜索模式是以国内知名互联网搜索引擎的结果为基础并利用Goonie采集器直接面向互联网定制内容进行直接采集,用户只需要输入搜索关键词就可以了。
l 支持内容抽取识别
网络舆情监测系统可对网页进行内容分析和过滤,自动去除广告、版权、栏目等无用信息,精确获取目标内容主体。
l 基于内容相似性去重
网络舆情监控系统通过内容相关识别技术自动判别分类中文章的关系,如果发现描述相同事件的文章自动去除重复部分。
l 支持手机WAP浏览
舆情软件系统支持手机wap浏览访问,不限手机系统平台无需安装手机客户端,通过手机浏览器即可实时掌握最新舆情动态。
l 支持短信、邮件等舆情预警
舆情监控系统7×24小时监测敏感信息,通过手机短信、邮件等方式实时预警。
功能描述
l 热点话题、敏感话题识别
系统可以根据新闻出处权威度、发言时间密集程度等参数,识别出给定时间段内的热门话题。利用内容主题词组和回贴数进行综合语义分析,识别敏感话题。
l 舆情主题跟踪
系统分析新发表文章、贴子的话题是否与已有主题相同。
l 自动摘要
舆情监控系统对各类主题,各类倾向能够形成自动摘要。
l 舆情趋势分析
网络舆情系统分析某个主题在不同的时间段内,人们所关注的程度。
l 突发事件分析
网络舆情系统对突发事件进行跨时间、跨空间综合分析,获知事件发生的全貌并预测事件发展的趋势。
l 舆情报警系统
网络舆情系统对突发事件、涉及内容安全的敏感话题及时发现并报警。
l 舆情统计报告
网络舆情系统软件根据舆情分析引擎处理后生成报告,用户可通过浏览器浏览,提供信息检索功能,根据指定条件对热点话题、倾向性进行查询,并浏览信息的具体内容,提供决策支持。