阳光安吉专业舆情监测产品白皮书阳光安吉公司公司简介阳光安吉成立于2009年8月,是一家专注于互联网舆情监测服务,提供整合网络信息服务的专业服务型企业;公司致力于用户体验优化和高新技术创新,在互联网信息采集与数据挖掘、搜索引擎核心技术、自然语言智能处理等领域的科学研究,运用最前沿的全文搜索技术、内容管理技术、文本挖掘技术、中文分析技术、海量数据处理技术,为各行业提供专业的互联网信息整合、舆情服务,从而创造和实现新的价值企业优势首家在网络舆情监测领域引入“云计算”技术的高科技企业;首批提供全网监测的网络舆情监测服务提供商;中国唯一一家承诺舆情情感倾向判定高准确率的监测平台;舆情行业标准的参与者与制定者;专注于舆情产品的研发与推广,是自主可控的舆情产品生产商软件著作权阳光安吉云监测--网络舆情监控(非企业版)系统,项目编号:2011SR021587阳光安吉云监测--网络舆情监控系统V2.0,项目编号:2011SR020874互联网实时在线监控平台软件,项目编号:2011SR020301口碑营销效果分析系统,项目编号:2011SR021428互联网服务器网关控制软件,项目编号:2011SR020136项目名称:阳光安吉云监测--网络舆情监测系统V1.0,项目编号:2010SR028970网络作为新的信息传播形式,已代替电视、报纸等传统媒体成为舆论传播的新载体。
近两年来,中国网民规模急剧扩大,网络基础设施日益完善,互联网普及率不断提升:2012年中国网民规模达到5.13亿,手机网民突破5亿,互联网的重要性逐渐凸显,已在社会、政治、经济、文化等各个领域发挥着重要作用。
互联网的发展使网络信息迅速膨胀,如何在浩瀚的网络世界中发掘出重要的信息和情报,将是政府、企业、媒体关注的重点。
特别是“微博”的崛起,网络议题得到传统媒体的响应和深入挖掘,而传统媒体的报道也经常在网上被迅速发酵、放大成全国性舆论。
政府部门面临的挑战广西烟草局长“香艳日记”、山东新泰选拔23岁副局长、南京“徐宝宝”……一系列在全国范围内掀起舆论旋风的事件几乎都发端于网络论坛,在网络民意的推动下,一步步发酵升级,并最终解决。
而“信访不如信网”也成为当下许多利益受损群众信奉的法则。
在观察这些网络事件时不难发现,不少事件最初都出现在地方网络论坛上,在问题没有得到解决的情况下,才逐步向全国性论坛转移,最终升级为公共事件。
信息对企业的战略作用比尔.盖茨曾在《未来时速》一书中提出“怎样收集、管理和使用信息将决定企业的成败”的重要观点。
在信息、知识经济时代,信息已被国际公认是继资金、技术、人才之后企业的第四大生产要素,信息、情报竞争也日趋白热化。
在第一时间获取关于公司的正负面新闻、泄密信息、公司领导的相关报道、近期的舆论热点等,以及深层次调研用户需求、市场反馈,改进自身的售后服务、借鉴竞争对手的核心竞争力情况等。
这些对于企业提升自身竞争力都至关重要。
信息对媒体的重要性相对传统三大媒体,网络新闻具有及时性、交互性、海量性、多渠道、个性化等特点。
如“躲猫猫”事件、“杭州飙车案”、“绿坝遭遇杯葛”、“上海市户籍新政”等热点事件多是通过网络进行第一时间传播。
从网络资源中发现舆情,追溯新闻事件起因,追踪事件发展,进行公正、客观的报道,为社会各界提供更具价值的信息服务。
搭建以互联网舆情监测平台为基础的未来信息服务新架构,将是新媒体时代提高信息服务质量的利器。
舆情是指在一定的社会空间内,围绕社会事件的发生、发展和变化,民众对管理者产生和持有的社会政治态度。
网络舆情是社会舆情在互联网空间的映射,是社会舆情的直接反映。
传统的社会舆情存在于民间,存在于大众的思想观念和日常的街头巷尾的议论之中,前者难以捕捉,后者稍纵即逝,舆情的获取只能通过社会明察暗访、民意调查等方式进行,获取效率低下,样本少而且容易流于偏颇,耗费巨大。
而随着互联网的发展,大众往往以信息化的方式发表各自看法。
网络舆情是人们对于该事件的所有认知、态度、情感和行为倾向的集合。
网络舆论的产生、发展网络舆论的形成,往往源于某些事件或问题的发生,也就是以某些具体的对象为依托。
一些关系国家民族利益的事件、自然灾害事件、与弱势群体相关的事件、反映社会道德困惑的事件、反映当今社会主要矛盾的事件的发生以及与国计民生相关的政策、法规出台,经媒体或网站论坛报道反映后,一般都会引起网民强烈关注与热烈讨论,并广泛传播开来。
网络舆论热点形成后,由于网民的情绪、意见等不断高涨,使热点受关注的程度越来越高,影响越来越大,进而吸引更多的网民关注网上热点。
热点持续一个时期后,逢新的事件涌现并产生新的话题,多数网民就会自动转向新的目标。
于是,原来的热点舆情便慢慢冷却,最终沉寂下来。
当然,依照舆情自身的变动规律,那些影响深远、关系重大的事件对网民的刺激和引发的舆情,只能说是“阶段性沉寂”,一旦有新的诱因关联性的事件发生,极有可能被网民旧事重提,再度成为热点。
网络舆论的特点与报纸、无线广播和电视等传统的传播媒体相比,网络媒体具有进入门槛低、信息超大规模、信息发布与传播迅速、参与群体庞大、实时交互性强等综合性特点。
由于网络信息的发布成本极低,信息的提供者、传播者和阅读者之间已经没有明显的界限。
信息网络已成为一个“虚拟社会”,具有非常明显的社会群体特征。
与此同时,“虚拟社会”与真实社会之间的互动日益显著。
通过因特网传播的信息包含了网民对当前社会各种现象以及诸多热点问题的立场和观点,话题涉及政治、经济、军事、娱乐、体育、卫生、科技、个人生活等各个领域。
网络舆论最直接、最快速地反映了各个层面的社会舆情状况与发展态势,它已成为社会政治、经济、文化等相关重要领域的社会舆情晴雨表。
本系统整合九大信息渠道,包括新闻、博客、论坛、微博、视频、问答、点评、平媒和搜索引擎,统一规划舆情信息体系、提高信息收集效率、加强重要信息采集处理的即时性和有效性,实现了多种格式信息源的采集、过滤、分类、去重,形成信息资源库,建立信息共享和组织协同处理机制,自动生成分析报告,提供强大的统计分析工具,全面提升舆情工作效率。
分析展现安吉专业舆情监测系统利用搜索引擎技术、文本处理技术、内容管理技术、全文检索技术、语义分析技术,通过对互联网海量信息自动获取、提取、分类、聚类、话题发现,实现用户对信息监测和热点事件专题报导等需求,形成舆情专报、舆情简报等分析结果,使客户全面掌握关键舆情动态,为做出正确决策提供分析依据。
本系统采用先进的云计算技术,对不同规模、不同预算、不同需求的用户都能满足其数据量全、功能完善、服务优良的需求。
针对特殊用户的特殊情况,为用户量身订制符合用户的最佳解决方案。
丰富的信息来源前沿技术支撑全面性全网监控:系统内置20余万国内主流网站采集源结合全部搜索引擎。
监控方式以定向监控与搜索引擎监控互补的方式;监控渠道包括(9种):新闻、博客、论坛、微博、视频、问答、点评、报纸、搜索引擎这些保证了我们基础数据的全面性,也为后面的各种统计分析提供保障。
准确性搜素引擎关键字采集、基于模板的定向采集、网页内容自动抽取、分析过滤广告等无效信息,以及高准确度文章情感倾向性判断等保证信息准确性。
及时性 安吉超强搜索能力和并发能力,可设置网站检索更新周期,自动收集网络关键信息,先进的预警功能,舆情报送功能,使用户第一时间掌握关键舆情。
安吉专业舆情监测系统三个重要特性安吉专业舆情监测系统功能网络舆情采集安吉专业舆情监控系统根据用户配置的采集策略自动采集网络上的各式文本信息。
采集器在互联网上不断采集各类信息,都可进行统一加工过滤、自动分类,自动提取标题、来源、发布时间、正文等信息,形成舆情数据库。
提供多种采集策略“定向采集”:用于实时监控互联网上指定网站的的重要信息,及时发现有价值的信息。
“定向采集”相对于搜索引擎采集具有获取数据速度快、信息采集准确度高等特点。
“全网采集”:通过设置关键字策略利用Google、Baidu、Bing等搜索引擎进行全网搜索。
相对于“定向采集”该方式大大提高搜索覆盖率,使信息获取不留死角。
丰富的信息采集内容支持网页结构自动分析信息采集器实现了基于网页结构的统计分析算法,能够根据模板标签自动识别、判断出每一篇文章正确的标题、时间、作者、来源等关键及其评论信息,满足舆情分析的需要。
支持Javascript、Ajax等动态技术生成的页面采集实现对采用动态技术生成博客、论坛、评论等信息准确和全面的采集。
支持登录采集通过对采集器进行登录设定,可以实现对需要登录验证网站的信息采集。
支持RSS解析许多博客、新闻评论采用RSS实现内容共享,除网页基本信息,RSS会包含更丰富的元数据信息,比如标题、作者、发表日期、分类、关键词等,这些元数据对于舆情分析有重要的价值,信息采集工具实现了对RSS聚合内容的自动解析和采集。
自动编码识别信息采集器采用领先的unicode编码技术,支持多种语言格式网页的采集。
URL去重信息采集器启动工作的过程中,对同一个网页不进行多次下载,因为重复下载不仅会浪费资源,还会为搜索引擎系统增加负荷。
URL去重控制这种重复性,很好的解决同一个网页重复下载的问题。
倾向性分析安吉舆情监测系统采用基于语义的文本倾向性研究方法,对文章内容进行人工智能化的情感分析,为用户及时发现负面信息提供保障。
准确度高于同类产品。
及时更新分词库舆情产品是否分类准确、判断准确的核心就在于其分词词库是否全面。
阳光安吉舆情系统的分词词库,不仅包含了百度的分词词库,更结合了搜索、腾讯等多个主流输入法的分词词库,实时更新,及时获取社会热词,而无需用户人工维护。
自动聚类由于网络转载的现象,网络上存在大量的重复信息,以往信息采集技术导致大量的重复数据,既增加工作量又耗费大量资源。
安吉信息采集器对重复信息内容自动判断和聚类,大大节省用户浏览效率又不会产生漏报情况。
智能过滤自动分析网页中的正文内容,剔除广告等垃圾信息。
即便通过关键词进行数据过滤,也会有一些包含关键词的垃圾信息,广告信息等。
这些信息严重影响用户的操作体验,并且会影响统计结果的准确率和说服力。
自动分类基于网页结构不同,将收集的信息自动按新闻、论坛、博客等渠道类型分类,结构清晰便于舆情工作人员第一时间找到有价值的信息。
敏感信息跟踪系统可根据用户的需求,对于用户关心的敏感微博、帖子、新闻实时更新其点击量、回复量等信息。
同时可监控该信息是否仍然存在在网络中。
为用户跟踪网文状态、及时处理提供依据。
专题分类阳光安吉与武汉大学合作,通过多年对政府舆情需求的研究,总结了政府关心的包括“公共管理”“民生问题”“执政形象”等7项大专题,100余个子专题,每个子专题又包含多个相关敏感词。
为政府用户提供一套专业、完整的舆情分类体系。