当前位置:文档之家› 公共卫生网络舆情监测系统的设计和实现

公共卫生网络舆情监测系统的设计和实现


3.4 个性化舆情服务:专题列表
3.4 个性化舆情服务:收藏管理
新建收藏夹 显示:收藏夹列表、专题导航、结果列表、序 号、标题、来源和相关时间。具备删除和制作简 报操作。
3.4 个性化舆情服务:舆情简报
监测网站举例……
CDC关注的网站
天津市疾病防控中心 健康报网 搜狐健康新闻 中国医药网卫生部新闻 中心 QQ新闻 中国网络电视新闻台 南医大公卫网 媒体门户 凤凰网资讯 环球网 联合早报 新浪国内新闻 网易新闻
内容提要
•建设背景 •系统设计 •系统功能
2、系统设计
基于互联网信息采集技术和数据挖掘技术,实时动态监测卫生相关的新闻门户、论坛、 博客等相关互联网站点,实现对互网海量信息的全方位实时扫描和监测。并利用数据挖掘 技术、全文检索技术、内容管理等技术对监测到的数据进行聚类、分类、统计分析等处理, 及时掌握网络上的卫生领域舆情热点,并对热点信息进行持续跟踪。及时发现网络突发性 事件和敏感舆情,实现对卫生领域互联网舆情的全面掌控。
敏 感 信 息 监 测
保 障 体

舆情 规划

文本挖掘技术
非结构化数据存储管理技术
内容分析管理技术
与采

舆情规划
信息采集 信息预处理 信息排重 信息抽取
硬件、网络平台
2.1、网络信应息用软采件系集统架系构图统体系结构
1
5
信息处理
2
4
6
3
8
7
9
应用服务器
数据库
临时数据 库
审核数据 库
概念关系词典、 敏感关键词库和样本库
2.1 系统设计-网络信息采集系统
数据分类与挖掘
支持全文、标题、敏感句、来 源及频道等多种规则
树形分 类体系
2.1 系统设计-网络信息采集系统
数据存储
数据可增量索引,新抓取的数据可以及时发布 采用视图和并行表管理方式,可以支持超大规模的数据存储管理 可自动维护数据,定时删除过期数据 数字对象可选择存放目录和数据库两种灵活方式
舆情简报 头版动态 舆情检索 统计报表
其 他 舆 情 服 务


智能处理
智能分析

规舆

情 自自信信智自联

分 动动息息能动规 析 分聚指过检标则
处 类类纹滤索引挖
体理

采集资源库 舆情信息库
舆 情 热 点 发 现
倾 向 性 分 析
传 播 路 径 分 析
舆 情 趋 势 分 析
舆 情 预 警 分 析
热 点 话 题 跟 踪
• 在重大专项艾滋病和病毒性肝炎等重大传染病研究信 息化技术平台研究( 2009ZX10004-215 )资助下,我 中心建设了公共卫生网络舆情监测系统。
1、建设背景
网络舆情监测系统以解决用户的网络舆情监测与监 控为目的,通过对新闻媒体、论坛、博客等网络信息源 进行采集、过滤、分析,形成舆情简报、专题报告、热 点分布等分析结果,以丰富的监测数据和舆情分析报告 为主要依据,为用户提供个性化、专业化和系统化的舆 情信息服务,最终使用户全面掌握热点动态,把握关键 舆情热点,做出正确舆论引导提供决策依据。
内容提要
•建设背景 •系统设计 •系统功能
3.1 舆情动态发布 热点词
根据热点词热度列出前二十位 热点词,可自定义数量;查看更多热点 词按钮
饼型图表 今日主流 媒体热点 词排序统 计
3.1 舆情动态发布-热点词
按a-z排列显示热点词 热点词出现趋势统计,以及时间范围 显示包含热点词的新闻列表
3.1 舆情动态发布-定制专题
3.1 舆情动态发布-舆情检索
舆情分类体系分类检索 依照关键词、标题、正文和摘要检索等自定义 检索。具备二次查询功能。
பைடு நூலகம்
3.2 舆情趋势
分类、分时间段查看 柱状分布图
3.3 舆情地图
分时间段显示各省分布
3.3 舆情地图
点击地图显示具体信息
3.4 个性化舆情服务:舆情定制
专题列表的管理 专题定制 检索范围:标题、关键词、正文、摘要和分类体系; 动态添加删除检索条件,条件之间可以设置关系。
媒体舆情具有创造舆论和情绪的巨大力量!! 网络舆情,特别是热点舆情有着发生范围广、传播 速度快、影响大的特点,因此研究网络热点舆情的监控 技术是网络舆情管理的需要,也具有着重大意义。
• 例:疫苗接种、H1N1病毒、抗震救灾等等。
1、建设背景
• 应对公共卫生事件中,很重要的一项工作——舆情监 测。
• 疾控机构应加强舆情监控和管理制度建设,通过成熟 的网络舆情监控工具,结合完善的工作机制,保障公 共危机事件网上舆情得到妥善处理。
发布数据 库
( 图中粗线箭头表示了信息数据处理)
2.1 系统设计-网络信息采集系统
数据分类与挖掘
集成多种分类算法KNN、VSM及Bayes 支持规则和模型两种分类方法:规则与模型可单独使用,也可并行及串行 多字段分类:支持标题、正文、来源及URL 支持不同规则之间的“与”、“或”关系 支持关键词之间的“与”、“或”、“非”关系,以及支持关键词的距离 关系 能够自动提取关键词和摘要 自动挖掘采集数据之间的相似关系 挖掘系统中的热点关系词及各个词之间的关联关系
互联网
网络采集系统
数据抓取 信息去噪
清华同方知网系统软件公司
智能信息处理 文本分类、聚类
信息过滤
舆情分析、预警 信息服务
发布系统
2、系统设计-总体功能框架
多终端服务(门户网站、短信、Email等)
舆 情 服 务

舆情监测研判
热突重特舆热最 点发大定情度新 舆事专人趋排话 情件题物势名题 预监监监监监监 警测控控测测测
2.1 系统设计-网络信息采集系统
数据发布
支持网页快照功能 自动链接相似网页 门户式、数据库式、搜索引擎式等多种发布方式 图片搜索 pdf、Word、ppt等附件搜索
2.2 系统设计-舆情分析与处理
智能信息处理层
中文智能信息处 理包括非结构化数 据管理、文本挖掘、 自然语言处理、概 念关系词典等核心 技术。它提供对海 量数据进行智能检 索、自动分类、自 动聚类、关键词自
自动 分类
自动 聚类
信息 指纹
信息 过滤
关键词 标引
自动 摘要
相似 检索
相似性 分析
关联 挖掘
动标引、自动文摘、
自然语言处理引擎
信息过滤、关联规 则 挖 掘 等 多 种 实 用 全切分切词
语义分析
语句法分析 未登词识别
功能。以其为基础
可方便地开发应用
概念关系词典
系 统 , 快 速 地 实 现 五百万级专业词汇,涵盖所有专业,详尽描述词和词之间各种关系: 智 能 信 息 挖 掘 , 有 同义、缩略语、译名、上下位等
公共卫生网络舆情监测系统
设计和实现
中国疾病预防控制中心 公共卫生监测与信息服务中心
内容提要
•建设背景 •系统设计 •系统功能
1、建设背景
近年来,随着Internet的迅速发展,网络在我国的 政治、社会生活中的重大作用日益凸显,而网络舆情作 为社会舆情在网络中的延伸,不仅反映了现实社会中的 各类问题,而且会对现实社会产生重大影响。
医生在线 医学论坛网 12320新闻频道 新华网健康频道 大公网健康首页 健康中国
论坛 天涯杂谈 中华网论坛 网易论坛社会万象 新浪社区
监测主题和关键词举例…...
一级分类 传染病事件
二级分类 炭疽 霍乱 鼠疫 艾滋病
病毒性肝炎
结核 疟疾
关键词规则
炭疽 + 炭疽杆菌
霍乱 + 霍乱弧菌
鼠疫 + 鼠疫杆菌 + 人兽共患病
效地进行知识管理。
- 14 -
聚类展示
聚类可视化
聚类细览
2.3 系统设计-舆情服务
舆情动态发布:通过PORTAL动态发布技术,实时组建主题发布,快速 建立索引、实时全文检索。 舆论热点挖掘:基于文本挖掘技术,通过用户内容点击、浏览、检索关 键词等内容实现热点挖掘。 媒体报道监测:通过采集系统实时对用户设定的网站进行采集,动态数 据更新。 热点趋势分析:可根据要求对监测到的信息进行按时间、主题等不同维 度进行趋势分析,生成各种分析图表。 舆情预警:系统可根据设置好的舆情监测分类标准及权重自动对监测到 的信息进行预警。 舆情地图:基于采集源、发生地等关键点提取区域化的舆情地图。 个人舆情工作平台:可根据机构和个人的关注点进行个性化定制。
• 继续完善监测知识库的建设; • 建设各省联动的一体化公共卫生舆情监测预警
平台,包括舆情体系建设、预警模型研究等; • 实现对互联网舆情的全方位实时监测,并对舆
情信息及时进行积极疏导,保证公共卫生安全 ,促进社会和谐发展。
THE END
THANKS 恳请各位专家批评指正!
中国疾病预防控制中心
艾滋病 + 获得性免疫缺陷综合征 + AID S + 艾滋病病毒 + 人类免疫缺陷病毒 + HIV
病毒性肝炎 + 甲型肝炎 + 乙型肝炎 + 丙型肝炎 + 丁型肝炎 + 戊型肝炎 + 庚 型病毒性肝炎 + 病毒性肝炎 + 甲肝 + 乙肝
结核 + 肺痨 + 结核分枝杆菌
疟疾 + 打摆子 + 疟原虫
下一步设想
相关主题