当前位置:文档之家› 总结及下一阶段工作计划

总结及下一阶段工作计划

数据网格不去解决的问题:
❖ 多类的和复杂的信息格式 ❖ 信息表示和元数据
❖ 智能化信息获取 (Information retrieval)
❖ 信息网格
信息网格解决的问题
❖ 信息的智能化获取 ❖ 信息检索 ❖ 信息的表示 ❖ 多类的元数据和结构化
❖ 给用户和应用程序提供特定 内容的信息服务
信息网格不去解决的问题
❖ InfoGrid[8]:一个实现信息访问应用的框架,其上提 供用户界面及交互模型。它集中于获取应用程序对 象,以其对于信息,数据和服务的统一访问 (retrieval-centered interaction model for information access applications)
大纲
❖ 信息网格研究综述 ❖ 阶段论文和科研成果 ❖ 基于属性的搜索引擎 ❖ 信息网格设计
阶段论文和科研成果
❖ 对等网络及信息网格的基础设施(infrastructure) 研究
结构化对等网络上静态和自适应的数据备份策略 基于节点异构信息的路由及负载平衡算法
❖ 信息搜索和基于语义的信息表示研究
应用于大规模分布系统的潜在语义分析和信息索引策略 查找环(Lookup-Rings):动态网络环境上的高效信息
❖ 海量数据存储,数据管理 ❖ 计算问题及强数据量(data-
density)的计算和数据访问 方式
信息网格和知识网格
❖ 信息网格
信息网格解决的问题
❖ 信息的智能化获取 ❖ 信息检索 ❖ 信息的表示 ❖ 多类的元数据和结构化
信息网格不去解决的问 题
❖ 数据挖掘 ❖ 问题求解
❖ 知识网格
知识网格解决的问题
❖ 数据挖掘、知识挖掘 ❖ 规则的发现 ❖ 数据、信息的可视化 ❖ Ontology 转换
知识网格不去解决的问 题
❖ 无结构信息的半结构化 ❖ 元数据格式的匹配和转换 ❖ 信息智能化检索
资源网格、信息网格与服务网格[2]
信息网格的其他讨论
❖ 信息网格作为计算网格和知识网格的中间层次,允许对于异 构信息的统一访问,提供分布式资源上的公用信息服务。统 一访问依赖于metadata对于信息的描述(并集成异构资源)
检索 基于元数据表示的信息网格
阶段论文和科研成果
❖ 大规模分布系统上消息传递及同步机制
O(1)复杂度对等网络路由算法 高可靠的大规模分布系统广播机制
结构化对等网络上 静态和自适应的数据备份策略
❖ 针对传统的“连续k-近邻”数据冗余备份算法之不 足,提出改进的“分区近邻”备份算法,适应高度 动态环境下的数据备份要求,很大程度上避免了无 用的数据迁移,节省了系统维护开销
信息网格的其他讨论
❖ IPG (information power grid), NASA.:针对与对异 构分布式信息资源的无缝访问[7]
❖ GIG (global information grid), USA Defance. 强调 以网络为中心的通信,信息广播和作战系统(netcentric information environment)
❖ 提出一个系统维护开销模型,并给出基于模型的优 化策略
❖ 提出variation-tolerant recovery和adaptive probing 相结合的系统维护策略,实现了静态的和自适应的 数据冗余备份
基于节点异构信息的路由 及负载平衡算法
❖ 传统对等网络采用哈希算法实现总体上的负载平衡。 这种简单处理方式没有能有效的利用节点能力(强 节点),并且仍然有一定程度上的负载不均衡
❖ 建立了对于潜在语义和用户使用特性的后验概率模型,使用 MAP (maximizing a posteriori)进行优化求解。采用基于E-M 优化的迭代算法实现了对于潜在语义表示空间的降维和求解, 避免了分布式环境下SVD分解的复杂计算量
[4,5]
❖ The computation / data grid has supercomputers, large servers, massive data storage facilities and specialised devices and facilities (e.g. for VR (Virtual Reality)). The main functions include compute load sharing / algorithm partitioning, resolution of data source addresses, security, replication and message rerouting. The information grid resolves homogeneous access to heterogeneous information sources. The knowledge grid utilises knowledge discovery in database technology (especially data mining) to generate knowledge (from information and data in the lower 2 layers of the GRIDs).[6]
总结及下一阶段工作计划
03.09.03
大纲
❖ 信息网格研究综述 ❖ 阶段论文和科研成果 ❖ 基于属性的搜索引擎 ❖ 信息网格设计
数据网格、信息网格和知识网格[1,3]
数据网格与信息网格
❖ 数据网格
数据网格解决的问题:❖ 解决海量数据的Fra bibliotek储和共享 问题
❖ 主要为计算任务以及计算网 格服务,是一种底层的海量 数据仓储体系
❖ 本算法利用节点容量表储存当前节点能力和使用状 况,并基于此进行负载分配,实现了实施的细粒度 平衡,并有效的利用了节点能力
❖ 算法使用一个轻度的消息扩散策略保证了容量表的 实施更新
应用于大规模分布系统的
潜在语义分析和信息索引策略
❖ 将传统信息获取领域(IR)中的潜在语义分析方法(Latent Semantic Analysis)应用于大规模分布式对等网络上,实现 对于信息源之间潜在语义关联的提取和利用。通过将信息和 用户使用特性映射到降维欧式空间中的点来实现对于语义相 关性的表示
相关主题