用友知识管理检索系统解决方案维思比科技(北京)有限公司2010年4月20日目录(一)现状及总体目标 (1)1.1、背景介绍 (1)1.2、现状 (1)1.3、总体目标 (1)1.4 总体设计 (2)1.4.1 系统结构图 (3)1.4.2信息采集工作原理 (3)1.4.2.1 数据采集 (3)1.4.2.2 数据分析 (5)1.4.2.3 数据写入 (5)(二)功能及界面设计 (5)2.1整合搜索 (6)2.1.1拼音提示.............................................................................. 错误!未定义书签。
2.1.2拼音纠错 (7)2.1.3 相关推荐 (7)2.1.4 多维度智能导航 (7)2.1.5 二次检索 (7)2.1.6 精确查询与模糊查询 (7)2.1.7多维度排序 (7)2.2 硬件配置 (7)2.7.1 服务器配置 (7)2.7.2 网络带宽配置 (8)2.7.3 软件配置 (8)(三)开发进度安排 (8)3.1 实施流程 (8)3.2 实施进度 (8)(四)投资概算 (9)4.1 软件产品 (9)4.2 定制开发 (9)4.3 培训费用 (9)4.4 总体预算 (9)(五)运行维护和培训 (12)5.1 维护 (10)5.2 培训 (11)5.2.1.培训人员 (11)5.2.2.培训目标 (12)5.2.3. 培训内容 (12)5.2.4. 培训方式 (12)5.2.5. 培训时间 (12)(六) 附录 (13)(一)现状及总体目标1.1、背景介绍用友软件股份有限公司(以下简称“用友”)成立于1988年,致力于用信息技术推动商业和社会进步,提供具有自主知识产权的企业管理/ERP软件、行业解决方案、服务,是亚太本土最大的管理软件提供商,是中国最大的管理软件、ERP软件、集团管理软件、财政管理软件、人力资源管理软件、财务管理软件,客户关系管理软件及小型企业管理软件提供商。
随着社会的进步,信息技术的发展,一个公司在不断向前发展的过程中会累积相当多的数据,而且随着时间的推移,这些数据累积的越来越快。
这些飞速增加的数据一方面为公司积累了一个非常庞大的知识库,成为公司的宝贵财富,而另一方面却产生了一些问题,就是要从这些信息库里查找一些资源越来越费劲,而且这个问题随着数据增加,越来越快的呈现出来。
由于这些信息库之间的信息是孤立的,它们之间没有任何联系,随着数据越来越多,查找这些信息耗费的人力物力成本却在不断增加,人们需要在不同的系统之间搜索整理数据,而且搜索的效率越来越低。
怎样在多个孤立的数据孤岛里快速找到希望得到的数据,成为一个困扰大家的难题。
众所周知,现在是信息社会,谁能在第一时间内掌握一些资料,谁就有可能在第一时间对某些问题做出反应,从而在一些领域取得领先。
1.2、现状用友软件股份有限公司和各事业单位、各部门之间的内部信息系统很多,像知识管理系统、团队管理系统、PMP、服务支持网站、GBU营销、EBU营销系统等等,关于知识管理系统使用情况的调查可知,当前的知识管理系统有大量的文档、附件,而且这些历史积累的文档知识非常重要,目前这些文档主要分布在各个服务器上,工作人员查找相关信息非常困难。
随着公司的发展,各种类型的文件也会越来越多,而且存放在各个不同的系统中,形成了一些信息孤岛。
要想查找一些资料,效率非常低,已不能适应具体工作的需要。
长期下去,会极大的阻碍公司的发展。
整合检索,迫在眉睫。
1.3、总体目标“整合全文检索系统”主要针对企业中存在的这些信息孤岛,利用先进的技术,把它们整合到一起,高效的生成透明、多维的检索结果,即使有些信息可能是用户本无了解或未能清楚记忆并表达的,并按照最新的互联网体验模式展示给用户。
检索结果的动态呈现、多维呈现将会为用户提供发现信息的最佳途径。
配合主题词表,即使用户输入错误,系统也能自动推荐正确的表达供用户选择。
总之,整合全文检索系统将帮助网站的终端用户、企业内部用户、管理人员或者其他类型的使用者准确获取信息,成为易于部署、管理方便、使用便捷的信息桥梁。
总体方案如下图所示:1.4 总体设计1.4.1 系统的结构图1.4.2 信息采集工作原理信息采集工作主要分为三部分,关系库和文件系统数据采集和数据分析、数据写入。
1.4.2.1 数据采集数据采集主要通过VSP数据库网关系统(VSP Gateway)来完成。
VSP Gateway是面向Oracle、DB2、SQL Server、Sybase、MySQL 等主流关系数据库和Lotus Notes系统的数据交换桥梁,可以整合多种异构数据源,将不同系统的数据实时同步、无缝集成到VSP全文数据库管理系统,协同工作,充分利用VSP全文数据库管理系统的强大检索性能来提供便捷高效的在线检索服务,实现企业级信息资源的统一搜索。
同时,VSP数据库网关系统也支持从政府、企业内部积累的或者正在持续增加的格式文本、XML文件、Excel文件、Access 等文件内提取数据。
VSP数据库网关系统具有以下10个特点:●易用性创建采集任务步骤简单,可一次性配置,自定义更新周期,自动定时运行采集任务,无需人工干预。
●实时性全文数据库与关系数据库的数据实时同步,保证查询结果的准确性。
●安全性数据采集不改变原有数据库的存储和业务应用,支持身份验证。
●开放性在数据转化的过程中进行数据的加工和整合。
●支持增量数据数据采集可以保证持续变化的关系型数据库内的增量数据向全文数据库自动添加。
●支持多个目标监控通过并发操作,VSP数据库网关系统可以同时监控多个目标数据库。
●直接调用底层接口VSP数据库网关系统直接调用各种系统的最底层接口,试用简单,配置方便,现有系统不需要增加任何的接口驱动。
●跨平台应用除微软SQL、Excel、Access产品外,支持跨平台交换其余的数据源所含数据。
●异常状态处理在数据环境运行异常情况下,可以自动报警,保证业务安全平稳运行。
●支持的版本全面如上述表格所示,VSP数据库网关系统不仅支持的关系型数据库类型全面,而且支持的版本也丰富,并且可以抽取Lotus Notes系统内数据。
1.4.2.2 数据分析VKM Server全称是VSP Knowledge Management Server,囊括自然语言处理模块的多个功能。
目前支持Windows,Linux下运行,以可配置的方式动态加载功能模块。
自然语言处理工具是为了梳理加工采集后的结构化、半结构化和非结构化信息,比如从非结构化文本中抽取结构化数据。
系统将自动采集处理信息,利用知识库的内容自动标引信息,实现概念检索。
1.4.2.3 数据写入网关系统获取数据后调用VKM进行数据分析,然后将得到的结果写入到vdb数据库供web 系统调用。
1.4.3 数据库系统VSP全文数据库(VDB Server)提供海量信息的分布存储和即时索引,并提供全文检索和高级检索功能,是我们实现高效精准检索的坚实基础。
由于数据库系统没有用到开源的软件技术,全部由自己研发,具有自己的知识产权,所以具有非常高的稳定性和灵活性。
一方面稳定性帮助我们快速地查找到需要的信息,另一方面的灵活性能确保我们随着需求的不断改进实时调整产品,使之能快速的适应新的需求,满足用户的需要。
(二)功能及界面设计2.1整合搜索2.1.1拼音提示如果您不清楚某个词语的写法,可以直接输入拼音进行查询,维思比搜索引擎会自动提示相应的查询字。
例如:输入“baiyun ”,系统会自动提示一些拼音为“baiyun ”的词给用户参考。
2.1.2拼音纠错由于汉字输入法的局限性,我们在搜索时经常会输入一些错别字,导致搜索结果不佳。
针对这种情况维思比搜索提供了拼写纠错功能。
例如:当用户想搜手机,而误输入为“收集”时,系统会提示是不是在找“手机”。
2.1.3相关推荐由于常常找不到合适的关键词,维思比会根据日常搜索行为,推荐与用户输入关键词含义相同或相近的其他词。
例如:当用户输入“白云机场”时,系统会推荐国际机场、虹桥机场、成田机场、浦东机场、启德机场 等词供参考查询。
2.1.4多维度智能导航以检索内容的不同属性为维度,生成动态导航目录。
用户只要点击不同属性,就能缩小信息检索的范围,从而快速、准确找到满意的信息。
2.1.5二次检索当一次搜索结果不理想时,可以在前一次搜索结果范围内,继续进行搜索。
2.1.6精确查询与模糊查询启发式搜索除了支持关键词精确匹配,还支持检索关键词先分词后检索,返回更多检索结果,根据检索结果的匹配程度决定结果列表显示顺序。
2.1.6.1 精确查询2.1.6.2 模糊查询2.1.7多维度排序默认结果是根据最新的互联网搜索体验,按照检索关键词的相关度进行排序,排序的结果与词频直接相关,并可以人工干预排序结果。
用户还可以根据其他属性进行排序。
2.2 硬件配置2.2.1 服务器配置系统采用两台HP服务器作为主运行系统,提供WEB,数据库,采集处理工作。
1台高性能的PC机连接在网络的前端,负责对数据进行采集,同时将采集的信息数据提供到处理系统。
2.2.2 软件配置(三)开发进度安排3.1 实施流程实施流程主要如下:1.需求调研2.系统设计3.功能开发4.测试5.部署6.系统试运行3.2 实施进度1.需求调研 (5天)2.系统设计 (10天)3.功能开发 (22天)4.测试 (10天)5.部署以及使用文档(3天)6.系统试运行 (30天)(四)投资概算知识管理检索系统建设总费用主要由软件采购和二次开发费用构成。
系统试运行期间,维思比提供免费的一次培训。
具体明细如下。
4.1 软件产品4.1.1 已购产品4.1.2 升级产品4.1.3 加购产品加购产品报价:67500用友作为维思比的重要客户,基于良好的合作关系,对于该项目所涉及的多套商业软件,维思比给予最低的折扣。
产品报价:108000.004.2 定制开发定制开发费用报价:47590 4.3 培训费用维思比提供一次3个工作日的免费培训,培训的细节请参考运行维护和培训服务。
4.4 总体预算软件产品报价¥108000元整定制开发费用¥475900 元整共计人民币拾伍万伍仟伍佰玖拾元(¥155590)人民币(五)运行维护和培训5.1 维护为了及时了解和准确掌握运行系统需求、意见和建议,不断提高服务质量,乙方的工程师将与甲方的系统维护人员建立紧密联系,保持沟通,及时全面地了解软件系统的运行状况。
试运行阶段:乙方将根据甲方的实际需要派专业工程师现场支持软件系统的运行。
正式运行期:乙方将提供操作级、维护级的支持,同时还提供以下几种服务方式:应甲方申请的应急现场服务;7*24小时热线服务;电子邮件支持服务。