Solr全文检索技术1.Solr介绍 152.Solr安装配置-SolrCore配置 153.Solr安装配置-Solr工程部署 104.Solr安装配置-Solr工程测试 155.Solr安装配置-多SorlCore配置 106.Solr入门--schema 207.Solr入门-安装中文分词器 158.Solr入门-自定义业务系统Field 209.Solr入门-SolrJ介绍1010.Solr入门-SolrJ索引维护 2011.Solr入门-数据导入处理器2012.Solr入门-搜索语法 1013.Solr入门-SolrJ-搜索 2014.Solr案例-需求分析 1015.Solr案例-架构设计 1516.Solr案例-Service 2017.Solr案例-Controller 2018.Solr案例-主体调试 2019.Solr案例-功能完善1【Solr介绍】1.1S olr是什么Solr 是Apache下的一个顶级开源项目,采用Java开发,它是基于Lucene的全文搜索服务。
Solr提供了比Lucene更为丰富的查询语言,同时实现了可配置、可扩展,并对索引、搜索性能进行了优化。
Solr可以独立运行,运行在Jetty、Tomcat等这些Servlet容器中,Solr 索引的实现方法很简单,用 POST 方法向 Solr 服务器发送一个描述 Field 及其内容的 XML 文档,Solr根据xml文档添加、删除、更新索引。
Solr 搜索只需要发送 HTTP GET 请求,然后对 Solr 返回Xml、json等格式的查询结果进行解析,组织页面布局。
Solr不提供构建UI的功能,Solr提供了一个管理界面,通过管理界面可以查询Solr的配置和运行情况。
1.2S olr与Lucene的区别Lucene是一个开放源代码的全文检索引擎工具包,它不是一个完整的全文检索引擎,Lucene提供了完整的查询引擎和索引引擎,目的是为软件开发人员提供一个简单易用的工具包,以方便的在目标系统中实现全文检索的功能,或者以Lucene为基础构建全文检索引擎。
Solr的目标是打造一款企业级的搜索引擎系统,它是一个搜索引擎服务,可以独立运行,通过Solr可以非常快速的构建企业的搜索引擎,通过Solr也可以高效的完成站内搜索功能。
1.3Solr下载从Solr官方网站(/solr/ )下载Solr4.10.3,根据Solr的运行环境,Linux下需要下载lucene-4.10.3.tgz,windows下需要下载lucene-4.10.3.zip。
Solr使用指南可参考:https:///solr/FrontPage。
下载solr-4.10.3.zip并解压:bin:solr的运行脚本contrib:solr的一些贡献软件/插件,用于增强solr的功能。
dist:该目录包含build过程中产生的war和jar文件,以及相关的依赖文件。
docs:solr的API文档example:solr工程的例子目录:●example/solr:该目录是一个包含了默认配置信息的Solr的Core目录。
●example/multicore:该目录包含了在Solr的multicore中设置的多个Core目录。
●example/webapps:该目录中包括一个solr.war,该war可作为solr的运行实例工程。
licenses:solr相关的一些许可信息1.4运行环境solr 需要运行在一个Servlet容器中,Solr4.10.3要求jdk使用1.7以上,Solr 默认提供Jetty(java写的Servlet容器),本教程使用Tocmat作为Servlet容器,环境如下:Solr:Solr4.10.3Jdk:jdk1.7.0_72Tomcat:apache-tomcat-7.0.532Solr安装配置2.1S olr与Tomcat整合2.1.1【SolrCore配置】2.1.1.1SolrHome与SolrCore创建一个Solr home目录,SolrHome是Solr运行的主目录,目录中包括了运行Solr 实例所有的配置文件和数据文件。
Solr实例即SolrCore,一个SolrHome中可以包括多个SolrCore目录,每个SolrCore对外提供单独的搜索和索引服务。
2.1.1.2目录结构example\solr是一个solr home目录结构,如下:collection1:叫做一个Solr运行实例SolrCore也称为一个collection,SolrCore 的名称不固定,命名方式类似collection1/collection2/collection3等,每个collection对外单独提供索引和搜索接口。
solrHome中可以创建多个solrCore即collection。
SolrCore目录内容如下所示:说明:(1)一个solrCore中包括一个索引目录,该目录存储了该 SolrCore的索引文件。
data 是SolrCore的索引文件目录,如果没有solr会自动创建。
(2)conf是SolrCore的配置文件目录:里面包括两个重要的配置文件solrconfig.xml 与schema.xml配置文件2.1.1.3创建SolrCore创建目录F:\develop\solr将example\solr目录拷贝至 F:\develop\solr目录下并改名为solrHome。
将contrib和dist两个目录拷贝到F:\develop\solr下。
SolrHome下:2.1.1.4SolrCore配置每个SolrCore的conf目录下有solrconfig.xml文件,它是SolrCore运行的配置文件。
2.1.1.4.1加载jar包在solrconfig.xml中可以加载一些扩展的jar,solr.install.dir表示solrCore 的目录位置,需要根据扩展Jar的实际存放位置坐对应的修改:2.1.1.4.2dataDir索引目录每个SolrCore都有自己的索引文件目录,默认在SolrCore目录下的data中。
data数据目录下包括了index索引目录和tlog日志文件目录。
如果不想使用默认的目录也可以通过solrConfig.xml更改索引目录,如下:2.1.1.4.3请求处理器requestHandler请求处理器,定义了索引和搜索的访问方式。
通过/update维护索引,可以完成索引的添加、修改、删除操作。
提交xml、json数据完成索引维护,索引维护小节详细介绍。
通过/select搜索索引。
设置搜索参数完成搜索,搜索参数也可以设置一些默认值,如下:<requestHandler name="/select" class="solr.SearchHandler"><!-- 设置默认的参数值,可以在请求地址中修改这些参数--><lst name="defaults"><str name="echoParams">explicit</str><int name="rows">10</int><!--显示数量--><str name="wt">json</str><!--显示格式--><str name="df">text</str><!--默认搜索字段--></lst></requestHandler>2.1.2【Solr工程部署】1.将dist\solr-4.10.3.war拷贝到Tomcat的webapp目录下改名为solr.war2.启动tomcat后,solr.war自动解压,将原来的solr.war删除。
3.拷贝example\lib\ext 目录下所有jar包拷贝到Tomcat的webapp\solr\WEB-INF\lib目录下4.修改Tomcat目录下webapp\solr\WEB-INF\web.xml文件,如下所示:设置Solrhome5.拷贝log4j.properties文件在 Tomcat下webapps\solr\WEB-INF目录中创建文件 classes文件夹,复制Solr目录下example\resources\log4j.properties至Tomcat下webapps\solr\WEB-INF\classes目录2.1.3启动Tomcat访问http://localhost:8080/solr2.2【管理界面】2.2.1Dashboard:仪表盘,显示了该Solr实例开始启动运行的时间、版本、系统资源、jvm等信息。
2.2.2Logging:Solr运行日志信息2.2.3Cloud:Cloud即SolrCloud,即Solr云(集群),当使用Solr Cloud模式运行时会显示此菜单,如下图是Solr Cloud的管理界面:2.2.4Core Admin:Solr Core的管理界面。
Solr Core 是Solr的一个独立运行实例单位,它可以对外提供索引和搜索服务,一个Solr工程可以运行多个SolrCore(Solr实例),一个Core对应一个索引目录。
2.2.5java propertiesSolr在JVM 运行环境中的属性信息,包括类路径、文件编码、jvm内存设置等信息。
2.2.6Tread Dump显示Solr Server中当前活跃线程信息,同时也可以跟踪线程运行栈信息。
2.2.7Core selector选择一个SolrCore进行详细操作,如下:2.2.8Analysis(重点)通过此界面可以测试索引分析器和搜索分析器的执行情况。
2.2.9dataimport可以定义数据导入处理器,从关系数据库将数据导入到Solr索引库中。
2.2.10Document(重点)通过此菜单可以创建索引、更新索引、删除索引等操作,界面如下:/update表示更新索引,solr默认根据id(唯一约束)域来更新Document的内容,如果根据id值搜索不到id域则会执行添加操作,如果找到则更新。
2.2.11query(重点)通过/select执行搜索索引,必须指定“q”查询条件方可搜索。
2.3【多SolrCore配置】配置多SolrCore的好处:1.一个solr工程对外通过SorlCore 提供服务,每个SolrCore相当于一个数据库,这个功能就相当于一个mysql可以运行多个数据库。