solr的java代码 solr schema _综述

solr3.5中如何用java代码为PDF，Office等文件添加索引1、将解压包中的solr-4.7.1/dist/solr-4.7.1.war复制到tomcat_dir/webapps/目录，并命名为solr.war 。
2、将solr-4.7.1/example/lib/ext/目录下的jar文件复制到tomcat/lib目录下，将solr-4.7.1/example/resources/下的log4j.properties文件复制到tomcat_dir/lib目录下;
切把 solr-4.7.1/example/solr，复制到tomcat_dir/bin下。
3、修改tomcat_dir/conf/server.xml
Connector port="8080" protocol="HTTP/1.1"
connectionTimeout="20000"
redirectPort="8443"
URIEncoding="UTF-8" /
4、创建solr.xml ，存放在路径：tomcat/conf/Catalina/localhost/solr.xml，内容：
Context path="/solr" docBase="C:\Tomcat 7.0\webapps\solr.war"
debug="0" crossContext="true"
Environment name="solr/home" type="java.lang.String" value="C:\Tomcat 7.0\bin\solr\" override="true" /
/Context
PS：上面的docBase和value路径中不能存在中文字符，否则会出现404错误。
5、将C:\Tomcat 7.0\webapps下的solr.war包，启动项目解压；然后再添加几个jar包：
solr-4.7.1\dist\solr-dataimporthandler-4.7.1.jar;
solr-4.7.1\dist\solr-dataimporthandler-extras-4.7.1.jar;
还要加载数据库驱动包：mysql-connector-java-3.1.13-bin.jar
6、在C:\Tomcat 7.0\bin\solr\collection1\conf 下的solrconfig.xml增加以下数据库配置：
requestHandler name="/dataimport" class="org.apache.solr.handler.dataimport.DataImportHandler"
lst name="defaults"
str name="config"data-config.xml/str
/lst
/requestHandler
7、将tomcat\bin\solr\collection1\conf下增加data-config.xml文件，内容如下：
dataConfig
dataSource type="JdbcDataSource"
driver="com.mysql.jdbc.Driver"
url="jdbc:mysql://192.168.1.221:3306/tmsdb"
user="root"
password="123456"/
document name="content"
entity name="node" query="select id,author,title,content from solrdb"
field column="id" name="id" /
field column="author" name="author" /
field column="title" name="title" /
field column="content" name="content" /
/entity
/document
/dataConfig
8、增加中文分词器，ik-analyzer的配置如下：
①目前的中文分词主要有两种
1，基于中科院ICTCLAS的隐式马尔科夫hhmm算法的中文分词器，例如smartcn等。（不支持自定义扩展词库）
2，基于正向迭代最细粒度切分算法（正向最大匹配并且最细分词）例如IK，庖丁等（支持自定义扩展词库）
安装分词前，可以去下载IK的分词包：
IK-Analyzer-4.7.1-0.0.1-SNAPSHOT.jar
下载完毕后，将此包放进tomcat\solr的\WEB-INF\lib下面：tomcat\webapps\solr\WEB-INF\lib。
下面需要在solr的schemal.xml进行分词器注册:
!-- 配置IK分词器 --
fieldType name="text_ik" class="solr.TextField" positionIncrementGap="100"
analyzer type="index"
!-- 分词--
tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory"/
!-- 禁用词过滤根据情况使用--
!-- filter class="org.wltea.analyzer.lucene.IKStopFilterFactory"/ --
/analyzer
analyzer type="query"
!-- 分词--
tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory"/
!-- 禁用词过滤根据情况使用--
!-- filter class="org.wltea.analyzer.lucene.IKStopFilterFactory"/--
/analyzer
/fieldType
最后还得配置一个引用字段就OK了
field name="ik" type="text_ik" indexed="true" stored="true" multiValued="true"/
②它的安装部署十分简单，将IKAnalyzer2012.jar部署亍项目的lib目录中；IKAnalyzer.cfg.xml不stopword.dic文件放置在class根目录（对于web项目，通常是WEB-I NF/classes目彔，同hibernate、log4j等配置文件相同）下即可；然后配置solr4.7中schema.xml配置解析器：

solr的java代码 solr schema

推荐阅读

电脑导航为什么突然变的卡顿

鬼泣5第八章BOSS是什么鬼泣5第八关BOSS打法说明

贡柑和皇帝柑的区别贡柑和皇帝柑的区别是什么

索纳塔论坛汽车之家索纳塔8论坛汽车之家

OPPOReno新品发布会价格像素等功能汇总 OPPOReno发布会全程直播观看方法

win7怎么初始化硬盘

装修面积是怎么计算的,装修全包如何计算面积装修面积是怎么计算的

Vue中微信支付的实例

pytorch|BERT、ALBERT模型加载——From pytorch_model.bin

银耳早上吃还是晚上吃

绿豆汤有减肥效果吗

电蚊香有毒吗

vb.net折叠项 vs折叠if

风行电视怎么投屏

neo4j数据库的连接 neo4j和mysql的优缺点

博世壁挂炉开暖气不启动怎么解除博世壁挂炉生活热水不加热什么原因 ,这是什么故障

2262年两个春节日历是真的吗 2262年两个春节日历表

港媒（三叶草智慧校园系统将广泛应用于内地中小学信息化管理）

福州评话的唱调有哪些福州评话的唱调都有什么

中核二三属于什么行业