Lucene就是这么简单

articleList = new ArrayList

(); QueryParser queryParser = new QueryParser(LuceneUtil.getVersion(),"content",LuceneUtil.getAnalyzer()); Query query = queryParser.parse(keywords); IndexSearcher indexSearcher = new IndexSearcher(LuceneUtil.getDirectory()); TopDocs topDocs = indexSearcher.search(query,1000000); //设置关键字高亮 Formatter formatter = new SimpleHTMLFormatter("",""); Scorer scorer = new QueryScorer(query); Highlighter highlighter = new Highlighter(formatter,scorer); for(int i=0;i 5.2搜索结果摘要

如果我们搜索出来的文章内容太大了，而我们只想显示部分的内容，那么我们可以对其进行摘要...

值得注意的是：搜索结果摘要需要与设置高亮一起使用

String keywords = "钟福成";
        List articleList = new ArrayList();
        QueryParser queryParser = new QueryParser(LuceneUtil.getVersion(),"content",LuceneUtil.getAnalyzer());
        Query query = queryParser.parse(keywords);
        IndexSearcher indexSearcher = new IndexSearcher(LuceneUtil.getDirectory());
        TopDocs topDocs = indexSearcher.search(query,1000000);
        
        Formatter formatter = new SimpleHTMLFormatter("","");
        Scorer scorer = new QueryScorer(query);
        Highlighter highlighter = new Highlighter(formatter,scorer);
        
        //设置摘要
        Fragmenter fragmenter  = new SimpleFragmenter(4);
        highlighter.setTextFragmenter(fragmenter);
        
        for(int i=0;i

5.3搜索结果排序
我们搜索引擎肯定用得也不少，使用不同的搜索引擎来搜索相同的内容。他们首页的排行顺序也会不同...这就是它们内部用了搜索结果排序....
影响网页的排序有非常多种：

head/meta/【keywords关键字】
网页的标签整洁
网页执行速度
采用div+css
等等等等

而在Lucene中我们就可以设置相关度得分来使不同的结果对其进行排序：
        IndexWriter indexWriter = new IndexWriter(LuceneUtil.getDirectory(),LuceneUtil.getAnalyzer(),LuceneUtil.getMaxFieldLength());
        //为结果设置得分
        document.setBoost(20F);
        indexWriter.addDocument(document);
        indexWriter.close();
当然了，我们也可以按单个字段排序：
    //true表示降序
    Sort sort = new Sort(new SortField("id",SortField.INT,true));
    TopDocs topDocs = indexSearcher.search(query,null,1000000,sort);
也可以按多个字段排序：在多字段排序中，只有第一个字段排序结果相同时，第二个字段排序才有作用 提倡用数值型排序
        Sort sort = new Sort(new SortField("count",SortField.INT,true),new SortField("id",SortField.INT,true));
        TopDocs topDocs = indexSearcher.search(query,null,1000000,sort);

5.4条件搜索
在我们的例子中，我们使用的是根据一个关键字来对某个字段的内容进行搜索。语法类似于下面：
    QueryParser queryParser = new QueryParser(LuceneUtil.getVersion(),"content",LuceneUtil.getAnalyzer());
    
其实，我们也可以使用关键字来对多个字段进行搜索，也就是多条件搜索。我们实际中常常用到的是多条件搜索，多条件搜索可以使用我们最大限度匹配对应的数据！
QueryParser queryParser = new MultiFieldQueryParser(LuceneUtil.getVersion(),new String[]{"content","title"},LuceneUtil.getAnalyzer());

六、总结


Lucene是全文索引引擎的祖先，后面的Solr、Elasticsearch都是基于Lucene的(后面会有一篇讲Elasticsearch的，敬请期待～)

Lucene中存的就是一系列的二进制压缩文件和一些控制文件,这些内容统称为索引库,索引库又分了两个部分：

原始记录
词汇表


了解索引库的优化方式：1、合并文件  2、设置内存索引库
Lucene的分词器有非常多种，选择自己适合的一种进行分词
查询出来的结果可对其设置高亮、摘要、排序

这篇这是Lucene的冰山一角，一般现在用的可能都是Solr、Elasticsearch的了，但想要更加深入了解Lucene可翻阅其他资料哦～
如果文章有错的地方欢迎指正，大家互相交流。习惯在微信看技术文章，想要获取更多的Java资源的同学，可以关注微信公众号:Java3y

资讯专栏INFORMATION COLUMN

上云采购季！| 2核2G4M爆款云服务器低至59元/年，更有多台、长期优惠，快来选购！

相关文章

Lucene就是这么容易

**用 Lucene 构建文档数据库**

**用 Lucene 构建文档数据库**

发表评论

0条评论

xeblog

男|高级讲师

TA的文章

不会做动画的程序猿不是好的动画师（如何用css3动画做动画）

程序员的算法趣题Q50: 完美洗牌

欧盟委员会发布《在欧盟经济中开源软硬件对技术独立、竞争力和创新的影响研究报告》

腾讯云服务器秒杀：新用户2核4G、6M独享、1499元/3年，企业用户2核4G、5M独享、1200元

Node.js 配合 express 框架、mongodb 实践 && [使用 T

深入理解ES6之《ES7》

中断数组（every、some方法）

VUE Error:if there's nested data,rowKey is re

最新活动