Lucene 是apache软件基金会一个开放源代码的全文检索引擎工具包,是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎,部分文本分析引擎。Lucene的目的是为软件开发人员提供一个简单易用的工具包,以方便的在目标系统中实现全文检索的功能,或者是以此为基础建立起完整的全文检索引擎。
Lucene最初是由Doug Cutting所撰写的,是一位资深全文索引/检索专家,曾经是V-Twin搜索引擎的主要开发者,后来在Excite担任高级系统架构设计师,目前从事 于一些INTERNET底层架构的研究。他贡献出Lucene的目标是为各种中小型应用程式加入全文检索功能。
Apache Lucene 4.10 发布了,改进记录包括:
New TermAutomatonQuery using an automaton for proximity queries
New OrdsBlockTree terms dictionary supporting ord lookup.
Simplified matchVersion handling for Analyzers with new setVersion method, as well as Analyzer constructors not requiring Version.
Fixed possible corruption when opening a 3.x index with NRT reader.
Fixed edge case in StandardTokenizer that caused extremely slow parsing times with long text which partially matched grammar rules.