对一个60万条记录的表进行测试,用mysql       like ‘%关键词%’ 的方式模糊进行查询一下,基本在1.9秒左右,这种模糊检索方式不走索引,建不建索引都一样;用 compass为表建索引,模糊检索达到0.001秒 级别,可以说是质的飞跃。

compass是建立在Lucene的基础之上,是一个强大的,事务的,高性能的对象/搜索引擎映射(OSEM:object/search engine mapping)与一个Java持久层框架.Compass包括:
* 搜索引擎抽象层(使用Lucene),
* OSEM (Object/Search Engine Mapping) 支持,
* 事务管理,
* 类似于Google的简单关键字查询语言,
* 可扩展与模块化的框架,
* 简单的API.

前一段时间,捣鼓了几天nutch,研究了一下全文检Lucene,今天停电到书店转了一圈,看到了这本书《开发自己的搜索引擎——Lucene 2.0+Heriterx》,58元打85折,就给买了,回来再研究一下。

© 2011 刘敏的Blog Suffusion theme by Sayontan Sinha