Sphinx全文检索引擎:修订间差异

来自站长百科
跳转至: 导航、​ 搜索
第52行: 第52行:
*[[Sphinx/源数据的限制|源数据的限制]]
*[[Sphinx/源数据的限制|源数据的限制]]
*[[Sphinx/字符集、大小写转换和转换表|字符集、大小写转换和转换表]]
*[[Sphinx/字符集、大小写转换和转换表|字符集、大小写转换和转换表]]
*[[Sphinx/SQL 数据源 (|SQL 数据源]]
*[[Sphinx/SQL 数据源|SQL 数据源]]
*[[Sphinx/xmlpipe 数据源|xmlpipe 数据源]]
*[[Sphinx/xmlpipe 数据源|xmlpipe 数据源]]
*[[Sphinx/xmlpipe2 数据源|xmlpipe2 数据源]]
*[[Sphinx/xmlpipe2 数据源|xmlpipe2 数据源]]
第59行: 第59行:
*[[Sphinx/索引合并|索引合并]]
*[[Sphinx/索引合并|索引合并]]
</div>
</div>
===[[Sphinx/搜索|搜索]]===
===[[Sphinx/搜索|搜索]]===
<div style="-moz-column-count:3;column-count:3;" class="sclist">
<div style="-moz-column-count:3;column-count:3;" class="sclist">

2011年11月23日 (三) 15:32的版本

sphinx logo

Sphinx(SQL Phrase Index)是一个基于SQL的全文检索引擎,它可以提供比数据库本身更专业的搜索功能,使得应用程序更容易实现专业化的全文检索。Sphinx可以与SQL数据库和脚本语言集成,系统内置MySQLPostgreSQL数据库数据源的支持,也支持从标准输入读取特定格式的XML数据。搜索API支持PHPPythonPerl、rudy和Java,并且也可以用作MySQL存储引擎。

软件介绍

软件特点

  1. 高速的建立索引(在当代CPU上,峰值性能可达到10 MB/秒);
  2. 高性能的搜索(在2 – 4GB 的文本数据上,平均每次检索响应时间小于0.1秒);
  3. 可处理海量数据(目前已知可以处理超过100 GB的文本数据, 在单一CPU的系统上可

处理100 M 文档);

  1. 提供了优秀的相关度算法,基于短语相似度和统计(BM25)的复合Ranking方法;
  2. 支持分布式搜索;
  3. 可作为MySQL的存储引擎提供搜索服务;
  4. 支持布尔、短语、词语相似度等多种检索模式;
  5. 文档支持多个全文检索字段(最大不超过32个);
  6. 文档支持多个额外的属性信息(例如:分组信息,时间戳等);
  7. 停止词查询;
  8. 支持单一字节编码和UTF-8编码;
  9. 原生的MySQL支持(同时支持MyISAMInnoDB );
  10. 原生的PostgreSQL支持。

主要功能

  • 关键字字典(快译通=关键字)支持RT索引
  • MVA,index_exact_words支持RT索引
  • MVA64支持两个磁盘和RT索引(rt_attr_multi_64指令)
  • 添加基于表达式的RANKER,和一些新的排名因素
  • ATTACH INDEX语句可将磁盘指数转换成RT指数
  • UPDATE语句的WHERE子句支持

使用手册

安装

建立索引

搜索

命令行工具参考

MySQL存储引擎

相关条目

参考来源