什么是全文检索 全文检索的简介

2017-03-10

全文检索是一种将文件中所有文本与检索项匹配的文字资料检索方法。那么你对全文检索了解多少呢?以下是由小编整理关于什么是全文检索的内容,希望大家喜欢!

全文检索的简介

基本介绍

全文检索是将存储于数据库中整本书、整篇文章中的任意内容信息查找出来的检索。它可以根据需要获得全文中有关章、节、段、句、词等信息,也就是说类似于给整本书的每个字词添加一个标签,也可以进行各种统计和分析。例如,它可以很快的回答“《红楼梦》一书中“林黛玉”一共出现多少次?”的问题。

与之相关的议题

语根处理 (stemming)

符素解析器 (token parser) 1-gram, 2-gram , n-gram

断词/分词 word segmentation

倒排索引 inverted index

算法、搜寻策略之模型

布尔式 boolean

统计模型 Probabilistic model

向量空间模型 vector base model

隐性语义模型 Latent semantic model

系统检索的介绍

评量之准则

判断检索效果的两个指标:

查全率=被检出相关信息量/相关信息总量(%)

查准率=被检出相关信息量/被检出信息总量(%)

开放源代码之全文检索系统

Apache Solr

BaseX

Clusterpoint Server(freeware licence for a single-server)

DataparkSearch

Ferret

Ht-//Dig

Hyper Estraier

KinoSearch

Lemur/Indri

Lucene

mnoGoSearch

Sphinx

Swish-e

Xapian

ElasticSearch

议题优化的概念

和中文有关的议题

断词(分词)

语法解析

古籍议题

多语言混合

优化

剔除字(Stopwords)

词性标注

权威档(authority file)

知识体系,本体论(ontology)

超链接分析(page rank)技术

历史及未来之趋势

自由语句搜寻

基于自然语言的分词

更多相关阅读

最新发布的文章