导航菜单

软件工程/索引构建
课程进度 50% · 第3/6章3/6章 · 标签 1/1
1

索引基础

索引是搜索引擎的核心数据结构,它通过对文档内容进行预处理,建立词项到文档的映射关系,从而实现快速检索。

索引构建的关键概念:

  • 索引的定义与作用
  • 索引的基本组成(词典、倒排列表)
  • 索引的工作流程(分词、去停用词、建立倒排表)
  • 索引的更新策略(增量更新、全量重建)

📖倒排索引是搜索引擎中最关键的索引结构,它将文档内容转换为词到文档列表的映射。

2

Elasticsearch索引示例

以下示例展示使用 Elasticsearch 创建索引和添加文档:

json
1
# 创建索引
2
PUT /my_index
3
{
4
"mappings": {
5
"properties": {
6
"title": { "type": "text" },
7
"content": { "type": "text" }
8
}
9
}
10
}
11
 
12
# 添加文档
13
POST /my_index/_doc
14
{
15
"title": "示例标题",
16
"content": "示例内容"
17
}

ES 的分析器(Analyzer)负责文本分词和标准化,中文场景建议配置 ik 智能分词。