课程进度 50% · 第3/6章第3/6章 · 标签 1/1
— 1 —
索引基础
索引是搜索引擎的核心数据结构,它通过对文档内容进行预处理,建立词项到文档的映射关系,从而实现快速检索。
索引构建的关键概念:
- 索引的定义与作用
- 索引的基本组成(词典、倒排列表)
- 索引的工作流程(分词、去停用词、建立倒排表)
- 索引的更新策略(增量更新、全量重建)
📖倒排索引是搜索引擎中最关键的索引结构,它将文档内容转换为词到文档列表的映射。
— 2 —
Elasticsearch索引示例
以下示例展示使用 Elasticsearch 创建索引和添加文档:
json
1
# 创建索引
2
PUT /my_index
3
{
4
"mappings": {
5
"properties": {
6
"title": { "type": "text" },
7
"content": { "type": "text" }
8
}
9
}
10
}
11
12
# 添加文档
13
POST /my_index/_doc
14
{
15
"title": "示例标题",
16
"content": "示例内容"
17
}
✓ES 的分析器(Analyzer)负责文本分词和标准化,中文场景建议配置 ik 智能分词。