《ElasticSearch》03 索引:索引管理详解
本文介绍了Elasticsearch索引管理的核心操作。主要内容包括:禁止自动创建索引的配置方法,手动创建索引的格式(包含settings和mappings设置),以及索引的常用管理操作(创建、修改、打开/关闭、删除、查看)。文章还通过Kibana的Dev Tools演示了创建test-index-users索引的完整过程,包括设置分片副本数、定义字段类型映射,并展示了数据类型校验、索引状态修改等
索引管理的引入
我们在前文中增加文档时,如下的语句会动态创建一个customer的index:
PUT /customer/_doc/1
{
"name": "John Doe"
}
而这个index实际上已经自动创建了它里面的字段(name)的类型。我们不妨看下它自动创建的mapping:
{
"mappings": {
"_doc": {
"properties": {
"name": {
"type": "text",
"fields": {
"keyword": {
"type": "keyword",
"ignore_above": 256
}
}
}
}
}
}
}
那么如果我们需要对这个建立索引的过程做更多的控制:比如想要确保这个索引有数量适中的主分片,并且在我们索引任何数据之前,分析器和映射已经被建立好。那么就会引入两点:第一个禁止自动创建索引,第二个是手动创建索引。
- 禁止自动创建索引
可以通过在 config/elasticsearch.yml 的每个节点下添加下面的配置:
action.auto_create_index: false
手动创建索引就是接下来文章的内容。
索引的格式
在请求体里面传入设置或类型映射,如下所示:
PUT /my_index
{
"settings": { ... any settings ... },
"mappings": {
"properties": { ... any properties ... }
}
}
- settings: 用来设置分片,副本等配置信息-
mappings
字段映射,类型等
properties: 由于type在后续版本中会被Deprecated, 所以无需被type嵌套
索引管理操作
我们通过kibana的devtool来学习索引的管理操作。
创建索引
我们创建一个user 索引test-index-users,其中包含三个属性:name,age, remarks; 存储在一个分片一个副本上。
PUT /test-index-users
{
"settings": {
"number_of_shards": 1,
"number_of_replicas": 1
},
"mappings": {
"properties": {
"name": {
"type": "text",
"fields": {
"keyword": {
"type": "keyword",
"ignore_above": 256
}
}
},
"age": {
"type": "long"
},
"remarks": {
"type": "text"
}
}
}
}
执行结果

- 插入测试数据

查看数据

- 我们再测试下不匹配的数据类型(age):
POST /test-index-users/_doc
{
"name": "test user",
"age": "error_age",
"remarks": "hello eeee"
}
你可以看到无法类型不匹配的错误:

修改索引
查看刚才的索引,curl 'localhost:9200/_cat/indices?v' | grep users
yellow open test-index-users LSaIB57XSC6uVtGQHoPYxQ 1 1 1 0 4.4kb 4.4kb
我们注意到刚创建的索引的状态是yellow的,因为我测试的环境是单点环境,无法创建副本,但是在上述number_of_replicas配置中设置了副本数是1; 所以在这个时候我们需要修改索引的配置。
修改副本数量为0
PUT /test-index-users/_settings
{
"settings": {
"number_of_replicas": 0
}
}

再次查看状态:
green open test-index-users LSaIB57XSC6uVtGQHoPYxQ 1 1 1 0 4.4kb 4.4kb
打开/关闭索引
- 关闭索引
一旦索引被关闭,那么这个索引只能显示元数据信息,不能够进行读写操作。

当关闭以后,再插入数据时:

- 打开索引

打开后又可以重新写数据了

删除索引
最后我们将创建的test-index-users删除。
DELETE /test-index-users

查看索引
由于test-index-users被删除,所以我们看下之前bank的索引的信息
- mapping
GET /bank/_mapping

- settings
GET /bank/_settings

Kibana管理索引
在Kibana如下路径,我们可以查看和管理索引

⭐补充:
match_phrase 和 match 的主要区别
1. 匹配方式

2. 核心区别对比
参数配置对比表
| 参数 | match |
match_phrase |
说明 |
|---|---|---|---|
query |
✅ 支持 | ✅ 支持 | 查询文本 |
operator |
✅ 支持(and/or) | ❌ 不支持 | 词项间的逻辑关系 |
minimum_should_match |
✅ 支持 | ❌ 不支持 | 最小匹配词数 |
slop |
❌ 不支持 | ✅ 支持 | 允许的词间距 |
analyzer |
✅ 支持 | ✅ 支持 | 指定分词器 |
zero_terms_query |
✅ 支持 | ✅ 支持 | 全部分词被过滤时的处理 |
查询语法对比
| 查询类型 | match 语法 |
match_phrase 语法 |
|---|---|---|
| 基础查询 | {"match": {"field": "value"}} |
{"match_phrase": {"field": "value"}} |
| 带参数查询 | {"match": {"field": {"query": "value", "operator": "and"}}} |
{"match_phrase": {"field": {"query": "value", "slop": 1}}} |
| 多字段查询 | 需用multi_match |
需用multi_match + type: phrase |
性能对比表
| 指标 | match |
match_phrase |
|---|---|---|
| 内存使用 | 较低 | 较高(需要加载位置信息) |
| 查询速度 | 快 | 中等 |
| 索引大小 | 基础大小 | 更大(需要存储位置信息) |
| 适合数据量 | 任意规模 | 中等规模以下 |
| 缓存效率 | 高 | 中等 |
使用场景推荐
| 场景 | 推荐查询类型 | 原因 |
|---|---|---|
| 搜索引擎(如百度/Google) | match |
需要容错,部分匹配 |
| 商品搜索 | match + match_phrase |
结合使用,兼顾准确性和召回率 |
| 自动补全 | match_phrase_prefix |
前缀匹配短语 |
| 精确匹配(如ID、名称) | term(优于match_phrase) |
keyword类型更适合 |
| 歌词搜索 | match_phrase |
需要精确的歌词顺序 |
| 法律文书检索 | match_phrase |
需要精确的措辞 |
更多推荐
所有评论(0)