《ElasticSearch》03 索引：索引管理详解

短剑重铸之日

724人浏览 · 2026-02-26 09:48:28

短剑重铸之日 · 2026-02-26 09:48:28 发布

索引管理的引入

我们在前文中增加文档时，如下的语句会动态创建一个customer的index：

PUT /customer/_doc/1
{
  "name": "John Doe"
}

而这个index实际上已经自动创建了它里面的字段（name）的类型。我们不妨看下它自动创建的mapping：

{
  "mappings": {
    "_doc": {
      "properties": {
        "name": {
          "type": "text",
          "fields": {
            "keyword": {
              "type": "keyword",
              "ignore_above": 256
            }
          }
        }
      }
    }
  }
}

那么如果我们需要对这个建立索引的过程做更多的控制：比如想要确保这个索引有数量适中的主分片，并且在我们索引任何数据之前，分析器和映射已经被建立好。那么就会引入两点：第一个禁止自动创建索引，第二个是手动创建索引。

禁止自动创建索引

可以通过在 config/elasticsearch.yml 的每个节点下添加下面的配置：

action.auto_create_index: false

手动创建索引就是接下来文章的内容。

索引的格式

在请求体里面传入设置或类型映射，如下所示：

PUT /my_index
{
    "settings": { ... any settings ... },
    "mappings": {
        "properties": { ... any properties ... }
    }
}

settings: 用来设置分片,副本等配置信息-

mappings

字段映射，类型等

properties: 由于type在后续版本中会被Deprecated, 所以无需被type嵌套

索引管理操作

我们通过kibana的devtool来学习索引的管理操作。

创建索引

我们创建一个user 索引test-index-users，其中包含三个属性：name，age, remarks; 存储在一个分片一个副本上。

PUT /test-index-users
{
  "settings": {
		"number_of_shards": 1,
		"number_of_replicas": 1
	},
  "mappings": {
    "properties": {
      "name": {
        "type": "text",
        "fields": {
          "keyword": {
            "type": "keyword",
            "ignore_above": 256
          }
        }
      },
      "age": {
        "type": "long"
      },
      "remarks": {
        "type": "text"
      }
    }
  }
}

执行结果

插入测试数据

查看数据

我们再测试下不匹配的数据类型(age)：

POST /test-index-users/_doc
{
  "name": "test user",
  "age": "error_age",
  "remarks": "hello eeee"
}

你可以看到无法类型不匹配的错误：

修改索引

查看刚才的索引,curl 'localhost:9200/_cat/indices?v' | grep users

yellow open test-index-users                          LSaIB57XSC6uVtGQHoPYxQ 1 1     1    0   4.4kb   4.4kb

我们注意到刚创建的索引的状态是yellow的，因为我测试的环境是单点环境，无法创建副本，但是在上述number_of_replicas配置中设置了副本数是1；所以在这个时候我们需要修改索引的配置。

修改副本数量为0

PUT /test-index-users/_settings
{
  "settings": {
    "number_of_replicas": 0
  }
}

再次查看状态：

green open test-index-users                          LSaIB57XSC6uVtGQHoPYxQ 1 1     1    0   4.4kb   4.4kb

打开/关闭索引

关闭索引

一旦索引被关闭，那么这个索引只能显示元数据信息，不能够进行读写操作。

当关闭以后，再插入数据时：

打开索引

打开后又可以重新写数据了

删除索引

最后我们将创建的test-index-users删除。

DELETE /test-index-users

查看索引

由于test-index-users被删除，所以我们看下之前bank的索引的信息

mapping

GET /bank/_mapping

settings

GET /bank/_settings

Kibana管理索引

在Kibana如下路径，我们可以查看和管理索引

⭐补充：

match_phrase 和 match 的主要区别

1. 匹配方式

在这里插入图片描述

2. 核心区别对比

参数配置对比表

参数	`match`	`match_phrase`	说明
`query`	✅ 支持	✅ 支持	查询文本
`operator`	✅ 支持（and/or）	❌ 不支持	词项间的逻辑关系
`minimum_should_match`	✅ 支持	❌ 不支持	最小匹配词数
`slop`	❌ 不支持	✅ 支持	允许的词间距
`analyzer`	✅ 支持	✅ 支持	指定分词器
`zero_terms_query`	✅ 支持	✅ 支持	全部分词被过滤时的处理

查询语法对比

查询类型	`match` 语法	`match_phrase` 语法
基础查询	`{"match": {"field": "value"}}`	`{"match_phrase": {"field": "value"}}`
带参数查询	`{"match": {"field": {"query": "value", "operator": "and"}}}`	`{"match_phrase": {"field": {"query": "value", "slop": 1}}}`
多字段查询	需用`multi_match`	需用`multi_match` + `type: phrase`

性能对比表

指标	`match`	`match_phrase`
内存使用	较低	较高（需要加载位置信息）
查询速度	快	中等
索引大小	基础大小	更大（需要存储位置信息）
适合数据量	任意规模	中等规模以下
缓存效率	高	中等

使用场景推荐

场景	推荐查询类型	原因
搜索引擎（如百度/Google）	`match`	需要容错，部分匹配
商品搜索	`match` + `match_phrase`	结合使用，兼顾准确性和召回率
自动补全	`match_phrase_prefix`	前缀匹配短语
精确匹配（如ID、名称）	`term`（优于`match_phrase`）	keyword类型更适合
歌词搜索	`match_phrase`	需要精确的歌词顺序
法律文书检索	`match_phrase`	需要精确的措辞

腾讯云开发者社区

腾讯云面向开发者汇聚海量精品云计算使用和开发经验，营造开放的云计算技术生态圈。

更多推荐

Elasticsearch复杂数据类型终极指南：从入门到精通

Elasticsearch作为功能强大的搜索引擎，支持多种复杂数据类型，让开发者能够灵活处理各种结构化和非结构化数据。本文将带你全面了解Elasticsearch中的复杂数据类型，从基础概念到实际应用，助你轻松掌握数据建模的核心技巧。## 内部对象：构建层级化数据结构在Elasticsearch中，对象类型（Object）是最基础的复杂数据类型之一，用于表示具有嵌套关系的数据。例如，我们可

腾讯云开发者社区

终极指南：Flink SQL连接器版本管理从混乱到有序的升级之路

Apache Flink作为流处理领域的佼佼者，其SQL连接器的版本管理一直是开发者面临的核心挑战。本文将系统讲解Flink SQL连接器版本管理的最佳实践，帮助你轻松应对版本兼容性问题，实现从混乱到有序的升级之旅。## 连接器版本管理的常见痛点 😫在Flink应用开发中，连接器版本管理常常让开发者头疼不已。不同版本的连接器可能导致各种兼容性问题，例如API变更、功能差异甚至运行时错误。

腾讯云开发者社区

如何快速搭建Neon无服务器PostgreSQL：面向初学者的完整指南

Neon是一款革命性的无服务器PostgreSQL解决方案，它通过分离存储和计算层，实现了自动扩缩容、类代码式数据库分支以及零级扩展能力。本指南将帮助你从零开始搭建Neon开发环境，体验这款创新数据库的强大功能。## 准备工作：环境要求与依赖项在开始搭建Neon环境前，请确保你的系统满足以下要求：- Linux操作系统（推荐Ubuntu 20.04+或Debian 11+）- Git