doc_values(文档值)

在默认情况下许多字段都是indexed(被索引的),这使得它们可以被搜索.反向索引允许查询通过唯一性排序的 term(词根)列表来查询term(词根),并且可以立即访问包含该term(词根)的文档.

脚本中的排序,聚合和对字段值的访问需要一种不同的数据访问模式.我们不需要先查找term(词根),再寻找对应的documents(文档),而是可以先查找document(文档),再查找它在一个字段中的terms(词根).

Doc values是在document索引时间内构建在磁盘上的数据结构,这使得上面所说的数据访问模式成为可能.它们存储与_source 相同的值,但是以列为主的方式存储.这使得排序和聚合效率更高.几乎所有字段类型都支持Doc values,除了the notable exception of analyzed string fields.

默认情况下,支持doc values的所有字段都是开启的.如果你确定不需要在字段上进行排序和聚合,活从脚本中访问字段值,则可以禁用doc values来节省磁盘空间.

curl -XPUT 'localhost:9200/my_index?pretty' -H 'Content-Type: application/json' -d'
{
  "mappings": {
    "my_type": {
      "properties": {
        "status_code": { # 1
          "type":       "keyword"
        },
        "session_id": { # 2
          "type":       "keyword",
          "doc_values": false
        }
      }
    }
  }
}
'

1

status_code 默认开启 doc_values

2

session_id 关闭 doc_values,但是仍然可以被查询.

简单点理解就是可以字段值可以索引一个正排的索引,可以被排序和聚合操作

Last updated