_source,_size 元字段
Document source meta-fields(文档源的元字段)
_source | 原始的JSON 字符串表示文档的正文。 |
_size | _source 字段的大小(以字节为单位),由 mapper-size 插件提供。 |
_source field
该 _source 字段包含在索引时传递的原始 JSON 文档正文。该 _source 字段本身不被索引(因此是不可搜索的),但它被存储,以便在执行撷取请求时可以返回,例如 get 或 search 。
禁用_source字段
虽然很方便,但是 _source 字段确实在索引中有不小的存储开销。 因此,可以使用如下方式禁用 :
警告 :
在禁用_source 字段之前请考虑用户经常禁用_source字段而不考虑后果,然后为此后悔。 如果_source字段不可用,则不支持许多功能 :
update,update_by_query,reindex APIs.
高亮
将索引从一 个 lasticsearch 索引 reindex(重索引) 到另一个索引的能力,以更改映射或分析,或将索引升级到新的主要版本。
通过查看索引时使用的原始文档来调试查询或聚合的能力。
潜在的未来可能会自动修复索引损坏的能力。
提示:
如果磁盘空间是瓶颈,应是增加压缩级别而不是禁用_source。
The metrics use case(指标用例)
指标用例与其他基于时间或日志记录的用例不同,因为有许多小型文档只包含数字,日期或关键字。
没有更新,没有高亮的请求,并且数据快速老化,因此不需要reindex。
搜索请求通常使用简单查询来按日期或标签过滤数据集,结果作为聚合返回。
在这种情况下,禁用_source字段将节省空间并减少I/O。
建议在metrics case下禁用_all字段。
包含 / 排除 _source 中的字段
专家级功能是在文档索引后但在 _source 字段存储之前修剪 _source 字段的内容。
警告:
从_source中删除字段与禁用_source有类似的缺点,尤其是您不能将文档从一个Elasticsearch索引重新索引到另一个。
考虑使用source filtering(源代码)过滤。
可以使用includes/excludes 参数(也可以接受通配符),如下所示 :
1 | 这些字段将从存储的_source字段中删除。 |
5 | 我们仍然可以搜索这个字段,即使它不在存储的_source。 |
Last updated