# 百分数桶聚合(Percentiles Bucket Aggregation)

## 百分数桶聚合(Percentiles Bucket Aggregation)

> 警告：此功能是实验性的，可能会在未来的版本中完全更改或删除。Elastic将采取最大的努力来解决任何的问题，但是实验功能不受SLA官方功能的支持。

同级管道聚合，它计算同级聚合中指定度量的所有桶的百分位数。指定度量必须是数字，并且同级聚合必须是多桶聚合。

## Syntax（语法） <a href="#percentilesbucketaggregation-bai-fen-shu-tong-ju-he-syntax-yu-fa" id="percentilesbucketaggregation-bai-fen-shu-tong-ju-he-syntax-yu-fa"></a>

百分数聚合看起来像这样：

```
{
    "percentiles_bucket": {
        "buckets_path": "the_sum"
    }
}
```

## percentiles\_bucket参数 <a href="#percentilesbucketaggregation-bai-fen-shu-tong-ju-he-table8.sumbucketparameterstable8.sumbucket-can-s" id="percentilesbucketaggregation-bai-fen-shu-tong-ju-he-table8.sumbucketparameterstable8.sumbucket-can-s"></a>

| 参数名称           | 描述                                                        | 是否必要 | 默认值                            |
| -------------- | --------------------------------------------------------- | ---- | ------------------------------ |
| `buckets_path` | 我们希望找到的数据的桶的路径（相关详细信息，请参阅"buckets\_path Syntax"一节）        | 必须   |                                |
| `gap_policy`   | 在数据中找到差异时应用的策略（相关详情，请参阅“Dealing with gaps in the data”一节） | 可选   | `skip`                         |
| `format`       | 应用于此聚合的输出值的格式                                             | 可选   | `null`                         |
| `percents`     | 要计算的百分数列表                                                 | 可选   | `[ 1, 5, 25, 50, 75, 95, 99 ]` |

以下代码计算每月sales桶总数的百分数：

```
POST /sales/_search
{
    "size": 0,
    "aggs" : {
        "sales_per_month" : {
            "date_histogram" : {
                "field" : "date",
                "interval" : "month"
            },
            "aggs": {
                "sales": {
                    "sum": {
                        "field": "price"
                    }
                }
            }
        },
        "percentiles_monthly_sales": {
            "percentiles_bucket": {
                "buckets_path": "sales_per_month>sales",   #1
                "percents": [ 25.0, 50.0, 75.0 ]           #2
            }
        }
    }
}
```

| 1 | buckets\_path指示这个为percentiles\_bucket聚合，我们希望在sales\_per\_month数据直方图中计算sales聚合的统计数据。 |
| - | ----------------------------------------------------------------------------------- |
| 2 | percents指定了我们希望计算的百分数，在这里，是第25，第50和第75百分数。                                          |

以下是响应信息：

```
{
   "took": 11,
   "timed_out": false,
   "_shards": ...,
   "hits": ...,
   "aggregations": {
      "sales_per_month": {
         "buckets": [
            {
               "key_as_string": "2015/01/01 00:00:00",
               "key": 1420070400000,
               "doc_count": 3,
               "sales": {
                  "value": 550.0
               }
            },
            {
               "key_as_string": "2015/02/01 00:00:00",
               "key": 1422748800000,
               "doc_count": 2,
               "sales": {
                  "value": 60.0
               }
            },
            {
               "key_as_string": "2015/03/01 00:00:00",
               "key": 1425168000000,
               "doc_count": 2,
               "sales": {
                  "value": 375.0
               }
            }
         ]
      },
      "percentiles_monthly_sales": {
        "values" : {
            "25.0": 375.0,
            "50.0": 375.0,
            "75.0": 550.0
         }
      }
   }
}
```

## Percentiles\_bucket实现 <a href="#percentilesbucketaggregation-bai-fen-shu-tong-ju-he-percentilesbucketimplementationpercentilesbucket" id="percentilesbucketaggregation-bai-fen-shu-tong-ju-he-percentilesbucketimplementationpercentilesbucket"></a>

百分数桶返回最近输入的数据点，该数据点不大于所请求的百分数；它不会在数据点之间插值。

百分数是精确计算的，不是近似值（与百分数指标不同）。这意味着在丢弃数据之前，实现会在内存中维护一个有序的数据列表来计算百分数。如果你尝试在数百万的数据点中计算一个百分数的percentiles\_bucket，可能会遇到内存压力问题。
