连续查询Continuous Query(CQ)¶

是在数据库内部自动周期性跑着的一个InfluxQL的查询，CQs需要在SELECT语句中使用一个函数，并且一定包括一个GROUP BY time()语句。

说明:

在写入之前设置CQs是因为CQ只对最近的数据有效, 即:
1. 数据的时间戳不会比now()减去CQ的FOR子句的时间早
2. 或是如果没有FOR子句的话比now()减去GROUP BY time()间隔早

<cq_query>:

SELECT <function[s]>
INTO <destination_measurement>
FROM <measurement>
[WHERE <stuff>]
GROUP BY time(<interval>)[,<tag_key[s]>]

基本语法:

CREATE CONTINUOUS QUERY <cq_name> ON <database_name>
BEGIN
  <cq_query>
END

高级语法:

CREATE CONTINUOUS QUERY <cq_name> ON <database_name>
RESAMPLE EVERY <interval> FOR <interval>
BEGIN
  <cq_query>
END

说明:
CQs对实时数据进行操作。
使用高级语法，CQ使用本地服务器的时间戳以及RESAMPLE子句中的信息
  和InfluxDB的预设时间边界来确定执行时间和查询中涵盖的时间范围。
CQs以与RESAMPLE子句中的EVERY间隔相同的间隔执行，并且它们在InfluxDB的预设时间边界开始时运行。
如果EVERY间隔是两个小时，InfluxDB将在每两小时的开始执行CQ。

EVERY间隔和FOR间隔都接受时间字符串。
RESAMPLE子句适用于同时配置EVERY和FOR,或者是其中之一。
如果没有提供EVERY间隔或FOR间隔，则CQ默认为相关为基本语法。

备注

注意，在WHERE子句中，cq_query不需要时间范围。 InfluxDB在执行CQ时自动生成cq_query的时间范围。cq_query的WHERE子句中的任何用户指定的时间范围将被系统忽略。

创建¶

实例说明(实战1实例):

> CREATE CONTINUOUS QUERY "cq_30m" ON "food_data"
BEGIN
  SELECT mean("website") AS "mean_website",mean("phone") AS "mean_phone"
  INTO "a_year"."downsampled_orders"
  FROM "orders"
  GROUP BY time(30m)
END

创建了一个叫做cq_30m的CQ作用于food_data数据库上。
cq_30m告诉InfluxDB每30分钟计算一次
    1. measurement为orders
    2. 并使用默认RPtow_hours的
    3. 字段website和phone的平均值
    4. 然后把结果写入到RP为a_year，
    5. 两个字段分别是mean_website和mean_phone的
    6. measurement名为downsampled_orders的数据中。
    7. InfluxDB会每隔30分钟跑对之前30分钟的数据跑一次这个查询。

实例:

CREATE CONTINUOUS QUERY "cq_active1month" ON "device"
    BEGIN
      SELECT mean("website") AS "mean_website",mean("phone") AS "mean_phone"
      INTO "a_year"."downsampled_orders"
      FROM "orders"
      GROUP BY time(30m)
    END

列出CQ¶

列出InfluxDB实例上的所有CQ:

SHOW CONTINUOUS QUERIES

例子:下面展示了telegraf和mydb的CQ:

> SHOW CONTINUOUS QUERIES
name: _internal
---------------
name   query


name: telegraf
--------------
name           query
idle_hands     CREATE CONTINUOUS QUERY idle_hands ON telegraf BEGIN SELECT min(usage_idle) INTO telegraf.autogen.min_hourly_cpu FROM telegraf.autogen.cpu GROUP BY time(1h) END
feeling_used   CREATE CONTINUOUS QUERY feeling_used ON telegraf BEGIN SELECT mean(used) INTO downsampled_telegraf.autogen.:MEASUREMENT FROM telegraf.autogen./.*/ GROUP BY time(1h) END

name: downsampled_telegraf
--------------------------
name   query

name: mydb
----------
name      query
vampire   CREATE CONTINUOUS QUERY vampire ON mydb BEGIN SELECT count(dracula) INTO mydb.autogen.all_of_them FROM mydb.autogen.one GROUP BY time(5m) END

删除CQ¶

从一个指定的database删除CQ:

DROP CONTINUOUS QUERY <cq_name> ON <database_name>

例子: 从数据库telegraf中删除idle_hands这个CQ：
> DROP CONTINUOUS QUERY "idle_hands" ON "telegraf"`

修改CQ¶

CQ一旦创建就不能修改了，你必须DROP再CREATE才行。

基本语法的实例¶

以下例子使用数据库transportation中的示例数据。

measurement:bus_data数据存储有关公共汽车乘客数量和投诉数量的15分钟数据:

name: bus_data
--------------
time                   passengers   complaints
2016-08-28T07:00:00Z   5            9
2016-08-28T07:15:00Z   8            9
2016-08-28T07:30:00Z   8            9
2016-08-28T07:45:00Z   7            9
2016-08-28T08:00:00Z   8            9
2016-08-28T07:45:00Z   7            9

例一：自动采样数据:

CREATE CONTINUOUS QUERY "cq_basic" ON "transportation"
BEGIN
  SELECT mean("passengers") INTO "average_passengers"
  FROM "bus_data" GROUP BY time(1h)
END

例二：自动采样数据到另一个保留策略里:

CREATE CONTINUOUS QUERY "cq_basic_rp" ON "transportation"
BEGIN
  SELECT mean("passengers") INTO "transportation"."three_weeks"."average_passengers"
  FROM "bus_data" GROUP BY time(1h)
END

例三：使用逆向引用自动采样数据:

// 计算数据库transportation中每个measurement的30分钟平均乘客和投诉。
// 它将结果存储在数据库downsampled_transportation中。
CREATE CONTINUOUS QUERY "cq_basic_br" ON "transportation"
BEGIN
  SELECT mean(*) INTO "downsampled_transportation"."autogen".:MEASUREMENT
  FROM /.*/ GROUP BY time(30m),*
END


> SELECT * FROM "downsampled_transportation."autogen"."bus_data"
name: bus_data
--------------
time                   mean_complaints   mean_passengers
2016-08-28T07:00:00Z   9                 6.5
2016-08-28T07:30:00Z   9                 7.5

例四：自动采样数据并配置CQ的时间边界:

# 使用GROUP BY time()子句的偏移间隔来改变CQ的默认执行时间和呈现的时间边界：
CREATE CONTINUOUS QUERY "cq_basic_offset" ON "transportation"
BEGIN
  SELECT mean("passengers") INTO "average_passengers"
  FROM "bus_data" GROUP BY time(1h,15m)
END

说明:
15分钟偏移间隔迫使CQ在默认执行时间后15分钟执行; cq_basic_offset在8:15而不是8:00执行
在8:15cq_basic_offset执行时间范围time> ='7:15'AND time <'8:15'的查询

> SELECT * FROM "average_passengers"
name: average_passengers
------------------------
time                   mean
2016-08-28T07:15:00Z   7.75
2016-08-28T08:15:00Z   16.75

基本语法的常见问题¶

备注

基本语法不支持使用fill()更改不含数据的间隔报告的值。如果基本语法CQs包括了fill()，则会忽略fill()。默认情况下，所有INTO查询将源measurement中的任何tag转换为目标measurement中的field

在CQ中包含GROUP BY，以保留目的measurement中的tag，如:

SELECT mean(*) INTO "downsampled_transportation"."autogen".:MEASUREMENT
  FROM /.*/ GROUP BY time(30m),*

高级语法例子¶

示例数据如下:

name: bus_data
--------------
time                   passengers
2016-08-28T06:30:00Z   2
2016-08-28T06:45:00Z   4
2016-08-28T07:00:00Z   5
2016-08-28T07:15:00Z   8
2016-08-28T07:30:00Z   8
2016-08-28T07:45:00Z   7
2016-08-28T08:00:00Z   8
2016-08-28T08:15:00Z   15
2016-08-28T08:30:00Z   15
2016-08-28T08:45:00Z   17
2016-08-28T09:00:00Z   20

例一：配置执行间隔:

CREATE CONTINUOUS QUERY "cq_advanced_every" ON "transportation"
RESAMPLE EVERY 30m
BEGIN
  SELECT mean("passengers") INTO "average_passengers"
  FROM "bus_data" GROUP BY time(1h)
END

1. 在8:00cq_basic_every执行时间范围time> ='7:00'AND time <'8:00':
time                   mean
2016-08-28T07:00:00Z   7

2. 在8:30cq_basic_every执行时间范围time> ='8:00'AND time <'9:00':
time                   mean
2016-08-28T08:00:00Z   12.6667

3. 在9:00cq_basic_every执行时间范围time> ='8:00'AND time <'9:00'
time                   mean
2016-08-28T08:00:00Z   13.75

最终结果为:
> SELECT * FROM "average_passengers"
name: average_passengers
------------------------
time                   mean
2016-08-28T07:00:00Z   7
2016-08-28T08:00:00Z   13.75

说明: 每半小时执行一次, 每次算的时间段是1小时。
如:cq_advanced_every计算8:00时间间隔的结果两次。
第一次，它运行在8:30，计算每个可用数据点在8:00和9:00（8,15和15）之间的平均值。(8点45的数据还没生成)
  time                   mean
  2016-08-28T08:00:00Z   12.6667
第二次，它运行在9:00，计算每个可用数据点在8:00和9:00（8,15,15和17）之间的平均值。
  time                   mean
  2016-08-28T08:00:00Z   13.75
由于InfluxDB处理重复点的方式，所以第二个结果只是覆盖第一个结果。

例二：配置CQ的重采样时间范围:

# 在RESAMPLE中使用FOR来指明CQ的时间间隔的长度。
CREATE CONTINUOUS QUERY "cq_advanced_for" ON "transportation"
RESAMPLE FOR 1h
BEGIN
  SELECT mean("passengers") INTO "average_passengers"
  FROM "bus_data" GROUP BY time(30m)
END

1. 在8:00cq_advanced_for执行时间范围time> ='7:00'AND time <'8:00':
time                   mean
2016-08-28T07:00:00Z   6.5
2016-08-28T07:30:00Z   7.5

2. 在8:30cq_advanced_for执行时间范围time> ='7:30'AND time <'8:30:
time                   mean
2016-08-28T07:30:00Z   7.5
2016-08-28T08:00:00Z   11.5

3. 在9:00cq_advanced_for执行时间范围time> ='8:00'AND time <'9:00':
time                   mean
2016-08-28T08:00:00Z   11.5
2016-08-28T08:30:00Z   16

最终结果为:
> SELECT * FROM "average_passengers"
name: average_passengers
------------------------
time                   mean
2016-08-28T07:00:00Z   6.5
2016-08-28T07:30:00Z   7.5
2016-08-28T08:00:00Z   11.5
2016-08-28T08:30:00Z   16

例三：配置执行间隔和CQ时间范围:

CREATE CONTINUOUS QUERY "cq_advanced_every_for" ON "transportation"
RESAMPLE EVERY 1h FOR 90m
BEGIN
  SELECT mean("passengers") INTO "average_passengers"
  FROM "bus_data" GROUP BY time(30m)
END

以1小时的间隔执行一次(由EVERY决定)
覆盖时间段为now()和now()-90m(由FOR决定时间间隔)

1. 在8:00cq_advanced_every_for执行时间范围time>='6:30'AND time <'8:00':
name: average_passengers
------------------------
time                   mean
2016-08-28T06:30:00Z   3
2016-08-28T07:00:00Z   6.5
2016-08-28T07:30:00Z   7.5
2. 在9:00cq_advanced_every_for执行时间范围time> ='7:30'AND time <'9:00'
name: average_passengers
------------------------
time                   mean
2016-08-28T07:30:00Z   7.5
2016-08-28T08:00:00Z   11.5
2016-08-28T08:30:00Z   16

最终结果为:
> SELECT * FROM "average_passengers"
name: average_passengers
------------------------
time                   mean
2016-08-28T06:30:00Z   3
2016-08-28T07:00:00Z   6.5
2016-08-28T07:30:00Z   7.5
2016-08-28T08:00:00Z   11.5
2016-08-28T08:30:00Z   16

例四：配置CQ的时间范围并填充空值:

使用FOR间隔和fill()来更改不含数据的时间间隔值

请注意，至少有一个数据点必须在fill()运行的FOR间隔内。
如果没有数据落在FOR间隔内，则CQ不会将任何点写入目标measurement

// 在没有结果的时间间隔里写入值1000
CREATE CONTINUOUS QUERY "cq_advanced_for_fill" ON "transportation"
RESAMPLE FOR 2h
BEGIN
  SELECT mean("passengers") INTO "average_passengers"
  FROM "bus_data" GROUP BY time(1h) fill(1000)
END

1. 在6:00cq_advanced_for_fill执行时间范围time>='4:00'AND time <'6:00'
   # 不写入任何点，因为在那个时间范围bus_data没有数据
2. 在7:00cq_advanced_for_fill执行时间范围time>='5:00'AND time <'7:00'
    name: average_passengers
    ------------------------
    time                   mean
    2016-08-28T05:00:00Z   1000          <------ fill(1000)
    2016-08-28T06:00:00Z   3             <------ 2和4的平均值
3. ...
4. 在11:00cq_advanced_for_fill执行时间范围time> ='9:00'AND time <'11:00'
    name: average_passengers
    ------------------------
    2016-08-28T09:00:00Z   20            <------ 20的平均
    2016-08-28T10:00:00Z   1000          <------ fill(1000)
5. 在12:00cq_advanced_for_fill执行时间范围time>='10:00'AND time <'12:00'
    向average_passengers不写入任何点，因为在那个时间范围bus_data没有数据.

最终结果为:
> SELECT * FROM "average_passengers"
name: average_passengers
------------------------
time                   mean
2016-08-28T05:00:00Z   1000
2016-08-28T06:00:00Z   3
2016-08-28T07:00:00Z   7
2016-08-28T08:00:00Z   13.75
2016-08-28T09:00:00Z   20
2016-08-28T10:00:00Z   1000

高级语法的常见问题¶

问题一：如果EVERY间隔大于GROUP BY time()的间隔:

不影响, 即:
如果GROUP BY time()间隔为5m，并且EVERY间隔为10m
则:
CQ每10分钟执行一次
now()和now()减去EVERY间隔之间的时间段

问题二：如果FOR间隔比执行的间隔少:

InfluxDB返回如下错误:
error parsing query: FOR duration must be >= GROUP BY time duration:
  must be a minimum of <minimum-allowable-interval> got <user-specified-interval>
为了避免在执行时间之间丢失数据，FOR间隔必须等于或大于GROUP BY time()或者EVERY间隔

CQ的使用场景¶

采样和数据保留:

使用CQ与InfluxDB的保留策略（RP）来减轻存储问题。
结合CQ和RP自动将高精度数据降低到较低的精度，并从数据库中移除可分配的高精度数据。

预先计算昂贵的查询:

通过使用CQ预先计算昂贵的查询来缩短查询运行时间。
提示：预先计算首选图形工具的查询，以加速图形和仪表板的展示。

替换HAVING子句:

InfluxQL不支持HAVING子句。通过创建CQ来聚合数据并查询CQ结果以达到应用HAVING子句相同的功能。
注意：InfluxDB提供了子查询也可以达到类似于HAVING相同的功能。

如: 想达到下面这种效果
SELECT mean("bees") FROM "farm" GROUP BY time(30m) HAVING mean("bees") > 20

1. 创建一个CQ
  CREATE CONTINUOUS QUERY "bee_cq" ON "mydb"
  BEGIN
    SELECT mean("bees") AS "mean_bees" INTO "aggregate_bees"
    FROM "farm" GROUP BY time(30m)
  END
2. 查询CQ的结果
  SELECT "mean_bees" FROM "aggregate_bees" WHERE "mean_bees" > 20

替换嵌套函数:

InfluxDB不接受使用嵌套函数的以下查询

如: 想达到下面这种效果
SELECT mean(count("bees")) FROM "farm" GROUP BY time(30m)

1. 创建一个CQ
  CREATE CONTINUOUS QUERY "bee_cq" ON "mydb"
  BEGIN
      SELECT count("bees") AS "count_bees" INTO "aggregate_bees"
      FROM "farm" GROUP BY time(30m)
  END
2. 查询CQ的结果
  SELECT mean("count_bees") FROM "aggregate_bees"
  WHERE time >= <start_time> AND time <= <end_time>