Chapter 16. 扩展的 SQL:聚集

Postgres里的聚集是用 状态值状态转换函数表达的. 也就是说,一个聚集可以定义为一些状态, 当一条输入的条目被处理时,这些状态被修改. 要定义一个新的聚集函数,我们就要选择一个表示状态值的数据类型, 一个状态初始值,一个状态转换函数. 该状态转换函数只是一个普通函数,也可以用于聚集的环境之外. 还可以声明一个终处理函数, 用于对付当期望的聚集输出和需要保留在运行的状态值里面的数据 不同的情况.

因此,除了被聚集用户看到的输入和结果数据类型外,还有一种内部 状态值数据类型,这种类型可能和输入和结果类型都不一样.

如果我们定义了一个不使用终处理函数的聚集, 那我们的聚集就是对每条记录的字段值进行函数计算. "Sum"(求和)是这类聚集的例子."Sum"从零开始,每次 都向运行总和追加当前记录值.比如,如果我们要把求和 聚集用于复数,我们只需要该数据类型的加法函数就行了. 该聚集这样定义:

CREATE AGGREGATE complex_sum (
    sfunc = complex_add,
    basetype = complex,
    stype = complex,
    initcond = '(0,0)'
);

SELECT complex_sum(a) FROM test_complex;

         +------------+
         |complex_sum |
         +------------+
         |(34,53.9)   |
         +------------+
   
(实际上,我们会把这个聚集命名为 "sum",然后让 Postgres 来区分对一个复数列应该施用哪种 sum.)

如果不存在非空输入值,上面的"Sum"定义将返回零值(初始状态条件). 可能我们在那种情况下会希望返回NULL--SQL92要求"Sum"的性质是那样的. 我们只需要忽略"initcond"段就可以实现那一点,这样初始状态条件是NULL. 通常这也意味着sfunc需要检查NULL状态条件输入,不过对于"Sum"和 一些象"Max"和"Min"这样的简单聚集来说,把第一个非空输入插入到状态值里面, 然后从第二个非空输入状态值开始使用转换函数就足够了. 如果初始条件是NULL并且转换函数标记为"strict", (也就是说,不能对NULL输入调用.) Postgres 就会自动处理这些内容.

另外一个"strict"转换函数的缺省特性是:当碰到一个NULL输入的时候, 前面一个状态转换函数会被保留下来不做改动. 这样,就忽略了NULL.如果你希望对NULL输入有其它处理,只需要 把你的转换函数定义为非严格(non-strict)的然后编写代码的时候 测试NULL并做相应处理即可.

"Average"(平均)是更复杂一点的聚集的例子.它需要两个运行时状态: 输入的总和以及输入数量的计数.最终结果是通过把这些量相除得到的. 平均的典型实现是用两元素数组做状态值.比如,内建的 avg(float8)实现是这样的:

CREATE AGGREGATE avg (
    sfunc = float8_accum,
    basetype = float8,
    stype = float8[],
    finalfunc = float8_avg,
    initcond = '{0,0}'
);
   

更详细的信息请参考 PostgreSQL 用户手册 里的 CREATE AGGREGATE