34.6. 规则与触发器之比较

许多用触发器可以干的事情同样也可以用 PostgreSQL 规则系统来完成。 目前不能用规则来实现的东西之一是某些约束,特别是外键。 我们可能在某字段的值没有在另一个表里出现的情况下用一条有条件的规则把查询重写为 NOTHING。 不过这样做数据就会被不声不响的被仍掉,因而这也不是一个好主意。 如果需要检查有效的值,而且如果是无效值出现时要生成一个错误信息, 这种情况下我们要用触发器来做。

另一方面,一个用于INSERT一个视图的触发器可以做到与规则一样, 把数据放到另外的地方去而取代对视图的插入。 但它不能在UPDATEDELETE时做同样的事情, 因为在视图关系里没有可供扫描的真实数据,因而触发器将永远不被调用。 这时只有规则可用。

对于两者都可用的情况,哪个更好取决于对数据库的使用。 触发器为任何涉及到的行执行一次。规则修改查询树或生成额外的一个。 所以如果在一个语句中涉及到多行,一个生成一个额外查询的规则通常可能会比一个对每一行都分别执行一次(因此要执行很多次)的触发器要好一些。

例如:这里有两个表

CREATE TABLE computer (
    hostname	text,    -- indexed
    manufacturer    text     -- indexed
);

CREATE TABLE software (
    software	text,    -- indexed
    hostname	text     -- indexed
);

两个表都有好几千行,并且hostname上的索引是唯一的。 规则/触发器应该实现这样一个约束,这个约束从software表中删除引用已删除计算机的行。触发器可以用下面这条命令:

DELETE FROM software WHERE hostname = $1;

因为触发器是为从 computer 里面删除的每一个独立的行调用一次,那么它可以准备并且保存这个命令的规划, 把hostname(主机名)作为参数传递。规则应该这样写

CREATE RULE computer_del AS ON DELETE TO computer
    DO DELETE FROM software WHERE hostname = OLD.hostname;

现在我们看看这两种不同的删除。在下面情况

DELETE FROM computer WHERE hostname = 'mypc.local.net';

对表 computer 使用索引(快速)进行扫描并且由触发器声明的查询也用索引进行扫描(同样快速)。规则里多出来的查询是一个

DELETE FROM software WHERE computer.hostname = 'mypc.local.net'
		       AND software.hostname = computer.hostname;

因为已经建立了合适的索引,规划器将创建一个下面的规划

Nestloop
  ->  Index Scan using comp_hostidx on computer
  ->  Index Scan using soft_hostidx on software

所以在规则和触发器的实现之间没有太多的速度差别。

下面的删除我们希望删掉所有 2000 个 hostnameold 开头的计算机。 有两个可能的用于这个用途的查询。一个是

DELETE FROM computer WHERE hostname >= 'old'
		       AND hostname <  'ole'

规则增加的命令是

DELETE FROM software WHERE computer.hostname >= 'old' AND computer.hostname < 'ole'
                       AND software.hostname = computer.hostname;

查询的规划将会是

Hash Join
  ->  Seq Scan on software
  ->  Hash
      ->  Index Scan using comp_hostidx on computer

另一个可能的查询是

DELETE FROM computer WHERE hostname ~ '^old';

它由规则增加执行规划是:

Nestloop
  ->  Index Scan using comp_hostidx on computer
  ->  Index Scan using soft_hostidx on software

这表明,规划器不能认识到表 computer 里的hostname (计算机主机名)的条件在多个条件表达式以 AND 的方式组合在一起时同样可以用于 software,就象在用正则表达式的查询里一样。 触发器将在任何 2000 个要被删除的旧计算机里被调用一次, 结果是对 computer 的一次索引扫描和对 software 的2000次索引扫描。 规则的实现将在两个对索引的查询实现之。 所以这是由 software 表的实际大小决定规则进行了顺序扫描后是否还是快一些。 2000 个在 SPI 管理器上的查询的执行是要点时间的, 即使所有要使用的索引块都很快在缓冲里出现。

我们看的最后一个查询是

DELETE FROM computer WHERE manufacurer = 'bim';

同样,这也会导致从 computer 表里的多行删除。 所以触发器同样会向执行器提交很多查询。规则生成的命令将会是

DELETE FROM software WHERE computer.manufacurer = 'bim'
                       AND software.hostname = computer.hostname;

但规则规划又将是对两个索引扫描的嵌套循环。 只是用了 computer 的另外一个索引:

Nestloop
  ->  Index Scan using comp_manufidx on computer
  ->  Index Scan using soft_hostidx on software

在任何一种情况下,从规则系统出来的额外查询都或多或少与查询中涉及到的行的数量相对独立。

概括来说,规则只是在它们的动作(action)生成了又大又烂的条件连接时才比触发器有较大速度差异, 这时规划器将失效。