使用 IN
  • 当你使用IN子句时,SQL 会比较指定列的每个值是否包含在IN之后的列表中。
  • 如果列表中的值很多,或者子查询返回的结果集很大,那么IN子句的效率可能会很低。
  • 另外,如果列表中包含NULLIN子句在逻辑上会更加复杂,因为NULL与任何值的比较都是未知的(即不是真也不是假)。
使用 EXISTS
  • EXISTS子句用于测试子查询是否返回了任何行。
  • 当使用EXISTS时,一旦找到符合条件的行,子查询就会停止处理,因为它不需要知道有多少行符合条件,只需要知道至少有一行符合条件。
  • 这意味着EXISTS通常在子查询可能返回大量结果时更有效率。
EXISTS 与 NULL 值
  • 当你的查询涉及到NULL值时,使用EXISTS可能更合适,因为EXISTS只关心是否存在符合条件的行,而不是实际的列值。
  • 如果子查询中的列存在NULL值,使用IN可能会导致不准确或者不符合预期的结果,因为NULL不能与其他值进行等值比较。
  • EXISTS不直接与列值比较,而是基于行的存在性来返回真或假,因此它不受NULL值的影响。
示例

假设我们有两个表:orders(订单表)和 customers(客户表),我们想要查找至少有一个订单的所有客户。

使用 IN 子句:

SELECT * FROM customers WHERE id IN (SELECT customer_id FROM orders);

如果 orders 表中的 customer_id 列包含 NULL 值,那么这个 NULL 会在比较中被忽略,因为 NULL 与任何值的比较都不会返回真。

使用 EXISTS 子句:

SELECT * FROM customers c WHERE EXISTS (SELECT 1 FROM orders o WHERE o.customer_id = c.id);

这里,一旦找到至少一个存在的订单,对应的 EXISTS 子句就会返回真,而且不关心 orders 表中的 customer_id 是否包含 NULL 值。

总结来说,当查询涉及到可能有 NULL 值的列时,使用 EXISTS 通常比 IN 更安全且效率更高。