运行时间建模

运行时间建模

学习目标

形式化的建模程序的运行时间, 特别是诸如 $O (n)$ 或 $O (n^{3})$ 时间算法的概念
分别对多项式时间和指数时间进行建模的复杂性类 $P$ 和 $EXP .$
了解时间层级定理, 即对于任意 $k \geq 1$ 都存在我们可以在 $O (n^{k + 1})$ 时间计算但不能在 $O (n^{k})$ 时间计算的函数.
代表非一致性计算 $P_{/poly}$ 的复杂性类, 及 $P \subseteq P_{/poly}$ 这一结论.

Quote

当问题规模的度量标准合理, 且当规模取值任意大时, 对算法难度的阶进行渐近估计在理论上具有重要意义. 这种估计无法被操纵——即无法通过人为地使算法在较小规模下变得困难而扭曲结果.

-杰克·埃德蒙兹, “Paths, Trees, and Flowers”, 1963.

Quote

马克斯·纽曼: “声称机器‘能够’做这做那固然很好, 但是……它做这些事情究竟需要花费多少时间呢？”

艾伦·图灵: “在我看来, 这个时间因素正是所有真正的技术难点所在. ”

-BBC 广播座谈节目 “我们可以说计算机会思考吗？”, 1952.

在第12章中, 我们介绍了一些高效的算法, 并且对他们的运行时间做了一些假设, 不过并未对这些算法的运行时间进行精确数学定义. 我们将在本章节中借助我们之前已经介绍过的图灵机和 RAM（或等价的 NAND-TM 和 NAND-RAM）机完成这一工作. 任何非平凡的算法都会在更大规模的输入上运行更长的时间, 因此算法的运行时间并不能用一个确定的数字来表示. 因此, 我们想要确定的是算法需要运行的步数和输入长度的关系. 我们特别关注以下两者之间的区别, 那些最多只需多项式时间（即对于某个常数 $c,$ 时间为 $O (n^{c})$ ）的算法, 与那些任何算法都至少需要指数时间（即对于某个 $c,$ 时间为 $Ω (2^{n^{c}})$ ）的问题. 正如第12章中 Edmonds 的引言所提到的, 这两者之间的差异, 有时与可计算和不可计算之间的差异一样重要.

overview

图 13.1. 本章得到结果的概览

本章：一个直观的概述

在这一章中我们形式化的定义一个函数可以被在确定的步数下计算意味着什么. 正如在第12章中所说的那样, 运行时间并不是一个数字, 我们关心的是随着输入规模增大, 算法运行步数会以怎样的规模增长. 我们可以用图灵机或 RAM 机来给出一个形式化定义 - 事实上模型的选择并不影响这个问题的核心解决方案本章我们将给出几个重要定义并证明一些重要的定理. 我们将定义本书中使用的主要时间复杂性类, 并展示时间层级定理, 该定理表明：如果给予更多的资源（即针对每个输入规模允许更多的执行步数）, 我们就能够计算更多的函数

要将这一切用不那么数学化的语言表述出来, 我们将定义能在 $T (n)$ 步内将函数 $F : {0, 1}^{*} \to {0, 1}^{*}$ 计算出来的含义, 其中 $T$ 是一个将输入长度 $n$ 映射到计算所需的步数的函数. 使用这些定义, 我们将做以下事情（可参考图 13.1）

我们定义复杂性类 $P$ 为可以在多项式时间内计算的布尔函数的集合, 复杂性类 $EXP$ 为可以在指数时间内计算的函数的集合. 注意 $P \subseteq EXP,$ 即如果我们能在多项式时间内计算一个函数, 那么当然也能在指数时间内计算他.
我们证明, 用图灵机和RAM机计算一个函数所需的时间是多项式相关的. 这意味着, 无论使用图灵机还是 RAM 机（或 NAND-RAM 机）来定义, $P$ 和 $EXP$ 总是相同.
我们给出一个高效且通用的 NAND-RAM 程序, 并使用它建立时间层级定理, 该定理意味着 $P$ 是 $EXP$ 的真子集.
我们将此处定义的概念与第3章中定义的布尔电路和 NAND-CIRC 程序等非一致性模型联系起来. 我们将 $P_{/poly}$ 定义为可以由一系列多项式大小的电路所计算的函数类. 我们证明了 $P \subseteq P_{/poly},$ 且 $P_{/poly}$ 包含不可计算函数.

13.1 形式化的定义运行时间

我们的计算模型（图灵机, NAND-TM 和 NAND-RAM 程序等）都是通过其运作方式都是对输入逐步执行一系列指令. 我们可以通过测量算法 $M$ 在输入 $x$ 上执行的步数, 并将其表示为输入长度 $∣ x ∣$ 的函数, 从而定义算法 $M$ 在这些模型下的运行时间. 我们首先定义基于图灵机的运行时间：

定义 13.1 (运行时间（图灵机）).

令 $T : N \to N$ 为某个实数到实数的映射. 如果存在一台图灵机 $M,$ 使得对于每一个充分大的 $n$ 和每一个 $x \in {0, 1}^{n},$ 当给定输入 $x$ 时, 机器 $M$ 在执行最多 $T (n)$ 步后停机并输出 $F (x),$ 那么我们称函数 $F : {0, 1}^{*} \to {0, 1}^{*}$ 是在 $T (n)$ 图灵机时间（Turing Machine Time, 简称 TM 时间）内可计算的. 我们定义 $T I M E_{TM} (T (n))$ 为所有在 $T (n)$ 图灵机时间内可计算的布尔函数（即映射 ${0, 1}^{*}$ 到 ${0, 1}$ 的函数）的集合.

重要启示

重要提示 13.1. 对于函数 $F : {0, 1}^{*} \to {0, 1}$ 和 $T : N \to N,$ 我们可以形式化的定义 $F$ 能在至多 $T (n)$ 的时间内计算意味着什么, 其中 $n$ 为输入规模.

暂停一下

定义 13.1 并不复杂, 但这是本书中最为重要的定义之一. 照例, $T I M E_{TM} (T (n))$ 代表一类函数, 而不是机器类. 若 $M$ 是图灵机, 则像 “ $M$ 属于 $T I M E_{TM} (n^{2})$ ” 这样的表述并不正确. 此处定义的 TM 时间（图灵机时间）概念在文献中有时被称为“单带图灵时间”（single-tape Turing machine time）, 这是因为有些文献会考虑拥有多条工作带的图灵机.

放宽条件只考虑充分大的 $n$ 虽然本质上并不是很重要, 但却非常便利, 因为这使我们能够避免讨论一些无趣的边界情况. 尽管“函数的运行时间”这一概念可以在任意函数上定义, 但在定义 $T I M E_{TM} (T (n))$ 类时, 我们只考虑布尔函数, 即那些只有一个 bit 输出的函数. 这一选择并不重要, 是为了后续讨论的简洁与便利而做出的. 事实上, 任何一个非布尔函数都有一个与之计算等价的布尔变体, 参见习题 13.3

练习 13.1 (时间界限的示例). 证明 $T I M E_{TM} (10 \cdot n^{3}) \subseteq T I M E_{TM} (2^{n}) .$

exampletimebounds

图 13.2. 将 $T (n) = 10 n^{3}$ 和 $T^{'} (n) = 2^{n}$ 比较（右图的 Y 轴采用对数标度）. 因为对于足够大的 $n,$ $T^{'} (n) \geq T (n),$ 则 $T I M E_{TM} (T (n)) \subseteq T I M E_{TM} (T^{'} (n)) .$

对练习 13.1 的解答

证明其实已经在图 13.2 中展示了. 假设 $F \in T I M E_{TM} (10 \cdot n^{3}),$ 则存在数 $N_{0}$ 和计算模型 $M,$ 满足对于任意 $n > N_{0},$ $x \in {0, 1}^{*},$ 都有 $M (x)$ 会在最多 $10 \cdot n^{3}$ 步内输出 $F (x)$ 的结果. 因为 $10 \cdot n^{3} = o (2^{n}),$ 一定存在数 $N_{1}$ 满足对于任意 $n > N_{1},$ 都有 $10 \cdot n^{3} < 2^{n} .$ 则对于任意 $n > max {N_{0}, N_{1}},$ $M (x)$ 会在至多 $2^{n}$ 步内输出 $F (x)$ 的结果, 即证明了 $F \in T I M E_{TM} (2^{n}) .$

13.1.1 多项式时间和指数时间

与可计算性的概念不同, 精确的运行时间可能会取决于我们所使用的计算模型. 然而, 事实上, 如果我们只关心“足够粗糙”的尺度（大部分情况下都是如此）, 那么模型的选择——无论是图灵机、RAM 机、NAND-TM/NAND-RAM 程序, 还是 C/Python 程序——都无关紧要了. 这就是所谓的扩展Church-Turing论题 (extended Church-Turing Thesis). 具体来说, 我们主要关心的是多项式时间与指数时间之前的区别.

我们将关注以下两个主要的时间复杂性类:

多项式时间: 如果一个函数 $F : {0, 1}^{*} \to {0, 1}$ 属于类 $P = \cup_{c \in {1, 2, 3, \dots}} T I M E_{TM} (n^{c}),$ 则称其是 多项式时间可计算 的. 也就是说, 若 $F \in P,$ 则存在一个计算 $F$ 的算法, 其运行时间关于输入长度至多是多项式的（换言之, 对于某个常数 $c,$ 至多 $n^{c}$ ）.
指数时间: 如果一个函数 $F : {0, 1}^{*} \to {0, 1}$ 属于类 $EXP = \cup_{c \in {1, 2, 3, \dots}} T I M E_{TM} (2^{n^{c}}),$ 则称其是 指数时间可计算 的. 也就是说, 若 $F \in EXP,$ 则存在一个计算 $F$ 的算法, 其运行时间关于输入长度至多是指数的（换言之, 对于某个常数 $c,$ 至多 $2^{n^{c}}$ ）.

形式化的说, 他们是如下定义的.

定义 13.2 ( $P$ 和 $EXP$ ).

设函数 $F : {0, 1}^{*} \to {0, 1} .$

若存在一个多项式 $p : N \to R,$ 和一个图灵机 $M,$ 满足对于任意 $x \in {0, 1}^{*},$ 当给出输入 $x$ 时, 图灵机将在至多 $p (∣ x ∣)$ 步内停机并输出 $F (x),$ 则我们称 $F \in P .$

若存在一个多项式 $p : N \to R,$ 和一个图灵机 $M,$ 满足对于任意 $x \in {0, 1}^{*},$ 当给出输入 $x$ 时, 图灵机将在至多 $2^{p (∣ x ∣)}$ 步内停机并输出 $F (x),$ 则我们称 $F \in EXP .$

暂停一下

请务必花点时间, 确保你透彻理解了这些定义. 特别需要注意的是, 学生们有时会误以为 $EXP$ 类指的是那些不在 $P$ 中的函数. 然而, 事实并非如此. 如果 $F$ 属于 $EXP,$ 这意味着它能够在指数时间内被计算出来. 这并不意味着它不能同时在多项式时间内被计算.

练习 13.2 ( $P$ 的另一定义).

证明定义 13.2 中定义的 $P$ 与 $\cup_{c \in {1, 2, 3, \dots}} T I M E_{TM} (n^{c})$ 等价.

对练习 13.2 的解答

为了证明这两个集合相等, 我们可证明 $P \subseteq \cup_{c \in {1, 2, 3, \dots}} T I M E_{TM} (n^{c})$ 以及 $\cup_{c \in {1, 2, 3, \dots}} T I M E_{TM} (n^{c}) \subseteq P .$

我们从前一个包含关系开始. 假设 $F \in P .$ 那么存在某个多项式 $p : N \to R$ 和一台图灵机 $M,$ 使得 $M$ 能计算 $F,$ 并且对于每一个输入 $x,$ $M$ 都在至多 $p (∣ x ∣)$ 步内停机. 我们可以将多项式 $p : N \to R$ 写成 $p (n) = \sum_{i = 0}^{d} a_{i} n^{i}$ 的形式, 其中 $a_{0}, \dots, a_{d} \in R,$ 并且我们假设 $a_{d}$ 非零（否则我们就让 $d$ 对应使得 $a_{d}$ 非零的最大数）. 这个 $d$ 即为 $p$ 的次数（degree）. 由于 $n^{d} = o (n^{d + 1}),$ 无论系数 $a_{d}$ 是多少, 对于足够大的 $n,$ 都有 $p (n) < n^{d + 1} .$ 这意味着图灵机 $M$ 在处理长度为 $n$ 的输入时, 会在少于 $n^{d + 1}$ 步内停机, 因此 $F \in T I M E_{TM} (n^{d + 1}) \subseteq \cup_{c \in {1, 2, 3, \dots}} T I M E_{TM} (n^{c}) .$

对于第二个包含关系, 假设 $F \in \cup_{c \in {1, 2, 3, \dots}} T I M E_{TM} (n^{c}) .$ 那么存在某个正整数 $c \in N$ 使得 $F \in T I M E_{TM} (n^{c}),$ 这意味着存在一台图灵机 $M$ 和某个数值 $N_{0},$ 使得 $M$ 能计算 $F,$ 并且对于每一个 $n > N_{0},$ $M$ 在处理长度为 $n$ 的输入时, 都在至多 $n^{c}$ 步内停机. 设 $T_{0}$ 为 $M$ 在处理长度至多为 $N_{0}$ 的输入时所花费的最大步数. 那么, 如果我们定义多项式 $p (n) = n^{c} + T_{0},$ 我们就会发现 $M$ 在处理每一个输入 $x$ 时都在至多 $p (∣ x ∣)$ 步内停机, 因此 $M$ 的存在证明了 $F \in P .$

因为指数时间比多项式时间大得多, $P \subseteq EXP$ 类. 我们在第12章中列出的所有问题都属于 $EXP,$ 不过如我们所见, 对于他们中的一些问题存在更高效的算法，这证明了他们实际上属于更小的 $P$ 类.

$P$	$EXP$ (但目前不知道属于 $P)$
最短路	最长路
最小割	最大割
2SAT	3SAT
解线性方程组	解二次方程组
零和博弈	纳什均衡
行列式	积和式
素数判定	整数分解

这是一个来自第12章的表格. 表格中的所有问题都属于 $EXP$ 类但只有左列中的问题目前已知属于 $P$ 类. (换言之, 他们有多项式时间的算法). 参见图 13.3.

PvsEXPfig

图 13.3. 一些在 $P$ 类中的问题和一些在 $EXP$ 类中但不知道在不在 $P$ 类中的问题的例子. 因为 $P$ 和 $EXP$ 都是布尔函数的类, 在此图中，我们始终指的是这些问题的布尔变体 (即只关心是/否).

问题的布尔版本

备注 13.1. 第12章中定义的许多问题都对应于非布尔函数 (即输出超过一个 bit 的函数), 而 $P$ 和 $EXP$ 是布尔函数的集合. 然而, 对于每一个非布尔函数 $F,$ 我们总是可以通过定义 $G (x, i)$ 为 $F (x)$ 的第 $i$ 个比特, 来定义一个与之等价的布尔函数 $G$ (参见习题 13.3). 因此, 上表以及图 13.3 中所指的, 都是这些问题的计算等价布尔变体.

13.2 使用 RAM 机 / NAND-RAM 建模运行时间

图灵机虽然是一种简洁的理论计算模型, 但它与现实世界的计算架构并不十分吻合. 当我们考虑哪些函数是“可计算的“这一问题时, 图灵机与实际计算机之间的这种差异关系不大; 但在涉及“效率“的语境下, 这种差异就会产生影响. 甚至是本科算法课程中的基础内容——如“归并排序“, 也无法在图灵机上以 $O (n lo g n)$ 的时间实现 (参见参考文献). RAM 机 (或等价的 NAND-RAM 程序) 更接近实际的计算架构, 也更符合我们在算法课程或白板编程面试中所说的 $O (n)$ 或 $O (n lo g n)$ 算法的含义. 我们可以像定义图灵机那样, 定义针对 NAND-RAM 程序的运行时间.

定义 13.3 (运行时间 (RAM)).

设 $T : N \to N$ 是某个将自然数映射到自然数的函数. 我们称函数 $F : {0, 1}^{*} \to {0, 1}^{*}$ 是 在 $T (n)$ RAM 时间内可计算的 (简称 RAM 时间), 如果存在一个 NAND-RAM 程序 $P,$ 使得对于每一个足够大的 $n$ 和每一个 $x \in {0, 1}^{n},$ 当给定输入 $x$ 时, 程序 $P$ 在执行至多 $T (n)$ 行指令后停机, 并输出 $F (x) .$

我们定义 $T I M E_{RAM} (T (n))$ 为在 $T (n)$ RAM 时间内可计算的布尔函数 (即映射 ${0, 1}^{*}$ 到 ${0, 1}$ 的函数) 的集合.

因为 NAND-RAM 程序更加符合我们对运行时间的直观理解, 我们将把 NAND-RAM 作为我们讨论运行时间的默认模型, 并因此使用不带任何下标的 $T I ME (T (n))$ 来表示 $T I M E_{RAM} (T (n)) .$ 然而, 事实证明, 只要我们只关心指数时间和多项式时间之间的区别, 模型的选择并没有太大影响. 原因是图灵机可以模拟 NAND-RAM 程序, 且其开销至多是多项式级别的 (参见图 13.4):

定理 13.1 (图灵机和 RAM 机的联系).

$T : N \to N$ 为一个函数, 满足对任意 $n$ 都有 $T (n) \geq n,$ 且映射 $n \mapsto T (n)$ 可以由一台图灵机在 $O (T (n))$ 时间内计算得出. 那么:

$T I M E_{TM} (T (n)) \subseteq T I M E_{RAM} (10 \cdot T (n)) \subseteq T I M E_{TM} (T (n)^{4}) . (13.1)$

暂停一下

定理 13.1 中的一些技术细节并不重要, 如要求 $n \mapsto T (n)$ 可以在 $O (T (n))$ 时间内被计算出来的条件, 或者 (13.1) 中的常数 $10$ 和 $4$ (这些常数并非紧致的, 是可以被改进的) 特别的, 我们在实践中遇到的所有非病态的时间界限函数, 如 $T (n) = n,$ $T (n) = n lo g n,$ $T (n) = 2^{n}$ 等, 都满足定理 13.1 的条件 (另见备注 13.2)

该定理的核心信息是: 图灵机和 RAM 机是“大致等价“的, 在这个意义上, 其中一个可以模拟另一个, 且只产生多项式级别的开销. 同样地, 虽然证明过程涉及一些技术细节, 但它并不深奥也不困难, 仅仅是沿用了我们在定理8.1 中看到的用图灵机模拟 RAM 机的方法, 只是做了更仔细的“簿记“ (即状态维护) 工作.

RAMTMsimulationfig

图 13.4. 定理 13.1 的证明表明, 我们可以用 $T$ 步的 NAND-RAM 程序来模拟 $T$ 步的图灵机, 并且可以用 $o (T^{4})$ 步的图灵机来模拟 $T$ 步的 NAND-RAM 程序. 因此, $T I M E_{TM} (T (n)) \subseteq T I M E_{RAM} (10 \cdot T (n)) \subseteq T I M E_{TM} (T (n)^{4}) .$

例如, 通过将 $T (n) = n^{a}$ 代入定理 13.1, 并利用 $10 n^{a} = o (n^{a + 1})$ 这一事实, 我们看到 $T I M E_{TM} (n^{a}) \subseteq T I M E_{RAM} (n^{a + 1}) \subseteq T I M E_{TM} (n^{4 a + 4}) .$ 这意味着 (根据练习 13.2): $P = \cup_{a = 1, 2, \dots} T I M E_{TM} (n^{a}) = \cup_{a = 1, 2, \dots} T I M E_{RAM} (n^{a}) .$ 也就是说, 我们完全可以将 $P$ 定义为由 NAND-RAM 程序 (而不是图灵机) 在输入长度的多项式时间内计算的函数类. 同样地, 通过将 $T (n) = 2^{n^{a}}$ 代入定理 13.1, 我们看到 $EXP$ 类也可以定义为由 NAND-RAM 程序在至多 $2^{p (n)}$ 时间内计算的函数集, 其中 $p$ 为某个多项式. 对于许多其他模型, 包括元胞自动机, C/Python/Javascript 程序, 并行计算机以及许多其他模型, 已知都存在类似的等价结果. 这证明了选择 $P$ 作为捕捉独立于技术的“易处理性“概念是合理的 (参见 13.3 节关于此问题的更多讨论). 图灵机和 NAND-RAM (以及其他模型) 之间的这种等价性, 允许我们根据手头的任务选择我们最喜欢的模型 (即“鱼与熊掌兼得“), 即使在研究效率问题时也是如此—只要我们只关心多项式时间和指数时间之间的差距. 当我们想要设计一个算法时, 我们可以利用 NAND-RAM 提供的额外能力和便利. 当我们想要分析一个程序或证明一个否定性结果时, 我们可以将注意力局限于图灵机.

重要启示

重要提示 13.2.

只要我们仅关注多项式时间与指数时间之间的区别, 所有 “合理的” 计算模型都是等价的.

上文中的形容词 “合理的” 指的是所有已实现的、可扩展的计算模型, 而 量子计算机 可能是唯一的例外. 参见 13.3 节和第23章.

定理 13.1 的证明思路

证明 $T I M E_{TM} (T (n)) \subseteq T I M E_{RAM} (10 \cdot T (n))$ 这一方向并不困难, 因为 NAND-RAM 程序 $P$ 可以通过在数组中存储图灵机 $M$ 的状态转移表（如定理9.1 的证明中所做的那样）, 以常数级的开销模拟 $M .$ 模拟图灵机的每一步都可以在常数 $c$ 步 RAM 操作内完成, 且可以证明这个常数 $c$ 小于 $10.$

因此, 该定理的核心在于证明 $T I M E_{RAM} (T (n)) \subseteq T I M E_{TM} (T (n)^{4}) .$ 这一证明紧随定理8.1 的证明思路, 在那里我们已经证明了任何由 NAND-RAM 程序 $P$ 可计算的函数 $F,$ 同样可以由图灵机（或等价的 NAND-TM 程序） $M$ 来计算. 为了证明定理 13.1, 我们沿用完全相同的证明过程, 只需核实 $M$ 模拟 $P$ 的开销是多项式级别的即可.

该证明包含许多细节, 但并不深奥. 因此, 相比于证明过程, 理解该定理的陈述要重要得多.

定理 13.1的证明

我们仅关注非平凡方向的 $T I M E_{RAM} (T (n)) \subseteq T I M E_{TM} (T (n)^{4}) .$ 令 $F \in T I M E_{RAM} (T (n)) .$ $F$ 可由某个 NAND-RAM 程序 $P$ 在 $T (n)$ 的时间内计算, 且我们需要证明它同样可以被一个图灵机 $M$ 在 $T (n)^{4}$ 的时间内被计算. 这等价于证明 $F$ 可以被一个 NAND-TM 程序在 $T (n)^{4}$ 时间内被计算, 因为对于任意 NAND-TM 程序 $Q,$ 都存在一台模拟它的图灵机 $M,$ 使得 $Q$ 的每一次迭代都对应 $M$ 的一个单步操作.

如前文所述, 我们沿用定理8.1 的证明方法 (使用 NAND-TM 程序模拟 NAND-RAM 程序), 并且使用一样的模拟方法, 但更仔细地核算每步模拟所需要消耗的步数. 回想一下, NAND-RAM 的模拟是通过“剥离“其特性, 直到只剩下 NAND-TM 为止.

我们不会提供所有证明的细节, 但将展示证明 NAND-RAM 的每个特性都能以至多多项式开销被 NAND-TM 模拟的核心思路:

回想一下, 每个 NAND-RAM 变量或数组元素包含的整数范围在 0 到 T 之间, 其中 T 是目前已经执行的行数. 因此, 如果 P 是一个在 $T (n)$ 时间内计算 $F$ 的 NAND-RAM 程序, 那么在长度为 $n$ 的输入下, P 所使用的所有整数的大小至多为 $T (n) .$ 这意味着索引 i 能到达的最大值至多是 $T (n),$ 因此 $P$ 的每个变量都可以看作是一个拥有至多 $T (n)$ 个索引的数组, 每个索引存放一个大小至多为 $T (n)$ 的自然数. 令 $ℓ = ⌈ lo g T (n) ⌉$ 为编码此类数字所需要的对比特数 (我们可以在模拟开始时先计算出 $T (n)$ 和 $ℓ) .$
我们可以将一个长度 $\leq T (n),$ 包含范围在 ${0, \dots, T (n) - 1}$ 内数字的 NAND-RAM 数组, 编码为一个包含 $T (n) ℓ = O (T (n) lo g T (n))$ 个比特的布尔 (即 NAND-TM) 数组. 我们也可以像定理8.1 的证明那样, 将其视为一个二维数组. 一个包含数字的 NAND-RAM 标量则简单地编码为一个长度为 $ℓ$ 的较短 NAND-TM 数组.
我们可以使用长度为 $T (n) ℓ = O (T (n) lo g T (n))$ 的一维数组来模拟二维数组. 所有关于整数的算术运算都是用“小学数学算法“, 其耗时是整数比特数 $ℓ$ 的多项式级别的, 在本例中即为 $p o l y (lo g T (n)) .$ 因此, 我们可以用一个使用随机访问内存但仅有布尔值的一维数组, 在 $O (T (n) p o l y (lo g T (n)))$ 步内模拟 $T (n)$ 步的 NAND-RAM 模型.
最昂贵的步骤是将随机访问内存转化为 NAND-TM/图灵机的顺序内存模型. 正如我们在定理8.1 证明中所做的, 我们可以通过以下步骤模拟访问数组 Foo 中由数组 Bar 编码的某个位置:
1. 将 Bar 复制到某个临时数组 Temp
2. 维护一个数组 Index, 其初始除第一位为 $1$ 外其余位置为 $0.$
3. 重复以下步骤直到 Temp 编码了数字 $0 :$ (最多重复 $T (n)$ 次)
  - 将 Temp 编码的数值减 $1.$ (消耗步数为 $ℓ = ⌈ lo g T (n) ⌉$ 的多项式级)
  - 减小 i 直到其等于 $0.$ (消耗 $O (T (n))$ 步)
  - 扫描 Index 直到直到值为 $1$ 的位置, 将其改成 $0,$ 向后移动一步并写下 $1.$ (消耗 $O (T (n))$ 步)
4. 完成后, 如果我们扫描 Index 直到找到 Index[i] $= 1$ 的点, 那么 i 就包含了原先由 Bar 编码的值. (消耗 $O (T (n))$ 步)
每次此类操作的总代价为 $O (T (n)^{2} + T (n) p o l y (lo g T (n))) = O (T (n)^{2})$ 步.

综上所述，我们使用 $O (T (n)^{2} p o l y (lo g T (n)))$ 步 NAND-TM 来模拟 NAND-RAM 的单步操作，因此总模拟时间为 $O (T (n)^{3} p o l y (lo g T (n)))$ 。对于足够大的 $n$ ，这个值小于 $T (n)^{4} .$

Info

备注 13.2 (好的时间界限).

在讨论一般的时间界限时, 我们需要确保排除掉一些“病态“的情况, 比如函数 $T$ 没有给算法留足够读取输入的时间, 或者时间界限函数本身就是不可计算的.

我们称函数 $T : N \to N$ 是一个 好的时间界限函数 (或简称为好函数), 如果它满足以下条件:

对于任意 $n \in N,$ 都有 $T (n) \geq n$ (即 $T$ 预留了足够的读入时间)
对于任意 $n^{'} \geq n,$ 都有 $T (n^{'}) \geq T (n)$ (即 $T$ 允许在更长的输入上花费更长的时间)
映射 $F (x) = 1^{T (∣ x ∣)}$ (即把长度为 $n$ 的字符串映射为长度为 $T (n)$ 的全 $1$ 序列) 可以被一个 NAND-RAM 程序在 $O (T (n))$ 时间内计算出来.

我们在应用中遇到所有“正常的“时间复杂度界限, 如 $T (n) = 100 n,$ $T (n) = n^{2} lo g n,$ $T (n) = 2^{n}$ 等, 都是好的. 因此, 从现在起, 我们只关心当 $T (n)$ 是“好函数“时的复杂性类 $T I ME (T (n)) .$ 可计算性的条件一般是很容易被满足的. 比如, 对于像 $T (n) = n^{3}$ 这样的代数函数, 我们可以在关于 $T (n)$ 的比特数的多项式时间内 (即关于 $T (n)$ 的对数多项式级) 计算出 $T (n)$ 的二进制表示. 因此, 在这种情况下, 写出字符串 $1^{T (n)}$ 的时间将会是 $T (n) + p o l y (lo g T (n)) = O (T (n)) .$

13.3 扩展Church-Turing论题 (讨论)

定理 13.1 表明, 图灵机和 RAM 机/ NAND-RAM 程序这几个计算模型在运行时间上是多项式等价的. 其他多项式等价模型的例子有:

所有标准的编程语言, 包括 C/Python/JavaScript/Lisp/等.
$λ$ 算子 (参见 13.8 节)
元胞自动机
并行计算机
生物计算设备, 如基于 DNA 的计算机.

扩展Church-Turing论题 指出, 这一表述对于所有物理上可实现的计算模型均成立. 换言之, 扩展Church-Turing论题认为, 对于任意一个可以扩展的计算设备 $C$ (该设备具有有限的描述, 但原则上可以用于处理任意长度的输入), 都存在某个常数 $a,$ 使得对于 $C$ 在长度为 $n$ 的输入上使用 $S (n)$ 量的物理资源所能计算的每一个函数 $F : {0, 1}^{*} \to {0, 1},$ $F$ 都属于 $T I ME (S (n)^{a}) .$ 这是对一般的Church-Turing论题 (在第 8.8 节中被讨论) 的加强. 普通论题仅指出所有物理上可实现模型的“可计算函数集“是相同的, 但不要求不同模型之间模拟的开销至多为多项式级别.

目前所有关于可扩展计算模型和编程语言的构建都遵循扩展Church-Turing论题, 即它们都可以被图灵机 (以及 NAND-TM 或 NAND-RAM 程序) 以多项式级开销进行模拟. 因此, $P$ 和 $EXP$ 类对于模型的选择具有鲁棒性. 我们可以使用任何我们喜欢的编程语言, 或者算法的高层描述, 来确定一个问题是否属于 $P .$

与Church-Turing论题本身一样, 扩展Church-Turing论题也处于渐近设定之下, 并不直接产生可实验验证的预测. 然而, 它可以用更具体的开销界限来实例化, 从而产生可实验验证的预测, 例如我们在 5.6 节中提到的物理扩展Church-Turing论题.

在过去一百多年对计算的研究和机械化进程中, 尚未有人制造出能违反扩展Church-Turing论题的可扩展计算设备. 然而, 量子计算 (如果得以实现) 将对扩展丘奇-图灵论题提出严峻挑战 (见第23章). 但是, 即便量子计算的愿景完全实现, 扩展Church-Turing论题在“精神层面“上依然是正确的: 虽然我们需要修正该论题以纳入量子计算的可能性, 但其宏观框架保持不变. 我们依然能够对计算进行数学建模; 依然可以将程序视为字符串并拥有通用程序; 依然拥有时间层级和不可计算性结果; 并且依然没有理由怀疑 (“普通”) Church-Turing论题. 此外, 量子计算的前景似乎并不会改变我们所关心的许多 (虽非全部!) 具体问题的运行时间复杂度. 特别是, 就我们目前所知, 在第12章提到的所有示例问题中, 只有整数分解这一个问题的复杂度, 会因为将模型修改为包含量子计算机而受到影响.

13.4 高效的通用机器: 在 NAND-RAM 中的 NAND-RAM 解释器

我们已经在定理 9.1 中见过了 “通用图灵机”. 审视其证明, 并结合定理 13.1 , 我们可以看到程序 $U$ 具有多项式开销, 即它可以在 $O (T^{4})$ 步内模拟给定 NAND-TM (或 NAND-RAM) 程序 $P$ 在输入 $x$ 上运行 $T$ 步. 但事实上, 通过直接模拟 NAND-RAM 程序, 我们可以做的更好, 仅需常数倍的乘法开销. 也就是说, 存在一个通用 NAND-RAM 程序 $U,$ 使得对于每一个 NAND-RAM 程序 $P,$ $U$ 仅需要 $O (T)$ 步就能模拟 $P$ 的 $T$ 步. ( $O$ 记号中隐含的常数可能取决于程序 $P,$ 但不依赖输入的长度.)

定理 13.2 (NAND-RAM 的高效通用性).

存在一个 NAND-RAM 程序 $U$ 满足以下性质:

( $U$ 是一个通用的 NAND-RAM 程序) 对于任意 NAND-RAM 程序 $P$ 和输入 $x,$ $U (P, x) = P (x),$ 其中 $U (P, x)$ 表示 $U$ 在一个编码 $(P, x)$ 的字符串上的输出.
( $U$ 是高效的) 存在一个常数 $a, b,$ 使得对于每一个 NAND-RAM 程序 $P,$ 如果 $P$ 在输入 $x$ 后运行至多 $T$ 步后停机, 那么 $U (P, x)$ 在运行至多 $C \cdot T$ 步后停机, 其中 $C \leq a ∣ P ∣^{b} .$

暂停一下

正如定理 13.1 的情况一样, 定理 13.2 的证明并不很深奥, 因此理解它的陈述更加重要. 具体来说, 如果你明白如何使用像 Python 这样的现代语言写一个 NAND-RAM 解释器, 那么你就知道了关于该定理证明的一切.

universalrammachinefig

图 13.5. 通用 NAND-RAM 程序 $U$ 通过将输入程序 $P$ 的所有变量存储在 $U$ 的单个数组 Vars 来模拟 $P .$ 如果 $P$ 有 $t$ 个变量, 那么 Vars 被划分为长度为 $t$ 的块, 其中第 $i$ 个块的第 $j$ 个坐标包含 $P$ 的第 $j$ 个数组的第 $i$ 个元素. 如果 $P$ 的第 $j$ 个变量是标量, 那么我们只需将其值存储在 Vars 的第 $0$ 个块中.

定理 13.2 的证明

若要完整展示一个通用 NAND-RAM 程序, 我们需要描述一个精确的表示方案, 以及该程序的完整 NAND-RAM 指令.

虽然这可以被完成, 但关注主要想法更为重要, 因此我们在这里仅概述证明.

NAND-RAM 的规范在附录中给出, 出于此模拟的目的, 我们可以简单地将 NAND-RAM 代码表示为 ASCII 字符串.

程序 $U$ 接收一个 NAND-RAM 程序 $P$ 和一个输入 $x$ 作为输入, 并逐步模拟 $P .$

为此, $U$ 执行以下操作:

$U$ 维护变量 program_counter 和 number_steps, 分别用于表示待执行的当前行和迄今为止已执行的步数.
$U$ 最初扫描 $P$ 的代码以找出 $P$ 使用的变量名的数量 $t .$ $U$ 将把每个变量名转换为 $0$ 到 $t - 1$ 之间的一个数字, 并使用一个数组 Program 来存储 $P$ 的代码, 其中对于每一行 $ℓ,$ Program[ $ℓ$ ] 将存储 $P$ 的第 $ℓ$ 行, 其中的变量名已被转换为数字. (更具体地说, 我们将使用常数数量的数组来分别编码该行中使用的操作, 以及操作数的变量名和索引.)
$U$ 维护一个数组 Vars, 其中包含 $P$ 的变量的所有值. 我们将 Vars 分割为长度为 $t$ 的块. 如果 $s$ 是对应于 $P$ 的数组变量 Foo 的数字, 那么我们将 Foo[0] 存储在 Vars[ $s$ ] 中, 将 Foo[1] 存储在 Vars[ $t + s$ ] 中, 将 Foo[2] 存储在 Vars[ $2 t + s$ ] 中, 依此类推 (参见图 13.5). 一般的, 如果 $P$ 的第 $s$ 个变量是标量变量, 那么它的值将被存储在位置 Vars[ $s$ ] 中. 如果它是一个数组变量, 那么它的第 $i$ 个元素的值将被存储在位置 Vars[ $t \cdot i + s$ ] 中.
为了模拟 $P$ 的一步, 程序 $U$ 从 Program 中获取对应于 program_counter 的行并执行它. 由于 NAND-RAM 具有常数数量的算术运算, 我们可以使用一连串常数数量的 if-then-else 来实现执行哪种运算的逻辑. 从 Vars 中检索每条指令的操作数的值可以使用常数数量的算术运算来完成.

初始化阶段仅花费常数 (取决于 $∣ P ∣$ 而非输入 $x)$ 数量的步骤.

一旦我们完成了初始化, 为了模拟 $P$ 的单一步骤, 我们只需要获取相应的行, 并进行常数数量的 “if else” 和对 Vars 的访问来模拟它.

因此, 当忽略依赖于程序 $P$ 的常数时, 模拟程序 $P$ 的 $T$ 个步骤的总运行时间至多为 $O (T) .$

13.4.1 限时通用图灵机

高效通用机的一个推论如下. 给定任意图灵机 $M,$ 输入 $x,$ 以及 “步数预算” $T,$ 我们可以在关于 $T$ 的多项式时间内模拟 $M$ 执行 $T$ 步. 形式化地, 我们定义一个函数 $T I ME D E V A L,$ 它接受 $M,$ $x$ 和时间预算这三个参数, 如果 $M$ 在至多 $T$ 步内停机, 则输出 $M (x),$ 否则输出 $0.$ 限时通用图灵机在多项式时间内计算 $T I ME D E V A L$ (见图 13.6). (由于我们将时间作为输入长度的函数来度量, 我们将 $T I ME D E V A L$ 定义为接受以一元表示的输入 $T :$ 即由 $T$ 个 1 组成的字符串.)

定理 13.3 (限时通用图灵机).

设 $T I ME D E V A L : {0, 1}^{*} \to {0, 1}^{*}$ 为如下定义的函数 $T I ME D E V A L (M, x, 1^{T}) = {M (x) 0 M 在 x 上 \leq T 步内停机否则 .$ 那么 $T I ME D E V A L \in P .$

timeduniversaltmfig

图 13.6. 限时通用图灵机接受图灵机 $M,$ 输入 $x$ 和时间界限 $T$ 作为输入, 并在 $M$ 于至多 $T$ 步内停机时输出 $M (x) .$ 定理 13.3 指出存在这样一台机器, 其运行时间是关于 $T$ 的多项式.

定理 13.3 的证明

我们只给出证明概要, 因为该结果相当直接地由定理 13.1 和定理 13.2 推导得出. 根据定理 13.1, 要证明 $T I ME D E V A L \in P,$ 只要给出一个计算 $T I ME D E V A L$ 的多项式时间 NAND-RAM 程序即可.

这样的程序可以通过如下方式获得. 给定图灵机 $M,$ 根据定理 13.1, 我们可以在关于其描述长度的多项式时间内, 将其转换为功能等价的 NAND-RAM 程序 $P,$ 使得 $M$ 执行 $T$ 步的过程可以由 $P$ 执行 $c \cdot T$ 步来模拟. 然后我们可以运行定理 13.2 中的通用 NAND-RAM 机器来模拟 $P$ 执行 $c \cdot T$ 步, 耗时 $O (T),$ 如果执行在该预算内没有停机则输出 $0.$ 这表明 $T I ME D E V A L$ 可以由一个 NAND-RAM 程序在关于 $∣ M ∣$ 的多项式且关于 $T$ 的线性时间内计算出来, 这意味着 $T I ME D E V A L \in P .$

13.5 时间层级定理 (Time Hierarchy Theorem)

一些函数是不可被计算的, 但是否存在可被计算, 但只能以很高的代价计算的函数呢? 具体来说, 是否存在能在 $2^{n}$ 时间内被计算, 但不能在 $2^{0.9 n}$ 时间内被计算的函数呢? 事实证明, 这个问题的答案为是.

定理 13.4 (时间层级定理).

对于任意一个好函数 (nice function) $T : N \to N,$ 一定存在一个函数 $F : {0, 1}^{*} \to {0, 1}$ 属于 $T I ME (T (n) lo g n) ∖ T I ME (T (n)) .$

这里出现 $lo g n$ 并没有什么特殊的理由, 我们也可以用其他能被高效计算, 且当 n 趋于无穷时也趋于无穷的函数来替代 $lo g n .$

重要启示

重要提示 13.3.

如果我们有更多的时间, 我们就能计算更多的函数.

Info

备注 13.3 (时间层级定理的简单推论).

时间层级定理的普适性会让其证明读起来略显晦涩. 如果你先尝试自己证明一个简单的命题 $P ⊊ EXP$ 可能会让你更易理解该证明.

你可以通过证明 $F : {0, 1}^{*} :\to {0, 1}$ 属于 $EXP ∖ P$ 来做到这一点: 对于任意图灵机 $M$ 和输入 $x,$ $F (M, x) = 1$ 当且仅当 $M$ 在输入 $x$ 上运行最多 $∣ x ∣^{l o g ∣ x ∣}$ 步后停机. 通过使用通用图灵机 (或定理 13.2 中的高效通用 NAND-RAM 程序), 可以证明 $F \in T I ME (n^{O (l o g n)}) \subseteq EXP .$ 另一方面, 我们可以利用与 9.3.2节中用于证明 $H A L T$ 不可计算性中类似的思路来证明 $F \neq \in P .$

timehierarchythmfig

图 13.7. 时间层级定理 (定理 13.4) 说明图中这些复杂性类有本质区别.

定理 13.4 的证明思路

在定理 9.3 (停机问题的不可计算性) 的证明中, 我们已经证明函数 $H A L T$ 无法在任何有限时间内被计算. 仔细审查该证明可以发现, 它实际上给出了更强的结论. 具体来说, 该证明表明, 如果我们将计算预算固定为 $T$ 步, 那么我们不仅无法区分停机的程序和不停机的程序, 甚至无法区分那些在至多 $T^{'}$ 步停机的程序与那些运行超过 $T^{'}$ 步的程序 (其中 $T^{'}$ 是某个由 $T$ 决定的数值). 因此定理 13.4 的证明沿用了停机问题不可计算性证明的思路, 但对运行时间进行了更仔细地分析.

定理 13.4 的证明

我们的证明灵感来源于停机问题不可计算性的证明. 具体的, 对于定理中描述的每个函数 $T,$ 我们定义 有界停机 函数 $H A L T_{T} .$ $H A L T_{T}$ 的输入是二元组 $(P, x)$ 满足 $∣ P ∣ \leq lo g lo g ∣ x ∣$ 且 $P$ 编码着某个 NAND-RAM 程序. 我们定义

$H A L T_{T} (P, x) = {1, 0, P 在 \leq 100 \cdot T (∣ P ∣ + ∣ x ∣) 步内于 x 上停机否则 .$ (常数 $100$ 和函数 $lo g lo g n$ 实际上是为了证明的便捷性任意选择的.)

定理 13.4 是以下两个断言的直接推论:

断言 1: $H A L T_{T} \in T I ME (T (n) \cdot lo g n)$

和

断言 2: $H A L T_{T} \neq \in T I ME (T (n)) .$

请确保你明白为什么这两个断言能直接得出定理 13.4. 接下来我们将转而证明这两个断言.

断言 1 的证明: 我们可以轻松的在线性时间内检查是否输入具有 $P, x$ 的形式, 其中 $∣ P ∣ \leq lo g lo g ∣ x ∣.$ 因为 $T (\cdot)$ 是一个好函数, 我们可以在 $O (T (n))$ 内计算它的值. 因此, 我们可以如下计算 $H A L T_{T} (P, x) :$

在 $O (T_{0})$ 步内计算 $T_{0} = T (∣ P ∣ + ∣ x ∣) .$
使用定理 13.2 中的通用 NAND-RAM 程序在至多 $p o l y (∣ P ∣) T_{0}$ 步内模拟 $P$ 在输入 $x$ 上运行 $100 \cdot T_{0}$ 步. (回想一下, 我们用 $p o l y (ℓ)$ 表示一个上界为 $a ℓ^{b}$ 的量, 其中 $a, b$ 为某个常数.)
如果 $P$ 在 $100 \cdot T_{0}$ 步内停机则输出 $1,$ 否则输出 $0.$

输入的长度为 $n = ∣ P ∣ + ∣ x ∣.$ 因为 $∣ x ∣ \leq n$ 且对于任意 $b$ 都有 $(lo g lo g ∣ x ∣)^{b} = o (lo g ∣ x ∣),$ 程序的运行时间将会是 $o (T (∣ P ∣ + ∣ x ∣) lo g n),$ 因此上述算法证明了 $H A L T_{T} \in T I ME (T (n) \cdot lo g n),$ 从而完成了对断言 1 的证明.

断言 2 的证明: 这个证明是定理 13.4 的核心, 并且容易让人回想起 $H A L T$ 不可计算性的证明. 假设 (为了导出矛盾), 存在某个 NAND-RAM 程序 $P^{*}$ 可在 $T (∣ P ∣ + ∣ x ∣)$ 步内计算 $H A L T_{T} (P, x) .$ 我们将通过构造一个程序 $Q$ 来导出矛盾. 我们将证明, 在我们的假设下, 如果 $Q$ 在给定其自身代码 (的填充版本) 作为输入时运行少于 $T (n)$ 步, 那么它实际上会运行超过 $T (n)$ 步, 反之亦然. (这句话值得反复阅读二到三次以确保你理解其中的逻辑. 这与停机问题不可计算性的直接证明非常相似, 在那个证明中我们利用假设的 “停机求解器” 构造了一个程序, 那个程序在给定它自身代码作为输入时, 停机当且仅当自身不停机.)

我们定义将程序 $Q^{*}$ 为: 当输入字符串 $z$ 时, 执行以下三个阶段的操作:

如果 $z$ 不具备 $z = P 1^{m}$ 的形式, 其中 $P$ 表示一个 NAND-RAM 程序且 $∣ P ∣ < 0.1 lo g lo g m,$ 则返回 $0.$ (回想一下, $1^{m}$ 表示有 $m$ 个 $1$ 的字符串.)
计算 $b = P^{*} (P, z)$ (在我们的假设下以最多 $T (∣ P ∣ + ∣ z ∣)$ 步的代价).
如果 $b = 1$ 则 $Q^{*}$ 进入无限循环, 否则停机.

令 $ℓ$ 为 $Q^{*}$ 作为字符串时描述的长度, 并令 $m \geq 2^{2^{1000 ℓ}} .$ 我们将通过讨论 $H A L T_{T} (Q^{*}, Q^{*} 1^{m})$ 等于 $0$ 还是 $1$ 来得出矛盾.

一方面, 如果 $H A L T_{T} (Q^{*}, Q^{*} 1^{m}) = 1,$ 则在我们 $P^{*}$ 计算 $H A L T_{T}$ 的假设下, $Q^{*}$ 在输入 $z = Q^{*} 1^{m}$ 上将进入无限循环, 因此 $Q^{*}$ 在输入为 $z = Q^{*} 1^{m}$ 下不会在 $100 T (∣ Q^{*} ∣ + m)$ 步内停机. 这与我们的假设 $H A L T_{T} (Q^{*}, Q^{*} 1^{m}) = 1$ 矛盾.

这意味着 $H A L T_{T} (Q^{*}, Q^{*} 1^{m}) = 0$ 必然成立. 但在这个情况下, 由于我们假设了 $P^{*}$ 计算 $H A L T_{T},$ $Q^{*}$ 在其计算的第 $3$ 阶段不会做任何事情, 因此计算的唯一开销来自第 $1$ 和第 $2$ 阶段. 不难验证第 $1$ 阶段可以在线性时间内完成 (事实上少于 $5∣ z ∣$ 步). 第 $2$ 阶段包括执行 $P^{*},$ 根据我们的假设, 这需要 $T (∣ Q^{*} ∣ + m)$ 步. 我们可以在总计少于 $10 T (∣ Q^{*} ∣ + m)$ 步执行这两个阶段. 根据定义, 这说明 $H A L T_{T} (Q^{*}, Q^{*} 1^{m}) = 1,$ 但这显然是一个矛盾, 完成了断言 2 的证明, 从而也完成了定理 13.4 的证明.

练习 13.3 ( $P$ vs $EXP$ ).

证明 $P ⊊ EXP .$

对练习 13.3 的解答

这一陈述直接由时间层级定理得出, 但直接证明它也是一项有益的练习 (参见定理 13.4). 我们需要证明存在 $F \in EXP ∖ P .$ 令 $T (n) = n^{l o g n}$ 且 $T^{'} (n) = n^{l o g n /2} .$ 两者都是良好的函数. 由于 $T (n) / T^{'} (n) = ω (lo g n),$ 根据定理 13.4, 存在某个 $F$ 属于 $T I ME (T (n)) ∖ T I ME (T^{'} (n)) .$ 由于对于充分大的 $n,$ $2^{n} > n^{l o g n},$ 故 $F \in T I ME (2^{n}) \subseteq EXP .$ 另一方面, $F \neq \in P .$ 实际上, 假设反之, 存在常数 $c > 0$ 以及一个图灵机, 对于所有充分大的 $n,$ 它在至多 $n^{c}$ 步内对长度为 $n$ 的输入计算 $F .$ 那么, 由于对于足够大的 $n,$ 有 $n^{c} < n^{l o g n /2},$ 这将推出 $F \in T I ME (n^{l o g n /2}),$ 这与我们对 $F$ 的选择矛盾.

时间层级定理告诉我们, 存在一些函数我们能在 $O (n^{2})$ 时间计算但不能在 $O (n)$ 时间计算, 能在 $2^{n}$ 时间计算但不能在 $2^{n}$ 时间计算, 等等.. 特别的, 肯定存在一些函数我们能在 $2^{n}$ 时间计算但不能在 $O (n)$ 时间计算. 我们已经见过了太多自然的函数, 其已知的最好算法需要大约 $2^{n}$ 的时间, 且已经有许多人投入了大量的时间与精力来尝试改进这些问题的算法. 然而, 不像有穷对无穷那样, 上述的所有例子, 我们目前仍然不知道如何去排除有 $O (n)$ 时间的算法存在.
然而我们将看到, 存在一个未被证明的猜想表明大多数这类问题都有这样的结论.

complexityclassinclusionfig

图 13.8. 一些函数已知 (或猜想) 包含在某个复杂性类里面.

时间层级定理的存在依赖于高效通用 NAND-RAM 程序 (已在定理 13.2 被证明存在). 对于其他计算模型, 如图灵机, 我们有类似的时间层级定理表明存在某个函数能在 $T (n)$ 时间内被计算但不能在 $T (n) / f (n)$ 时间内被计算, 其中 $f (n)$ 对应于相应通用机器的开销.

13.6 非一致性计算

我们现在已经了解过了两种 “计算代价” 的度量. 在 4.6 节中, 我们使用电路 / 直线式程序定义了计算有限函数的复杂性. 具体来说, 对于有限函数 $g : {0, 1}^{n} \to {0, 1}$ 和数 $s \in N,$ 如果存在一个至多包含 $s$ 个与非门的电路 (或一个等价的 $s$ 行的 NAND-CIRC 程序) 来计算 $g,$ 则 $g \in S I Z E_{n} (s) .$ 为了将其与本章定义的类 $T I ME (T (n))$ 联系起来, 我们首先需要将类 $S I Z E_{n} (s)$ 扩展到具有无界输入长度的函数.

定义 13.4 (非一致性计算).

设 $F : {0, 1}^{*} \to {0, 1}$ 且 $T : N \to N$ 为一个好的时间界限函数. 对于任意 $n \in N,$ 定义 $F_{↾ n} : {0, 1}^{n} \to {0, 1}$ 为 $F$ 在大小为 $n$ 的输入上的限制. 也就是说, $F_{↾ n}$ 是将 ${0, 1}^{n}$ 映射到 ${0, 1}$ 的函数, 使得对于任意 $x \in {0, 1}^{n},$ $F_{↾ n} (x) = F (x) .$

如果存在与非门电路序列 $(C_{0}, C_{1}, C_{2}, \dots)$ 满足以下条件, 我们称 $F$ 是 在至多 $T (n)$ 大小内非一致可计算的, 记作 $F \in S I ZE (T) :$

对于任意 $n \in N,$ $C_{n}$ 计算函数 $F_{↾ n}$
对于任意足够大的 $n,$ $C_{n}$ 至多有 $T (n)$ 个门.

换言之, $F \in S I ZE (T)$ 当且仅当对于任意 $n \in N,$ $F_{↾ n} \in S I Z E_{n} (T (n)) .$ 类 $P$ 在非一致性中的类似物是 $P_{/poly},$ 其被定义为

$P_{/poly} = \cup_{c \in N} S I ZE (n^{c}) . (13.2)$

非一致性计算与一致性复杂性类 (如 $T I ME (T (n))$ 或 $P)$ 之间存在巨大差异. $F \in P$ 意味着存在一个固定的 (不由输入改变) 图灵机 $M$ 满足在任意输入上, $M$ 都能以多项式时间计算 $F$ 的结果. 而 $F \in P_{/poly}$ 仅意味着, 对于每个输入长度 $n,$ 存在一个不同的 (可能由输入大小改变) 的电路, 使用多项式数量的门来计算该长度输入上的 $F .$ 正如我们所见, $F \in P_{/poly}$ 并不意味着 $F \in P .$ 然而, 这一陈述的反方向是成立的.

Ppolyfig

图 13.9. 我们可以将无限函数 $F : {0, 1}^{*} \to {0, 1}$ 视为有限函数集合 $F_{0}, F_{1}, F_{2}, \dots,$ 其中 $F_{↾ n} : {0, 1}^{n} \to {0, 1}$ 是 $F$ 在长度为 $n$ 的输入上的限制. 如果对于任意 $n,$ 函数 $F_{↾ n}$ 可由多项式大小的 NAND-CIRC 程序 (或等价地, 多项式大小的布尔电路) 计算, 我们就说 $F$ 属于 $P_{/poly} .$

定理 13.5 (非一致性计算包含一致性计算).

存在某个 $a \in N,$ 使得对于每个好函数 $T : N \to N$ 和 $F : {0, 1}^{*} \to {0, 1},$ 都有

$T I ME (T (n)) \subseteq S I ZE (T (n)^{a}) .$

特别的, 定理 13.5 表明对于每个 $c,$ $T I ME (n^{c}) \subseteq S I ZE (n^{c a}),$ 因此 $P \subseteq P_{/poly} .$

定理 13.5 的证明思路

证明的思路是 “循环展开”. 具体的, 我们将使用一致性计算和非一致性计算的编程语言变体, 即 NAND-CIRC 和 NAND-TM. 两者之间的主要差别在于 NAND-TM 有循环. 然而, 对于每个固定的 $n,$ 如果我们知道一个 NAND-TM 程序最多运行 $T (n)$ 步, 那么我们就可以将这些循环用简单的“复制粘贴“代码 $T (n)$ 替代, 类似于在 Python 我们可以将

for i in range(4):
	print(i)

替换成没有循环的代码

print(0)
print(1)
print(2)
print(3)

为了将这一证明思路转化为实际的证明, 我们需要解决一个技术难点, 即确保 NAND-TM 程序是非感知的, 意思是说在循环的第 $j$ 次迭代中, 索引变量 i 的值仅取决于 j, 而不取决于输入的内容. 我们将在 13.6.1 节中暂时岔开话题来专门解决这一点, 随后完成定理 13.5 的证明.

13.6.1 非感知的 NAND-TM 程序

我们证明定理 13.5 的方法涉及了 “循环展开”. 比如, 考虑下面这个用于计算任意输入长度 $XOR$ 函数的 NAND-TM 程序:

temp_0 = NAND(X[0],X[0])
Y_nonblank[0] = NAND(X[0],temp_0)
temp_2 = NAND(X[i],Y[0])
temp_3 = NAND(X[i],temp_2)
temp_4 = NAND(Y[0],temp_2)
Y[0] = NAND(temp_3,temp_4)
MODANDJUMP(X_nonblank[i],X_nonblank[i])

举个例子, 若 $n = 3,$ 我们可以尝试通过简单地把循环复制三遍 (删去 MODANDJMP 这行), 把这个 NAND-TM 程序翻译成用于计算 $XO R_{3} : {0, 1}^{3} \to {0, 1}$ 的 NAND-CIRC 程序

temp_0 = NAND(X[0],X[0])
Y_nonblank[0] = NAND(X[0],temp_0)
temp_2 = NAND(X[i],Y[0])
temp_3 = NAND(X[i],temp_2)
temp_4 = NAND(Y[0],temp_2)
Y[0] = NAND(temp_3,temp_4)
temp_0 = NAND(X[0],X[0])
Y_nonblank[0] = NAND(X[0],temp_0)
temp_2 = NAND(X[i],Y[0])
temp_3 = NAND(X[i],temp_2)
temp_4 = NAND(Y[0],temp_2)
Y[0] = NAND(temp_3,temp_4)
temp_0 = NAND(X[0],X[0])
Y_nonblank[0] = NAND(X[0],temp_0)
temp_2 = NAND(X[i],Y[0])
temp_3 = NAND(X[i],temp_2)
temp_4 = NAND(Y[0],temp_2)
Y[0] = NAND(temp_3,temp_4)

然而, 上面这个仍然不是一个合法的 NAND-CIRC 程序, 因为它包含一个对特殊变量 i 的引用. 我们可以通过将第一个迭代中的 i 替换为 $0,$ 第二个迭代中的替换为 $1,$ 第三个迭代中的替换为 $2$ 来把上述程序转化为一个合法的 NAND-CIRC 程序. (我们还创建了一个变量 zero, 并在任意变量第一次初始化时使用, 同时移除了那些后续不再使用的非输出变量的赋值) 结果程序是一个标准的计算 $XO R_{3}$ 的 “无索引无循环” 的 NAND-CIRC 程序. (另见图 13.10)

temp_0 = NAND(X[0],X[0])
one = NAND(X[0],temp_0)
zero = NAND(one,one)
temp_2 = NAND(X[0],zero)
temp_3 = NAND(X[0],temp_2)
temp_4 = NAND(zero,temp_2)
Y[0] = NAND(temp_3,temp_4)
temp_2 = NAND(X[1],Y[0])
temp_3 = NAND(X[1],temp_2)
temp_4 = NAND(Y[0],temp_2)
Y[0] = NAND(temp_3,temp_4)
temp_2 = NAND(X[2],Y[0])
temp_3 = NAND(X[2],temp_2)
temp_4 = NAND(Y[0],temp_2)
Y[0] = NAND(temp_3,temp_4)

unrolledcircuitfig

图 13.10. 一个通过 “循环展开” 三次计算 $XOR$ 的 NAND-TM 程序得到的计算 $XO R_{3}$ 的 NAND 电路.

这种转换的关键在于, 在我们最初的 $XOR$ NAND-TM 程序中, 无论输入是 $011,$ $100$ 还是任何其他字符串, 索引变量 i 都保证在第一次迭代中等于 $0,$ 在第二次迭代中等于 $1,$ 在第三次迭代中等于 $2,$ 依此类推. 特定的序列 $0, 1, 2, \dots$ 并不重要: 关键属性在于 $XOR$ 的 NAND-TM 程序是 非感知的, 即在第 $j$ 次迭代中索引 i 的值仅取决于 $j,$ 而不取决于输入的具体选择. 幸运的是, 我们能够将每个 NAND-TM 程序转换为功能等效的非感知程序, 且其开销至多为二次方. (类似地, 我们可以将任何图灵机转换为功能等效的非感知图灵机, 参见习题 13.6)

定理 13.6 (使 NAND-TM 非感知).

令 $T : N \to N$ 为一个好函数, 且 $F \in T I M E_{TM} (T (n)) .$ 则存在一个 NAND-TM 程序 $P$ 在 $O (T (n)^{2})$ 内计算 $F$ 且满足下述条件: 对于任意 $n \in N,$ 存在一个序列 $i_{0}, i_{1}, \dots, i_{m - 1},$ 满足对于任意 $x \in {0, 1}^{n},$ 当 $P$ 在输入 $x$ 上执行时在第 $j$ 次迭代时变量 i 等于 $i_{j} .$

换言之, 定理 13.6 意味着如果我们能在 $T (n)$ 步内计算 $F,$ 那么我们就能用一个程序 $P$ 在 $O (T (n)^{2})$ 步内计算它, 且变量 i 在第 $j$ 次迭代中的值只取决于 $j$ 和输入的长度, 不依赖于输入的内容. 这样的程序可以通过 “循环展开” 轻松的被转译成 $O (T (n)^{2})$ 行的 NAND-CIRC 程序.

定理 13.6 的证明思路

我们可以通过让一个 NAND-TM 程序 $P$ 扫描它的数组来把任意 $P^{'}$ 翻译成非感知的程序 $P .$ 换言之, $P$ 中的索引 i 将始终在 $0$ 和 $T (n) - 1$ 之间反复移动. 于是我们便可以用至多 $T (n)$ 的开销来模拟程序 $P^{'} :$ 如果 $P^{'}$ 想要在一个向右的扫描中向左移动, 则我们可以简单的等待至多 $2 T (n)$ 步直到下一次在向左移动的过程中回到原位置.

obliviousnandtmfig

图 13.11. 通过添加两个特殊数组 Atstart 和 Atend 来分别标记 $0$ 和 $T - 1$ 两个位置, 我们得已用一个非感知的 NAND-TM 程序 $P$ 来模拟一个 $T (n)$ 时间的 NAND-TM 程序 $P^{'} .$ 程序 $P$ 会简单的从左到右再从右到左反复扫描它的数组. 如果原来的程序 $P^{'}$ 想要向一个相反的方向移动 i, 那么我们会等待 $O (T)$ 步直到我们到达了相同的位置, 因此 $P$ 在 $O (T (n)^{2})$ 时间运行.

定理 13.6 的证明

令 $P^{'}$ 为一个在 $T (n)$ 步内计算 $F$ 的 NAND-TM 程序. 我们构造一个非感知的 NAND-TM 程序 $P$ 以如下过程计算 $F$ (另见图 13.11).

在输入 $x$ 上, $P$ 会计算 $T = T (∣ x ∣)$ 并创建数组 Atstart 和 Atend 满足 Atstart[ $0$ ] $= 1$ 且对于 $i > 0,$ Atstart[ $i$ ] $= 0$ 和 Atend[ $T - 1$ ] $= 1$ 且对于 $i \neq = T - 1,$ Atend[i] $= 0.$ 因为 $T$ 是一个好函数, 所以我们可以做到这一点. 注意因为这步计算并不依赖于 $x$ 而只依赖于其长度, 因此这是非感知的.
$P$ 还会有一个初始化为全 $0$ 的特殊数组 Marker.
当 Atstart[i] $= 1$ 时, $P$ 的索引变量会会将其移动方向改为向右, 当 Atend[i] $= 1$ 时, 会改为向左.
程序 $P$ 会模拟程序 $P^{'}$ 的指令执行. 不过当遇到指令 MODANDJMP 时, 且此时 $P^{'}$ 在向左移动时尝试向右移动 (反之亦然), 那么 $P$ 会将 Marker[i] 设置为 $1$ 并进入一个特殊的 “等待模式”. 在这个模式下, $P$ 将会一直等待直到 Marker[i] $= 1$ 再次成立, 且此时 $P$ 会将 Marker[i] 设为 $0$ 并继续模拟的过程. 在最坏的情况下, 这将会消耗 $2 T (n)$ 步 (如果 $P$ 需要从一头移动到另一头并从另一头移动回来.)
我们同样会在 $P^{'}$ 更早结束的情况下通过添加 “虚拟步” 来保证 $P$ 在恰好模拟了 $P^{'}$ 的 $T (n)$ 步之后结束计算.

我们可以看到 $P$ 以 $O (T (n))$ 每步的开销模拟 $P^{'}$ 的执行, 因此我们完成了证明.

定理 13.6 能导出定理 13.5. 事实上, 如果 $P$ 是一个 $k$ 行的非感知的在 $T (n)$ 时间内计算 $F$ 的 NAND-TM 程序, 那么对于每个 $n,$ 只需要简单的做 $T (n)$ 次复制黏贴 (删去 MODANDJMP 指令), 我们都可以得到一个 $(k - 1) \cdot T (n)$ NAND-CIRC 程序. 在第 $j$ 个副本中, 我们将所有形为 Foo[i] 的引用替换为 foo_ $i_{j},$ 其中 $i_{j}$ 是 i 在第 $j$ 次迭代中的值.

13.6.2 “循环展开”: 从图灵机到电路的转换算法

定理 13.5 的证明是 算法的, 即这个证明给出了一个多项式时间的算法能够在给出一个图灵机 $M,$ 参数 $T$ 和 $n$ 的前提下生成一个有 $O (T^{2})$ 个门的电路, 且这个电路在任意输入 $x \in {0, 1}^{n}$ 上运行的结果都与 $M$ 一致 (只要 $M$ 在这些输入上的运行步数少于 $T .$ ) 我们将在下面的定理中记录这一事实, 因为这之后会对我们很有用.

unrollloopfig

图 13.12. 函数 $U NRO LL$ 以图灵机 $M,$ 输入长度参数 $n$ 和时间界限 $T$ 为输入, 输出一个 $O (T^{2})$ 大小的 NAND 电路, 该电路在 $M$ 于至多 $T$ 步内停机的所有输入 $x \in {0, 1}^{n}$ 上与 $M$ 一致.

定理 13.7 (编译图灵机到电路的编译器).

存在一个算法 $U NRO LL$ 满足对于任意图灵机 $M$ 和参数 $n,$ $T,$ $U NRO LL (M, 1^{T}, 1^{n})$ 在至多 $p o l y (∣ M ∣, T, n)$ 步内运行, 且输出一个 NAND 电路 $C .$ 该电路接受长度为 $n$ 的输入, 有 $O (T^{2})$ 个门, 只有一个输出, 并且满足: $C (x) = {y 0 M 在 T 步内停机且输出 y 否则 .$

定理 13.7 的证明

我们将只概述证明, 因为它可以通过直接将定理 13.5 的证明转化为算法, 并结合 NAND-TM 程序对图灵机的模拟得到 (另见图 13.13). 具体来说, $U NRO LL$ 将执行以下操作:

将图灵机 $M$ 翻译为等价的 NAND-TM 程序 $P .$
将 NAND-TM 程序 $P$ 翻译为等价的非感知的程序 $P^{'}$ (按照定理 13.6 的证明). 程序 $P^{'}$ 需要 $T^{'} = O (T^{2})$ 步来模拟 $P$ 程序的 $T$ 步.
通过获得对应于 $P^{'}$ 的 $T^{'}$ 次迭代执行的 NAND-CIRC 程序 (或等价的具有 $O (T^{2})$ 个门的 NAND 电路) 来展开 $P^{'}$ 的循环.

unrolldescriptionfig

图 13.13. 我们可以将图灵机 $M,$ 输入长度参数 $n$ 和时间界限 $T$ 转换为一个 $O (T^{2})$ 大小的 NAND 电路, 该电路在 $M$ 于至多 $T$ 步内停机的所有输入 $x \in {0, 1}^{n}$ 上与 $M$ 一致. 该转换首先利用图灵机和 NAND-TM 程序 $P$ 的等价性, 然后通过定理 13.6 将 $P$ 转换为等价的 非感知的 NAND-TM 程序 $P^{'},$ 接着 “展开” $P^{'}$ 的循环 $O (T^{2})$ 次迭代以获得一个与 $P^{'}$ 在长度为 $n$ 的输入上一致的 $O (T^{2})$ 行 NAND-CIRC 程序, 最后将此程序翻译为等价的电路.

重要启示

重要提示 13.4.

通过 “循环展开”, 我们可以将一个需要 $T (n)$ 步来计算 $F$ 的算法转换为一个使用 $p o l y (T (n))$ 个门来计算 $F$ 在 ${0, 1}^{n}$ 上的限制的电路.

暂停一下

回顾图 13.13 中描述的转换, 以及解决以下两个练习, 是更适应非一致性复杂度, 特别是 $P_{/poly}$ 及其与 $P$ 关系的绝佳方式.

练习 13.4 ( $P$ 的另一刻画).

证明对于任意 $F : {0, 1}^{*} \to {0, 1},$ $F \in P$ 当且仅当存在一个多项式时间图灵机 $M,$ 使得对于任意 $n \in N,$ $M (1^{n})$ 输出一个 $n$ 输入电路 $C_{n}$ 的描述, 该电路计算 $F$ 在输入 ${0, 1}^{n}$ 上的限制 $F_{↾ n} .$

对练习 13.4 的解答

我们从 “当” 的方向开始. 假设存在一个多项式时间图灵机 $M,$ 它在输入 $1^{n}$ 上输出计算 $F_{↾ n}$ 的电路 $C_{n} .$ 那么以下是计算 $F$ 的多项式时间图灵机 $M^{'} .$ 对于输入 $x \in {0, 1}^{*},$ $M^{'}$ 将:

令 $n = ∣ x ∣$ 并计算 $C_{n} = M (1^{n}) .$
返回 $C_{n}$ 在 $x$ 上的执行结果.

由于我们可以在多项式时间内计算布尔电路在输入上的结果, 因此 $M^{'}$ 在多项式时间内运行并对每个输入 $x$ 计算 $F (x) .$

对于 “仅当” 的方向, 如果 $M^{'}$ 是一个在多项式时间内计算 $F$ 的图灵机, 那么 (应用图灵机和 NAND-TM 的等价性以及定理 13.6) 同样存在一个非感知的 NAND-TM 程序 $P,$ 它在时间 $p (n)$ 内计算 $F,$ 其中 $p$ 为某个多项式. 我们现在可以定义 $M$ 为这样一个图灵机: 在输入 $1^{n}$ 上, 它输出通过将 $P$ 的 “循环展开” $p (n)$ 次迭代而获得的 NAND 电路. 结果 NAND 电路计算 $F_{↾ n}$ 并且具有 $O (p (n))$ 个门. 它也可以被转换为具有 $O (p (n))$ 个 AND/OR/NOT 门的布尔电路.

练习 13.5 ( $P_{/poly}$ 的刻画).

令 $F : {0, 1}^{*} \to {0, 1} .$ 那么 $F \in P_{/poly}$ 当且仅当存在一个多项式 $p : N \to N,$ 一个多项式时间图灵机 $M$ 和一个字符串序列 ${a_{n}}_{n \in N},$ 满足对于任意 $n \in N :$

$∣ a_{n} ∣ \leq p (n)$
对于任意 $x \in {0, 1}^{n},$ $M (a_{n}, x) = F (x) .$

对练习 13.5 的解答

我们只概述证明. 对于 “仅当” 方向, 如果 $F \in P_{/poly},$ 那么我们可以简单地使用对应电路 $C_{n}$ 的描述作为 $a_{n},$ 并使用在多项式时间内计算一个电路在其输入上的结果的程序作为 $M .$

对于 “当” 方向, 我们可以使用与定理 13.5 相同的 “循环展开” 技术来证明: 如果 $P$ 是一个多项式时间 NAND-TM 程序, 那么对于任意 $n \in N,$ 映射 $x \mapsto P (a_{n}, x)$ 可以由多项式大小的 NAND-CIRC 程序 $Q_{n}$ 计算.

13.6.3 一致性算法可以模拟非一致性算法吗?

定理 13.5 向我们展示了每个属于 $T I ME (T (n))$ 的函数都属于 $S I ZE (p o l y (T (n))) .$ 有人可能会问是否存在一个反向的关系. 假设有一个 $F,$ 满足对于每个 $n,$ 其 $F_{↾ n}$ 都有一个 “短的” NAND-CIRC 程序. 我们能说对于某些 “小的” $T$ 它一定在 $T I ME (T (n))$ 中吗? 答案是坚决的不. 不仅 $P_{/poly}$ 不包含在 $P$ 中, 事实上, $P_{/poly}$ 中存在一些函数 无法计算.

定理 13.8 ( $P_{/poly}$ 包含不可计算函数).

存在一个 不可计算 函数 $F : {0, 1}^{*} \to {0, 1}$ 满足 $F \in P_{/poly} .$

对定理 13.8 的证明思路

因为 $P_{/poly}$ 对应于非一致性计算, 若对于每个 $n \in N,$ 限制 $F_{↾ n}$ 在输入长度 $n$ 上有一个小的电路/程序, 尽管对于不同的 $n$ 这个电路/程序可能完全不同, 我们就说函数 $F$ 属于 $P_{/poly} .$ 特别的, 如果对于所有相同长度的输入 $x$ 和 $x^{'},$ 函数 $F$ 都满足 $F (x) = F (x^{'}),$ 那么这意味着 $F_{↾ n}$ 要么是常函数 $0$ 要么是常函数 $1.$ 因为常函数有一个 (非常!) 小的电路, 这样的函数 $F$ 总是属于 $P_{/poly}$ (事实上属于一个更小的类). 然而通过规约停机问题, 我们可以得到一个具有上述性质但不可计算的函数.

对定理 13.8 的证明

考虑如下定义的 “一元停机函数” $U H : {0, 1}^{*} \to {0, 1} .$ 我们令 $S : N \to {0, 1}^{*}$ 为这样一个函数: 接受输入 $n \in N,$ 输出对应于数字 $n$ 的二进制表示但不包含最高位 1 的字符串. 注意 $S$ 是一个满射. 对于所有 $x \in {0, 1}^{*},$ 我们定义 $U H (x) = H A L TONZERO (S (∣ x ∣)) .$ 即, 如果 $n$ 为 $x$ 的长度, 那么 $U H (x) = 1$ 当且仅当字符串 $S (n)$ 编码了一个在输入 $0$ 上停机的 NAND-TM 程序.

$U H$ 是不可计算的, 因为如果 $U H$ 可被计算, 那么我们就可以通过将程序 $P$ 转化为数字 $n,$ 满足 $P = S (n),$ 并运行 $U H (1^{n})$ (换言之, $U H$ 在长为 $n$ 的全 $1$ 串上的结果) 来计算 $H A L TONZERO$ 的结果. 另一方面, 对于所有 $n,$ 对于所有输入 $x,$ $U H_{n} (x)$ 总是为 $0$ 或总是为 $1,$ 因此这个程序可以被一个常数行的 NAND-CIRC 程序计算.

这里的问题显然是 一致性. 对于一个函数 $F : {0, 1}^{*} \to {0, 1},$ 如果 $F$ 属于 $T I ME (T (n)),$ 那么我们有单一的算法可以对于每个 $n$ 计算 $F_{↾ n} .$ 另一方面, 对于每个 $n,$ $F_{↾ n}$ 可能都在 $S I ZE (T (n))$ 中, 但对每个输入长度使用完全不同的算法. 因此, 我们通常不将 $P_{/poly}$ 用作高效计算的模型, 而是用来建模 低效计算. 例如, 在密码学中, 人们通常将一个加密方案是安全的定义为: 破解长度为 $n$ 的密钥需要超过多项式数量的 NAND 行. 由于 $P \subseteq P_{/poly},$ 这特别排除了用于破解的多项式时间算法, 但在密码学中使用非一致性模型还有技术上的原因. 它也允许用非渐进术语来谈论安全性, 例如方案具有 “ $128$ 位安全性”.

虽然这有时可能是一个真正的问题, 但在许多自然的背景下, 一致性和非一致性计算之间的差异似乎并不那么重要. 特别的, 在我们之前讨论的所有未知是否在 $P$ 中的问题示例中: 最长路径, 3SAT, 因数分解等, 这些问题也都不知道是否在 $P_{/poly}$ 中. 因此, 对于 “自然的” 函数, 如果你假装 $T I ME (T (n))$ 大致等同于 $S I ZE (T (n)),$ 你正确的概率通常比错误的要大.

PEXPPpolyrelationsfig

图 13.14. $P,$ $EXP,$ 和 $P_{/poly}$ 之间的关系. 已知的是 $P \subseteq EXP,$ $P \subseteq P_{/poly}$ 且 $P_{/poly}$ 包含不可计算函数 (特别的, 这些函数不属于 $EXP) .$ 目前仍未知 $EXP \subseteq P_{/poly}$ 是否成立, 虽然大部分人相信 $EXP \neq \subseteq P_{/poly} .$

13.6.4 一致性与非一致性计算: 总结

总而言之, 我们目前描述的两种计算模型是:

一致性模型 (Uniform models): 图灵机, NAND-TM 程序, RAM 机器, NAND-RAM 程序, C/JavaScript/Python 等. 这些模型包含循环和无界内存, 因此单个程序可以计算具有无界输入长度的函数.
非一致性模型 (Non-uniform models): 布尔电路 或 直线程序 没有循环, 只能计算有限函数. 执行它们的时间恰好是它们包含的行数或门的数量.

对于一个函数 $F : {0, 1}^{*} \to {0, 1}$ 和某个良好的时间界限 $T : N \to N,$ 我们知道:

如果 $F$ 在时间 $T (n)$ 内是一致可计算的, 那么存在一系列电路 $C_{1}, C_{2}, \dots,$ 其中 $C_{n}$ 具有 $p o l y (T (n))$ 个门并且对每个 $n$ 计算 $F_{↾ n}$ (即, $F$ 对 ${0, 1}^{n}$ 的限制).
反之不一定成立 - 存在函数 $F : {0, 1}^{n} \to {0, 1}$ 的例子, 使得 $F_{↾ n}$ 甚至可以由常数大小的电路计算, 但 $F$ 是不可计算的.

这意味着非一致性复杂度对于建立函数的 困难性 比建立其 容易性 更有用.

本章回顾

我们可以使用 NAND-TM 程序定义函数的时间复杂度, 与可计算性的概念类似, 这似乎捕捉了函数的固有复杂度.
有许多自然问题具有多项式时间算法, 也有其他我们很想解决的自然问题, 但其已知最好的算法是指数级的.
多项式时间的定义, 以及由此产生的类 $P,$ 对模型的选择具有鲁棒性, 无论是图灵机, NAND-TM, NAND-RAM, 现代编程语言, 还是许多其他模型.
时间层级定理表明, 有一些问题可以在指数时间内解决, 但不能在多项式时间内解决. 然而, 我们不知道本章节中描述的自然示例是否属于这种情况.
通过 “循环展开”, 我们可以证明每个在时间 $T (n)$ 内可计算的函数都可以由一系列 NAND-CIRC 程序 (每个输入长度一个) 计算, 每个程序的大小至多为 $p o l y (T (n)) .$

13.7 习题

习题 13.1 ( $P$ 和 $EXP$ 不同定义之间的等价性.).

证明在定义 13.2 中定义的复杂性类 $P$ 和 $EXP$ 分别等价于 $\cup_{c \in {1, 2, 3, \dots}} T I ME (n^{c})$ 和 $\cup_{c \in {1, 2, 3, \dots}} T I ME (2^{n^{c}}) .$ (如果 $S_{1}, S_{2}, S_{3}, \dots$ 是一个集合的集族, 那么集合 $S = \cup_{c \in {1, 2, 3, \dots}} S_{c}$ 是所有满足存在某个 $c \in {1, 2, 3, \dots},$ 且 $e \in S_{c}$ 的元素 $e$ 的集合.)

习题 13.2 (表示的鲁棒性).

定理 13.1 表明类 $P$ 和 $EXP$ 对于计算模型的选择具有_鲁棒性_. 本练习表明这些类对于我们输入表示的选择也具有鲁棒性.

具体来说, 令 $F$ 为一个将图映射到 ${0, 1}$ 的函数, 并令 $F^{'}, F^{''} : {0, 1}^{*} \to {0, 1}$ 为定义如下的函数. 对于每个 $x \in {0, 1}^{*} :$

$F^{'} (x) = 1$ 当且仅当 $x$ 通过邻接矩阵表示法表示一个图 $G,$ 且 $F (G) = 1.$
$F^{''} (x) = 1$ 当且仅当 $x$ 通过邻接表表示法表示一个图 $G,$ 且 $F (G) = 1.$

证明 $F^{'} \in P$ 当且仅当 $F^{''} \in P .$

更一般地, 对于每个函数 $F : {0, 1}^{*} \to {0, 1},$ 关于 $F \in P$ (或 $F \in EXP)$ 的问题的答案在切换表示后保持不变, 只要一种表示转换为另一种表示可以在多项式时间内完成 (这基本上对所有合理的表示都成立).

习题 13.3 (布尔函数).

对于每个函数 $F : {0, 1}^{*} \to {0, 1}^{*},$ 定义 $B oo l (F)$ 为一个将 ${0, 1}^{*}$ 映射到 ${0, 1}$ 的函数, 使得对于输入三元组 $(x, i, σ)$ (的字符串表示), 其中 $x \in {0, 1}^{*},$ $i \in N$ 且 $σ \in {0, 1},$ 有

$B oo l (F) (x, i, σ) = ⎩ ⎨ ⎧ F (x)_{i} 10 σ = 0, i < ∣ F (x) ∣ σ = 1, i < ∣ F (x) ∣ otherwise$ 其中 $F (x)_{i}$ 是字符串 $F (x)$ 的第 $i$ 位.

证明对于每个 $F : {0, 1}^{*} \to {0, 1}^{*},$ $B oo l (F) \in P$ 当且仅当存在一个图灵机 $M$ 和一个多项式 $p : N \to N,$ 使得对于每个 $x \in {0, 1}^{*},$ 在输入 $x$ 上, $M$ 在 $\leq p (∣ x ∣)$ 步内停机并输出 $F (x) .$

习题 13.4 (多项式时间的复合).

如果存在一个图灵机 $M$ 和一个多项式 $p : N \to N,$ 使得对于每个 $x \in {0, 1}^{*},$ 在输入 $x$ 上, $M$ 在 $\leq p (∣ x ∣)$ 步内停机并输出 $F (x),$ 则称 (可能非布尔的) 函数 $F : {0, 1}^{*} \to {0, 1}^{*}$ 是_多项式时间可计算的_. 证明对于每一对多项式时间可计算的函数 $F, G : {0, 1}^{*} \to {0, 1}^{*},$ 它们的_复合_ $F \circ G$ (即满足 $H (x) = F (G (x))$ 的函数 $H)$ 也是多项式时间可计算的.

习题 13.5 (指数时间的非复合性).

如果存在一个图灵机 $M$ 和一个多项式 $p : N \to N,$ 使得对于每个 $x \in {0, 1}^{*},$ 在输入 $x$ 上, $M$ 在 $\leq 2^{p (∣ x ∣)}$ 步内停机并输出 $F (x),$ 则称 (可能非布尔的) 函数 $F : {0, 1}^{*} \to {0, 1}^{*}$ 是_指数时间可计算的_. 证明存在某些 $F, G : {0, 1}^{*} \to {0, 1}^{*},$ 使得 $F$ 和 $G$ 都是指数时间可计算的, 但 $F \circ G$ 不是指数时间可计算的.

习题 13.6 (非感知的图灵机).

我们称图灵机 $M$ 是 非感知的, 如果存在某个函数 $T : N \times N \to Z$ 使得对于每个长度为 $n$ 的输入 $x$ 和 $t \in N$ 满足:

如果 $M$ 在输入 $x$ 上停机所需的步数超过 $t,$ 那么在第 $t$ 步 $M$ 的读写头将位于位置 $T (n, t) .$ (注意该位置仅取决于 $x$ 的_长度_而不取决于其内容.)
如果 $M$ 在第 $t$ 步之前停机, 则 $T (n, t) = - 1.$

证明如果 $F \in P,$ 那么存在一个 非感知的 图灵机 $M$ 在多项式时间内计算 $F .$ 见脚注提示. ¹

习题 13.7.

令 $E D GE : {0, 1}^{*} \to {0, 1}$ 为这样一个函数: 对于表示三元组 $(L, i, j)$ 的输入字符串, 其中 $L$ 是 $n$ 个顶点图 $G$ 的邻接表表示, 且 $i$ 和 $j$ 是 $[n]$ 中的数字, 如果图中存在边 ${i, j}$ 则 $E D GE (L, i, j) = 1.$ $E D GE$ 在所有其他输入上输出 $0.$

证明 $E D GE \in P .$
令 $P L A N A RM A TR I X : {0, 1}^{*} \to {0, 1}$ 为这样一个函数: 当输入为邻接矩阵 $A$ 时, 当且仅当 $A$ 表示的图是_平面图_ (即可以画在平面上且边互不交叉) 时输出 $1.$ 对于这个问题, 你可以直接使用 $P L A N A RM A TR I X \in P$ 这一事实而无需证明. 证明 $P L A N A R L I ST \in P,$ 其中 $P L A N A R L I ST : {0, 1}^{*} \to {0, 1}$ 是这样一个函数: 当输入为邻接表 $L$ 时, 当且仅当 $L$ 表示一个平面图时输出 $1.$

习题 13.8 (评估 NAND 电路).

令 $N A N D E V A L : {0, 1}^{*} \to {0, 1}$ 为这样一个函数: 对于每个表示二元组 $(Q, x)$ 的字符串, 其中 $Q$ 是一个 $n$ 输入 $1$ 输出的 NAND-CIRC (不是 NAND-TM!) 程序, 且 $x \in {0, 1}^{n},$ 有 $N A N D E V A L (Q, x) = Q (x) .$ 在所有其他输入上 $N A N D E V A L$ 输出 $0.$

证明 $N A N D E V A L \in P .$

习题 13.9 (寻找困难函数).

令 $N A N DH A R D : {0, 1}^{*} \to {0, 1}$ 为这样一个函数: 对于表示二元组 $(f, s)$ 的输入字符串, 其中

$f \in {0, 1}^{2^{n}}$ 对于某个 $n \in N$
$s \in N$

$N A N DH A R D (f, s) = 1$ 如果不存在至多 $s$ 行的 NAND-CIRC 程序 $Q$ 能计算真值表为字符串 $f$ 的函数 $F : {0, 1}^{n} \to {0, 1} .$ 也就是说, $N A N DH A R D (f, s) = 1$ 如果对于每个至多 $s$ 行的 NAND-CIRC 程序 $Q,$ 都存在某个 $x \in {0, 1}^{n}$ 使得 $Q (x) \neq = f_{x},$ 其中 $f_{x}$ 表示 $f$ 的第 $x$ 个坐标, 这里使用二进制表示将 ${0, 1}^{n}$ 与数字 ${0, \dots, 2^{n} - 1}$ 对应起来.

证明 $N A N DH A R D \in EXP .$
(挑战) 证明存在一个算法 $F I N DH A R D,$ 使得如果 $n$ 足够大, 则 $F I N DH A R D (1^{n})$ 在时间 $2^{2^{O (n)}}$ 内运行并输出一个字符串 $f \in {0, 1}^{2^{n}},$ 该字符串是一个不包含在 $S I ZE (2^{n} / (1000 n))$ 中的函数的真值表. (换句话说, 如果 $f$ 是 $F I N DH A R D (1^{n})$ 输出的字符串, 那么如果我们令 $F : {0, 1}^{n} \to {0, 1}$ 为使得 $F (x)$ 输出 $f$ 的第 $x$ 个坐标的函数, 则 $F \neq \in S I ZE (2^{n} / (1000 n)) .$ ²

习题 13.10.

假设你负责 X 大学的计算机科学课程调度. 在 X 大学, 计算机科学系的学生起得很晚, 下午必须去忙他们的创业公司, 并且还要和投资人一起度过长周末. 所以你只有两个可能的时间段: 你可以将课程安排在周一-周三的上午 11 点到下午 1 点, 或者周二-周四的上午 11 点到下午 1 点.

令 $SC H E D UL E : {0, 1}^{*} \to {0, 1}$ 为一个函数, 它接受一个课程列表 $L$ 和一个_冲突_列表 $C$ (即不能共享同一时间段的课程对列表) 作为输入, 当且仅当 $L$ 中的课程存在一个 “无冲突” 的调度方案 (即 $C$ 中没有一对课程被安排在同一时间段) 时输出 $1.$

更准确地说, 列表 $L$ 是一个字符串列表 $(c_{0}, \dots, c_{n - 1}),$ 列表 $C$ 是一个形式为 $(c_{i}, c_{j})$ 的配对列表. $SC H E D UL E (L, C) = 1$ 当且仅当存在 $c_{0}, \dots, c_{n - 1}$ 的一个划分为两部分, 使得不存在 $(c_{i}, c_{j}) \in C$ 满足 $c_{i}$ 和 $c_{j}$ 都在同一部分中.

证明 $SC H E D UL E \in P .$ 像往常一样, 你不需要提供完整的代码来证明这一点, 可以高层次地描述操作, 也可以引用本书或讲座中提到的任何数据结构或其他结果. 注意, 要证明一个函数 $F$ 在 $P$ 中, 你需要同时 (1) 给出一个在多项式时间内计算 $F$ 的算法 $A,$ (2) 证明 $A$ 确实在多项式时间内运行, 并且确实计算出正确的答案.

试着思考你的算法是否可以扩展到有三个可能时间段的情况.

13.8 参考文献

因为我们对给定长度输入的最大步数感兴趣, 我们定义的运行时间通常被称为 最坏情况复杂度. 计算长度为 $n$ 的输入上的函数的最小步数 (或 “最好情况” 复杂度) 通常不是一个有意义的量, 因为本质上每个自然问题都会有一些极其简单的实例. 然而, 平均情况复杂度 (即 “典型” 或 “随机” 输入上的复杂度) 是一个有趣的概念, 我们将在讨论 密码学 时回到这个话题. 话虽如此, 最坏情况复杂度是复杂度度量中最标准和最基本的, 并且将是我们本书大部分内容的重点.

单带图灵机的一些下界在 (Maass, 1985) 中给出.

为了定义 $λ$ 演算中的效率, 人们需要对归约步骤的应用顺序保持谨慎, 这对计算效率可能很重要, 例如参见这篇论文.

符号 $P_{/poly}$ 的使用是出于历史原因. 它是由 Karp 和 Lipton 引入的, 他们认为这个类对应于可以由多项式时间图灵机计算的函数, 这些图灵机对于任何输入长度 $n$ 都被赋予一个长度为 $n$ 的多项式的 建议串.

1: 提示: 这是定理 13.6 的图灵机类比. 我们将计算 $F$ 的原始 TM $M^{'}$ 的一步替换为非感知 TM $M$ 的一次 “扫描”, 在扫描中它向右移动 $T$ 步, 然后向左移动 $T$ 步.

2: 提示: 使用第 1 项, 需要指数级困难 NAND 程序的函数的存在性, 以及映射 ${0, 1}^{n}$ 到 ${0, 1}$ 的函数只有有限多个这一事实.

| 理论计算机科学导论 |