乱数を使った計算

R. Frivalds "Fast Probabilistic Algorithms". Mathematical Foundation of Computer Science (1979), Lecture Note in Computer Science, volume 74,(1979) pp. 57-69

多項式 p(x), q(x) から積 r(x) を求めるには、各項の係数を計算する必要があります。 n 次式の二つの多項式があり、積和標準型になっていたとします。 (例) これについて、中央付近の係数は n 回程度の掛け算と n 回程度の足し算が必要になります。したがって、 O(n²) 回程度の掛け算が必要になります。

しかし、 p(x)q(x) が r(x) と等しいかどうかを調べるのに、乱数を使うと効率よく求まります。

このようにすると掛け算の回数を O(n) に下げることができます。但し、必ずしも正解にはなりません。ではこのアルゴリズムを分析します。

始めに、入力のp,q,r に対して、　p(x)q(x)=r(x) が成り立っているようなものを考えます。すると、上記のアルゴリズムにおいて常に a*b=c が成立します。したがって、 yes instance に関しては必ず yes を出力することがわかります。

一方、 p(x)q(x)≠r(x) の場合を考えます。この時、常に a*b≠c が成り立てば良いのですが、運悪くたまたま a*b=c になってしまうことがあります。例えば、 p(x)=x, q(x)=x²+3x-2, r(x)=2x³ の時、p(x)q(x)≠r(x) ですが、p(1)q(1)=r(1) となります。このように、 no instance に関しては yes か no を出力します。つまり、 no instance の時に誤って yes を出してしまうことがこのアルゴリズムの問題点になっています。しかし、この yes を出す確率を計算することができます。

多項式の性質により、0 と恒等的に等しくない n 次式の多項式は高々 n 個の解しか持ちません。したがって、 p(x)q(x)-r(x) が恒等的に 0 でないのであれば、これが 0 になるような x は高々 n 個しかありません。そのため、乱数の選び方として、 1 から 2n までをランダムに選ぶと、 no instance に対して、 yes を出力してしまう確率は 1/2 以下に、さらに 1 から n² までをランダムに選ぶと、 yes を出力してしまう確率は 1/n 以下になります。

もちろん、複数回上記のアルゴリズムを行って答えの精度を上げることもできます。上記のアルゴリズムにおいて、 yes が出力された時は yes instance か no instance かいずれかになり得ますが、no を出力したとすると、この回答には誤りがありません。たくさん試行して、一度でも no が出れば、入力は no instance であることが分かります。いま、 no instance を入れたときに誤りを出す確率を p とするとします。その時、 k 回試行すると全て誤る確率は p^k となるため、誤りの確率を減らすことができます。

演習13-1

n×n の正方行列 A, B, C において、 A*B=C をチェックするアルゴリズムを考えなさい。さらに、誤りの確率を計算しなさい。

13-2. Probabilistic Two-way Machine

R. Freivalds "Probabilistic Two-way Machines". International Symposium on Mathmatical Foundation of Computer Science. Lecture Note in Computer Science, Volume 118, (1981) pp.33-45

オートマトンは入力を一回ずつだけ読んで状態遷移し、入力を読み終えた段階で答えを出力します。ここで取り上げている Two-way Machine とは、入力を何度でも読み込めるもので、読み込みテープヘッドが Turing 機械のように左右に動きます。入力の始点と終点にはそれを示すマークが付加されています。また、これに作業用の読み書き可能なテープを付加したものを Two-way Turing 機械と呼ぶことにします。

このような状況で 0ⁿ1ⁿ という 0 の長さと 1 の長さが等しいかどうかを判定する問題を考えます。これは、 Two-way オートマトンだけではなく ω(log n) SPACE Two-way Turing 機械でも受理することはできません。

演習13-2

0ⁿ1ⁿ が Two-way オートマトンで受理できないことを示しなさい。

演習13-3

0ⁿ1ⁿ が ω(log n) SPACE Two-way Turing 機械で受理できないことを示しなさい。

演習13-4

0ⁿ1ⁿ が O(log n) SPACE Two-way Turing 機械で受理できることを示しなさい。

さて、 Freivalds はこれに関して以下の定理を証明しました。

定理

任意の ε<0 に対して、 0ⁿ1ⁿ を確率 1-ε で受理する確率的 Two-way オートマトンが存在する。

つまり、確率的な Two-way オートマトンは、 ω(log n) SPACE Two-way Turing 機械より真に能力が高いことを示したことになります。

証明

まず、 c(ε) と d(ε) を以下を満たす十分大きな自然数とする。

入力列 x が 0ⁿ 1^m と仮定します。最初のステップでは、

n \equiv m (mod c (ε))

かどうかを決定的に判定します。もし異なっていれば、 n と m は異なりますので reject します。一方、合同であれば、 n=m または、

| n - m | > c (ε)

が成り立ちます。

次のステップでは、 0の列と 1 の列で試合をします。互いの列に対して、それぞれ乱数をその長さ分だけ発生させます。一方が全て 1 が出て、もう一方が少なくとも 0 が一つ以上出たら前者の勝ちとします。それ以外は引き分けとします。一方が全て 1 が出る確率は (1/2)ⁿ ですので、滅多に勝負はつきません。

もし、 n=m であったら、両者の勝率は等しくなります。一方、異なっていた場合、例えば n < m なら、 m > n+c(ε) になります。ここで、どちらかが d(ε) 回勝つまで勝負をするとします。そのとき、もう一方が 1 勝もしない確率を求めます。

0 側が全部 1 が出る確率を p, 1 側が q とします。 1 回のラウンドで 0 が勝つ確率は p(1-q), 引き分けになる確率は (1-p)(1-q)+pq=(1-p-q+2pq) です。この時、 0 側が 1 回勝つ確率は次の通りです。

Σ p(1-q)(1-p-q+2pq)^k=p(1-q) 1/(1- (1-p-q+2pq)) = (p-pq)/(p+q-2pq)

p=q なら、これは 1/2 になります。よって、 n=m なら、 d(ε)連勝する確率は (1/2)^d(ε) で、これが 0 側と 1 側のどちらかで達成する確率は 2 (1/2)^d(ε) です。これは d(ε) の定義により ε 未満です。

一方、p=(1/2)ⁿ, q<(1/2)^n+c(ε) の場合を考えます。まず、次が言えます。

補題

(p-pq)/(p+q-2pq) * (1+p/q) / p/q
= (1-q)(p+q) / (o+q-2pq)
= 1 + (pq-q²)/(p+q-2pq)

ここで、分母は正、分子は p>q の時は正なので、 1 以上であることがわかりました。

ここで、 y =x/ (1+ x) = 1 - 1/x より、 x が小さい方が y は小さくなることと、 p/q > 2^c(ε) であることを使うと、 0 側が勝つ確率は 2^c(ε)/(1+2^c(ε)) 以上であることが分かります。したがって、 d(ε) 連勝する確率は下記の値より大きくなります。

したがって、 n=m の時、一方が連勝する確率は ε より小さく、また、 n≠m の時は必ず reject するか、 1-ε 以上の確率で連勝します。よって、連勝したとき reject するようにすれば、これで 0ⁿ1ⁿ を誤り確率 ε 以下で受理できることになります。

13-3. 確率的な計算量のクラス

確率的 Turing 機械は、0 または 1 が無限に書かれている乱数テープが接続され、毎ステップに一ますずつ読むことができようになっています。さらに、 accept と reject という二つの終了状態を持っています。

確率的多項式時間 Turing 機械は、このような確率的 Turing 機械で、入力の長さに対して、ある多項式ステップで処理を終了するものです。

言語 L が PP に属するとは、ある確率的多項式時間チューリング機械 M が存在して、 x が L に属するとき M(x) は 1/2 より大きい確率で accept し、 x が L に属さないときは M(x) が accpet する確率は 1/2 以下のものです。

ある言語 L が BPP に属するとは、ある確率的多項式時間チューリング機械 M が存在して、 x が L に属するとき M(x) は 2/3 より大きい確率で accept し、 x が L に属さないときは M(x) が accpet する確率は 1/3 以下のものです。

ある言語 L が RP に属するとは、ある確率的多項式時間チューリング機械 M が存在して、 x が L に属するとき M(x) は 1/2 より大きい確率で accept し、 x が L に属さないときは M(x) は必ず reject するものです。

ある言語 L が ZPP に属するとは、 x が L に属するときは M(x) は accept し、 x が L に属さないときは M(x) は reject する平均実行時間が多項式に抑えられる確率的チューリング機械 M が存在する。

クラス間の関係

確率的な計算と非決定的な計算を比較します。 NP の定義では、 accept する計算が存在するかしないかという定義でしたが、 NP の計算における 1bit の guess を 0 か 1 の乱数に置き換えてみると、 accept する確率が 0 より大きいか、0 かということになります。つまり上記のように NP を定義すると次のようになります。

ある言語 L が NP に属するとは、ある確率的多項式時間チューリング機械 M が存在して、 x が L に属するとき M(x) が accept する確率は 0 より大きい。 x が L に属さないときは M(x) は必ず reject するものです。

一方、非決定性の計算を計算木で考えると、確率的な計算も非決定性の計算において、 accept する木の葉の量に関係して定義できます。例えば、 PP は非決定性の計算において、 accept する計算が過半数かどうかを調べることになります。

さて、 Savitch の定理つまり NSPACE(p(n)) subseteq DSPACE(p(n)²) の証明を思い出すと、 PP の計算において、計算木の accept する葉の数を数えるのも決定性の多項式空間でできます。つまり PP subseteq PSPACE になります。

一方、 NP を計算する確率的 Turing 機械に対して、計算の前に 1/2 の確率で accept すると、yes インスタンスの入力では 1/2 を越える確率で accept しますが、 no インスタンスでは accept の確率は 1/2 のままです。つまり、この計算は PP に含まれます。

一方 RP に関しては、yes インスタンスで 1/2 以上の accept があるということは、少なくとも accept する計算があることになります。一方 no インスタンスでは accept する計算がないので、これはそのまま NP に含まれることが分かります。

また RP の計算を二回繰り返し、少なくとも一回は accept される確率を考えると、 yes インスタンスに関して 3/4 以上でありますが、 no インスタンスは 0 のままです。このように繰り返すことで、 BPP の定義も満たすことになっています。

また、 L が RP に含まれ、一方で、 L~ も RP に含まれる状態を考えます。つまり、 L が RP と co-RP に含まれるという状態です。この時、入力 x に対して、 RP の計算をするプログラムと、 co-RP の計算をするプログラムを交互に動かし、どちらかが accept を出力するまで繰り返すことを考えます。この時、計算が終わらない状況も考えられますが、誤った答えを出すことはなくなります。また、正しい答えを出すまでの繰り返し回数を考えると、 yes インスタンスに対しては RP の計算をするプログラムが accept するまでの回数、 no インスタンスに対しては、 co-RP の計算をするプログラムが accept するまでの回数の平均を考えれば良いので、下記のようになります。

Σkp(1-p)^k
S(n)=Σkp(1-p)^(k-1) とすると
(1-p)S(n)=Σ_(k=2)ⁿ (k-1)p(1-p)^(k-1) + np(1-p)ⁿ
辺々を引くと pS(n)=Σp(1-p)^(k-1) - np(1-p)ⁿ =p (1-(1-p)ⁿ)/(1- (1-p)) - np(1-p)ⁿ
したがって、 lim n-> ∞ S(n) = 1/p

つまり、平均で高々 2 回以内に accept されることが分かります。それぞれの計算は多項式時間ですから、平均実行時間は多項式時間になります。したがって、 RP co-RP は ZPP に含まれます。

一方、 ZPP の計算に関して、適当な時刻で計算を打ちきって、 reject することを考えます。すると、 no-instance に対してはエラーがありません。一方、 yes-instance に対しては必ず多項式時間で計算が終了する代わりに、エラーが発生する確率が生じます。

これでこの途中で打ちきる計算が RP の計算になることが示せます。

P ⊆ ZPP=RP∩ co-RP ⊆ RP ⊆ NP ⊆ PP ⊆ PSAPCE
P ⊆ ZPP ⊆ RP ⊆ BPP ⊆ PP ⊆ PSPACE

但し、これらに関してこれ以上のことは分かっていません。

13-4. 素数判定

フェルマーテスト

フェルマーの小定理は素数に対して、0 と素数の倍数以外では必ず下記の式が成り立つというものです。

それでは p が合成数の場合はどうでしょうか? ここで、もし、 a^n-1 を n で割った余りが 1 でない x というような値になるとき、そのような a が半分以上存在することが示せます。

a^{n - 1} \equiv x (mod n)

(x≠1)と仮定します。ここで、 b^(n-1)≡1 mod n となるような b を集めた集合を S とします。その時、 (ab)^(n-1) ≡ x mod n となりますので、実は a^(n-1)≡x となる a の集合の要素数と S の要素数は等しくなります。別の c^(n-1)≡y mod n なども考えることができますが、それも S の要素数と同じになります。結局 n と互いに素な数に対して b^(n-1)≡1 mod n となるような b の要素数は全体の要素数の約数になることが分かります。したがって、値の種類が k 種類あれば 1 となる要素数は 1/k となります。

したがって、次のプログラムは素数なら reject, 合成数なら 1/2 以上の確率で accept になるでしょうか？

とこが、合成数の中でもこのフェルマーの小定理が成立してしまう数が存在します。上記の議論は 1 でない数が一つでもあれば確率 1/2 以下になるというものでしたが、すべて 1 では成立しません。これらの数はカーマイケル数と呼ばれてますが、最小で 561 がありますが、生成方法なども分かっています。

Solovay-Strassenテストと Miller-Rabin テスト

Solovay と Strassen はフェルマーテストを改良して、合成数なら必ず 1/2 以上の確率で accept するテストを作りました。下記がそうですが、

a^(n-1)/2 ≡ J(a/n) mod n
但し、 J(a/n) はヤコビ記号という数論上の演算

Miller と Rabin も別の方式ですが、ほぼ同様の性質を持つテストを作りました。

入力 n に対して、 n 以下の乱数 a を選びます。 2^s d = n-1 となるように奇数 d を選びます。ここでもし、 a^d が 1 と合同でなく、 1 から s までの全ての r に対して、 a^{d 2^r} も 1 と合同でないなら、 n は合成数

なお、これらのテストは多項式回繰り返しても多項式時間で済みます。この時の誤りの確率は (1/2)^p(n) となるため非常に小さな誤り確率で判定できることになります。

java.math.BigInteger#isProbablePrime メソッドは Miller-Rabin テストを使用しています。

Agrawal Kayal Saxena

2002 年に Agrawal と Kayal と Saxena は素数判定が乱数を使わずに多項式時間でできることを発表しました。彼らのテストは次のようなものです。

但し、 r を見つけるのに (log n)⁶ 程度かかるため、トータルで (log n)¹² 程度の計算量がかかります。その後、 (log n)⁶ まで計算量は改善されましたが、依然として、実用的な範囲では確率的なチェックより遅い状況です。

第 13 回乱数を使った計算

本日の内容

13-1. 乱数を使った計算

演習13-1

13-2. Probabilistic Two-way Machine

演習13-2

演習13-3

演習13-4

定理

証明

補題

13-3. 確率的な計算量のクラス

クラス間の関係

13-4. 素数判定

フェルマーテスト

Solovay-Strassenテストと Miller-Rabin テスト

Agrawal Kayal Saxena

第 13 回 乱数を使った計算

本日の内容

13-1. 乱数を使った計算

演習13-1

13-2. Probabilistic Two-way Machine

演習13-2

演習13-3

演習13-4

定理

証明

補題

13-3. 確率的な計算量のクラス

クラス間の関係

13-4. 素数判定

フェルマーテスト

Solovay-Strassenテストと Miller-Rabin テスト

Agrawal Kayal Saxena

第 13 回乱数を使った計算