2010年4月7日 星期三

賽局理論與《黑暗騎士》

  天氣似乎已經從冰庫走出來,我的情緒卻乍暖還寒,歹戲拖棚。雖無人聞問,我還是在此跟自己打個招呼,嗨!我在故我寫啦。

  《黑暗騎士》〈The Dark Knight〉的主角是小丑,整部電影的情節其實是由他操控的,蝙蝠俠一如影片中說的他是幕後人物,他的一切行動也處於被動。當然所有的犯罪電影也就是英雄電影,罪犯與英雄的雙人舞其實都由罪犯帶動。《關鍵報告》〈Minority Report〉除外,它講的是搶先一步阻止有犯罪意圖的嫌犯行動,電影的結論也告訴我們,這是互相矛盾的。假使還沒有行動就不構成犯罪〈思想無罪〉,他也就不是罪犯,警方不能以預測的犯罪來逮捕他,何況這預知的資訊不僅無法證實是否誤判,甚至還能作假誣陷他人於罪。

  《黑暗騎士》整個就是一個大的賽局遊戲,這個遊戲由小丑主控,警察、民眾甚至黑道都是他遊戲的對象,當然主要對手是神秘正義的蝙蝠俠。這麼一個龐大遊戲,其中不可能沒有個人利益、生死與背叛。這些也就是小丑可以把玩的棋子。「賽局」根據馮‧紐曼〈John von Neumann〉的說法,「下棋不屬於賽局理論〈Game Theory〉。下棋是定義得十分完善的一種計算,你也許無法算出答案,但是理論上,任何棋局必然有一個解,也就是有一個正確的過程。而真正的賽局完全不是這個樣子的。實際生活也不是這個樣子。實際生活中包括虛張聲勢、一些騙人的小策略,互相揣測對方以便應對等等」。馮紐曼的賽局理論研究的就是這些內容,他想知道這樣的賽局中是否存在一種理性的玩法,更確切地說「最佳的」玩法。約翰‧馮紐曼〈1903~1957〉是個數學天才,他把數學應用在實際生活中,甚至世界局勢,美蘇冷戰期間他也是個舉足輕重的人物。還有少數人把他視作庫柏力克的電影《奇愛博士》〈Dr.Strangelove〉中的科學家,可能出於馮紐曼曾坐在輪椅上參加原子能委員會的會議。有興趣的人可以從維基百科查他的資料,或者看左岸文化出版的《囚犯的兩難》──賽局理論與數學天才馮紐曼的故事。

  這個大的賽局中又可以舉出兩三個經典賽局:「膽小鬼遊戲」與「囚犯兩難遊戲」。

  「膽小鬼遊戲」,就是影片中蝙蝠車與小丑的大卡在筆直的路上面對面飛快疾駛的畫面。這個遊戲最初的版本是1955年的電影《養子不教誰之過》〈Rebel without A Cause〉中,詹姆斯狄恩與一名富家子同時開車往懸崖邊疾駛,在車子跌下懸崖前看誰能最後跳下車,先跳的就輸了,會被取笑「膽小鬼」。往後好萊塢的編劇們挖空心思想出類似種種毀滅年輕人的新花樣。1959年羅素在他的一本書《常識和核武戰爭》中詳細描寫了這種遊戲,而他所描述的遊戲在賽局理論中現在被當成了“正版”膽小鬼。「玩法如下:挑選一條長長的筆直大路,中間畫一條白線。兩輛汽車分別從兩頭出發。以飛快的速度向對方衝過去,每輛車內側的車輪不能離開白線。當兩車接近,眼看就要對撞,如果其中一人猛打方向盤讓自己的車離開白線,那麼另一人在急馳而過時就會衝著他大叫“膽小鬼”,讓他成為恥笑的對象.....」。在膽小鬼難題中,非理性的參賽者〈就是瘋子〉反而是贏家,所以《黑暗騎士》中,蝙蝠俠是膽小鬼。

  另一則「囚犯困境」則發生在兩艘渡輪上。高譚市的市民跟監獄的囚犯分乘兩艘船,小丑在兩船上都佈滿炸藥,卻把引爆器放在對方手中,限時要兩方作出抉擇。賽局理論中的典型現代版是這麼說的,「犯罪幫派的兩個成員被逮住並分別監禁起來,不能交談或交換訊息。警察承認沒有足夠的證據指控這兩人的罪刑,他們打算以較輕的罪名判處兩人各一年監禁。同時警方許諾兩犯人都可以進行浮士德式交易。如果他作不利於同夥的證供,他將被釋放,而他的同伴將被判三年監禁。.....如果兩人都作不利於對方的證詞,則兩人都將被判刑兩年」。電影與正版的賭注輕重與人數有別,但利害格局相同,也就是個人利益與群體利益存在著衝突。以電影中的情況,選擇背叛搶先按鈕者可活命,理性合作都放棄按鈕則大家都保全性命。問題是斷了通訊沒有人知道對方如何決定,假使背叛有利卻對理性的一方不利,那麼就沒有所謂的“最佳解”。我們很難證明相互合作是合乎邏輯的結果,其難度跟我們很難證明相互背叛是合理的一樣。這就是矛盾所在。人是非理性的,自保的最佳選項是讓對方死,否則就有可能自己死。就像市民中有人說反正他們是該死的囚犯。電影情節出現了不可置信的奇蹟,雖然證明了人性的光明面打擊了小丑,卻是電影中最超現實的部分。文學中愛倫坡的小說《瑪莉‧羅傑之謎》對囚犯困境有透徹討論。小說中的偵探答應提供獎勵和豁免給犯罪集團中第一個招供的成員,他說:匪幫中被抓獲的每一個人並非貪婪獎金或急於逃脫,他最害怕的是被同夥出賣。最早或最急於出賣別人,才能不被人出賣。這故事是根據1842年紐約一件轟動一時的謀殺案改編。案中實際提供的獎金始終無人領取。愛倫坡認為這件事表明兇案不是一夥人幹的。

  「膽小鬼」和「囚犯困境」有甚麼不同?在膽小鬼遊戲中相互背叛〈兩人都不閃躲〉是最可怕的結果,轉彎〈合作〉是最好的策略。而在囚犯困境中,一方背叛而另一方合作〈成為傻瓜〉是最壞的結果,背叛卻是比較安全的。

  電影中另一個難題,就是檢察官和愛人被小丑分別綁架在不同的地方,將同步引爆。時間上蝙蝠俠只來得及救一個人,這時候兩難又出現了,作英雄或個人是小丑給他的考驗。生命中、現實中大大小小的兩難也同時讓我們作出非此即彼的選擇,只是損益沒有那麼明顯,我們也能輕易過關。至少我們不須如臨深淵般作每一項決定。

  賽局中有時會出現「零合賽局」,它是指加總報酬為固定的賽局,意即有人得就有人失,用在經濟學上就是「天下沒有白吃的午餐」。實際上賽局策略與經濟行為的確有深切關連,馮紐曼與摩根斯坦合著的《賽局理論與經濟行為》就是企圖替經濟學找出公理化的基礎,以賽局作為經濟互動的潛在模型。例如為兩個孩子均分蛋糕的故事,不管父母多麼小心翼翼,總是無法讓兩小孩滿意。解決的方法就是讓一個孩子切蛋糕,另一個孩子選蛋糕,兩個孩子實際上在進行一場零和賽局。貪婪的動機保證了蛋糕有公平的分配,重點在兩個孩子都在預測對方怎麼作,正是這一點使馮紐曼把它看成一種「賽局」。這個解決方法並不是因為孩子很慷慨大方或者有公平意識,而是由於兩個孩子各自的利益必然形成的真正平衡。賽局理論尋找的正是出於參與者利益所得出的「理性解」,雙方都確信他們不可能有更好的結果了。

  1980年代賽局理論改變到一個甚至連馮紐曼也從未料過的方向。生物學和社會學成了賽局理論最活躍的應用領域,許多生物之間各種形式的合作和競爭在過去無法解釋,此時賽局理論提供了富有說服力的答案。在生物演化的長鏈中,囚犯的兩難〈合作或背叛〉並不是一次性的,因此演化穩定策略可能不只一種。在一回合的囚犯困境中只有兩個策略,但在反覆進行的囚犯困境賽局中,可能有任意種策略,它們是根據對手過去的行動來決定每一步該怎麼作。共享一個食物源的同一群動物會多次面臨飽餐或分享的兩難,因此生物學家對反覆進行的囚犯困境賽局特別感興趣。在實際生活中,包括人類和動植物的生活都是非零和遊戲,大自然時常扮演莊家的角色,因此個體們可以因彼此的成就而互蒙其利。1980年由密西根大學政治學教授艾瑟羅德作了一系列電腦「錦標賽」,關於反覆進行的囚犯困境賽局中的策略研究,被認為是賽局理論最有意義的發現之一。也許他的結論可以這樣解讀:「在人類自利的條件下,我們仍然可以看到,互助合作如何使這自私的世界欣欣向榮」。馮紐曼認為,人類是否能長久共存,取決於是否能提出更好的辦法,促進比現在既存的合作更多的合作。而賽局理論正可以讓我們拋棄道德的偽善,真正認識到理性合作的互利共生機制才是永續經營。

  另一個我覺得非常有趣的遊戲是舒比克發明的「美元拍賣」。規則有二:

  一、〈和任何拍賣一樣〉鈔票歸最高報價者。新的報價必須高於上一次報價,在規定時限內沒有新報價則拍賣結束。
  二、〈不同於蘇富比拍賣規則〉報出第二高價者也要付出他最後一次報價的款項,但甚麼也得不到。〈你當然不想成為第二高的出價人〉

  這兩條規則很快讓大家瘋了。一張一美元的鈔票,所有人都希望以一美分得到它。所以許多人都開始喊價。怎麼收場呢?當報價到達一美元的時候,這使另一個報99美分或略少的人成為次高報價者。如果以一美元結束,這個人將白白損失99美分。他必然被迫出價1.01美元,損失一美分總比損失99美分划算。這樣的考量讓最後競價的人失去理性,不斷用比當前高出一美分的新報價壓住對手,使自己的地位暫時獲得改善,但他的處境只會越來越壞。這個賽局的試驗證明可以用遠遠多於一美元的價格「賣出」一張一美元紙幣。也許你以為這純屬遊戲,但瞧瞧我們身邊竟然充斥著種種的「美元拍賣」:明知是無底洞,還要將大把大把的錢往裡扔,無非是想撈回一點,免得先前扔進去的錢血本無歸,或者只是因為無路可退和想保住面子。例如打電話服務人員都在忙線中,排一條曲曲折折的長龍隊伍,看一部很難看的電影,都很難決定該在何時放棄。或者等公車時總想再等幾分鐘,最後才決定招計程車;多打幾圈牌以挽回損失;留在一個很糟的工作裡;維持一段很糟的關係。這些都是「美元拍賣」。舒比克認為越南戰爭是「美元拍賣」的一個極好例子。