當前位置:首頁 » 生產成本 » 高阻撓成本什麼意思
擴展閱讀
減肥產品投放平台哪個好 2025-07-29 04:26:57
石油大亨管道怎麼開 2025-07-29 04:26:54

高阻撓成本什麼意思

發布時間: 2022-08-25 01:23:59

A. 成本高是什麼意思

成本是商品經濟的價值范疇,是商品價值的組成部分,也稱生產費用。人們要進行生產經營活動或達到一定的目的,就必須耗費一定的資源(人力、物力和財力),其所費資源的貨幣表現及其對象化稱之為成本。並且隨著商品經濟的不斷發展,成本概念的內涵和外延都處於不斷地變化發展之中。給人們帶來更多的方便。

B. 什麼叫高成本效益

所謂成本效益分析就是將投資中可能發生的成本與效益歸納起來:利用數量分析方法來計算成本和效益的比值,從而判斷該投資項目是否可行。成本效益是一個矛盾的統一體,二者互為條件,相伴共存,又互相矛盾,此增彼減。從事物發展規律看,任何事情都存在成本效益。成本大致可劃分兩個層次:一是直接的、有形的成本問題;二是間接的、無形的成本。效益也包含兩個層次:一是直接的、有形的效益;二是間接的、無形的效益。
成本收益分析的三種主要方法:
1、凈現值法是指在投資項目的壽命期內,將所有的成本和效益按照一定的貼現率折算為成本現值和效益現值,如果效益現值減去成本現值後的差額大於零,則該投資項目就是可行的。
2、現值指數法是指在投資項目的壽命期內,計算所有的效益現值與成本現值之比,如果該比率大於1,則投資項目就是可行的。
3、內含報酬率是指能夠使投資方案的凈現值為零的貼現率。這種方法就是通過計算投資項目的未來所有成本和效益的現值之差為零的貼現率,如果這一內含貼現率比要求的貼現率為高,則該投資項目就是可行。
換句話來理解,就是高成本效益,就是目前所說的高投入高產出,其典型代表就是EGPRS(GSM長期演進過程中的一個商業手段,它在收入和成本效益方面能對高速增長的全球移動市場有很大作為).

C. 抑價成本是什麼意思

高於市場價。抑價成本是指較正常競爭條件下所確定的市場價格為高的那部分價格。指的是超過最開始發布的價格,比最開始發布的價格要高,叫做抑價成本。

D. 概率統計

貝葉斯公式
若B1,B2,...為一系列互不相容的事件,且

U Bi=Ω,P(Bi)>0,i=1,2,…
i=1
則對任一事件A,有
P(Bi|A)=[P(Bi)P(A|Bi)]/[P(A|B1) P(A|B2)...P(A|B∞)] i=1,2,...
這個公式為我們判斷某種結果生成的原因提供理論依據。

貝葉斯法則
貝葉斯的統計學中有一個基本的工具叫「貝葉斯法則」,盡管它是一個數學公式,但其原理毋需數字也可明了。如果你看到一個人總是做一些好事,則那個人多半會是一個好人。這就是說,當你不能准確知悉一個事物的本質時,你可以依靠與事物特定本質相關的事件出現的多少去判斷其本質屬性的概率。用數學語言表達就是:支持某項屬性的事件發生得愈多,則該屬性成立的可能性就愈大。
貝葉斯法則又被稱為貝葉斯定理、貝葉斯規則是概率統計中的應用所觀察到的現象對有關概率分布的主觀判斷(即先驗概率)進行修正的標准方法。
所謂貝葉斯法則,是指當分析樣本大到接近總體數時,樣本中事件發生的概率將接近於總體中事件發生的概率。
但行為經濟學家發現,人們在決策過程中往往並不遵循貝葉斯規律,而是給予最近發生的事件和最新的經驗以更多的權值,在決策和做出判斷時過分看重近期的事件。面對復雜而籠統的問題,人們往往走捷徑,依據可能性而非根據概率來決策。這種對經典模型的系統性偏離稱為「偏差」。由於心理偏差的存在,投資者在決策判斷時並非絕對理性,會行為偏差,進而影響資本市場上價格的變動。但長期以來,由於缺乏有力的替代工具,經濟學家不得不在分析中堅持貝葉斯法則。
[編輯本段]貝葉斯法則的原理
通常,事件A在事件B(發生)的條件下的概率,與事件B在事件A的條件下的概率是不一樣的;然而,這兩者是有確定的關系,貝葉斯法則就是這種關系的陳述。
作為一個規范的原理,貝葉斯法則對於所有概率的解釋是有效的;然而,頻率主義者和貝葉斯主義者對於在應用中概率如何被賦值有著不同的看法:頻率主義者根據隨機事件發生的頻率,或者總體樣本裡面的個數來賦值概率;貝葉斯主義者要根據未知的命題來賦值概率。一個結果就是,貝葉斯主義者有更多的機會使用貝葉斯法則。
貝葉斯法則是關於隨機事件A和B的條件概率和邊緣概率的。
\Pr(A|B) = \frac{\Pr(B | A)\, \Pr(A)}{\Pr(B)}\propto L(A | B)\, \Pr(A) \!
其中L(A|B)是在B發生的情況下A發生的可能性。
在貝葉斯法則中,每個名詞都有約定俗成的名稱:
Pr(A)是A的先驗概率或邊緣概率。之所以稱為"先驗"是因為它不考慮任何B方面的因素。
Pr(A|B)是已知B發生後A的條件概率,也由於得自B的取值而被稱作A的後驗概率。
Pr(B|A)是已知A發生後B的條件概率,也由於得自A的取值而被稱作B的後驗概率。
Pr(B)是B的先驗概率或邊緣概率,也作標准化常量(normalized constant)。
按這些術語,Bayes法則可表述為:
後驗概率 = (相似度 * 先驗概率)/標准化常量
也就是說,後驗概率與先驗概率和相似度的乘積成正比。
另外,比例Pr(B|A)/Pr(B)也有時被稱作標准相似度(standardised likelihood),Bayes法則可表述為:後驗概率 = 標准相似度 * 先驗概率
[編輯本段]舉例分析
全壟斷市場,只有一家企業A提供產品和服務。現在企業B考慮是否進入。當然,A企業不會坐視B進入而無動於衷。B企業也清楚地知道,是否能夠進入,完全取決於A企業為阻止其進入而所花費的成本大小。
挑戰者B不知道原壟斷者A是屬於高阻撓成本類型還是低阻撓成本類型,但B知道,如果A屬於高阻撓成本類型,B進入市場時A進行阻撓的概率是20%(此時A為了保持壟斷帶來的高利潤,不計成本地拚命阻撓);如果A屬於低阻撓成本類型,B進入市場時A進行阻撓的概率是100%。
博弈開始時,B認為A屬於高阻撓成本企業的概率為70%,因此,B估計自己在進入市場時,受到A阻撓的概率為:
0.7×0.2+0.3×1=0.44
0.44是在B給定A所屬類型的先驗概率下,A可能採取阻撓行為的概率。
當B進入市場時,A確實進行阻撓。使用貝葉斯法則,根據阻撓這一可以觀察到的行為,B認為A屬於高阻撓成本企業的概率變成A屬於高成本企業的概率=0.7(A屬於高成本企業的先驗概率)×0.2(高成本企業對新進入市場的企業進行阻撓的概率)÷0.44=0.32
根據這一新的概率,B估計自己在進入市場時,受到A阻撓的概率為:
0.32×0.2+0.68×1=0.744
如果B再一次進入市場時,A又進行了阻撓。使用貝葉斯法則,根據再次阻撓這一可觀察到的行為,B認為A屬於高阻撓成本企業的概率變成
A屬於高成本企業的概率=0.32(A屬於高成本企業的先驗概率)×0.2(高成本企業對新進入市場的企業進行阻撓的概率)÷0.744=0.086
這樣,根據A一次又一次的阻撓行為,B對A所屬類型的判斷逐步發生變化,越來越傾向於將A判斷為低阻撓成本企業了。
以上例子表明,在不完全信息動態博弈中,參與人所採取的行為具有傳遞信息的作用。盡管A企業有可能是高成本企業,但A企業連續進行的市場進入阻撓,給B企業以A企業是低阻撓成本企業的印象,從而使得B企業停止了進入地市場的行動。
應該指出的是,傳遞信息的行為是需要成本的。假如這種行為沒有成本,誰都可以效仿,那麼,這種行為就達不到傳遞信息的目的。只有在行為需要相當大的成本,因而別人不敢輕易效仿時,這種行為才能起到傳遞信息的作用。
傳遞信息所支付的成本是由信息的不完全性造成的。但不能因此就說不完全信息就一定是壞事。研究表明,在重復次數有限的囚徒困境博弈中,不完全信息可以導致博弈雙方的合作。理由是:當信息不完全時,參與人為了獲得合作帶來的長期利益,不願過早暴露自己的本性。這就是說,在一種長期的關系中,一個人干好事還是干壞事,常常不取決於他的本性是好是壞,而在很大程度上取決於其他人在多大程度上認為他是好人。如果其他人不知道自己的真實面目,一個壞人也會為了掩蓋自己而在相當長的時期內做好事。

E. 成本高是什麼意思,,

就是投入產出不成比例。
比如投入了10元,拿回來9元,相對於投入10元,拿回來20元,就是成本高。

F. 博弈的四種基本類型的實例有哪些

1.首先行動優勢
首先行動優勢(first-mover advantage)是指,在博弈中首先作出戰略選擇並採取相應行動的參與人可以獲得較多的利益。
2.確實可信的威脅

確實可信的威脅(credible threat)是指,博弈的參與人通過某種行動改變自己的支付函數,從而使得自己的威脅顯得可信。參與人為改變博弈結果而採取的措施稱為承諾(commitment)。

第四節 不完全信息靜態博弈

在許多情況下,參與人對對手的了解往往是不夠精確的。這種情況下的博弈就是不完全信息博弈。

舉例來說,某一市場原來被A企業所壟斷。現在B企業考慮是否進入。B企業知道,A企業是否允許它進入,取決於A企業阻撓B企業進入所花費的成本。如果阻撓的成本低,那麼,正如表7-10後兩列所表示的,A企業的占優戰略是阻撓,博弈有重復剔除的占優戰略均衡――A阻撓,B不進入。如果阻撓的成本高,那麼,正如表7-10前兩列所表示的,A企業的占優戰略是默許B進入,博弈有重復剔除的占優戰略均衡――A默許,B進入。B企業所不知道的,是A企業的阻撓成本是高是低。這里,某一參與人本人知道、其他參與人則不知道的信息稱為私人信息。某一參與人所擁有的全部私人信息稱為他的類型。在上述例子中,阻撓成本就是 A的私人信息。高阻撓成本和低阻撓成本則是兩種不同的類型。
顯然,在這里,B所遇到的,是不確定性條件下的選擇問題。因為B不僅不知道A的類型(是高還是低),而且不知道不同類型的分布概率。

解決這類問題的方法之一,就是把不確定性條件下的選擇轉換為風險條件下的選擇。在風險條件下,B雖然不知道A的類型,但可以知道不同類型的分布概率。將不確定性條件下的選擇轉換為風險條件下的選擇,稱為海薩尼轉換(the Harsanyi transformation)
按照海薩尼的方法,所有參與人的真實類型都是給定的。其他參與人雖然不清楚某一參與人的真實類型,但知道這些可能出現的類型的分布概率,而且這種概率是公共知識。用上例來說,公共知識不僅意味著B企業知道A企業高阻撓成本與低阻撓成本的分布概率,而且意味著A也清楚B知道這一概率。

通過海薩尼轉換,不完全信息博弈變成了完全但不完美信息博弈(games of complete but imperfect information)。這里的不完美信息,就是指其他參與人只知道某一參與人某些方面類型的分布概率,而不知道該參與人在這些方面的真實類型。

在上述轉換的基礎上,海薩尼提出了貝葉斯納什均衡(Bayesian Nash equilibrium)。對此,可以作如下解釋:在不完全信息靜態博弈中,參與人同時行動,沒有機會觀察到別人的選擇。給定其他參與人的戰略選擇,每個參與人的最優戰略依賴於自己的類型。由於每個參與人僅知道其他參與人有關類型的分布概率,而不知道其真實類型,因而,他不可能知道其他參與人實際上會選擇什麼戰略。但是,他能夠正確地預測到其他參與人的選擇與其各自的有關類型之間的關系。

因此,該參與人的決策目標就是:在給定自己的類型,以及給定其他參與人的類型與戰略選擇之間關系的條件下,使得自己的期望效用最大化。

貝葉斯納什均衡是一種類型依賴型戰略組合。在給定自己的類型和其他參與人類型的分布概率的條件下,這種戰略組合使得每個參與人的期望效用達到了最大化。

回到上面提到的市場進入的例子。在這個例子里,對於挑戰者B來說,原壟斷者A在阻撓成本方面,存在著兩種可能性:高成本或低成本。B不知道A的阻撓成本究竟是高是低,但他知道A在這兩種不同阻撓成本下會作出的選擇,以及不同阻撓成本(類型)的分布概率。假定高成本的概率為x,則低成本的概率為(1-x)。如果A的阻撓成本高,A將默許B進入市場;如果A的阻撓成本低,A將阻撓B進入市場。在這兩種情況下,如表7-10所示,B進入的支付函數分別是得到40和失去10。因此,B選擇進入所得到的期望利潤為40x+(-10)(1- x),選擇不進入的期望利潤為0。簡單的計算表明,當A阻撓成本高的概率大於20%時,挑戰者B選擇進入得到的期望利潤大於選擇不進入的期望利潤。此時,選擇進入是B的最優選擇。此時的貝葉斯納什均衡為,挑戰者B選擇進入,高成本原壟斷者選擇默許,低成本原壟斷者選擇阻撓。

根據參與者類型的公共知識獲得參與者行動的概率,依此決定下一步策略。

第五節 不完全信息動態博弈

在動態博弈中,行動有先後次序,後行動者可以通過觀察先行動者的行為,來獲得有關先行動者的信息,從而證實或修正自己對先行動者的判斷。
如上所述,在不完全信息條件下,博弈的參與人知道其他參與人可能有哪幾種類型,也知道不同的類型與相應戰略選擇之間的關系。但他們並不知道其他參與人的真實類型。在不完全信息靜態博弈中,我們是通過海薩尼轉換,即通過假定其他參與人知道某一參與人的所屬類型的分布概率,來得出博弈的貝葉斯納什均衡結果的。

而在不完全信息動態博弈中,問題變得更加簡單。博弈開始時,某一參與人既不知道其他參與人的真實類型,也不知道其他參與人所屬類型的分布概率。他只是對這一概率分布有自己的主觀判斷,即有自己的信念。博弈開始後,該參與人將根據他所觀察到的其他參與人的行為,來修正自己的信念。並根據這種不斷變化的信念,作出自己的戰略選擇。

對應於不完全信息動態博弈的均衡概念是精煉貝葉斯均衡(perfect Bayesian equilibrium)。這個概念是完全信息動態博弈的子博弈精煉納什均衡與不完全信息靜態均衡的貝葉斯(納什)均衡的結合。

具體來說,精煉貝葉斯均衡是所有參與人戰略和信念的一種結合。它滿足如下條件:第一,在給定每個參與人有關其他參與人類型的信念的條件下,該參與人的戰略選擇是最優的。第二,每個參與人關於其他參與人所屬類型的信念,但是使用貝葉斯法則從所觀察到的行為中獲得的。

貝葉斯法則是概率統計中的應用所觀察到的現象對有關概率分布的主觀判斷(即先驗概率)進行修正的標准方法。採用上一節的例子,可以將貝葉斯規則的分析思路表達如下。
挑戰者B不知道原壟斷者A是屬於高阻撓成本類型還是低阻撓成本類型,但B知道,如果A屬於高阻撓成本類型,B進入市場時A進行阻撓的概率是20%(此時A為了保持壟斷帶來的高利潤,不計成本地拚命阻撓);如果A屬於低阻撓成本類型,B進入市場時A進行阻撓的概率是100%。
博弈開始時,B認為A屬於高阻撓成本企業的概率為70%,因此,B估計自己在進入市場時,受到A阻撓的概率為:
0.7×0.2+0.3×1=0.44
0.44是在B給定A所屬類型的先驗概率下,A可能採取阻撓行為的概率。
當B進入市場時,A確實進行阻撓。使用貝葉斯法則,根據阻撓這一可以觀察到的行為,B認為A屬於高阻撓成本企業的概率變成
A屬於高成本企業的概率=0.7(A屬於高成本企業的先驗概率)×0.2(高成本企業對新進入市場的企業進行阻撓的概率)÷0.44=0.32
根據這一新的概率,B估計自己在進入市場時,受到A阻撓的概率為:
0.32×0.2+0.68×1=0.744
如果B再一次進入市場時,A又進行了阻撓。使用貝葉斯法則,根據再次阻撓這一可觀察到的行為,B認為A屬於高阻撓成本企業的概率變成
A屬於高成本企業的概率=0.32(A屬於高成本企業的先驗概率)×0.2(高成本企業對新進入市場的企業進行阻撓的概率)÷0.744=0.086
這樣,根據A一次又一次的阻撓行為,B對A所屬類型的判斷逐步發生變化,越來越傾向於將A判斷為低阻撓成本企業了。
以上例子表明,在不完全信息動態博弈中,參與人所採取的行為具有傳遞信息的作用。盡管A企業有可能是高成本企業,但A企業連續進行的市場進入阻撓,給B企業以A企業是低阻撓成本企業的印象,從而使得B企業停止了進入地市場的行動。
應該指出的是,傳遞信息的行為是需要成本的。假如這種行為沒有成本,誰都可以效仿,那麼,這種行為就達不到傳遞信息的目的。只有在行為需要相當大的成本,因而別人不敢輕易效仿時,這種行為才能起到傳遞信息的作用。
傳遞信息所支付的成本是由信息的不完全性造成的。但不能因此就說不完全信息就一定是壞事。研究表明,在重復次數有限的囚徒困境博弈中,不完全信息可以導致博弈雙方的合作。理由是:當信息不完全時,參與人為了獲得合作帶來的長期利益,不願過早暴露自己的本性。這就是說,在一種長期的關系中,一個人干好事還是干壞事,常常不取決於他的本性是好是壞,而在很大程度上取決於其他人在多大程度上認為他是好人。如果其他人不知道自己的真實面目,一個壞人也會為了掩蓋自己而在相當長的時期內做好事。

根據參與者類型的公共知識以及參與者歷史行為來獲得參與者行動的概率,依此決定下一步策略

G. 海薩尼轉換的實踐操作

按照海薩尼的方法,所有參與人的真實類型都是給定的。其他參與人雖然不清楚某一參與人的真實類型,但知道這些可能出現的類型的分布概率,而且這種概率是公共知識。用上例來說,公共知識不僅意味著B企業知道A企業高阻撓成本與低阻撓成本的分布概率,而且意味著A也清楚B知道這一概率。通過海薩尼轉換,不完全信息博弈變成了完全但不完美信息博弈(games of complete but imperfect information)。這里的不完美信息,就是指其他參與人只知道某一參與人某些方面類型的分布概率,而不知道該參與人在這些方面的真實類型。在上述轉換的基礎上,海薩尼提出了貝葉斯納什均衡(Bayesian Nash equilibrium)。對此,可以作如下解釋:在不完全信息靜態博弈中,參與人同時行動,沒有機會觀察到別人的選擇。給定其他參與人的戰略選擇,每個參與人的最優戰略依賴於自己的類型。由於每個參與人僅知道其他參與人有關類型的分布概率,而不知道其真實類型,因而,他不可能知道其他參與人實際上會選擇什麼戰略。但是,他能夠正確地預測到其他參與人的選擇與其各自的有關類型之間的關系。因此,該參與人的決策目標就是:在給定自己的類型,以及給定其他參與人的類型與戰略選擇之間關系的條件下,使得自己的期望效用最大化。貝葉斯納什均衡是一種類型依賴型戰略組合。在給定自己的類型和其他參與人類型的分布概率的條件下,這種戰略組合使得每個參與人的期望效用達到了最大化。
回到上面提到的市場進入的例子。在這個例子里,對於挑戰者B來說,原壟斷者A在阻撓成本方面,存在著兩種可能性:高成本或低成本。B不知道A的阻撓成本究竟是高是低,但他知道A在這兩種不同阻撓成本下會作出的選擇,以及不同阻撓成本(類型)的分布概率。假定高成本的概率為x,則低成本的概率為(1-x)。如果A的阻撓成本高,A將默許B進入市場;如果A的阻撓成本低,A將阻撓B進入市場。在這兩種情況下,如表7-10所示,B進入的支付函數分別是得到40和失去10。因此,B選擇進入所得到的期望利潤為40x+(-10)(1-x),選擇不進入的期望利潤為0。簡單的計算表明,當A阻撓成本高的概率大於20%時,挑戰者B選擇進入得到的期望利潤大於選擇不進入的期望利潤。此時,選擇進入是B的最優選擇。此時的貝葉斯納什均衡為,挑戰者B選擇進入,高成本原壟斷者選擇默許,低成本原壟斷者選擇阻撓。
在動態博弈中,行動有先後次序,後行動者可以通過觀察先行動者的行為,來獲得有關先行動者的信息,從而證實或修正自己對先行動者的判斷。
如上所述,在不完全信息條件下,博弈的參與人知道其他參與人可能有哪幾種類型,也知道不同的類型與相應戰略選擇之間的關系。但他們並不知道其他參與人的真實類型。在不完全信息靜態博弈中,我們是通過海薩尼轉換,即通過假定其他參與人知道某一參與人的所屬類型的分布概率,來得出博弈的貝葉斯納什均衡結果的。而在不完全信息動態博弈中,問題變得更加簡單。博弈開始時,某一參與人既不知道其他參與人的真實類型,也不知道其他參與人所屬類型的分布概率。他只是對這一概率分布有自己的主觀判斷,即有自己的信念。博弈開始後,該參與人將根據他所觀察到的其他 。 (1)一個虛擬的參與人「自然」,自然首先決定參與人的類型,賦予各參與人的類型向量 , 其中 t=(t1....tn),
(2)自然告知參與者i自己的類型,卻不告訴其他參與者的類型;
(3)參與者同時選擇行動,每一參與者i從可行集Ai中選擇行動方案 ;
(4)各方得到收益Ai(a1......ai,ti) 。
藉助於第一步和第二步中虛構的參與者「自然」的行動,我們可以把一個不完全信息的博弈表述為一個不完美信息的博弈。海薩尼轉換是處理不完全信息博弈的標准方法。 海薩尼轉換是處理不完全信息博弈的標准方法。一般地,「自然」在博弈開始的時候選擇參與人的類型,參與人的某個類型包括表徵類型的各個特徵如策略空間、信息集、得益函數等,這些又稱為該類型參與人所擁有的個人信息。
不完全信息意味著博弈各方中至少有一個參與人有多個類型。
通過海薩尼轉換,博弈開始時,所有參與人有關「自然」的行動有一致的信念,即都知道所有參與人類型的概率分布函數P(t1,t2,…,tn),此即「海薩尼公理」。 舉例來說,某一市場原來被A企業所壟斷。B企業考慮是否進入。B企業知道,A企業是否允許它進入,取決於A企業阻撓B企業進入所花費的成本。如果阻撓的成本低,那麼,正如下表後兩列所表示的,A企業的占優戰略是阻撓,博弈有重復剔除的占優戰略均衡——A阻撓,B不進入。如果阻撓的成本高,那麼,正如表7-10前兩列所表示的,A企業的占優戰略是默許B進入,博弈有重復剔除的占優戰略均衡——A默許,B進入。B企業所不知道的,是A企業的阻撓成本是高是低。這里,某一參與人本人知道、其他參與人則不知道的信息稱為私人信息。某一參與人所擁有的全部私人信息稱為他的類型。在上述例子中,阻撓成本就是 A的私人信息。高阻撓成本和低阻撓成本則是兩種不同的類型。
海薩尼轉換後的市場進入博弈
A高成本 低成本默許 阻撓 默許 阻撓
B 進入 40,50 -10,0 30,100 -10,140
不進入 0,300 0,300 0,400 0,400
顯然,在這里,B所遇到的,是不確定性條件下的選擇問題。因為B不僅不知道A的類型(是高還是低),而且不知道不同類型的分布概率。

H. 什麼是貝葉斯納什均衡

博弈論(Game Theory),有時也稱為對策論,或者賽局理論,應用數學的一個分支, 目前在生物學,經濟學,國際關系,計算機科學, 政治學,軍事戰略和其他很多學科都有廣泛的應用。主要研究公式化了的激勵結構(游戲或者博弈(Game))間的相互作用。是研究具有斗爭或競爭性質現象的數學理論和方法。也是運籌學的一個重要學科。

博弈論考慮游戲中的個體的預測行為和實際行為,並研究它們的優化策略。 表面上不同的相互作用可能表現出相似的激勵結構(incentive structure),所以他們是同一個游戲的特例。其中一個有名有趣的應用例子是囚徒困境悖論(Prisoner's dilemma)。

具有競爭或對抗性質的行為成為博弈行為。在這類行為中,參加斗爭或競爭的各方各自具有不同的目標或利益。為了達到各自的目標和利益,各方必須考慮對手的各種可能的行動方案,並力圖選取對自己最為有利或最為合理的方案。比如日常生活中的下棋,打牌等。博弈論就是研究博弈行為中斗爭各方是否存在著最合理的行為方案,以及如何找到這個合理的行為方案的數學理論和方法。

生物學家使用博弈理論來理解和預測進化論的某些結果。例如,John Maynard Smith 和George R. Price 在1973年發表於Nature上的論文中提出的「evolutionarily stable strategy」的這個概念就是使用了博弈理論。還可以參見進化博弈理論(evolutionary game theory)和行為生態學(behavioral ecology)。

博弈論也應用於數學的其他分支,如概率,統計和線性規劃等。

[編輯]博弈論簡史
對於博弈論的研究,開始於策墨洛(Zermelo,1913),波雷爾(Borel,1921)及馮·諾伊曼(von Neumann, 1928),後來由馮·諾伊曼和奧斯卡·摩根斯坦(von Neumann and Morgenstern,1944,1947)首次對其系統化和形式化(參照Myerson, 1991)。隨後約翰·福布斯·納什(John Forbes Nash Jr., 1950, 1951)利用不動點定理證明了均衡點的存在,為博弈論的一般化奠定了堅實的基礎。

當代博弈論的「三大家」和「四君子」

"三大家" 包括約翰·福布斯·納什、約翰·C·海薩尼,以及萊因哈德·澤爾騰。這三人同時因為他們對博弈論的突出貢獻而獲得1994年的瑞典銀行經濟學獎(也稱諾貝爾經濟學獎)。

"四君子" 包括羅伯特·J·奧曼、肯·賓摩爾、戴維·克瑞普斯,以及阿里爾·魯賓斯坦。

[編輯]博弈論分類
博弈的分類根據不同的基準也有不同的分類。一般認為,博弈主要可以分為合作博弈和非合作博弈。它們的區別在於相互發生作用的當事人之間有沒有一個具有約束力的協議,如果有,就是合作博弈,如果沒有,就是非合作博弈。

從行為的時間序列性,博弈論進一步分為兩類:靜態博弈是指在博弈中,參與人同時選擇或雖非同時選擇但後行動者並不知道先行動者採取了什麼具體行動;動態博弈是指在博弈中,參與人的行動有先後順序,且後行動者能夠觀察到先行動者所選擇的行動。通俗的理解:"囚徒困境"就是同時決策的,屬於靜態博弈;而棋牌類游戲等決策或行動有先後次序的,屬於動態博弈

按照參與人對其他參與人的了解程度分為完全信息博弈和不完全信息博弈。完全博弈是指在博弈過程中,每一位參與人對其他參與人的特徵、策略空間及收益函數有準確的信息。如果參與人對其他參與人的特徵、策略空間及收益函數信息了解的不夠准確、或者不是對所有參與人的特徵、策略空間及收益函數都有準確的信息,在這種情況下進行的博弈就是不完全信息博弈。

目前經濟學家們現在所談的博弈論一般是指非合作博弈,由於合作博弈論比非合作博弈論復雜,在理論上的成熟度遠遠不如非合作博弈論。非合作博弈又分為:完全信息靜態博弈,完全信息動態博弈,不完全信息靜態博弈,不完全信息動態博弈。與上述四種博弈相對應的均衡概念為:納什均衡(Nash equilibrium),子博弈精煉納什均衡(subgame perfect Nash equilibrium),貝葉斯納什均衡(Bayesian Nash equilibrium),精煉貝葉斯納什均衡(perfect Bayesian Nash equilibrium)。

博弈論還又很多分類,比如:以博弈進行的次數或者持續長短可以分為有限博弈和無限博弈;以表現形式也可以分為一般型(戰略型)或者展開型,等等。

[編輯]博弈論的意義
博弈論的研究方法和其他許多利用數學工具研究社會經濟現象的學科一樣,都是從復雜的現象中抽象出基本的元素,對這些元素構成的數學模型進行分析,而後逐步引入對其形勢產影響的其他因素,從而分析其結果。

基於不同抽象水平,形成三種博弈表述方式,標准型、擴展型和特徵函數型利用這三種表述形式,可以研究形形色色的問題。因此,它被稱為「社會科學的數學」從理論上講,博弈論是研究理性的行動者相互作用的形式理論,而實際上正深入到經濟學、政治學、社會學等等,被各門社會科學所應用。

[編輯]博弈論與納什平衡
博弈論(game theory)對人的基本假定是:人是理性的(rational,或者說自私的),理性的人是指他在具體策略選擇時的目的是使自己的利益最大化,博弈論研究的是理性的人之間如何進行策略選擇的。

納什(John Nash)編制的博弈論經典故事"囚徒的困境",說明了非合作博弈及其均衡解的成立,故稱"納什平衡"。

所有的博弈問題都會遇到三個要素。在囚徒的故事中,兩個囚徒是當事人(players)又稱參與者;當事人所做的選擇策略 (strategies)是承認了殺人事實,最後兩個人均贏得(payoffs)了中間的宣判結果。如果兩個囚徒之中有一個承認殺人,另外一個抵賴,不承認殺人,那麼承認者將會得到減刑處理,而抵賴者將會得到最嚴厲的死刑判決,在納什故事中兩個人都承認了犯罪事實,所以兩個囚徒得到的是中間的結果。

類似的: 我們也能從「自私的基因」等理論中看到「納什平衡」的體現。

在互聯網這個原始叢林中:最優策略是如何產生的呢?

[編輯]博弈中最優策略的產生
艾克斯羅德(Robert Axelrod)在開始研究合作之前,設定了兩個前提:一、每個人都是自私的;二、沒有權威干預個人決策。也就是說,個人可以完全按照自己利益最大化的企圖進行決策。在此前提下,合作要研究的問題是:第一、人為什麼要合作;第二、人什麼時候是合作的,什麼時候又是不合作的;第三、如何使別人與你合作。

社會實踐中有很多合作的問題。比如國家之間的關稅報復,對他國產品提高關稅有利於保護本國的經濟,但是國家之間互提關稅,產品價格就提高了,喪失了競爭力,損害了國際貿易的互補優勢。在對策中,由於雙方各自追求自己利益的最大化,導致了群體利益的損害。對策論以著名的囚犯困境來描述這個問題。

A和B各表示一個人,他們的選擇是完全無差異的。選擇C代表合作,選擇D代表不合作。如果AB都選擇C合作,則兩人各得3分;如果一方選C,一方選D,則選C的得零分,選D的得5分;如果AB都選D,雙方各得1分。

顯然,對群體來說最好的結果是雙方都選C,各得3分,共得6分。如果一方選C,一方選D,總體得5分。如果兩人都選D,總體得2分。

對策學界用這個矩陣來描述個體理性與群體理性的沖突:每個人在追求個體利益最大化時,就使群體利益受損,這就是囚徒困境。在矩陣中,對於A來說,當對方選 C,他選D得5分,選C只得3分;當對方選D,他選D得1分,選C得零分。因此,無論對方選C或D,對A來說,選D都得分最多。這是A單方面的優超策略。而當兩個優超策略相遇,即A,B都選D時,結果是各得1分。這個結果在矩陣中並非最優。困境就在於,每個人採取各自的優超策略時,得出的解是穩定的,但不是帕累托最優的,這個結果體現了個體理性與群體理性的矛盾。在數學上,這個一次性決策的矩陣沒有最優解。

如果博弈進行多次,只要對策者知道博弈次數,他們在最後一次肯定採取互相背叛的策略。既然如此,前面的每一次也就沒有合作的必要,因此,在次數已知的多次博弈中,對策者沒有一次會合作。

如果博弈在多人間進行,而且次數未知,對策者就會意識到,當持續地採取合作並達成默契時,對策者就能持續地各得3分,但如果持續地不合作的話,每個人就永遠得1分。這樣,合作的動機就顯現出來。多次對局下,未來的收益應比現在的收益多一個折現率W,W越大,表示未來的收益越重要。在多人對策持續進行下去,且W比較大,即未來充分重要時,最優的策略是與別人採取的策略有關的。假設某人的策略是,第一次合作,以後只要對方不合作一次,他就永不合作。對這種對策者,當然合作下去是上策。假如有的人不管對方採取什麼策略,他總是合作,那麼總是對他採取不合作的策略得分最多。對於總是不合作的人,也只能採取不合作的策略。

艾克斯羅德做了一個實驗,邀請多人來參加游戲,得分規則與前面的矩陣相同,什麼時候結束游戲是未知的。他要求每個參賽者把追求得分最多的策略寫成計算機程序,然後用單循環賽的方式將參賽程序兩兩博弈,以找出什麼樣的策略得分最高。

第一輪游戲有14個程序參加,再加上艾克斯羅德自己的一個隨機程序(即以50%的概率選取合作或不合作),運轉了300次。結果得分最高的程序是加拿大學者羅伯布寫的"一報還一報"(tit for tat)。這個程序的特點是,第一次對局採用合作的策略,以後每一步都跟隨對方上一步的策略,你上一次合作,我這一次就合作,你上一次不合作,我這一次就不合作。艾克斯羅德還發現,得分排在前面的程序有三個特點:第一,從不首先背叛,即"善良的";第二,對於對方的背叛行為一定要報復,不能總是合作,即" 可激怒的";第三,不能人家一次背叛,你就沒完沒了的報復,以後人家只要改為合作,你也要合作,即"寬容性"。

為了進一步驗證上述結論,艾氏決定邀請更多的人再做一次游戲,並把第一次的結果公開發表。第二次徵集到了62個程序,加上他自己的隨機程序,又進行了一次競賽。結果,第一名的仍是"一報還一報"。艾氏總結這次游戲的結論是:第一,"一報還一報"仍是最優策略。第二,前面提到的三個特點仍然有效,因為63人中的前15名里,只有第8名的哈靈頓程序是"不善良的",後15名中,只有1個總是合作的是"善良的"。可激怒性和寬容性也得到了證明。此外,好的策略還必須具有的一個特點是"清晰性",能讓對方在三、五步對局內辨識出來,太復雜的對策不見得好。"一報還一報"就有很好的清晰性,讓對方很快發現規律,從而不得不採取合作的態度。

[編輯]合作的進行過程及規律
"一報還一報"的策略在靜態的群體中得到了很好的分數,那麼,在一個動態的進化的群體中,這種合作者能否產生、發展、生存下去呢?群體是會向合作的方向進化,還是向不合作的方向進化?如果大家開始都不合作,能否在進化過程中產生合作?為了回答這些疑問,艾氏用生態學的原理來分析合作的進化過程。

假設對策者所組成的策略群體是一代一代進化下去的,進化的規則包括:一,試錯。人們在對待周圍環境時,起初不知道該怎麼做,於是就試試這個,試試那個,哪個結果好就照哪個去做。第二,遺傳。一個人如果合作性好,他的後代的合作基因就多。第三,學習。比賽過程就是對策者相互學習的過程,"一報還一報"的策略好,有的人就願意學。按這樣的思路,艾氏設計了一個實驗,假設63個對策者中,誰在第一輪中的得分高,他在第二輪的群體中所佔比例就越高,而且是他的得分的正函數。這樣,群體的結構就會在進化過程中改變,由此可以看出群體是向什麼方向進化的。

實驗結果很有趣。"一報還一報"原來在群體中佔1/63,經過1000代的進化,結構穩定下來時,它佔了24%。另外,有一些程序在進化過程中消失了。其中有一個值得研究的程序,即原來前15名中唯一的那個"不善良的"哈靈頓程序,它的對策方案是,首先合作,當發現對方一直在合作,它就突然來個不合作,如果對方立刻報復它,它就恢復合作,如果對方仍然合作,它就繼續背叛。這個程序一開始發展很快,但等到除了"一報還一報"之外的其它程序開始消失時,它就開始下降了。因此,以合作系數來測量,群體是越來越合作的。

進化實驗揭示了一個哲理:一個策略的成功應該以對方的成功為基礎。"一報還一報"在兩個人對策時,得分不可能超過對方,最多打個平手,但它的總分最高。它賴以生存的基礎是很牢固的,因為它讓對方得到了高分。哈靈頓程序就不是這樣,它得到高分時,對方必然得到低分。它的成功是建立在別人失敗的基礎上的,而失敗者總是要被淘汰的,當失敗者被淘汰之後,這個好占別人便宜的成功者也要被淘汰。

那麼,在一個極端自私者所組成的不合作者的群體中,"一報還一報"能否生存呢?艾氏發現,在得分矩陣和未來的折現系數一定的情況下,可以算出,只要群體的 5%或更多成員是"一報還一報"的,這些合作者就能生存,而且,只要他們的得分超過群體的總平均分,這個合作的群體就會越來越大,最後蔓延到整個群體。反之,無論不合作者在一個合作者佔多數的群體中有多大比例,不合作者都是不可能自下而上的。這就說明,社會向合作進化的棘輪是不可逆轉的,群體的合作性越來越大。艾克斯羅德正是以這樣一個鼓舞人心的結論,突破了"囚犯困境"的研究困境。

在研究中發現,合作的必要條件是:第一、關系要持續,一次性的或有限次的博弈中,對策者是沒有合作動機的;第二、對對方的行為要做出回報,一個永遠合作的對策者是不會有人跟他合作的。

那麼,如何提高合作性呢?首先,要建立持久的關系,即使是愛情也需要建立婚姻契約以維持雙方的合作。(火車站的小販為什麼要騙人?為什麼工作中要形成小組制度?換防的時候一方總是要小小地進攻一下的,在中越前線就是這樣)第二、要增強識別對方行動的能力,如果不清楚對方是合作還是不合作,就沒法回報他了。第三、要維持聲譽,說要報復就一定要做到,人家才知道你是不好欺負的,才不敢不與你合作。第四、能夠分步完成的對局不要一次完成,以維持長久關系,比如,貿易、談判都要分步進行,以促使對方採取合作態度。第五、不要嫉妒人家的成功,"一報還一報"正是這樣的典範。第六、不要首先背叛,以免擔上罪魁禍首的道德壓力。第七、不僅對背叛要回報,對合作也要作出回報。第八、不要耍小聰明,占人家便宜。

艾克斯羅德在《合作的進化》一書結尾提出幾個結論。第一、友誼不是合作的必要條件,即使是敵人,只要滿足了關系持續,互相回報的條件,也有可能合作。比如,第一次世界大戰期間,德英兩軍在戰壕戰中遇上了三個月的雨季,雙方在這三個月中達成了默契,互相不攻擊對方的糧車給養,到大反攻時再你死我活地打。這個例子說明,友誼不是合作的前提。第二、預見性也不是合作的前提,艾氏舉出生物界低等動物、植物之間合作的例子來說明這一點。但是,當有預見性的人類了解了合作的規律之後,合作進化的過程就會加快。這時,預見性是有用的,學習也是有用的。

當游戲中考慮到隨機干擾,即對策者由於誤會而開始互相背叛的情形時,吳堅忠博士經研究發現,以修正的"一報還一報",即以一定的概率不報復對方的背叛,和 "悔過的一報還一報",即以一定的概率主動停止背叛。群體所有成員處理隨機環境的能力越強,"悔過的一報還一報"效果越好,"寬大的一報還一報"效果越差。

[編輯]艾克斯羅德的貢獻與局限性
艾克斯羅德通過數學化和計算機化的方法研究如何突破囚徒困境,達成合作,將這項研究帶到了一個全新境界,他在數學上的證明無疑是十分雄辯和令人信服的,而且,他在計算機模擬中得出的一些結論是非常驚人的發現,比如,總分最高的人在每次博弈中都沒有拿到最高分。(劉邦和項羽的戰爭)

艾氏所發現的"一報還一報"策略,從社會學的角度可以看作是一種"互惠式利他",這種行為的動機是個人私利,但它的結果是雙方獲利,並通過互惠式利他有可能復蓋了范圍最廣的社會生活,人們通過送禮及回報,形成了一種社會生活的秩序,這種秩序即使在多年隔絕,語言不通的人群之間也是最易理解的東西。比如,哥倫布登上美洲大陸時,與印地安人最初的交往就開始於互贈禮物。有些看似純粹的利他行為,比如無償損贈,也通過某些間接方式,比如社會聲譽的獲得,得到了回報。研究這種行為,將對我們理解社會生活有很重要的意義。

囚徒困境擴展為多人博弈時,就體現了一個更廣泛的問題——"社會悖論",或"資源悖論"。人類共有的資源是有限的,當每個人都試圖從有限的資源中多拿一點兒時,就產生了局部利益與整體利益的沖突。人口問題、資源危機、交通阻塞,都可以在社會悖論中得以解釋,在這些問題中,關鍵是通過研究,制定游戲規則來控制每個人的行為。

艾克斯羅德的一些結論在中國古典文化道德傳統中可以很容易地找到對應,"投桃報李"、"人不犯我,我不犯人"都體現了"tit for tat"的思想。但這些東西並不是最優的,因為"一報還一報"在充滿了隨機性的現實社會生活里是有缺陷的。對此,孔子在幾千年前就說出了"以德報德,以直報怨"這樣精彩的修正策略,所謂"直",就是公正,以公正來回報對方的背叛,是一種修正了的"一報還一報",修正的是報復的程度,本來會讓你損失5分,現在只讓你損失3分,從而以一種公正審判來結束代代相續的報復,形成文明。

但是,艾氏對博弈者的一些假設和結論使其研究不可避免地與現實脫節。首先,《合作的進化》一書暗含著一個重要的假定,即,個體之間的博弈是完全無差異的。現實的博弈中,對策者之間絕對的平等是不可能達到的。一方面,對策者在實際的實力上有差異,雙方互相背叛時,可能不是各得1分,而是強者得5分,弱者得0分,這樣,弱者的報復就毫無意義。另一方面,即使對局雙方確實旗鼓相當,但某一方可能懷有賭徒心理,認定自己更強大,採取背叛的策略能佔便宜。艾氏的得分矩陣忽視了這種情形,而這種賭徒心理恰恰在社會上大量引發了零和博弈。因此,程序還可以在此基礎上進一步改進。

其次,艾氏認為合作不需預期和信任。這是他受到質疑頗多之處。對策者根據對方前面的戰術來制定自己下面的戰術,合作要求個體能夠識別那些曾經相遇過的個體並且記得與其相互作用的歷史,以便作出反應,這些都暗含著"預期"行為。在應付復雜的對策環境時,信任可能是對局雙方達成合作的必不可少的環節。但是,預期與信任如何在計算機的程序中體現出來,仍是需要研究的。

最後,重復博弈在現實中是很難完全實現的。一次性博弈的大量存在,引發了很多不合作的行為,而且,對策的一方在遭到對方背叛之後,往往沒有機會也沒有還手之力去進行報復。比如,資本積累階段的違約行為,國家之間的核威懾。在這些情況下,社會要使交易能夠進行,並且防止不合作行為,必須通過法制手段,以法律的懲罰代替個人之間的"一報還一報",規范社會行為。這是艾克斯羅德的研究對制度學派的一個重要啟發。

I. 貝葉斯納什均衡的舉例說明

某一市場原來被A企業所壟斷。現在B企業考慮是否進入。B企業知道,A企業是否允許它進入,取決於A企業阻撓B企業進入所花費的成本。如果阻撓的成本低,A企業的占優戰略是阻撓,博弈有重復剔除的占優戰略均衡——A阻撓,B不進入。如果阻撓的成本高,A企業的占優戰略是默許B進入,博弈有重復剔除的占優戰略均衡――A默許,B進入。B企業所不知道的,是A企業的阻撓成本是高是低。這里,某一參與人本人知道、其他參與人則不知道的信息稱為私人信息。某一參與人所擁有的全部私人信息稱為他的類型。在上述例子中,阻撓成本就是 A的私人信息。高阻撓成本和低阻撓成本則是兩種不同的類型。
B所遇到的,是不確定性條件下的選擇問題。因為B不僅不知道A的類型(是高還是低),而且不知道不同類型的分布概率。
對於挑戰者B來說,原壟斷者A在阻撓成本方面,存在著兩種可能性:高成本或低成本。B不知道A的阻撓成本究竟是高是低,但他知道A在這兩種不同阻撓成本下會作出的選擇,以及不同阻撓成本(類型)的分布概率。假定高成本的概率為x,則低成本的概率為(1-x)。如果A的阻撓成本高,A將默許B進入市場;如果A的阻撓成本低,A將阻撓B進入市場。在這兩種情況下,B進入的支付函數分別是得到40和失去10。因此,B選擇進入所得到的期望利潤為40x+(-10)(1- x),選擇不進入的期望利潤為0。簡單的計算表明,當A阻撓成本高的概率大於20%時,挑戰者B選擇進入得到的期望利潤大於選擇不進入的期望利潤。此時,選擇進入是B的最優選擇。此時的貝葉斯納什均衡為,挑戰者B選擇進入,高成本原壟斷者選擇默許,低成本原壟斷者選擇阻撓。

J. 貝葉斯納什均衡一定是純戰略均衡嘛

貝葉斯納什均衡(Bayesian Nash equilibrium)為博弈論中的相關概念。不完全信息靜態博弈的均衡稱為貝葉斯納什均衡。編輯本段基本解釋在不完全信息靜
態博弈中,參與人同時行動,沒有機會觀察到別人的選擇。給定其他參與人的戰略選擇,每個參與人的最優戰略依賴於自己的類型。由於每個參與人僅知道其他參與
人有關類型的分布概率,而不知道其真實類型,因而,他不可能知道其他參與人實際上會選擇什麼戰略。但是,他能夠正確地預測到其他參與人的選擇與其各自的有
關類型之間的關系。
因此,該參與人的決策目標就是:在給定自己的類型,以及給定其他參與人的類型與戰略選擇之間關系的條件下,使得自己的期望效用最大化。貝葉斯納什均衡是一種類型依賴型戰略組合。編輯本段舉例說明
某一市場原來被A企業所壟斷。現在B企業考慮是否進入。B企業知道,A企業是否允許它進入,取決於A企業阻撓B企業進入所花費的成本。如果阻撓的成本
低,A企業的占優戰略是阻撓,博弈有重復剔除的占優戰略均衡——A阻撓,B不進入。如果阻撓的成本高,A企業的占優戰略是默許B進入,博弈有重復剔除的占
優戰略均衡――A默許,B進入。B企業所不知道的,是A企業的阻撓成本是高是低。這里,某一參與人本人知道、其他參與人則不知道的信息稱為私人信息。某一參與人所擁有的全部私人信息稱為他的類型。在上述例子中,阻撓成本就是 A的私人信息。高阻撓成本和低阻撓成本則是兩種不同的類型。
B所遇到的,是不確定性條件下的選擇問題。因為B不僅不知道A的類型(是高還是低),而且不知道不同類型的分布概率。
對於挑戰者B來說,原壟斷者A在阻撓成本方面,存在著兩種可能性:高成本或低成本。B不知道A
的阻撓成本究竟是高是低,但他知道A在這兩種不同阻撓成本下會作出的選擇,以及不同阻撓成本(類型)的分布概率。假定高成本的概率為x,則低成本的概率為
(1-x)。如果A的阻撓成本高,A將默許B進入市場;如果A的阻撓成本低,A將阻撓B進入市場。在這兩種情況下,B進入的支付函數分別是得到40和失去
10。因此,B選擇進入所得到的期望利潤為40x+(-10)(1- x),選擇不進入的期望利潤為0。簡單的計算表明,當A阻撓成本高的概率大於20%時,挑戰者B選擇進入得到的期望利潤大於選擇不進入的期望利潤。此時,選擇進入是B的最優選擇。此時的貝葉斯納什均衡為,挑戰者B選擇進入,高成本原壟斷者選擇默許,低成本原壟斷者選擇阻撓。