Novaĵoj kaj SocioEkonomio

Nash-ekvilibro. Teorio de ludoj por ekonomikistoj (John Nash)

En la 1930-aj jaroj, Dzhon Fon Neyman kaj Oskar Morgenstern iĝis la fondintoj de la nova interesa areoj de matematiko, kiu estis nomita "Ludo Teorio." En la 1950-aj jaroj, juna matematikisto John Nash interesiĝis pri ĉi tiu direkto. La teorio de ekvilibro fariĝis la temo de sia disertacio, kiun li skribis kiam li havis 21 jarojn. Tiel, ĝi naskiĝis novan strategion de videoludoj nomita "Nash Equilibrium", kiu gajnis la Nobel-premion multajn jarojn poste - en 1994.

La longa interspaco inter skribi disertacion kaj universalan rekonon fariĝis provo por matematikisto. Genio sen rekoni rezultigis gravajn mensajn malordojn, sed ankaŭ la tasko Dzhon Nesh povis solvi danke al la bonega logicheskumu menso. Lia teorio pri "Nash-ekvilibro" estis premiita la Nobel-premio, kaj sian vivon de adapto en la filmo "Bela menso".

Mallonge pri la teorio de ludoj

Pro tio ke la teorio de la ekvilibro de Nash klarigas la konduton de homoj sub la kondiĉoj de interago, do valore konsideras la bazajn konceptojn de ludoteorio.

La teorio de la ludo studas la konduton de partoprenantoj (agentoj) en kondiĉoj de interago inter si per la tipo de ludo, kie la rezulto dependas de la decido kaj konduto de pluraj homoj. La partoprenanto prenas decidojn surbaze de liaj antaŭdiroj pri la konduto de la ripozo, kiu estas nomata la strategia ludo.

Ekzistas ankaŭ reganta strategio, en kiu la partoprenanto ricevas la plej bonan rezulton por iu ajn konduto de aliaj partoprenantoj. Ĉi tiu estas la plej bona venkinta strategio por la ludanto.

La dilemo de la malliberulo kaj scienca progreso

La dilemo de la malliberulo estas kazo de ludoj, kie la partoprenantoj devigas raciajn decidojn, atingante komunan celon en la konflikta kondiĉo de alternativoj. La demando estas kiu el tiuj opcioj li elektas, realigante sian personan kaj ĝeneralan intereson, same kiel la nekapablon akiri ambaŭ. Ludantoj ŝajnas esti enmetitaj en malmolaj ludkondiĉoj, kiuj kelkfoje faras ilin pensi tre produktive.

Ĉi tiu dilemo estis enketita de la usona matematikisto John Nash. La ekvilibro, kiun li derivis, fariĝis revolucia laŭ sia propra maniero. Precipe ĉi tiu nova penso influis la opinion de ekonomikistoj pri kiel elektas la merkatistoj, konsiderante la interesojn de aliaj, kun proksima interago kaj intersekco de interesoj.

Lin pli bona estas studi la teorion de la ludoj pri specifa ekzemploj, ĉar ĉi tiu matematika disciplino mem ne estas seka teoria.

Ekzemplo de la malliberulo de malliberulo

Ekzemple, du homoj faris ŝtelon, falis en la manojn de la polico kaj estas pridemanditaj en apartaj ĉeloj. Samtempe la policanoj ofertas al ĉiu partio favorajn kondiĉojn sub kiuj li estos liberigita en kazo de atesto kontraŭ sia partnero. Ĉiu el la krimuloj havas la jenan aron de strategioj, kiujn li konsideros:

  1. Ambaŭ donas ateston kaj ricevas 2.5 jarojn en malliberejo.
  2. Ambaŭ silentas samtempe kaj ricevas 1 jaron, ĉar en ĉi tiu kazo la evidenteca bazo de ilia kulpo estos malgranda.
  3. Unu atestas kaj ricevas liberecon, kaj la alia silentas kaj ricevas 5 jarojn en malliberejo.

Evidente, la rezulto de la kazo dependas de la decido de ambaŭ partoprenantoj, sed ili ne povas interkonsenti, ĉar ili sidas en malsamaj ĉeloj. Ankaŭ klare vidita estas la konflikto de siaj personaj interesoj en la lukto por komuna intereso. Ĉiu malliberulo havas du eblojn por agado kaj 4 ebloj por rezultoj.

La ĉeno de logikaj inferencoj

Do, la krimulo A konsideras la jenajn eblojn:

  1. Mi silentas kaj mia kompano silentas - ni ambaŭ ricevos 1 jaron en malliberejo.
  2. Mi turnas min en partnero kaj li kapitulacigas min - ni ambaŭ ricevos 2.5 jarojn en malliberejo.
  3. Mi silentas, kaj mia kompano donas min supren - Mi ricevos 5 jarojn en malliberejo, kaj li estas senpaga.
  4. Mi transdonas kompaninon, sed li silentas - mi ricevas liberecon, kaj li havas 5 jarojn en malliberejo.

Ni donas matricon de eblaj solvoj kaj rezultoj por klareco.

Tablo de verŝajne rezultoj de la dilemo de la malliberulo.

La demando estas, kion elektos ĉiu partoprenanto?

"Silentu, vi ne povas paroli" aŭ "vi ne povas silenti, vi ne povas paroli"

Por kompreni la elekton de la partoprenanto, vi devas trapasi ĉenon de liaj spegulbildoj. Sekvante la rezonadon de la kriminala A: se mi silentos kaj silentos mian kompanon, ni ricevos minimuman terminon (1 jaro), sed mi ne povas ekscii kiel li kondutos. Se li atestas kontraŭ mi, ankaŭ estas pli bone por mi atesti, alie mi povas sidi dum 5 jaroj. Pli bone estas por mi sidi dum 2.5 jaroj, ol dum 5 jaroj. Se li ne diras ion, tiam ĉio pli, mi devas atesti, ĉar tiel mi ricevos liberecon. Simile, partoprenanto B ankaŭ argumentas.

Ne malfacile komprenas, ke la reganta strategio por ĉiu el la krimuloj estas la provo. La optimuma punkto de ĉi tiu ludo venas kiam ambaŭ krimuloj donas provojn kaj ricevas sian "premion" - 2.5 jarojn en malliberejo. Ludoteorio Nash nomas ĝin ekvilibro.

Malfacila Optimuma Nash Solvo

La revolucia naturo de la vidado de Nashev estas, ke tia ekvilibro ne estas optimuma, se oni konsideras la individuan partoprenanton kaj sian interesan intereson. Post ĉio, la plej bona eblo estas silenti kaj iri senpage.

La ekvilibro de Nash estas komuna punkto de intereso, kie ĉiu partoprenanto elektas eblon, kiu estas optimuma por li nur se la aliaj partoprenantoj elektas certan strategion.

Konsiderante la eblon, kiam ambaŭ krimuloj silentas kaj ricevas nur 1 jaron, vi povas nomi ĝin Pareto-optimuma opcio. Tamen, ĝi eblas nur se la krimuloj povus esti pretaj antaŭen. Sed eĉ ĉi tio ne garantius ĉi tiun rezulton, ĉar la tento reteni sin de persvado kaj eviti punon estas bonega. La manko de kompleta fido inter si kaj la risko de atingi 5 jarojn faras necese elekti varianton per rekono. Por pripensi la fakton, ke partoprenantoj subtenos la opcion per silento, agante en koncerto, estas simple neracia. Tia konkludo povas esti farita, se ni studas la Nash-ekvilibron. La ekzemploj nur pruvas la veron.

Selfisma aŭ racia

La teorio de la ekvilibro de Nash donis mirindajn konkludojn, refutante la antaŭtempajn principojn. Ekzemple, Adam Smith vidis la konduton de ĉiu el la partoprenantoj kiel tute egoisma, kio kondukis la sistemon en ekvilibron. Ĉi tiu teorio nomis "nevidebla mano de la merkato".

John Nash vidis, ke se ĉiuj partoprenantoj agas, sekvante nur siajn proprajn interesojn, tiam ĉi tio neniam kondukos al optimuma grupa rezulto. Konsiderante, ke racia pensado estas propra de ĉiu partoprenanto, la elekto, kiun la strategia strategio de Nash proponas, estas pli verŝajna.

Pura virseksa eksperimento

Vida ekzemplo estas la "paradokso de la blonda ludo", kiu, kvankam ŝajnas netaŭga, estas viva ilustraĵo montrante kiel funkcias la teorio de la ludo de Nash.

En ĉi tiu ludo vi devas imagi, ke la kompanio de liberaj homoj venis al la trinkejo. Proksime estas kompanio de knabinoj, unu el kiuj preferas al aliaj, ni diru blonda. Kiel gvidas sin mem por akiri la plej bonan koramikinon por si mem?

Do, la rezonado de la infanoj: se ĉiuj komencas konatiĝi kun la blonda, tiam plej verŝajne ŝi ne atingos iun ajn, ĉar ŝiaj amikoj ne volas renkonti. Neniu volas esti la dua rezerva opcio. Sed se la infanoj elektas eviti blonon, tiam la probablo por ke ĉiu el la infanoj trovi bonan fianĉinon inter knabinoj estas alta.

La situacio de Nash-ekvilibro ne estas optimuma por infanoj, ĉar, persekutante nur siajn proprajn egoismajn interesojn, ĉiuj elektus blonda. Oni povas vidi, ke la serĉado de nur egoismaj interesoj estos kalkulanta al la kolapso de grupaj interesoj. Ekvilibro laŭ Nash signifos, ke ĉiu ulo agas en siaj propraj interesoj, kiuj kontaktas la interesojn de la tuta grupo. Ĉi tio ne estas optimuma elekto por ĉiuj persone, sed optimuma por ĉiuj, bazita sur ĝenerala strategio de sukceso.

Nia tuta vivo estas ludo

Decidado en realaj kondiĉoj estas tre simila al la ludo, kiam vi atendas iun racionan konduton de aliaj partoprenantoj. En komerco, en laboro, en teamo, en kompanio kaj eĉ en rilato kun la kontraŭa sekso. De grandaj transakcioj al normalaj vivokazoj, ĉio obeas unu aŭ alian leĝon.

Kompreneble, la konsideritaj ludaj situacioj kun krimuloj kaj stango estas nur bonegaj ilustradoj, kiuj pruvas la nordan ekvilibron. Ekzemploj de tiaj dilemoj tre ofte ŝprucas en la vera merkato, kaj precipe ĝi funkcias en kazoj kun du monopolistoj kontrolante la merkaton.

Miksitaj strategioj

Ofte ni estas implikitaj ne en unu, sed en pluraj ludoj. Elektante unu el la ebloj por unu ludo, gvidata de racia strategio, sed vi eniras alian ludon. Post pluraj raciaj decidoj, vi eble trovos, ke via rezulto ne konvenas al vi. Kion fari?

Konsideru du tipojn de strategio:

  • Pura strategio estas la konduto de partoprenanto, kiu venas de pensado pri la ebla konduto de aliaj partoprenantoj.
  • Miksita strategio aŭ hazarda strategio alternas purajn strategiojn hazarde aŭ elektas pura strategio kun certa probablo. Ĉi tiu strategio ankaŭ estas nomata hazarde.

Konsiderante ĉi tiun konduton, ni ekrigardas la ekvilibron super la Neshu. Se vi antaŭe diris, ke la ludanto elektas strategion unufoje, tiam vi povas imagi alian konduton. Vi povas permesi la eblon, ke ludantoj elektas strategion aleatike kun certa probablo. Ludoj en kiuj oni ne povas trovi la ekvilibron de Nash en puraj strategioj, ĉiam havas ilin en miksitaj.

Nash-ekvilibro en miksitaj strategioj estas nomata miksita ekvilibro. Ĉi tio estas ekvilibro, kie ĉiu partoprenanto elektas la optimuman oftecon elekti siajn strategiojn, kondiĉe ke aliaj partoprenantoj elektas siajn strategiojn ĉe ofteco.

Puno kaj miksita strategio

Ekzemplo de miksita strategio povas esti donita en ludo de futbalo. La plej bona ilustraĵo de miksita strategio estas eble puno. Do ni havas golon, kiu povas salti nur en unu angulo, kaj ludanto, kiu venkos punon.

Do, se por la unua fojo la ludanto elektas strategion por fari sukceson en la maldekstra angulo, kaj la pordisto ankaŭ falos en ĉi tiun angulon kaj kaptos la pilkon, kiel povas okazaĵoj evolui por la dua fojo? Se ludanto trafas la kontraŭan angulon, ĉi tio verŝajne tro evidentas, sed la bato al la sama angulo ne estas malpli evidenta. Sekve, ambaŭ la pordisto kaj la strikanto havas neniun elekton sed fidi al hazarda elekto.

Do, alternanta hazarda elekto kun certa pura strategio, la ludanto kaj pordisto provas akiri la maksimuman rezulton.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 eo.unansea.com. Theme powered by WordPress.