
Spiele in der Extensivform
Bisher haben wir nur Spiele analysiert, bei denen die Spieler ihre Züge gleichzeitig durchführen. Dieses ist aber nicht nur in den meisten Gesellschaftsspielen, sondern auch in zahlreichen realen Situationen nicht der Fall. Hierzu ein Beispiel:
Die beiden Firmen A und B haben einen Vertrag
abgeschlossen. Hiernach ist A dazu verpflichtet B eine Dienstleistung zu
erbringen, die A selbst 100€ kostet. B soll dafür den Betrag 200€ an A
zahlen, wobei die Dienstleistung für B einen Wert von 400€ hat. Jeder der
Spieler hat also die Möglichkeit die Leistung, die er dem anderen zugesichert
hat zu erbringen oder nicht. Im Unterschied zu den bisher untersuchten Spielen
handeln die Spieler hier nicht gleichzeitig sondern nacheinander. Derartige
Situationen stellt man in der Spieltheorie in Form eines so genannten Spielbaumes
dar. Zunächst die entsprechende Illustration für unser Beispiel:

Wir sehen, dass die verschiedenen Zustände
des Spiels durch Kreise abgebildet sind. Ein derartiges Objekt in einer
Baumstruktur nennt man Knoten. Besondere Knoten
sind zum einen der Knoten ganz oben, also der Anfangsknoten, den man Wurzel
nennt, und die Knoten, die einen Endzustand des Spiels kennzeichnen, also einen
Zustand, an dem kein Spieler mehr handeln kann und die einzelnen Erträge feststehen.
Diese bezeichnet man als Blätter. Die einzelnen Zustände werden durch die Züge
der Spieler herbeigeführt. Dies bedeutet, dass zwei Zustände durch einen
Spielzug verbunden werden. Die Verbindungen im Spielbaum werden Kanten
genannt.
Um in einem Baum von einem Knoten aus die
verschiedenen möglichen Züge einzuschätzen, bedient man sich der Rückverfolgung.
Hierbei untersucht man den Baum ausgehend von den Blättern. Zunächst sucht man
Blätter, die alle über eine Kante mit demselben Knoten verbunden sind. In
unserem Spielbaum führen die beiden Blätter für die Strategiekombinationen
(nicht leisten, nicht zahlen) und (nicht leisten, zahlen) zu demselben Knoten
zurück. Da sich ein Spieler in jedem Fall für die aus seiner Sicht beste Alternative
entscheiden wird, sucht man den Endzustand mit dem besten Ergebnis für den
Spieler. In unserem Beispiel ist dies "nicht zahlen". Folglich kann
man annehmen, dass in dem Fall, das der Knoten, von dem die beiden Blätter
ausgehen erreicht wird, die Payoff-Zuteilung erreicht wird, die für das aus
Sicht des Spielers, der an dem Knoten am Zug ist, beste Blatt ist. Dasselbe macht man nun für die weiteren Blätter.
Danach tastet sich der Algorithmus nach diesem Schema weiter Ebene für Ebene
hoch, bis er schließlich an die Wurzel
gelangt und somit den gesamten Baum analysiert hat.
In unserem Beispiel finden wir nach dieser
Methode heraus, dass es für Spieler B, egal wie sich Spieler A entschieden hat,
am besten ist nicht zu zahlen, denn so erreicht er immer den besseren Payoff als
mit der anderen Strategie. Somit kann man "nicht zahlen" als für B dominante
Strategie bezeichnen. Spieler A weiß dieses, er geht also davon aus, dass
Spieler B die für ihn dominante Strategie ausspielt und betrachtet seine
Entscheidung natürlich unter diesem Aspekt. Es ist für ihn also in jedem Fall
am besten die Leistung nicht zu erbringen, demzufolge ist (nicht leisten, nicht
zahlen) das Nash-Gleichgewicht dieses Spiels.
Man bemerkt hier, dass die beiden Spieler
einen besseren Payoff eingefahren hätten, wenn sie sich an den Vertrag gehalten
hätten, demzufolge kann man hier ein Gefangenendilemma erkennen.
Ein weiteres Beispiel für ein sequentielles
Spiel ist das folgende:
Ein großer Pharmakonzern hat vor vielen
Jahren ein Medikament gegen eine bestimmte Magenkrankheit entwickelt. Der
Wirkstoff ist durch den Konzern patentiert und andere Wirkstoffe wurden bisher
nicht erforscht, folglich ist der Konzern ein Monopolist. Nun ist aber das
Patent abgelaufen und ein kleinerer Generikahersteller plant ein ähnliches
Medikament zu produzieren. Der Monopolist droht daraufhin im Falle eines
Markteintritts durch das Unternehmen mit einem ruinösen Preiskampf zu beginnen.
Nun ist es interessant, inwieweit diese Drohung glaubhaft ist und wie sich der
Generikahersteller wohl entscheiden wird. Dazu fassen wir die Situation als
Spiel in der Extensivform auf. Die beteiligten Spieler sind der Monopolist und
der Generikahersteller. Der Generikahersteller ist zuerst am Zug und bestimmt ob
er in den Markt eintreten soll oder nicht. Daraufhin entscheidet der Monopolist
im Falle dass die Entscheidung des Generikaherstellers positiv ausfällt über
die Wahrmachung seiner Drohung. Die entsprechenden Payoffs sind im Spielbaum zu
sehen:

Entsprechend der
Rückverfolgung untersuchen wir zunächst die Entscheidungsalternativen des
Monopolisten. Für diesen ist es am besten keine Preisschlacht anzufangen. Nun wird
vor diesem Hintergrund die beste Strategie für
den Generikahersteller ermittelt und das ist auf jeden Fall der Markteintritt
(ein Payoff von 500 ist besser als einer von 0).
Im Bezug auf die beiden dargestellten Spiele lässt
sich eine neue Form der Beschreibung von Spielen neben der Normalform einführen,
nämlich die Extensivform. Hierbei gelten grundsätzlich die gleichen Annahmen,
jedoch kann die Extensivform eine viel komplexere Beschreibung der Strategieräume
leisten als die Normalform. Die Extensivform eines Spiels enthält als Angaben
Folgendes:
|
die Menge der Spieler |
|
|
zu welchem Zeitpunkt welcher Spieler am Zug ist |
|
|
Was weiß der Spieler wenn er am Zug ist (es gibt
auch Situationen, in denen der Spieler nicht genau weiß welchen Zustand das
Spiel erreicht hat, wenn er zwischen verschiedenen Möglichkeiten wählen kann,
dazu später mehr) |
|
|
die Aktionen, die den einzelnen Spielern für die
verschiedenen Spielzustände zur Verfügung stehen |
|
|
den Payoff jedes Spielers für jede Kombination von Zügen |
Untersuchen wir einmal das Gefangenendilemma
vom Anfang dieser Arbeit in der Extensivform. Hierbei gehen wir von Folgendem
aus:
Zuerst ist Spieler 1 am Zug und entscheidet,
ob er redet oder schweigt. Danach entscheidet sich Spieler 2. Hierbei gilt aber,
dass Spieler 2 nicht weiß, wofür sich Spieler 1 entschieden hat.
Hierfür
sollen zunächst folgende
Definitionen eingeführt werden:
| Definition:
Ein Entscheidungsknoten in einem
Spielbaum ist ein Knoten, an dem sich ein Spieler für eine Strategie
entscheiden muss. |
|
Definition:
Eine Informationsmenge ist
eine Menge von Knoten mit folgende Eigenschaften: -
an jedem Knoten ist derselbe Spieler am Zug -
der Spieler kann zwischen den einzelnen Knoten der Menge nicht unterscheiden,
d.h. wenn sich mehrere Knoten in der Menge befinden, weiß der Spieler nicht,
an welchem Knoten er sich zu der Zeit befindet -
an jedem Knoten hat der Spieler dieselben Entscheidungsmöglichkeiten Jeder
Knoten in einem Spielbaum ist in einer Informationsmenge enthalten. |
| Definition:
Wenn ein Spiel nur aus einelementigen Informationsmengen besteht, so ist dies
ein Spiel mit perfekter Information,
andernfalls mit imperfekter Information. |
Bei einem Spiel mit perfekter Information in
der Extensivform gibt es im Allgemeinen immer genau ein teilspielperfektes
Nash-Gleichgewicht. Dies liegt daran, dass man bei einem solchen Spiel durch die
Rückwärtsinduktion nur auf Entscheidungsknoten stößt. An diesen Knoten hat
der jeweilige Spieler die Auswahl aus einer endlichen Menge von Entscheidungen,
es gibt also eine Lösung. Da unterschiedliche Aktionen nicht zu gleichen Erträgen
führen müssen, gibt es also eine optimale Lösung für diese
Entscheidungsprobleme und somit ein teilspielperfektes Nash-Gleichgewicht.
In unserer Variation des Gefangenendilemmas
bilden also die beiden Entscheidungsknoten an denen Spieler 2 am Zug ist eine
Informationsmenge, denn Spieler 2 weiß nicht was Spieler 1 gewählt hat.
Demzufolge ist dies ein Spiel mit imperfekter Information. Die Informationsmenge
stelle ich in einem Spielbaum so dar, dass die Entscheidungsknoten in der Menge
in ein Oval eingebunden sind. D.h. wir erhalten für das Gefangenendilemma
folgenden Spielbaum:

Für die Analyse von Spielen in der
Extensivform müssen die bisherigen Untersuchungsmethoden etwas erweitert
werden. So lässt sich ein extensives Spiel in Teilspiele zerlegen:
| Definition:
Ein Teilspiel eines Spiels G
in der Extensivform
beginnt im Entscheidungsknoten K
und enthält alle Knoten, die diesem Knoten nachfolgen. Es werden durch das
Teilspiel keine nachfolgenden Informationsmengen durchtrennt. |
Diese Zerlegung kann man sich folgendermaßen
zu Nutze machen:
| Definition:
Ein Nash-Gleichgewicht ist teilspielperfekt,
wenn es ein Nash-Gleichgewicht in jedem Teilspiel von G
ist. |
Die Nash-Gleichgewichte, die wir in den beiden
Spielen bestimmt haben, sind also teilspielperfekt. Für das Gefangenendilemma
ist (schweigen, schweigen) ein teilspielperfektes Nash-Gleichgewicht.
Wir haben bei dem Vertragsspiel
herausgefunden, dass beide Spieler gegen ihren Vertrag verstoßen, wenn sie
rational handeln. In der Realität wird jedoch meistens gegen derartige Verträge
nicht verstoßen. Wie können wir also unser Modell präzisieren?
In der Realität gibt es für jemanden, der
Opfer eines Vertragsbruchs wurde die Möglichkeit den anderen vor Gericht
anzuklagen. Diese Möglichkeit soll an dieser Stelle auch modelliert werden. So
kann A darauf klagen, dass B die im Vertrag festgehaltene Zahlungsleistung
erbringt. Dabei muss man zwischen so genannten legitimen und opportunistischen
Klagen unterscheiden. Eine opportunistische Klage ist in diesem Fall, wenn B A
wegen Unterlassung der Zahlung anklagt, obwohl B gezahlt hat. Hierbei muss man
sich klarmachen, dass opportunistische Klagen beim Richter ein
Entscheidungsproblem erzeugen. Dieser muss untersuchen, ob die Klage nun
berechtigt ist oder nicht. Dabei stellt sich die Schwierigkeit, dass er nicht
genau über alle Umstände informiert ist, da er ja kein Beteiligter ist. Der
Richter soll an dieser Stelle durch zwei Eigenschaften modelliert sein. Einmal
die Siegeswahrscheinlichkeit opportunistischer Klagen Sopp
und einmal die Siegeswahrscheinlichkeit legitimer Klagen Sleg.
Bei einem perfekten Richter würde Sopp=0
und Sleg=1 gelten. In
der Realität hat man aber mit imperfekten Richtern zu tun.
Bei der Analyse dieses Problems müssen darüber
hinaus noch die Gerichtskosten berücksichtigt werden. Zu unterscheiden ist
zwischen den Gerichtskosten des Klägers und denen des Beklagten. Es gibt zwei
verschiedene Regelungen für die Verteilung der Gerichtskosten:
| das britische System: hier muss die unterliegende Partei die Kosten
beider Seiten tragen |
|
| das amerikanische System: hier müssen beide Seiten selbst für
ihre Kosten aufkommen |
Nun
stellt sich die Frage, wie man die richterliche Entscheidung in den Spielbaum
einbaut. Dies geschieht folgendermaßen: Nach der Entscheidung von B, ob dieser
zahlt oder nicht, kann sich A für oder gegen eine Klage entscheiden. Dabei hat
er, wenn B nicht gezahlt hat die Erfolgswahrscheinlichkeit einer legitimen
Klage, wenn B doch gezahlt hat die Erfolgswahrscheinlichkeit einer
opportunistischen Klage. Dabei kann man die Payoffs der auf den letzten
Entscheidungsknoten von A folgenden Blätter anhand des Erwartungswertes der
Klage abzüglich der Gerichtskosten ermitteln.
Es ist nun interessant zu wissen, wie sich die
einzelnen Parameter eines solchen Gerichtssystems verhalten müssen, damit die
Parteien dazu ermutigt werden zusammenzuarbeiten. Daher soll von jetzt an nicht
mehr mit konkreten Werten für die Parameter sondern mit Variablen gearbeitet
werden. Hierbei bezeichnet a die Leistung von A, b die Leistung von B und c den
Wert, den die Leistung von B für A hat. Darüber hinaus setze ich von jetzt an
voraus, dass B nicht zahlen wird wenn A keine Leistung erbracht hat, daher wird
der Entscheidungsknoten von B nun zu einem Blatt mit den entsprechenden
Payoff-Verteilungen. Es entsteht also folgender Spielbaum:

(1)
Etleg-a, Etleg+c
(2)
Etopp-a+b, Etleg+c-b
Dabei ist
Ets
der Erwartungswert für A bei einer Klage vom Status s und der
Gerichtskostenregelung t. t kann entweder den Wert 1 oder den Wert 2 annehmen.
Dabei steht 1 für ein amerikanisches Kostenverteilungssystem und 2 für ein
britisches und s kann leg oder opp sein. Ets
bezeichnet entsprechend den Payoff der Gerichtsverhandlung für B. Dieser Wert
kann logischerweise nur negativ sein, denn als Beklagter wird B im Falle einer
Verurteilung Geld an A zahlen müssen. Selbst wenn B nicht verurteilt wird, müssen
immer noch Prozesskosten gezahlt werden. Die beiden Klagen hängen vom Status
der Klage ab, von der entsprechenden Siegwahrscheinlichkeit und von den
entsprechenden Kosten für Kläger und Beklagtem sowie der
Gerichtskostenverteilungsregel.
Man sollte sich klar machen, dass der Richter
hier nicht explizit modelliert ist.
Seine einzigen Eigenschaften, die Siegwahrscheinlichkeiten für die jeweiligen
Klagearten, finden in der Berechnung der Erwartungswerte der Verhandlung
Ausdruck.
Es können für diese Wahrscheinlichkeiten Sleg
und Sopp
folgende Bedingungen gelten:
·
Sleg=1 und
Sopp=0. In diesem Fall
wird von den Parteien erwartet, dass ein perfekter Richter über sie urteilt.
Dem Kläger ist schon vor der Verhandlung klar, welcher Wert im zugesprochen
wird, denn der Kläger weiß, ob seine Klage opportunistisch oder legitim ist.
Die Gegenleistung von B ist also
von den Parteien perfekt verifizierbar. Wichtig anzumerken ist darüber hinaus,
dass selbst ein perfekter Richter keine hinreichende Bedingung dafür ist, dass
die Parteien zur Zusammenarbeit angestiftet werden. Hier spielen die anderen
Variablen, wie wir noch sehen werden eine große Rolle.
·
Sleg =
Sopp : In diesem Fall
ist die Gegenleistung nicht verifizierbar. Die Entscheidung des Richters hat die
Qualität eines zufälligen Losverfahrens
·
Sleg <
Sopp: Hier herrscht
so genannte negative Verifizierbarkeit. Die Qualität des Richters wird als sehr
gering angesehen. (Möglicherweise könnte man so bestochene oder nicht neutrale
Richter beschreiben.)
·
1> Sleg >
Sopp>0: In diesem
Fal, ist die Gegenleistung imperfekt verifizierbar.
Eine anstrebenswerte Situation wäre es die
Rahmenbindungen so festzulegen, dass es für die Parteien rational ist, wenn sie
den Vertrag erfüllen und keine opportunistischen Klagen führen.
In einem solchen Fall müssen opportunistische
Klagen einen negativen Betrag einbringen, legitime Klagen hingegen einen
positiven, also lässt sich als erste Bedingung formulieren:
Sleg >0> Sopp
Zusätzlich muss der Erwartungswert der
Belastung, die für B bei einer legitimen Klage entsteht kleiner sein, als die
Zahlung, die B gemäß Vertrag hätte leisten müssen, also:
Etleg<-b
Des Weiteren muss eine positive
Verifizierbarkeit der Gegenleistung von B gegen A sein. Andernfalls nämlich ließe
sich A nicht dazu ermutigen auf opportunistische Klagen zu verzichten und nur
legitime Klagen zu führen.