Spiele in der Extensivform

 

Bisher haben wir nur Spiele analysiert, bei denen die Spieler ihre Züge gleichzeitig durchführen. Dieses ist aber nicht nur in den meisten Gesellschaftsspielen, sondern auch in zahlreichen realen Situationen nicht der Fall. Hierzu ein Beispiel:

 

Die beiden Firmen A und B haben einen Vertrag abgeschlossen. Hiernach ist A dazu verpflichtet B eine Dienstleistung zu erbringen, die A selbst 100€ kostet. B soll dafür den Betrag 200€ an A zahlen, wobei die Dienstleistung für B einen Wert von 400€ hat. Jeder der Spieler hat also die Möglichkeit die Leistung, die er dem anderen zugesichert hat zu erbringen oder nicht. Im Unterschied zu den bisher untersuchten Spielen handeln die Spieler hier nicht gleichzeitig sondern nacheinander. Derartige Situationen stellt man in der Spieltheorie in Form eines so genannten Spielbaumes dar. Zunächst die entsprechende Illustration für unser Beispiel:

 

    

Wir sehen, dass die verschiedenen Zustände des Spiels durch Kreise abgebildet sind. Ein derartiges Objekt in einer Baumstruktur nennt man Knoten. Besondere Knoten sind zum einen der Knoten ganz oben, also der Anfangsknoten, den man Wurzel nennt, und die Knoten, die einen Endzustand des Spiels kennzeichnen, also einen Zustand, an dem kein Spieler mehr handeln kann und die einzelnen Erträge feststehen. Diese bezeichnet man als Blätter. Die einzelnen Zustände werden durch die Züge der Spieler herbeigeführt. Dies bedeutet, dass zwei Zustände durch einen Spielzug verbunden werden. Die Verbindungen im Spielbaum werden Kanten genannt. 

 

Um in einem Baum von einem Knoten aus die verschiedenen möglichen Züge einzuschätzen, bedient man sich der Rückverfolgung. Hierbei untersucht man den Baum ausgehend von den Blättern. Zunächst sucht man Blätter, die alle über eine Kante mit demselben Knoten verbunden sind. In unserem Spielbaum führen die beiden Blätter für die Strategiekombinationen (nicht leisten, nicht zahlen) und (nicht leisten, zahlen) zu demselben Knoten zurück. Da sich ein Spieler in jedem Fall für die aus seiner Sicht beste Alternative entscheiden wird, sucht man den Endzustand mit dem besten Ergebnis für den Spieler. In unserem Beispiel ist dies "nicht zahlen". Folglich kann man annehmen, dass in dem Fall, das der Knoten, von dem die beiden Blätter ausgehen erreicht wird, die Payoff-Zuteilung erreicht wird, die für das aus Sicht des Spielers, der an dem Knoten am Zug ist, beste Blatt ist. Dasselbe macht man nun für die weiteren Blätter. Danach tastet sich der Algorithmus nach diesem Schema weiter Ebene für Ebene hoch, bis er schließlich an die Wurzel gelangt und somit den gesamten Baum analysiert hat.

 

In unserem Beispiel finden wir nach dieser Methode heraus, dass es für Spieler B, egal wie sich Spieler A entschieden hat, am besten ist nicht zu zahlen, denn so erreicht er immer den besseren Payoff als mit der anderen Strategie. Somit kann man "nicht zahlen" als für B dominante Strategie bezeichnen. Spieler A weiß dieses, er geht also davon aus, dass Spieler B die für ihn dominante Strategie ausspielt und betrachtet seine Entscheidung natürlich unter diesem Aspekt. Es ist für ihn also in jedem Fall am besten die Leistung nicht zu erbringen, demzufolge ist (nicht leisten, nicht zahlen) das Nash-Gleichgewicht dieses Spiels.

 

Man bemerkt hier, dass die beiden Spieler einen besseren Payoff eingefahren hätten, wenn sie sich an den Vertrag gehalten hätten, demzufolge kann man hier ein Gefangenendilemma erkennen.

 

Ein weiteres Beispiel für ein sequentielles Spiel ist das folgende:

 

Ein großer Pharmakonzern hat vor vielen Jahren ein Medikament gegen eine bestimmte Magenkrankheit entwickelt. Der Wirkstoff ist durch den Konzern patentiert und andere Wirkstoffe wurden bisher nicht erforscht, folglich ist der Konzern ein Monopolist. Nun ist aber das Patent abgelaufen und ein kleinerer Generikahersteller plant ein ähnliches Medikament zu produzieren. Der Monopolist droht daraufhin im Falle eines Markteintritts durch das Unternehmen mit einem ruinösen Preiskampf zu beginnen. Nun ist es interessant, inwieweit diese Drohung glaubhaft ist und wie sich der Generikahersteller wohl entscheiden wird. Dazu fassen wir die Situation als Spiel in der Extensivform auf. Die beteiligten Spieler sind der Monopolist und der Generikahersteller. Der Generikahersteller ist zuerst am Zug und bestimmt ob er in den Markt eintreten soll oder nicht. Daraufhin entscheidet der Monopolist im Falle dass die Entscheidung des Generikaherstellers positiv ausfällt über die Wahrmachung seiner Drohung. Die entsprechenden Payoffs sind im Spielbaum zu sehen:

 

 

Entsprechend der Rückverfolgung untersuchen wir zunächst die Entscheidungsalternativen des Monopolisten. Für diesen ist es am besten keine Preisschlacht anzufangen. Nun wird vor diesem Hintergrund die beste Strategie für den Generikahersteller ermittelt und das ist auf jeden Fall der Markteintritt  (ein Payoff von 500 ist besser als einer von 0).

 

Im Bezug auf die beiden dargestellten Spiele lässt sich eine neue Form der Beschreibung von Spielen neben der Normalform einführen, nämlich die Extensivform. Hierbei gelten grundsätzlich die gleichen Annahmen, jedoch kann die Extensivform eine viel komplexere Beschreibung der Strategieräume leisten als die Normalform. Die Extensivform eines Spiels enthält als Angaben Folgendes:

die Menge der Spieler

 zu welchem Zeitpunkt welcher Spieler am Zug ist

Was weiß der Spieler wenn er am Zug ist (es gibt auch Situationen, in denen der Spieler nicht genau weiß welchen Zustand das Spiel erreicht hat, wenn er zwischen verschiedenen Möglichkeiten wählen kann, dazu später mehr)

die Aktionen, die den einzelnen Spielern für die verschiedenen Spielzustände zur Verfügung stehen

den Payoff jedes Spielers für jede Kombination von Zügen

    

Untersuchen wir einmal das Gefangenendilemma vom Anfang dieser Arbeit in der Extensivform. Hierbei gehen wir von Folgendem aus:

Zuerst ist Spieler 1 am Zug und entscheidet, ob er redet oder schweigt. Danach entscheidet sich Spieler 2. Hierbei gilt aber, dass Spieler 2 nicht weiß, wofür sich Spieler 1 entschieden hat.

 

Hierfür sollen zunächst folgende Definitionen eingeführt werden:

 

Definition: Ein Entscheidungsknoten in einem Spielbaum ist ein Knoten, an dem sich ein Spieler für eine Strategie entscheiden muss.  

 

Definition: Eine Informationsmenge ist eine Menge von Knoten mit folgende Eigenschaften:

- an jedem Knoten ist derselbe Spieler am Zug

- der Spieler kann zwischen den einzelnen Knoten der Menge nicht unterscheiden, d.h. wenn sich mehrere Knoten in der Menge befinden, weiß der Spieler nicht, an welchem Knoten er sich zu der Zeit befindet

 - an jedem Knoten hat der Spieler dieselben Entscheidungsmöglichkeiten  

Jeder Knoten in einem Spielbaum ist in einer Informationsmenge enthalten.  

   

 

Definition: Wenn ein Spiel nur aus einelementigen Informationsmengen besteht, so ist dies ein Spiel mit perfekter Information, andernfalls mit imperfekter Information.  

 

Bei einem Spiel mit perfekter Information in der Extensivform gibt es im Allgemeinen immer genau ein teilspielperfektes Nash-Gleichgewicht. Dies liegt daran, dass man bei einem solchen Spiel durch die Rückwärtsinduktion nur auf Entscheidungsknoten stößt. An diesen Knoten hat der jeweilige Spieler die Auswahl aus einer endlichen Menge von Entscheidungen, es gibt also eine Lösung. Da unterschiedliche Aktionen nicht zu gleichen Erträgen führen müssen, gibt es also eine optimale Lösung für diese Entscheidungsprobleme und somit ein teilspielperfektes Nash-Gleichgewicht.

 

In unserer Variation des Gefangenendilemmas bilden also die beiden Entscheidungsknoten an denen Spieler 2 am Zug ist eine Informationsmenge, denn Spieler 2 weiß nicht was Spieler 1 gewählt hat. Demzufolge ist dies ein Spiel mit imperfekter Information. Die Informationsmenge stelle ich in einem Spielbaum so dar, dass die Entscheidungsknoten in der Menge in ein Oval eingebunden sind. D.h. wir erhalten für das Gefangenendilemma folgenden Spielbaum:

 

 

Für die Analyse von Spielen in der Extensivform müssen die bisherigen Untersuchungsmethoden etwas erweitert werden. So lässt sich ein extensives Spiel in Teilspiele zerlegen:

 

 

Definition: Ein Teilspiel eines Spiels G in der Extensivform  beginnt im Entscheidungsknoten K und enthält alle Knoten, die diesem Knoten nachfolgen. Es werden durch das Teilspiel keine nachfolgenden Informationsmengen durchtrennt.  

 

Diese Zerlegung kann man sich folgendermaßen zu Nutze machen:

   

 

Definition: Ein Nash-Gleichgewicht ist teilspielperfekt, wenn es ein Nash-Gleichgewicht in jedem Teilspiel von G ist.  

 

Die Nash-Gleichgewichte, die wir in den beiden Spielen bestimmt haben, sind also teilspielperfekt. Für das Gefangenendilemma ist (schweigen, schweigen) ein teilspielperfektes Nash-Gleichgewicht.

 

Wir haben bei dem Vertragsspiel herausgefunden, dass beide Spieler gegen ihren Vertrag verstoßen, wenn sie rational handeln. In der Realität wird jedoch meistens gegen derartige Verträge nicht verstoßen. Wie können wir also unser Modell präzisieren?

 

In der Realität gibt es für jemanden, der Opfer eines Vertragsbruchs wurde die Möglichkeit den anderen vor Gericht anzuklagen. Diese Möglichkeit soll an dieser Stelle auch modelliert werden. So kann A darauf klagen, dass B die im Vertrag festgehaltene Zahlungsleistung erbringt. Dabei muss man zwischen so genannten legitimen und opportunistischen Klagen unterscheiden. Eine opportunistische Klage ist in diesem Fall, wenn B A wegen Unterlassung der Zahlung anklagt, obwohl B gezahlt hat. Hierbei muss man sich klarmachen, dass opportunistische Klagen beim Richter ein Entscheidungsproblem erzeugen. Dieser muss untersuchen, ob die Klage nun berechtigt ist oder nicht. Dabei stellt sich die Schwierigkeit, dass er nicht genau über alle Umstände informiert ist, da er ja kein Beteiligter ist. Der Richter soll an dieser Stelle durch zwei Eigenschaften modelliert sein. Einmal die Siegeswahrscheinlichkeit opportunistischer Klagen Sopp und einmal die Siegeswahrscheinlichkeit legitimer Klagen Sleg. Bei einem perfekten Richter würde Sopp=0 und Sleg=1 gelten. In der Realität hat man aber mit imperfekten Richtern zu tun.

 

Bei der Analyse dieses Problems müssen darüber hinaus noch die Gerichtskosten berücksichtigt werden. Zu unterscheiden ist zwischen den Gerichtskosten des Klägers und denen des Beklagten. Es gibt zwei verschiedene Regelungen für die Verteilung der Gerichtskosten:

das britische System: hier muss die unterliegende Partei die Kosten beider Seiten tragen
das amerikanische System: hier müssen beide Seiten selbst für ihre Kosten aufkommen

 

 

 Nun stellt sich die Frage, wie man die richterliche Entscheidung in den Spielbaum einbaut. Dies geschieht folgendermaßen: Nach der Entscheidung von B, ob dieser zahlt oder nicht, kann sich A für oder gegen eine Klage entscheiden. Dabei hat er, wenn B nicht gezahlt hat die Erfolgswahrscheinlichkeit einer legitimen Klage, wenn B doch gezahlt hat die Erfolgswahrscheinlichkeit einer opportunistischen Klage. Dabei kann man die Payoffs der auf den letzten Entscheidungsknoten von A folgenden Blätter anhand des Erwartungswertes der Klage abzüglich der Gerichtskosten ermitteln.

 

Es ist nun interessant zu wissen, wie sich die einzelnen Parameter eines solchen Gerichtssystems verhalten müssen, damit die Parteien dazu ermutigt werden zusammenzuarbeiten. Daher soll von jetzt an nicht mehr mit konkreten Werten für die Parameter sondern mit Variablen gearbeitet werden. Hierbei bezeichnet a die Leistung von A, b die Leistung von B und c den Wert, den die Leistung von B für A hat. Darüber hinaus setze ich von jetzt an voraus, dass B nicht zahlen wird wenn A keine Leistung erbracht hat, daher wird der Entscheidungsknoten von B nun zu einem Blatt mit den entsprechenden Payoff-Verteilungen. Es entsteht also folgender Spielbaum:

 

 

 

(1) Etleg-a, Etleg+c

(2) Etopp-a+b, Etleg+c-b

 

Dabei ist Ets der Erwartungswert für A bei einer Klage vom Status s und der Gerichtskostenregelung t. t kann entweder den Wert 1 oder den Wert 2 annehmen. Dabei steht 1 für ein amerikanisches Kostenverteilungssystem und 2 für ein britisches und s kann leg oder opp sein. Ets bezeichnet entsprechend den Payoff der Gerichtsverhandlung für B. Dieser Wert kann logischerweise nur negativ sein, denn als Beklagter wird B im Falle einer Verurteilung Geld an A zahlen müssen. Selbst wenn B nicht verurteilt wird, müssen immer noch Prozesskosten gezahlt werden. Die beiden Klagen hängen vom Status der Klage ab, von der entsprechenden Siegwahrscheinlichkeit und von den entsprechenden Kosten für Kläger und Beklagtem sowie der Gerichtskostenverteilungsregel.

 

Man sollte sich klar machen, dass der Richter hier nicht explizit  modelliert ist. Seine einzigen Eigenschaften, die Siegwahrscheinlichkeiten für die jeweiligen Klagearten, finden in der Berechnung der Erwartungswerte der Verhandlung Ausdruck.

 

Es können für diese Wahrscheinlichkeiten Sleg und Sopp folgende Bedingungen gelten:

·        Sleg=1 und Sopp=0. In diesem Fall wird von den Parteien erwartet, dass ein perfekter Richter über sie urteilt. Dem Kläger ist schon vor der Verhandlung klar, welcher Wert im zugesprochen wird, denn der Kläger weiß, ob seine Klage opportunistisch oder legitim ist. Die Gegenleistung von B ist also von den Parteien perfekt verifizierbar. Wichtig anzumerken ist darüber hinaus, dass selbst ein perfekter Richter keine hinreichende Bedingung dafür ist, dass die Parteien zur Zusammenarbeit angestiftet werden. Hier spielen die anderen Variablen, wie wir noch sehen werden eine große Rolle.

·        Sleg = Sopp : In diesem Fall ist die Gegenleistung nicht verifizierbar. Die Entscheidung des Richters hat die Qualität eines zufälligen Losverfahrens

·        Sleg < Sopp: Hier herrscht so genannte negative Verifizierbarkeit. Die Qualität des Richters wird als sehr gering angesehen. (Möglicherweise könnte man so bestochene oder nicht neutrale Richter beschreiben.)

·        1> Sleg > Sopp>0: In diesem Fal, ist die Gegenleistung imperfekt verifizierbar.

 

Eine anstrebenswerte Situation wäre es die Rahmenbindungen so festzulegen, dass es für die Parteien rational ist, wenn sie den Vertrag erfüllen und keine opportunistischen Klagen führen.

 

 

In einem solchen Fall müssen opportunistische Klagen einen negativen Betrag einbringen, legitime Klagen hingegen einen positiven, also lässt sich als erste Bedingung formulieren:

Sleg >0> Sopp                                                        

 

Zusätzlich muss der Erwartungswert der Belastung, die für B bei einer legitimen Klage entsteht kleiner sein, als die Zahlung, die B gemäß Vertrag hätte leisten müssen, also:

 

Etleg<-b

 

Des Weiteren muss eine positive Verifizierbarkeit der Gegenleistung von B gegen A sein. Andernfalls nämlich ließe sich A nicht dazu ermutigen auf opportunistische Klagen zu verzichten und nur legitime Klagen zu führen. Dies ist ein Beispiel wie man Regeln oder Regelungssysteme entwerfen kann, indem man spieltheoretische Konzepte nutzt. Dieses Beispiel lässt sich noch viel weiter ausdehnen. So könnte man die Rolle eines Anwaltes in die Untersuchung einbeziehen. Dabei beeinflussen unterschiedlich gute Anwälte die Erfolgswahrscheinlichkeiten der Klagen. Es ist sehr interessant, wie man Gesetze und Rechtssysteme aus spieltheoretischer Sicht betrachten kann.