Spieltheorie des Verhandelns  - Bargaining Theory

 

Die kooperative Spieltheorie findet ein interessantes Anwendungsfeld in der so genannten Spieltheorie des Verhandelns, der Bargaining Theory. Von einem grundlegenden Verhandlungsproblem ausgehend können viele komplexere Verhandlungs- und Kooperationsmöglichkeiten untersucht werden. Über die Konzepte lassen sich auch wirtschaftliche Prozesse, wie z.B. die Preisbildung auf einem Markt untersuchen. Daher erhält dieser Bereich der Spieltheorie in dieser Arbeit, die die Anwendung der Spieltheorie für wirtschaftliche Probleme erläutern soll, besonders großes Gewicht.

 

Ein Verhandlungsproblem besteht formal beschrieben aus M Auszahlungskombinationen, die n Spieler miteinander realisieren können. Die Kombinationen können höchst unterschiedliche Ergebnisse für die einzelnen Spieler bringen. Dabei gibt es eine spezielle Auszahlungskombination für den Fall, dass sich die Spieler nicht einigen können, die so genannte Konfliktauszahlung. Man nimmt bei einem Verhandlungsproblem an, dass es mindestens eine Auszahlungskombination gibt, mit der alle Spieler einen höheren Ertrag einfahren, als bei der Konfliktauszahlung.

 

Um das Ganze an einem Problem zu verdeutlichen nehmen wir einmal Folgendes an:

Zwei Firmen können durch eine Zusammenarbeit einen Profit erreichen, der maximal 1 beträgt. Die beiden Unternehmen verhandeln nun über die Verteilung der Kooperationsrente. Hierbei gilt, wenn x1 für den Anteil von Unternehmen A und x2 für den Anteil von Unternehmen B steht, dass x1+x2<=1 gelten muss. Dabei sind alle Verteilungen, wo x1+x2<1     

ist, pareto-ineffizient, denn jeder der beiden Spieler könnte seinen Anteil erhöhen bis die Summe der beiden Anteile 1 ergibt ohne dem jeweils anderen zu schaden.

 

Zur Lösung derartiger Probleme gibt es die so genannten Nash-Axiome. Dies sind Bedingungen, die eine Lösung eines Verhandlungsproblems erfüllen muss:

 

Die Nash-Axiome

 

  1. Die Güterverteilung sollte sich nicht ändern, wenn die Nutzenfunktionen der  Akteure postiv-affin geändert werden
  2. Das Ergebnis soll Pareto-effizient sein
  3. Das Verhandlungsergebnis soll sich nicht ändern, wenn Möglichkeiten weggelassen werden, die ohnehin niemand gewählt hätte

 

Anhand dieser Axiome lässt sich unser Verhandlungsproblem lösen. Zunächst ermitteln wir dafür einen Graphen für die Verteilung der Güter:

 

 

Es ist also möglich, dass jeder Punkt, der innerhalb des von  x1-Achse, x2-Achse und des Funktionsgraphen begrenzten Bereichs liegt, eine Verteilung darstellt, die unsere Lösung ist. Nach dem Nash-Axiom Nummer 2 lässt sich jedoch schon eine starke Einschränkung machen: Das Axiom besagt, dass eine Lösung pareto-effizient sein muss, folglich kommen als Lösung der Verhandlung nur Verteilungen, die genau auf dem Funktionsgraphen liegen in Frage. 

 

Da beide Spieler nach einer maximalen Zuteilung streben, gilt dass das Produkt aus x1 und x2 maximiert werden soll. Graphisch gesehen lässt sich das Problem also so formulieren, dass ein Rechteck gezeichnet werden soll, das einen Eckpunkt auf der x2-Achse und einen auf dem Funktionsgraphen hat.

Der Flächeninhalt eines solchen Rechtecks lässt sich in Abhängigkeit von x1 durch folgende Funktion darstellen:

 

f(x1)=(1-x1)*x1= -x12  + x1

 

Diese Funktion hat als Graphen eine umgedrehte Parabel. Der Scheitelpunkt der Parabel, also in diesem Fall der Punkt, an dem der Funktionsgraph den höchsten Wert erreicht hat, lässt sich über die so genannte Scheitelpunktsform der Parabel ermitteln. Wenn die Funktionsgleichung y= - (x-b)2 + c ist, erreicht der Graph seinen Scheitelpunkt bei P(b|c). Die gefundene Funktionsgleichung für den Flächeninhalt muss also anhand der Binomischen Formeln in die Scheitelpunktsform übertragen werden. Es gilt:

-x12  + x1 = -(x12 - x1) =-(x12 - 2*0,5x1 + 0,5 2) + 0,5 2 = -(x1-0,5)2 + 0,25

 

Folglich ist der höchste Flächeninhalt des Rechtecks bei x1=0,5 mit ARechteck=0,25 erreicht. Da x2=1-x1, ist x1=0,5 und x2=0,5 die Nash-Bargaining-Lösung des Problems. 

 

Nehmen wir aber nun einmal an, dass A ein anderes Angebot hat, mit dem ein Profit von 0,2 erreicht werden kann und B über ein Angebot verfügt mit dem ein Payoff von 0,3 erzielt werden kann. Es stellt sich nun die Frage ob dies Auswirkungen auf das Verhandlungsergebnis hat.

 

Zunächst einmal leuchtet es ein, dass A kein Angebot unter 0,2 und B kein Angebot unter 0,3 akzeptieren wird, also gilt nun

 

x1>=0,2   und

x2>=0,3

 

Diese Beschränkungen stellen wir nun in der Grafik dar:

In diesem Fall kann sich die Lösung nur innerhalb des blau eingefärbten Dreiecks oder auf einer seiner Kanten befinden. Wie im ersten Beispiel lässt sich nach dem zweiten Nash-Axiom der Untersuchungsbereich auf die rote Linie beschränken. Eine Lösung des Problems muss die Eigenschaft haben, dass das Produkt (x1 - 0,2) * (x2 - 0,3) maximiert wird. In diesem Fall lässt sich das grafisch wieder als Maximierung des Flächeninhalts eines Rechtecks darstellen. Im Unterschied zum ersten Beispiel hat das Dreieck 3 seiner Eckpunkte auf den grünen Linien und einen wie gehabt auf dem rot eingefärbten Funktionsgraphen. Der optimale Flächeninhalt ergibt sich wenn man x2=1-x1  setzt nach demselben Verfahren wie im ersten Beispiel:

 

(x1 - 0,2) * (x2 - 0,3)   =    (x1 - 0,2) * (1 - x1 - 0,3)   =    (x1 - 0,2) * (- x1 + 0,7) =

-x12 + 0,7x1 + 0,2x1 -0,14 = -x12 + 0,9x1 - 0,14 = -(x12 - 0,9x1) - 0,14 = 

-(x12 - 2*0,45x1 + 0,45 2) + 0,45 2 - 0,14 = - (x-0,45)2 + 0,0625

 

Also ist mit x1 = 0,45 und x2=0,55. Dadurch, dass B das bessere Alternativangebot hat, besitzt er die stärkere Verhandlungsposition und bekommt daher am Ende mehr vom Kuchen.

 

 

Die bisherigen Überlegungen gehen allerdings noch nicht von konkreten Verhandlungsmodellen aus. Diese zu beleuchten ergibt weitere Aufschlüsse über das optimale Verhandlungsverhalten.

 

Zunächst zu einem sehr einfachen Verhandlungsmodell, das man als Basis für die komplexeren betrachten kann, dem Ultimatumspiel. Hierbei soll über die Verteilung eines Betrags b verhandelt werden. Dabei kann der erste Spieler dem anderen zunächst ein Angebot machen. Der zweite Spieler entscheidet, ob er dieses annimmt oder ablehnt. Wenn er ablehnt gehen beide Spieler leer aus, haben also einen Payoff von 0, wenn er zustimmt wird der Betrag entsprechend des Vorschlags von A geteilt.

 

Nach dem Prinzip der Rückverfolgung ergibt sich, dass Spieler 2 dem Angebot von Spieler 1 auf jeden Fall zustimmen sollte, wenn dieses für ihn größer als 0 ist. Denn wenn er ablehnen würde, hätte er einen Payoff von 0 was schlechter ist als wenn er zustimmen würde. Demzufolge ist es für Spieler A eine dominante Strategie, den kleinsten möglichen Geldbetrag, in unserem Währungssystem also 0,01 € anzubieten. Dieses gilt natürlich nur wenn beide Spieler streng rational handeln. Bei der Verteilung eines größeren Betrags würden viele Menschen wahrscheinlich ein Angebot von einem Cent abschlagen, wenn sie wissen, dass der andere Spieler in diesem Fall eine viel höhere Summe erhalten würde, um diesen zu bestrafen.

 

 

Das Ultimatumspiel modelliert viele Verhandlungssituationen nur sehr schlecht, da diese oft mehr als eine Runde haben. Nehmen wir einmal Folgendes an:

 

Daniel und John verhandeln über die Verteilung eines Kontos mit einem Vermögen von

1000 €. Die Verhandlung hat dabei 10 Runden. In jeder dieser Runden werden von dem Konto 100 € abgehoben und an die Bank gezahlt. Daniel macht das erste Angebot, danach wird abwechselnd geboten.     

 

Da der aufzuteilende Betrag mit fortschreitender Zeit immer geringer wird, erstreben die Verhandlungspartner eine schnelle Einigung. Ein rationales Erstangebot von Daniel lässt sich durch Rückwärtsinduktion ermitteln. Dabei sollte berücksichtigt werden, dass die letzte Verhandlungsrunde ein Ultimatumspiel ist, das rationale Angebot desjenigen, der dort am Zug ist, also Max ist demzufolge der kleinstmögliche Betrag, in diesem Fall 0,01 €. Daraus lässt sich nun durch Rückwärtsinduktion das rationale Erstangebot ermitteln.

   

Es ergibt sich folgende Tabelle:

 

Runde

Wert des Kontos in Euro

Angebot von Daniel an Max in Euro

Angebot von Max an Daniel   in Euro

 

 

 

 

10

100

 

0,01

9

200

100

 

8

300

 

100,01

7

400

200

 

6

500

 

200,01

5

600

300

 

4

700

 

300,01

3

800

400

 

2

900

 

400,01

1

1000

500

 

 

 

 

 

 

Das rationale Gebot von Max an Daniel in Runde 10 ist 100 €, weil dadurch Daniel besser fahren würde, als wenn er in der letzten Runde Daniel 0,01 € bieten würde. Dies hätte einen Payoff von 99,99€ zur Folge, was schlechter ist als die 100 €, die er durch Max Angebot erreichen kann. Dementsprechend ergibt sich der Rest der Rückverfolgung. Ein Erstangebot von 500 € ist in diesem Fall also die rationale Strategie für Daniel.

 

 

Ein sehr anschauliches Verhandlungsmodell ist das sogenannte Rubinstein-Modell. Hierbei verhandeln wieder zwei Akteure um die Verteilung eines Betrages, z.B. 1 €. Die Akteure ziehen eine schnelle Einigung einer langsamen vor, da der eine Euro durch die Verzinsung für jeden der beiden Spieler in einer späteren Runde einen höheren Wert hat. Akteur A hat die Verzinsung s, Akteur B hat die Verzinsung t. Ein Euro ist also morgen für A 1+s € wert, für B 1+t €, wobei 0>s,t>1. Wenn also a den Wert des Angebots in Runde n bezeichnet und b den entsprechenden Wert für B gilt:

 

a= 1/(1+s)  und b=1/(1+t)

 

Folglich ist der akzeptable Vorschlag für beide Spieler nicht gleich hoch, denn schnelle Gewinne haben einen unterschiedlich starken Wert für die beiden.

 

Der akzeptable Vorschlag ist jedoch in jeder Runde für beide Spieler konstant, denn jeder Zeitpunkt der Verhandlung lässt sich als Neuanfang des Spiels sehen, da sich an dem zu verteilenden Betrag nichts ändert und auch die weiteren Umstände konstant bleiben. Daher muss man, um das optimale Angebot von Akteur A zu ermitteln eine Rückwärtsinduktion über drei Runden durchführen:

Wir nehmen an, dass a in Runde n+2 seinen akzeptablen Vorschlag macht. Dieser ist auch in Runde n akzeptabel. Es ergibt sich folgende Tabelle:

 

 

 

Runde

n

n+1

n+2

Vorschlagender

A

B

A

 

 

 

 

Gebot für A

1-b(1-a*x)

a*x

x

Gebot für B

b*(1-a*x)

1 - a*x

1-x

  

 

Die durch Rückwärtsinduktion ermittelte Bedingung für x lässt sich umformen, sodass sich ein Ergebnis klar berechnen lässt:

 

                                  x  =  1 -  b(1 - a*x)

< = >                         x  =  1 -  b   +  a*b*x        |  - (a*b*x)

< = >           x - a*b*x   =  1 -  b

< = >       x(1 - a*b)       =  1 -  b                        |  : (1-a*b) 

 

< = >                           x =  1 -  b  =   s  +    st

                                           1 - ab      t + s + st

 

Entsprechend ergibt sich für das akzeptable Angebot von B

 

y =  1 - a       =    r    +   st  

      1-ab               t + s + st

 

Nun nehmen wir einmal an, dass die Zeitintervalle zwischen den einzelnen Angeboten sehr kurz sind. Dies entspricht bei vielen Verhandlungen der Realität. In diesem Fall werden t und s sehr klein. Daher können wir das Produkt t*s in dem akzeptablen Angebot vernachlässigen. Dementsprechend ergibt sich dann

 

x  =       s          und    y =    t 

          t + s                         t + s

 

Entsprechend ergibt sich für die Verteilung der Güter:

 

 y    =   t

 x         s    

 

Die Anteile der beiden Spieler verhalten sich also, wie die Zinsen, welche die Spieler für die Güter über die verhandelt wird bekommen können. D.h. je höher der mit dem Güter zu erzielende Gewinn, desto stärker die Verhandlungsposition.