
Spieltheorie des Verhandelns - Bargaining Theory
Die kooperative Spieltheorie findet ein
interessantes Anwendungsfeld in der so genannten Spieltheorie des Verhandelns,
der Bargaining Theory. Von einem grundlegenden Verhandlungsproblem ausgehend können
viele komplexere Verhandlungs- und Kooperationsmöglichkeiten untersucht werden.
Über die Konzepte lassen sich auch wirtschaftliche Prozesse, wie z.B. die
Preisbildung auf einem Markt untersuchen. Daher erhält dieser Bereich der
Spieltheorie in dieser Arbeit, die die Anwendung der Spieltheorie für
wirtschaftliche Probleme erläutern soll, besonders großes Gewicht.

Ein Verhandlungsproblem besteht formal
beschrieben aus M
Auszahlungskombinationen, die n
Spieler miteinander realisieren können. Die Kombinationen können höchst
unterschiedliche Ergebnisse für die einzelnen Spieler bringen. Dabei gibt es
eine spezielle Auszahlungskombination für den Fall, dass sich die Spieler nicht
einigen können, die so genannte Konfliktauszahlung. Man nimmt bei einem
Verhandlungsproblem an, dass es mindestens eine Auszahlungskombination gibt, mit
der alle Spieler einen höheren Ertrag einfahren, als bei der
Konfliktauszahlung.
Um das Ganze an einem Problem zu verdeutlichen
nehmen wir einmal Folgendes an:
Zwei Firmen können durch eine Zusammenarbeit
einen Profit erreichen, der maximal 1 beträgt. Die beiden Unternehmen
verhandeln nun über die Verteilung der Kooperationsrente. Hierbei gilt, wenn x1
für den Anteil von Unternehmen A und x2 für den Anteil von
Unternehmen B steht, dass x1+x2<=1
gelten muss. Dabei sind alle Verteilungen, wo x1+x2<1
ist,
pareto-ineffizient, denn jeder der beiden
Spieler könnte seinen Anteil erhöhen bis die Summe der beiden Anteile 1 ergibt
ohne dem jeweils anderen zu schaden.
Zur Lösung derartiger Probleme gibt es die
so genannten Nash-Axiome. Dies sind Bedingungen, die eine Lösung eines
Verhandlungsproblems erfüllen muss:
Die Nash-Axiome
Anhand dieser Axiome lässt sich unser
Verhandlungsproblem lösen. Zunächst ermitteln wir dafür einen Graphen für
die Verteilung der Güter:

Es ist also möglich, dass jeder Punkt, der
innerhalb des von x1-Achse,
x2-Achse und des Funktionsgraphen begrenzten Bereichs liegt, eine
Verteilung darstellt, die unsere Lösung ist. Nach dem Nash-Axiom Nummer 2 lässt
sich jedoch schon eine starke Einschränkung machen: Das Axiom besagt, dass eine
Lösung pareto-effizient sein muss, folglich kommen als Lösung der Verhandlung
nur Verteilungen, die genau auf dem Funktionsgraphen liegen in Frage.
Da beide Spieler nach einer maximalen
Zuteilung streben, gilt dass das Produkt aus x1 und x2
maximiert werden soll. Graphisch gesehen lässt sich das Problem also so
formulieren, dass ein Rechteck gezeichnet werden soll, das einen Eckpunkt auf
der x2-Achse und einen auf dem Funktionsgraphen hat.

Der Flächeninhalt eines solchen Rechtecks lässt
sich in Abhängigkeit von x1 durch folgende Funktion darstellen:
f(x1)=(1-x1)*x1= -x12
+ x1
Diese Funktion hat als Graphen eine umgedrehte
Parabel. Der Scheitelpunkt der Parabel, also in diesem Fall der Punkt, an dem
der Funktionsgraph den höchsten Wert erreicht hat, lässt sich über die
so genannte Scheitelpunktsform der Parabel ermitteln. Wenn die Funktionsgleichung
y= - (x-b)2 + c ist,
erreicht der Graph seinen Scheitelpunkt bei P(b|c). Die gefundene Funktionsgleichung für den Flächeninhalt muss also anhand der
Binomischen Formeln in die Scheitelpunktsform übertragen werden. Es gilt:
-x12
+ x1 = -(x12 - x1) =-(x12
- 2*0,5x1 + 0,5 2) + 0,5 2 = -(x1-0,5)2
+ 0,25
Folglich ist der höchste Flächeninhalt des
Rechtecks bei x1=0,5 mit ARechteck=0,25 erreicht. Da x2=1-x1,
ist x1=0,5 und x2=0,5 die Nash-Bargaining-Lösung des
Problems.
Nehmen wir aber nun einmal an, dass A ein
anderes Angebot hat, mit dem ein Profit von 0,2 erreicht werden kann und B über
ein Angebot verfügt mit dem ein Payoff von 0,3 erzielt werden kann. Es stellt sich nun
die Frage ob dies Auswirkungen auf das Verhandlungsergebnis hat.
Zunächst einmal leuchtet es ein, dass A kein
Angebot unter 0,2 und B kein Angebot unter 0,3 akzeptieren wird, also gilt nun
x1>=0,2
und
x2>=0,3
Diese Beschränkungen stellen wir nun in der
Grafik dar:

In diesem Fall kann sich die Lösung nur
innerhalb des blau eingefärbten Dreiecks oder auf einer seiner Kanten befinden.
Wie im ersten Beispiel lässt sich nach dem zweiten Nash-Axiom der
Untersuchungsbereich auf die rote Linie beschränken. Eine Lösung des Problems
muss die Eigenschaft haben, dass das Produkt (x1 - 0,2) * (x2
- 0,3) maximiert wird. In diesem Fall lässt sich das grafisch wieder als
Maximierung des Flächeninhalts eines Rechtecks darstellen. Im Unterschied zum
ersten Beispiel hat das Dreieck 3 seiner Eckpunkte auf den grünen Linien und
einen wie gehabt auf dem rot eingefärbten Funktionsgraphen. Der optimale Flächeninhalt
ergibt sich wenn man x2=1-x1
setzt nach demselben Verfahren wie im ersten Beispiel:
(x1 - 0,2) * (x2 - 0,3)
= (x1 - 0,2) * (1 - x1 - 0,3)
= (x1
- 0,2) * (- x1 + 0,7) =
-x12 + 0,7x1
+ 0,2x1 -0,14 = -x12 + 0,9x1 - 0,14
= -(x12 - 0,9x1) - 0,14 =
-(x12 - 2*0,45x1
+ 0,45 2) + 0,45 2 - 0,14 = - (x-0,45)2 +
0,0625
Also ist mit x1 = 0,45 und x2=0,55.
Dadurch, dass B das bessere Alternativangebot hat, besitzt er die stärkere
Verhandlungsposition und bekommt daher am Ende mehr vom Kuchen.
Die bisherigen Überlegungen gehen allerdings
noch nicht von konkreten Verhandlungsmodellen aus. Diese zu beleuchten ergibt
weitere Aufschlüsse über das optimale Verhandlungsverhalten.
Zunächst zu einem sehr einfachen
Verhandlungsmodell, das man als Basis für die komplexeren betrachten kann, dem
Ultimatumspiel. Hierbei soll über die Verteilung eines Betrags b
verhandelt werden. Dabei kann der erste Spieler dem anderen zunächst ein
Angebot machen. Der zweite Spieler entscheidet, ob er dieses annimmt oder
ablehnt. Wenn er ablehnt gehen beide Spieler leer aus, haben also einen Payoff
von 0, wenn er zustimmt wird der Betrag entsprechend des Vorschlags von A
geteilt.
Nach dem Prinzip der Rückverfolgung ergibt
sich, dass Spieler 2 dem Angebot von Spieler 1 auf jeden Fall zustimmen sollte,
wenn dieses für ihn größer als 0 ist. Denn wenn er ablehnen würde, hätte er
einen Payoff von 0 was schlechter ist als wenn er zustimmen würde. Demzufolge
ist es für Spieler A eine dominante Strategie, den kleinsten möglichen
Geldbetrag, in unserem Währungssystem also 0,01 € anzubieten. Dieses gilt natürlich
nur wenn beide Spieler streng rational handeln. Bei der Verteilung eines größeren
Betrags würden viele Menschen wahrscheinlich ein Angebot von einem Cent
abschlagen, wenn sie wissen, dass der andere Spieler in diesem Fall eine viel höhere
Summe erhalten würde, um diesen zu bestrafen.
Das Ultimatumspiel modelliert viele
Verhandlungssituationen nur sehr schlecht, da diese oft mehr als eine Runde
haben. Nehmen wir einmal Folgendes an:
Daniel und John verhandeln über die
Verteilung eines Kontos mit einem Vermögen von
1000 €. Die Verhandlung hat dabei 10 Runden.
In jeder dieser Runden werden von dem Konto 100 € abgehoben und an die Bank
gezahlt. Daniel macht das erste Angebot, danach wird abwechselnd geboten.
Da der aufzuteilende Betrag mit
fortschreitender Zeit immer geringer wird, erstreben die Verhandlungspartner
eine schnelle Einigung. Ein rationales Erstangebot von Daniel lässt sich durch
Rückwärtsinduktion ermitteln. Dabei sollte berücksichtigt werden, dass die
letzte Verhandlungsrunde ein Ultimatumspiel ist, das rationale Angebot
desjenigen, der dort am Zug ist, also Max ist demzufolge der kleinstmögliche
Betrag, in diesem Fall 0,01 €. Daraus lässt sich nun durch Rückwärtsinduktion
das rationale Erstangebot ermitteln.
Es ergibt sich folgende Tabelle:
|
Runde |
Wert
des Kontos in Euro |
Angebot
von Daniel an Max in Euro |
Angebot
von Max an Daniel in
Euro |
|
|
|
|
|
|
10 |
100 |
|
0,01
|
|
9 |
200 |
100
|
|
|
8 |
300 |
|
100,01 |
|
7 |
400 |
200 |
|
|
6 |
500 |
|
200,01 |
|
5 |
600 |
300 |
|
|
4 |
700 |
|
300,01 |
|
3 |
800 |
400 |
|
|
2 |
900 |
|
400,01 |
|
1 |
1000 |
500 |
|
|
|
|
|
|
Das rationale Gebot von Max an Daniel in Runde
10 ist 100 €, weil dadurch Daniel besser fahren würde, als wenn er in der
letzten Runde Daniel 0,01 € bieten würde. Dies hätte einen Payoff von
99,99€ zur Folge, was schlechter ist als die 100 €, die er durch Max Angebot
erreichen kann. Dementsprechend ergibt sich der Rest der Rückverfolgung. Ein
Erstangebot von 500 € ist in diesem Fall also die rationale Strategie für
Daniel.
Ein sehr anschauliches Verhandlungsmodell ist
das sogenannte Rubinstein-Modell. Hierbei verhandeln wieder zwei Akteure um die
Verteilung eines Betrages, z.B. 1 €. Die Akteure ziehen eine schnelle Einigung
einer langsamen vor, da der eine Euro durch die Verzinsung für jeden der beiden
Spieler in einer späteren Runde einen höheren Wert hat. Akteur A hat die
Verzinsung s, Akteur B hat die
Verzinsung t. Ein Euro ist also
morgen für A 1+s € wert, für B 1+t €, wobei 0>s,t>1. Wenn also a den
Wert des Angebots in Runde n bezeichnet und b den entsprechenden Wert für B
gilt:
a=
1/(1+s) und b=1/(1+t)
Folglich ist der akzeptable Vorschlag für
beide Spieler nicht gleich hoch, denn schnelle Gewinne haben einen
unterschiedlich starken Wert für die beiden.
Der akzeptable Vorschlag ist jedoch in jeder
Runde für beide Spieler konstant, denn jeder Zeitpunkt der Verhandlung lässt
sich als Neuanfang des Spiels sehen, da sich an dem zu verteilenden Betrag
nichts ändert und auch die weiteren Umstände konstant bleiben. Daher muss man,
um das optimale Angebot von Akteur A zu ermitteln eine Rückwärtsinduktion über
drei Runden durchführen:
Wir nehmen an, dass a in Runde n+2 seinen
akzeptablen Vorschlag macht. Dieser ist auch in Runde n akzeptabel. Es ergibt
sich folgende Tabelle:
|
Runde |
n |
n+1 |
n+2 |
|
Vorschlagender |
A |
B |
A |
|
|
|
|
|
|
Gebot
für A |
1-b(1-a*x) |
a*x |
x |
|
Gebot
für B |
b*(1-a*x) |
1
- a*x |
1-x |
Die durch Rückwärtsinduktion ermittelte
Bedingung für x lässt sich umformen, sodass sich ein Ergebnis klar berechnen lässt:
x = 1 - b(1 - a*x)
<
= >
x =
1 - b
+ a*b*x
| - (a*b*x)
<
= >
x - a*b*x =
1 - b
<
= > x(1
- a*b) =
1 - b
| : (1-a*b)
<
= >
x
= 1 - b =
s +
st
1 - ab t
+ s + st
Entsprechend ergibt sich für das akzeptable
Angebot von B
y = 1 -
a =
r +
st
1-ab
t + s + st
Nun nehmen wir einmal an, dass die
Zeitintervalle zwischen den einzelnen Angeboten sehr kurz sind. Dies entspricht
bei vielen Verhandlungen der Realität. In diesem Fall werden t und s sehr
klein. Daher können wir das Produkt t*s in dem akzeptablen Angebot vernachlässigen.
Dementsprechend ergibt sich dann
x =
s
und
y = t
t
+ s
t + s
Entsprechend ergibt sich für die Verteilung der Güter:
y =
t
x
s
Die Anteile der beiden Spieler verhalten sich
also, wie die Zinsen, welche die Spieler für die Güter über die verhandelt
wird bekommen können. D.h. je höher der mit dem Güter zu erzielende Gewinn,
desto stärker die Verhandlungsposition.