Andrea Nestler treffe ich – auf Abstand – zu Hause, im größten Zimmer ihrer Berliner Wohnung. Das Familienzimmer mit langem Esstisch und Couch ist seit mittlerweile einem Jahr auch ihr Arbeitsplatz. Denn ihr Arbeitgeber, das Online-Handelsunternehmen Zalando, schickte die Mitarbeiter letztes Jahr bereits zwei Wochen vor Beginn der offiziellen Ausgangs- und Kontaktbeschränkungen ins Homeoffice. Als Andrea Nestler 2013 bei Zalando anfing, war das Unternehmen noch ein Start-up und ihre Berufsbezeichnung Data Scientist gerade erst erfunden.
Andrea Nestler. Foto: Christoph Eyrich
Frau Nestler, Ihre E-Mail-Signatur enthält neben der Information, dass Sie Data Scientist bei Zalando sind auch die etwas kryptische Bezeichnung „sizing reco“. Was hat es damit auf sich?
Das steht für size recommendation [Größen-Empfehlung]. Ursprünglich war das nur eine Idee, mittlerweile ist das ein Produkt. Gerade E-Commerce Unternehmen wie Zalando haben eine gewisse Return Rate: Kunden bestellen Artikel und viele davon werden zurückgeschickt. Es gibt unterschiedliche Gründe dafür. Der Artikel gefällt nicht, manchmal haben Kunden von vornherein nicht vor, alle Artikel zu behalten, und manchmal passiert es, dass sie zu groß oder zu klein ausfallen. Wir haben uns also hingesetzt und ein Pilotprojekt gestartet, um zu gucken, ob es eine Möglichkeit gibt, den Kunden zu helfen, die richtige Größe zu finden. Dafür haben wir zwei Recommendation-Produkte aufgebaut,
Was meinen Sie mit „Produkt“?
Ein Produkt ist zum Beispiel, wenn auf der Zalando-Website die Box erscheint: „Wir empfehlen, eine Nummer größer oder kleiner zu bestellen“. Oder: „Wir empfehlen, die Größe xy zu bestellen“.
Auf welcher Grundlage kann Zalando diese Empfehlung geben?
Wir kennen die Historie, wir wissen, was Kunden in der Vergangenheit bestellt haben. Und wir kennen auch die Artikel.
Wenn ich als Kunde eine Hose oder einen Mantel zurückschicke, gibt es außerdem einen Zettel, auf dem ich den Grund angebe, zum Beispiel, war zu groß oder zu klein.
Genau, auch das sind Daten, die wir benutzen. Wir haben einen sehr großen Schatz an Daten, die über die Kunden kommen, aber wir generieren auch selbst Daten. Wir haben etwas aufgebaut, das wir Inhouse Fitting Station nennen. Dort werden Artikel ausgemessen und Models probieren die Artikel, also Schuhe, Hosen, Blusen, Kleider nach einem gewissen Standard an. So bekommen wir Daten darüber, ob ein Artikel zu groß oder zu klein ausfällt.
In Deutschland wird im Onlinehandel laut Verbraucherzentrale jede zweite Kleidungsbestellung zurückgeschickt, wenn der Rückversand wie bei Zalando nichts kostet. Das verursacht enorme Kosten, vor allem für die Umwelt. Hat sich die Zahl der Retouren durch die automatischen Empfehlungen reduziert?
Bei Zalando haben wir eine Rücklaufquote von 50 Prozent, und jede dritte Retoure hat dieses Größenproblem. Davon gehen wir aus, weil das von den Kunden angekreuzt wird. Unsere Recommendation-Produkte sind in der Lage, diese größenbedingten Retouren um vier Prozent zu reduzieren.
Um wie viele Bestellungen geht es da?
Aktuell haben wir um die 35 Millionen Kunden. Wir können sagen, von 35 Millionen hat jeder mindestens eine Bestellung getätigt, da sind wir dann auf jeden Fall im Millionenbereich von Rücksendungen, die vermieden werden können.
Blicken wir zurück. Sie sind 2013 direkt von der Uni zu Zalando gegangen. Da war der Beruf Data Scientist noch recht exotisch.
Stimmt, als ich damals angefangen habe, hießen wir noch Quantitative Analysts, dann wurde das umbenannt in Data Scientists, das muss 2013/2014 gewesen sein, kurz nachdem ich bei Zalando angefangen habe.
Damals war Zalando der Inbegriff des Start-ups. Die einen haben sich gefreut, dass Deutschland endlich eine international erfolgreiche digitale Handelsplattform hat, für andere war die aggressive Expansion eher furchterregend. Warum wollten Sie zu Zalando?
Ich war vorher am KIT [Karlsruher Institut für Technologie], habe dort promoviert und wollte nach Berlin, das war die Start-up-Stadt in Deutschland. Ich hätte gerne weiter in der Forschung gearbeitet, zum Beispiel Richtung Automobilbranche, aber die Forschungsabteilungen von diesen großen Technologieunternehmen, die gibt’s eher im süddeutschen Raum. Ich habe auch lange überlegt, ob ich in die Versicherungsbranche gehen soll, habe mich aber bewusst dagegen entschieden, weil das für mich was Verstaubtes hat. Ich fand diese Start-ups einfach spannend. Bei Zalando reizt mich sehr, dass man auch forschen kann. Das wusste ich 2013 noch nicht, damals war es tatsächlich diese Kombination aus der Dynamik des Unternehmens und der Aussicht, dass ich weiterhin als Mathematiker arbeiten kann.
Sie haben am KIT Angewandte Mathematik studiert und 2012 auf diesem Gebiet auch promoviert. Soweit ich verstehe, ging es um Verfahren, mit denen sich Messgrößen aus Experimenten schätzen lassen, um damit mathematische Modelle realitätsnäher zu machen. Inwieweit baut Ihre jetzige Tätigkeit darauf auf?
Der gemeinsame Nenner ist die angewandte Mathematik. Bei der Promotion hatte ich engen Kontakt mit dem Institut für Bio- und Lebensmitteltechnik des KIT, und die standen vor der Herausforderung, dass sie, um bestimmte Parameter schätzen zu können, viele Experimente im Labor durchführen mussten. Die Idee war, ob man das nicht mithilfe der Simulation beschleunigen kann. Also, sprich, dass man mit beidem arbeitet, mit experimentellen Daten und mit der Mathematik. Zum einen braucht man für die mathematische Modellierung gewisse Daten aus dem Labor und das Labor kann schneller arbeiten, wenn es zusätzlich Informationen über Simulationen bekommt. Wenn ich an size recommmendation denke, dann ist das eine ähnliche Aufgabe. Wir haben das Expertenwissen über die Artikel aus der Fitting Station und von Lieferanten. Auf der anderen Seite hat man die Maschine, den Algorithmus, und beides zusammen ist einfach stärker. Ich bin ein Freund der Aussage: Das Expertenwissen ist stark, die Algorithmen sind stark, aber richtig stark sind wir, wenn man beides miteinander kombiniert.
Gibt es auch Parallelen bei der Methodik?
Ja, zum Beispiel durch die Stochastik. Damals in der Promotion drehte sich alles um etwas, das man Maximum- Likelihood-Schätzung nennt, und diese Methoden kommen in meiner jetzigen Arbeit auch immer wieder vor. Es gibt also gewisse inhaltliche Kontinuität. Kommen wir zu Ihrem Arbeitsalltag.Wie sieht der aus? Sie meinen den jetzigen [lacht]
Ja, Sie arbeiten ja jetzt schon eine Weile zu Hause.
Und das wird auch noch ein bisschen so bleiben. Wir waren, als wir letztes Jahr im Februar in den Lockdown gegangen sind, eigentlich ganz gut vorbereitet. Und im Prinzip ist der Alltag nicht großartig anders, aber es ist schon eine Herausforderung, weil man sich nur noch in den Meetings trifft, aber gerade die wichtige Zeit vor dem Meeting und danach, die fällt weg. Deswegen treffen wir uns jetzt manchmal nach dem Online-Meeting zum „Kaffeetrinken“, zum Quatschen sozusagen. Mit den Meetings ist der Kalender eigentlich schon recht voll für die Woche.
Gibt es noch andere Arbeitsroutinen?
Ja, es gibt immer Fragen, die aktuell auftauchen und die ad hoc beantwortet werden müssen. Zum Beispiel hat jemand eine Idee und da muss der Impact berechnet werden oder es sind irgendwelche Analysen zu machen. Zum Beispiel kaufen gerade durch die Corona-Situation mehr Leute ein: Wie verändert sich jetzt unser Recommendation-Produkt? Das Schöne bei Zalando ist aber, dass wir eigene Ideen einbringen, neue Projekte überlegen können. Dafür gibt es ein Prozedere. Wir schreiben unsere Idee als Produkt auf: Was brauche ich dafür? Wie viel Zeit benötige ich? Was erwarte ich als Ergebnis? Das reicht man bei den Führungskräften ein und die entscheiden, ob das gemacht wird oder nicht.
Arbeiten Sie aktuell an so einer Idee?
Ja, wir forschen im Moment sehr viel in Richtung Lokalisierung. Das ist ein Produkt, das ich jetzt vorantreibe und manage. Ich bin dafür verantwortlich, dass das auch gepusht wird, aber die Ideen kommen immer von vielen.
Was meinen Sie mit Lokalisierung?
Lokalisierung bedeutet, man betrachtet lokale Stellen, wenn man sich den Körper und den Artikel anguckt. Es passiert ja, dass ein Kleidungstück eigentlich passt, aber gerade an der Schulter oder an der Hüfte ist es zu eng oder zu breit oder am Bein zu lang oder zu kurz.
Dafür müssten Sie bei den Kunden bei Retouren noch genauer nachfragen oder wie kommt man an solche Daten?
Zum einen haben wir die Daten aus unserer Inhouse Fitting Station. Und wir haben Business-Experten, die sich sehr, sehr gut mit den Artikeln auskennen. Die wissen genau, wo die problematischen Stellen sind, Hüfte und Oberschenkel zum Beispiel. Und dann gäbe es die Möglichkeit, die Kunden zu fragen. Angenommen der Kunde ist bereit, sich selbst auszumessen und die Messdaten an uns zu geben. Wenn wir den Körper genau kennen, aber auch den Artikel, dann wäre es einfach zu sagen: Diese Person hat breitere Schultern, der würde dieser oder jener Artikel perfekt passen. Aber bevor man Kunden fragt, muss man User Tests machen. Wir müssen erst wissen, wie das beim Kunden ankommt. Solche Nachfragen könnten Kunden abschrecken. Aber das Empfehlungssystem soll auf jeden Fall noch stärker in diese Richtung weiterentwickelt werden.
Realisieren Sie solche Ideen gemeinsam mit ihrem Data-Science-Team?
Ich gehöre zwar zum Data-Science-Team, aber für solche Projekte arbeiten wir nicht in festen Teams. Für jedes Produkt, das wir entwickeln, gibt es eine andere Zusammensetzung. Was ich toll finde, weil ich dadurch in jedem Projekt mit anderen Leuten zusammenarbeite. Das ist sehr spannend, denn jeder hat nun mal eine eigene Expertise und einen anderen Blickwinkel.
Mit welchen Perspektiven haben Sie es zu tun?
Neben den Business-Leuten sind das zum Beispiel Textil-Spezialisten. Und auch unter den Data-Science-Kollegen gibt es nicht nur Mathematiker, sondern auch Informatiker und das alleine bringt schon unterschiedliche Blickwinkel mit sich.
Wie ist die Zusammensetzung im Data-Science-Team?
Die meisten kommen nach wie vor aus der Computer-Science-Richtung, denn Data Science gab’s früher im Mathematikstudium einfach noch nicht. Ich weiß, dass das jetzt aufgebaut wird und das ist auch richtig, denn ich habe öfters die Aussage gehört, wir bräuchten für den und den Fall eigentlich mehr Mathematiker.
Warum Mathematiker?
Um sich als Data Scientist ausbilden zu lassen, ist entweder ein Informatikstudium mit starkem Mathematikanteil erforderlich oder ein Mathematikstudium mit Informatikanteil. Beides hat seine Berechtigung. Aber Mathematiker haben oft ein tieferes Verständnis der Methodik, denn während des Studiums lernen sie, mathematische Probleme genau und tiefgreifend anzuschauen. Manchmal ist es notwendig, tiefer in die mathematischen Modelle rein zu gehen und Mathematiker sind darin eben mehr geschult.
Es geht darum, die innere Dynamik von solchen Modellen zu verstehen.
Genau das ist das Problem. Manchmal ist es notwendig in diese – ich nenne es jetzt mal – Blackbox reinzugucken. Wenn ich mir einen Algorithmus angucke, dann fällt irgendwann der Groschen und dann weiß ich, weil ich aus der tieferen Mathematik komme, das hat mit dem und dem zu tun. Durch diese Assoziationsketten komme ich manchmal auf neue Ideen.
Für manche sind die Algorithmen also eher Tools, aber als Mathematikerin wissen Sie darüber hinaus, wie sie in die Mathematik eingebettet sind.
Genau.
Gibt es bei Ihrer Arbeit Aufgaben, die Sie besonders gerne übernehmen?
Ja, natürlich, gerade wenn es darum geht, diese Data-Science-Produkte weiterzuentwickeln, zum Beispiel neue Algorithmen oder einen neuen mathematischen Ansatz auszuprobieren. Man weiß vorher oft gar nicht, ob es funktionieren wird, und sich dann hinzusetzen und das einfach mal auszuknobeln, die Formeln aufzuschreiben und das durchzurechnen, das macht mir wahnsinnig viel Spaß.
Also aus den vorhandenen Daten nochmal was Neues zu schöpfen.
Genau. Wir wissen ja, dass diese Size-Recommendation-Produkte funktionieren, aber wir haben diese Vision, dass es ganz bestimmt noch Verbesserungspotenzial gibt.
Als Sie angefangen haben Mathematik zu studieren, konnten Sie nicht wissen, dass sie mal mit Daten arbeiten werden. Was war Ihre Motivation, Mathematik zu studieren?
Ich habe relativ früh gesagt, ich möchte gerne Mathematik studieren, weil es mich begeistert. Man kann schon sagen, dass Mathematik meine Leidenschaft ist.
Schon in der Schule.
Ja. Ich hatte frühzeitig gelesen, dass man als Mathematiker auch gut Geld verdient. Und ich habe mir gedacht, wenn mir die Mathematik so liegt, mir so leicht fällt und man dann auch noch gut verdienen kann, dann mach’ ich das doch. Ich bin auch sehr dankbar, dass ich mit dem, was ich mag, Geld verdienen kann.
Wenn Sie an Ihre jungen Kolleginnen und Kollegen an der Uni denken, wie schaffen die am besten den Einstieg als Data Scientist? Was sollten sie schon im Studium beachten?
Es gibt unterschiedliche Richtungen im Studium, die angewandte Mathematik zum Beispiel und die reine Mathematik. Das erste, was ich empfehlen würde: Überlegt, was euch Spaß macht. Data Science ist ja angewandte Mathematik, wenn man jetzt begeisterter reiner Mathematiker ist und die Anwendung nicht so wichtig findet, dann ist das vielleicht einfach die falsche Richtung. Beim Data Scientist kommen mehrere Sachen zusammen – einmal die Fähigkeit zu programmieren, die Fähigkeit in der Optimierung und das Verständnis von Daten. Das, würde ich behaupten, sind die Grundvoraussetzungen, wenn man in die Richtung gehen möchte. Auch das cloudbasierte Arbeiten erfordert Vorwissen. Aber das muss man nicht im Studium erlernen, das kann man sich im Beruf aneignen.
Stellenangebote für Data Scientists gibt es sicher viele.
Mittlerweile ist es der Beruf für Mathematiker. Ich vergleiche das gerne mit der Informatik. Als die plötzlich wichtig wurde, gab es nur wenige Spezialisten und dann wurden es immer mehr. So eine ähnliche Entwicklung sehen wir jetzt auch. Es werden immer mehr Data Scientists gesucht. Und es ist ein Beruf, der wahnsinnig viel Spaß macht, weil man wirklich viele Anwendungen hat.
Frau Nestler, ich danke Ihnen für das Gespräch.
Das Gespräch führte Kristina Vaillant,
freie Journalistin in Berlin.
www.vaillant-texte.de