Wie können mehrere Informationsquellen zu einem Gesamtbild beitragen? Fragen wie diese tauchen in vielen Bereichen der Forschung auf, etwa in den Neurowissenschaften, wo es darum geht, wie mehrere Neuronen gemeinsam für einen Reiz kodieren. Forschende des Göttingen Campus Instituts für Dynamik biologischer Netzwerke (CIDBN) haben in der Fachzeitschrift Physical Review E eine neuartige Herangehensweise vorgestellt, indem sie die mathematische Methode der Informationszerlegung (Partial Information Decomposition) weiterentwickeln und für reelle Probleme anwendbar machen.
Wie verschiedene Quellen zur gesamten Information beitragen, kann sehr unterschiedlich sein. Während einige Informationen nur von der einen oder anderen Quelle stammen und somit einzigartig sind, sind andere Teile in mehreren Quellen vorhanden und folglich redundant. Oder es sind mehrere Quellen gleichzeitig erforderlich, um eine Teilinformation zu entschlüsseln. Diese Teile werden entsprechend als synergetisch bezeichnet. In den Neurowissenschaften betrifft dies die Frage, welches Neuron für welche Information zuständig ist. Manche Informationen sind von jedem Neuron zugänglich, manche nur, wenn mehrere Neuronen zusammenarbeiten – wie bei einem verschlüsselten Text, der nur verständlich ist, wenn er mit dem entsprechenden Passwort kombiniert wird.
Mathematisch gesprochen enthalten mehrere Quellvariablen Teilinformationen über die Zielvariable. Die in der Zielvariablen enthaltene Information kann nicht komplett erschlossen werden, wenn lediglich eine der Quellvariablen bekannt ist. Hier ist entscheidend, um wieviel die Unsicherheit über eine Variable verringert werden kann, wenn nur eine Quellvariable betrachtet wird. Hierdurch erhält man jedoch keinen Einblick, ob Informationen auf einzigartige, redundante oder synergetische Weise unter den Quellen verteilt sind. Diesen weiteren Schritt ermöglicht die sogenannte Informationszerlegung.
Seit Einführung dieser Methode 2011 wurde eine Vielzahl unterschiedlicher Herangehensweisen entwickelt, um Redundanzen zu bestimmen. Die meisten funktionieren nur mit diskreten Variablen, das heißt mit Variablen, die eine endliche (oder abzählbar unendliche) Anzahl verschiedener Werte annehmen können, wie zum Beispiel ein Würfelwurf oder das Werfen einer Münze. In der Wissenschaft sind die meisten Variablen dagegen kontinuierlich, das heißt, dass sie Werte aus einem kontinuierlichen Spektrum mit beliebiger Genauigkeit annehmen können, wie etwa Temperatur, Position oder Geschwindigkeit eines Objekts. Kürzlich wurde bewiesen, dass eine solche kontinuierliche Version einer PID-Definition theoretisch existiert. Aber erst diese Studie zeigt einen Weg auf, wie die Methode auf experimentelle Daten angewendet werden kann.
Die Definition informationstheoretischer Größen hängt im Allgemeinen stark von der Wahrscheinlichkeit ab, mit der einzelne Ereignisse beobachtet werden. In der empirischen Forschung kennt man jedoch selten die wahren Wahrscheinlichkeiten, sondern muss sie auf Grundlage aufgezeichneter Datenpunkte schätzen. Auch hierfür haben die Forschenden in ihrer Arbeit ein effizientes Vorgehen eingeführt. „Mit unserer Lösung steht der Forschung ein weiteres Werkzeug zur Verfügung, um komplizierte Wechselwirkungen zwischen experimentellen Daten aufzudecken“, freut sich David Alexander Ehrlich vom CIDBN. „Dadurch, dass wir nun auch mit Variablen aus dem kontinuierlichen Spektrum arbeiten können, wird unsere Methode für zahlreiche wissenschaftliche Disziplinen interessant,“ ergänzt Kyle Schick-Poland, ebenfalls vom CIDBN.
Wissenschaftliche Ansprechpartner:
Dr. Britta Korkowsky
Georg-August-Universität Göttingen
Göttingen Campus Institut für Dynamik biologischer Netzwerke (CIDBN) – Geschäftsstelle
Heinrich-Düker-Weg 12, 37073 Göttingen
Telefon: (0551) 39-26675
E-Mail: Diese E-Mail-Adresse ist vor Spambots geschützt! Zur Anzeige muss JavaScript eingeschaltet sein!
Originalpublikation:
David A. Ehrlich, Kyle Schick-Poland et al. Partial information decomposition for continuous variables based on shared exclusions: Analytical formulation and estimation. Physical Review E 2024.https://doi.org/10.1103/PhysRevE.110.014115
Quelle: Presseinformation der Universität Göttingen vom 28. August 2024.