Systematische Unsicherheiten quantifizierenvon Tim Ruhe

Viele Dinge ändern ihre Eigenschaften nicht, wenn diese Eigenschaften gemessen werden. Die Zugspitze zum Beispiel ist knapp 3000 Meter hoch, unabhängig davon, ob das jemand gemessen hat oder nicht. Mit Unsicherheit ist das ähnlich, die ist zunächst vor allem eines, nämlich da. Und quantifizieren kann man sie auch nicht besonders gut.

Das gilt zumindest für die persönliche und gefühlte Unsicherheit in Krisenzeiten und wohl auch darüber hinaus. Es gibt allerding Unsicherheiten, bei denen das anders ist. Systematische Unsicherheiten zum Beispiel kann man quantifizieren. Und wenn man etwas quantifizieren kann, dann sollte man das auch tun – zumindest solange man an sich und seine Arbeit den Anspruch der Wissenschaftlichkeit stellt.

Das Quantifizieren von systematischen Unsicherheiten – oder besser: verschiedener Quellen systematischer Unsicherheit – reduziert die persönliche Unsicherheit, z.B. während der Corona-Pandemie nicht im Geringsten. Es kann aber dabei helfen, wissenschaftliche Publikationen von Falschmeldungen zu unterscheiden.

Aber was ist eine systematische Unsicherheit eigentlich?

Vielleicht schaut man sich dafür einmal kurz eine Personenwaage an. Das ist schon ein tolles Gerät. Erst recht, wenn sie digital ist! Man steigt drauf, bekommt das eigene Gewicht angezeigt und flucht oder auch nicht, das ist optional. In jedem Fall aber weiß man anschließend genau, wieviel man wiegt. Beziehungsweise glaubt man das, denn so ganz genau weiß man das eigentlich nie.

Das gilt übrigens nicht nur für das eigene Gewicht, sondern für alles, was gemessen werden kann und jemals gemessen wurde, sogar für Naturkonstanten. Am genauesten wurde bisher die nach Johannes Rydberg benannte Rydberg-Konstante, die zur Charakterisierung von Energien in der Atomphysik verwendet wird, vermessen. Bei der Rydberg-Konstante hat man so genau gemessen, dass man erst ab der zwölften Stelle nach dem Komma noch unsicher ist.

Das ist zugegebenermaßen schon ziemlich genau und in jedem Fall genauer als eine oder zumindest als meine Personenwaage. Die ist sich nämlich schon bei der ersten Stelle nach dem Komma nicht ganz sicher, ob die wirklich stimmt. Aber woher weiß ich das eigentlich?

Die Antwort auf diese Frage ist einfach, denn wie bei allen guten Messgeräten, zumindest bei denen, die man käuflich erwerben kann, steht das drauf. In vielen Fällen ist das mit einem d oder dem griechischen Buschstaben Delta gekennzeichnet. Auf meiner Waage zum Beispiel steht: d = 100 g. Diese 100 g sind die sog. systematische Unsicherheit, die eine Eigenschaft des jeweiligen Messprozesses ist. Wenn die Waage mir also anzeigt, dass ich 82,3 kg wiege, kann ich mir ziemlich sicher sein, dass der korrekte Wert, also mein tatsächliches Gewicht, irgendwo zwischen 82,2 und 82,4 kg liegt. Aber reicht mir diese Genauigkeit eigentlich?

Diese Frage kann man nicht pauschal beantworten, denn es kommt darauf an, was ich mit dem gemessenen Wert vorhabe. Wenn es darum geht, bei einem beliebigen Arzt eine Zahl in ein Formular einzutragen, sind 100 Gramm Unsicherheit geradezu lächerlich genau. Versuche ich hingegen, mit einer Personenwaage die Zutaten für einen Kuchen abzumessen, wird das unter Umständen eklig. Heikel bis tödlich wird das Ganze, wenn ich versuche mit einer solchen Waage die Zutaten für ein Medikament abzuwiegen.

Der geneigte Leser wird jetzt vielleicht einwenden, dass das ziemlich trivial ist, wenn die systematische Unsicherheit auf dem Messgerät vermerkt ist. Und er hat recht damit, denn kompliziert wird das Ganze erst dann, wenn die Unsicherheit auf andere Art und Weise bestimmt werden muss.

Ich könnte zum Beispiel auf die Idee kommen, mir selbst eine Waage zu bauen. Alles, was ich dazu benötige, sind eine Spiralfeder, ein Zollstock und ein beliebiges Gewicht. Nach dem Hookeschen Gesetz ist die Auslenkung einer Feder proportional zur angehängten Masse. Das ist kein komplizierter Zusammenhang, aber ich kann ihn benutzen, um eine Waage zu basteln. Ich hänge einfach ein beliebiges Gewicht an die Feder und messe, wie sehr diese sich dabei dehnt.

Wenn ich jetzt aber mich oder einen Sack Mehl oder was auch immer an die Feder hänge und unbedarft die Auslenkung messe, bin ich allerdings exakt so schlau wie vorher, denn ich habe einen wichtigen Schritt übersprungen: das Kalibrieren. Hier kommt jetzt das bekannte Gewicht ins Spiel. Ich hänge es an meine selbst gebaute Waage und weiß dann, wie sehr sich die Feder bei einem Gewicht von z.B. einem Kilogramm dehnt. Für alle weiteren Gewichte muss ich dann nur noch umrechnen, also doppelte Auslenkung gleich doppeltes Gewicht usw.

Aber schon beim Kalibrieren habe ich mit Unsicherheiten zu kämpfen, denn ich weiß keinesfalls genau, dass mein Gewicht exakt ein Kilogramm schwer ist. Das Gewicht könnte im Lauf der Zeit durch einen Anstrich schwerer geworden sein oder durch Abrieb und chemische Prozesse einen Teil seiner Masse verloren haben. Das kann durchaus passieren, beim Ur-Kilogramm zum Beispiel. Hinzu kommt, dass ich die Auslenkung der Feder mit einem Zollstock maximal auf einen Millimeter genau bestimmen kann.

Ich habe es also schon bei einer simplen selbst gebauten Waage mit zwei Quellen systematischer Unsicherheit zu tun, und man kann sich leicht vorstellen, dass die Angelegenheit umso komplexer wird, je komplizierter die Messapparatur aufgebaut ist. Besonders schwierig wird es dann, wenn auch noch natürliche Medien wie Südpoleis für eine Messung benutzt werden. Eine Konstante auf die elfte oder zwölfte Stelle nach dem Komma genau zu messen, ist also alles andere als trivial und verdient größten Respekt.

Das ist ja alles schön und gut, mag man jetzt einwerfen, aber was bedeutet das?

Es bedeutet, dass systematische Unsicherheiten eine Eigenschaft jeder Messung sind und aus der Methode, wie etwas gemessen wird, resultieren. Wenn ich Zutaten für einen Kuchen abwiege oder ein Stück Holz ausmesse, ist das natürlich egal, aber sobald eine Messung den Anspruch erhebt, wissenschaftlich zu sein, müssen die Unsicherheiten der Messung angegeben werden. Das Vorhandensein von Unsicherheiten in wissenschaftlichen Publikationen zeugt also nicht von Ahnungslosigkeit, sondern von Qualität. Und davon, dass derjenige, der dort gemessen hat, die benutzte Apparatur auch im Detail verstanden hat.

Die Angabe von Unsicherheiten ermöglicht darüber hinaus die Überprüfung eines Messwertes in einer oder mehreren unabhängigen Kontrollversuchen. Dabei ist für die wissenschaftliche Akzeptanz einer Messung nicht entscheidend, ob die zwei Werte besonders nah beieinander liegen, sondern, ob sie miteinander verträglich sind, also im Rahmen ihrer Unsicherheiten übereinstimmen. Besonders vertrauenerweckend wird das natürlich dann, wenn ein gemessener Wert innerhalb der Unsicherheiten des jeweils anderen liegt.

Um aber systematische Unsicherheiten angeben zu können, müssen die einzelnen Fehlerquellen in geeigneter Weise kombiniert werden, was in vielen Fällen dadurch erschwert wird, dass diese Quellen miteinander korreliert sind.

Angegeben werden diese Unsicherheiten häufig in Form von sogenannten Fehlerbalken oder Fehlerbändern. Ein gutes Beispiel dafür sind die Temperaturtrends aus der Wettervorhersage. Dort ist eine meist bunte Linie von einem grauen Balken umgeben. Und dieser Balken gibt die Unsicherheit auf die Temperatur an einem bestimmten Tag an.

Gleichzeitig sind Temperaturtrends aus der Wettervorhersage aber auch ein schlechtes Beispiel, denn es ist völlig unklar, wie diese Unsicherheiten berechnet wurden. Aber man muss hier fair sein und zugeben, dass eine solche Erklärung den Rahmen einer jeden Wettervorhersage sprengen würde. Und zwar komplett. Nicht so in wissenschaftlichen Publikationen. Neben der Quantifizierung der Unsicherheiten sollte dort auch immer vermerkt sein, wie diese bestimmt wurden. Ein weiteres Qualitätsmerkmal.

Auch Wissenschaftler greifen natürlich hin und wieder zu einfachen Modellen, um bestimmte Sachverhalte zu erklären. Und: Nur weil ein Modell einfach ist, ist es nicht notwendigerweise falsch, hat aber – und das ist entscheidend – große Unsicherheiten. Das bedeutet konkret, dass bestimmte aus dem Modell abgeleitete Vorhersagen einen sehr breiten Bereich abdecken können.

Das Quantifizieren von Unsicherheiten ist also ein wichtiges wissenschaftliches Werkzeug, insbesondere in der Kommunikation von Ergebnissen in Form von Fachartikeln. Diese spezielle Art des Quantifizierens lässt sich nur schwer oder gar nicht auf die persönliche und gefühlte Unsicherheit – insbesondere in Krisenzeiten – übertragen. Aber sie kann, als eines von vielen Qualitätskriterien, dabei helfen wissenschaftliche Publikationen von Falschmeldungen zu unterscheiden.

Unsicherheit, auch gefühlte Unsicherheit, wird dadurch nicht beseitigt, aber Behauptungen und vor allem Ergebnisse und deren Gültigkeitsbereich können so besser eingeschätzt werden. Ein Messergebnis ist nicht notwendigerweise falsch, nur weil es von einem früheren Messergebnis abweicht. Und es ist erst recht nicht falsch, wenn beide Messergebnisse innerhalb ihrer Unsicherheiten übereinstimmen.

Was gewinnt man also durch die Kenntnis dieser Unsicherheiten?

Ich glaube Gelassenheit. Messprozesse sind nicht perfekt, aber Wissenschaftler sind sich dieses Mangels an Perfektion mehr als bewusst und tragen dem Rechnung. Und Gelassenheit ist doch immer gut. Auch im Bezug auf Personenwaagen.

 

Literaturhinweise

National Institute on Standards and Technology:, Rydberg Konstante. URL: https://physics.nist.gov/cgi-bin/cuu/Value?ryd

Physikalisch Technische Bundesanstalt: Das Kilogramm. URL: https://www.ptb.de/cms/forschung-entwicklung/forschung-zum-neuen-si/countdown-zum-neuen-si/das-kilogramm.html