52 RISIKO MANAGER 10|2019 2. Die Schätzung der erwarteten durchschnittlichen Anzahl von jährlichen Oberleitungsschäden kann andererseits auch ergänzt werden durch die Aussage über eine (subjektive) Bandbreite von äußerst plausiblen Werten für λ: Die erwartete durchschnittliche Schadenanzahl wird vom Betriebsleiter auf 1,7 geschätzt. Ferner glaubt der Experte, dass die „wahre“ durchschnittliche Schadenanzahl mit 80-prozentiger Wahrscheinlichkeit nicht größer als 2,5, aber mindestens 0,5, beträgt. Mathematisch liefert die Lösung des folgenden Gleichungssystems die geschätzten Werte für die Hyperparameter α und β. Der Einsatz von Software-Programmen wie beispielsweise R erleichtert unterdessen häufig die Bestimmung der Hyperparameter. ( Gleichung 10) Gleichung 10 Die Lösungen α ≈ 3,846 und β ≈ 0,442 spezifizieren die A-priori-Verteilung von λ. ( Abb. 06) Weitere Möglichkeiten die Hyperparameter mithilfe subjektiver Wahrscheinlichkeiten zu bestimmen, können Berger [vgl. Berger 2013 S. 77 ff.] entnommen werden. Basiert das Vorwissen andererseits auf einer ausreichend großen Datenmenge, können wiederum die Methoden der klassischen Statistik herangezogen werden, um die Hyperparameter der A-priori-Verteilung zu schätzen. Mit der Bestimmung der Hyperparameter erfolgt schließlich die vollständige Spezifizierung der A-priori-Verteilung von λ. Kombination von Vorwissen mit aktuellen Daten: A-posteriori- Verteilung von λ Das Gesamtrisikomodell für die jährlichen Oberleitungsausfälle wird durch die jährliche Gesamtschadensumme anhand der Schadenanzahl N sowie der Schadenhöhe je Vorfall X i , für i = 1, …, N, beschrieben. ( Abb. 01) Das Submodell der Schadenanzahl N wird durch ein Verteilungsmodell, die Poisson-Verteilung mit Parameter λ, beschrieben. Die Wahrscheinlichkeitsfunktion der Poisson-Verteilung ist gegeben durch Gleichung 11 Gleichung 11 Gegeben den bekannten Parameter λ, ordnet die Wahrscheinlichkeitsfunktion jeder Schadenanzahl m ihre Eintrittswahrscheinlichkeit P(N = m|λ) zu. Da λ, die durchschnittliche jährliche Schadenanzahl, in der Praxis eine unbekannte, nicht messbare Größe ist, wurde zunächst die Parameterunsicherheit mithilfe der Bayesschen Statistik modelliert. Dazu wurde λ als Zufallsgröße aufgefasst und der Glaube an mögliche, plausible Werte für λ durch Wahrscheinlichkeiten ausgedrückt. Alle Vorinformationen I wurden durch die A-priori-Verteilung von λ spezifiziert: λ ~ Gamma(3,846; 0,442) Das Vorwissen zu dem unbekannten Parameter kann anschließend mit empirischen Daten oder neuen qualitativen Informationen aktualisiert werden. Das Bayessche Theorem bildet diesen Lernprozess ab. Das Ergebnis der Aktualisierung durch neue Informationen ist die A-posteriori-Verteilung von λ. Zur Bestimmung der A-posteriori-Verteilung des unbekannten Parameters λ wird die A-priori-Verteilung durch die vorliegenden Daten mithilfe der Likelihood gewichtet. Da in diesem Praxisbeispiel für die Modellierung von λ konjugierte Verteilungen herangezogen wurden, ist in Konsequenz die A-posteriori-Verteilung wieder eine Gamma-Verteilung. Die Aktualisierung des Verteilungsmodells erfolgt über die Hyperparameter der Gamma-Verteilung. Der folgende Algorithmus für die Hyperparameter der k-ten Aktualisierung, α̂ k und β̂ k, kann inklusive weiterer Hintergründe beispielsweise Shevchenko/Wüthrich [vgl. Shevchenko/Wüthrich 2008] entnommen werden. Die Aktualisierung basiert auf den Hyperparametern der jüngst verwendeten A-posteriori-Verteilung von λ, ausgedrückt durch die Hyperparameter α̂ k-1 und β̂ k-1: A-posteriori-Verteilung von λ nach k-ter Aktualisierung: wobei m k die neu gewonnene, neu beobachtete Anzahl von Oberleitungsschäden ist, die die k-te Aktualisierung initiiert hat. Praktisch kann eine Aktualisierung notwendig sein, wenn im ersten Geschäftsjahr keine Daten vorlagen. Die Risikoquantifizierung basierte somit ausschließlich auf der mit Expertenwissen modellierten A-priori-Verteilung von λ. Liegen dem Risikomanagement anschließend der Verkehrsgesellschaft zusätzliche Informationen vor, so kann die Aktualisierung des Risikomodells durch neu berechnete Hyperparameter erfolgen. Wurde beispielsweise im zurückliegenden Jahr kein Oberleitungsschaden beobachtet, so ergibt sich nach der ersten Aktualisierung (k = 1) die A-posteriori-Verteilung von λ als Gammaverteilung mit den Parametern α̂ 1 = 3,846 + 0 = 3,846 und β̂ 1 = 0,442 ⁄ (1 + 0,442) = 0,307. In jedem neuen Geschäftsjahr ergänzt ein neuer Beobachtungswert für die jährliche Schadenanzahl die Daten, sodass jährlich eine Fortschreibung des Gesamtrisikomodells durch eine aktualisierte A-posteriori-Verteilung von λ in der Risikoquantifizierung berücksichtigt werden kann. Die Aktualisierung des Verteilungsmodells für λ im Zeitverlauf ist beispielhaft für einen Datensatz von n = 4 Jahren in Abb. 07 dargestellt. Quantifizierung des jährlichen Oberleitungsschadens Im Zeitverlauf bietet die Bayessche Statistik Methoden an, neue Informationen in der Risikoquantifizierung zu berücksichtigen. Zu einem konkreten Bewertungszeitpunkt ist jedoch die Bestandsgefährdung von Interesse, die von den Oberleitungsausfällen im Prognosejahr ausgeht. Aus diesem Grund werden die Submodelle für Schadenanzahl und Schadenhöhe zu der Wahr-
OpRisk 53 Abb. 06 A-priori-Verteilung für λ aus den Fallbeispielen 1 und 2 50 % 80 % Werte für die durchschnittliche Schadenanzahl (Beispiel 1) Werte für die durchschnittliche Schadenanzahl (Beispiel 2) Abb. 07 Aktualisierung des A-priori-Wissens über λ – 4-jähriger Lernprozess A-priori-Verteilung im Jahr 0 Lernprozess Jahr Schadenanzahl 1 0 1 3,846 0,307 1,181 2 1 2 4,846 0,235 1,139 3 0 3 4,846 0,190 0,921 4 2 4 6,846 0,160 1,095 scheinlichkeitsverteilung der jährlichen Gesamtschadensumme zusammengeführt. Anschließend ermöglicht die Anwendung von Risikomaßen die Bestimmung des Risikoumfangs, der durch jährliche Oberleitungsausfälle verursacht wird. Parameterunsicherheiten im Gesamtrisikomodell Das Gesamtrisikomodell für die jährlichen Oberleitungsausfälle wird anhand der Schadenanzahl N und der Schadenhöhe je Vorfall X i , für i = 1, …, N, modelliert. Da angenommen wird, dass die einzelnen Schadenhöhen je Vorfall die gleiche Wahrscheinlichkeitsverteilung besitzen und unabhängig voneinander auftreten, wird die Analyse der Parameterunsicherheiten für
Laden...
Laden...
Laden...
Copyright Risiko Manager © 2004-2017. All Rights Reserved.