msc - Wissen für Ihre Produktivität.

Direkt zum Kursprogramm

Detaillierte Projektbeispiele finden Sie hier...

Was ist RCM ?

Maxime 4 + Maxime 5 + Maxime 6

 

 

Maxime 4

ALT: Die meisten Geräte fallen eher aus je älter sie werden
NEU: Die meisten Störungen werden nicht häufiger je älter die Geräte werden

Für Jahrzehnte war es gang und gäbe zur Optimierung der Leistung technischer Anlagen diese regelmässig zu überholen oder Teile in festen Intervallen zu ersetzen. Dieses basierte auf der Annahme es gibt einen direkten Zusammenhang zwischen der Zeitdauer (oder Anzahl Zyklen) die eine technische Anlage in Betrieb ist und der Wahrscheinlichkeit dass sie ausfallen wird, wie in Abbildung 2 dargestellt. Dieses suggeriert, dass die meisten Teile für eine bestimmte Zeitspanne "X" zuverlässig ihren Dienst versehen und dann verschlissen sind.

Paradig2Nach der klassischen Denkweise ist es möglich "X" aufgrund von bisherigen Aufzeichnungen über Störungen zu bestimmen. Dieses soll es dem Benutzer der Anlage ermöglichen, vorbeugende Maßnahmen kurz vor dem Eintritt einer zukünftigen Störung durchzuführen. Dieser vorhersehbare Zusammenhang zwischen Alter und Störung ist tatsächlich für einige Störarten vorhanden. Er scheint dort aufzutreten wo die Anlage in direkten Kontakt mit dem Produkt kommt. Beispiele sind Pumpenlaufräder, Ventilsitze, Brecheranlagen, Schraubenförderer und so weiter. Altersabhängige Störungen hängen auch oft mit Ermüdung und Korrosion zusammen.

  Technische Geräte sind heute jedoch allgemein viel komplexer als sie es eben noch vor 20 Jahren waren. Dieses führte zu veränderten Mustern von Anlagenstörungen wie in Abbildung 3 dargestellt. Die Kurven zeigen die zustandbedingte Wahrscheinlichkeit einer Störung über der Betriebszeit für eine breite Auswahl elektrischer und mechanischer Teile.
  Muster A ist die bekannte "Badewannenkurve" und Muster B ist dieselbe wie in Abbildung 2. Muster C zeigt eine leicht ansteigende Wahrscheinlichkeit einer Störung ohne spezifisches Verschleißalter. Muster D stellt eine niedrige Störwahrscheinlichkeit zu Beginn dar, mit dann schnellem Anstieg auf ein konstantes Niveau. Das Muster E dagegen zeigt eine konstante Wahrscheinlichkeit über die gesamte Betriebszeit und Muster F beginnt mit einer hohen Störwahrscheinlichkeit (Kinderkrankheiten) und fällt dann auf ein konstantes oder sehr langsam steigendes niedriges Niveau.
  Untersuchungen in der zivilen Luftfahrt zeigten, dass 4% der Teile mit Muster A übereinstimmen, 2% mit B, 5% mit C, 7% mit D, 14% mit E und nicht weniger als 68% mit Muster F. (Diese Verteilung in der Luftfahrt ist nicht notwendigerweise dieselbe wie in der Industrie, aber je komplexer technische Geräte werden, um so mehr Teile werden mit Muster F oder E übereinstimmen).
  Diese Erkenntnisse widersprechen dem Glauben, dass es immer einen Zusammenhang zwischen Zuverlässigkeit und Betriebszeit gibt - der Glauben der zu der Meinung führte, je öfter ein Gerät überholt wird, desto weniger wird es ausfallen. In der Praxis ist dies nahezu nie so. Außer bei dominierenden altersabhängigen Störarten helfen Überholung oder Austausch wenig oder gar nichts um die Zuverlässigkeit komplexer Teile zu verbessern.
  Die meisten Instandhaltungsprofis sind sich dieser Erkenntnisse bewusst. Sie kommen mit den Bedingungen der Realität von Zufälligkeit nach Jahrzehnten der Badewannenkurve zurecht. Die Tatsache jedoch, dass die Badewannenkurve immer noch in so vielen Texten über Instandhaltung vorkommt beweist den fast mystischen Glauben den manche Leute in den Zusammenhang von Alter und Störung haben. In der Praxis hat dieser Glauben zwei ernsthafte Nachteile:
 > Er führt zu der Annahme, wenn wir keine eindeutigen Fakten über die Existenz von altersabhängigen Störarten haben, dass es ratsam ist trotzdem das Gerät von Zeit zu Zeit "für alle Fälle", dass es vielleicht doch solch eine Störart gibt, zu überholen. Dieses vernachlässigt die Tatsache, dass Überholungen extrem eingreifende Maßnahmen sind, die stabile Systeme massiv beeinflussen. Als solche besitzen sie eine hohe Wahrscheinlichkeit Kinderkrankheiten zu erzeugen die Störungen verursachen, die man eigentlich dadurch verhindern wollte. Dies ist in Abbildung 4 dargestellt.
 > Auf einer mehr philosophischen Ebene überzeugen die Badewannengläubigen sich selbst es sei konservativer (in anderen Worten sicherer) anzunehmen jedes Teil hat ein Leben - und deshalb die Geräte auf der Basis des angenommenen Lebens zu überholen - als anzunehmen es könnte zufällig ausfallen. Nach der Einführung von Instandhaltungsprogrammen die auf dieser Annahme basieren, nehmen sie dann auch an, dass keine Störung zwischen diesen Überholungen auftreten können und alles was trotzdem auftritt kann nichts mit Instandhaltung zu tun haben, denn "wir haben es ja erst letzte Woche, letztes Jahr oder wann auch immer überholt". Die Möglichkeit, dass die Überholung selbst die Ursache einer Störung sein mag, wird von diesen Leuten üblicherweise gar nicht mehr wahrgenommen. Noch ernsthafter wirkt sich aus, wenn diese die wichtigste Schlussfolgerung im Zusammenhang mit Maxime 4 einfach nicht akzeptieren, die wie folgt formuliert werden kann:

  In Abwesenheit jedes gegenteiligen Beweises, ist es konservativer - d.h. sicherer - Instandhaltungsstrategien zu entwickeln die annehmen die Störung könnte jederzeit (in anderen Worten, zufällig) auftreten, als anzunehmen sie werden nur nach einer bestimmten Betriebszeit auftreten.
Zum Anfang

Maxime 5

ALT: Es müssen umfassende Daten über Störraten vorhanden sein, bevor es möglich ist ein wirklich erfolgreiches Instandhaltungsprogramm zu entwickeln.
NEU: Entscheidungen über das Management von Anlagenstörungen werden nahezu immer mit unzureichenden Daten über Störraten getroffen werden müssen.

Eine erstaunliche Zahl von Leuten glauben, eine effektive Instandhaltungspolitik könnte nur formuliert werden auf der Basis von umfangreichen historischen Informationen über Störungen. Tausende manuelle und computerunterstützte Aufzeichnungssysteme für technische Daten, wurden weltweit auf der Basis dieses Glaubens installiert. Es führte auch zu der großen Betonung der Störmuster wie im vorherigen Absatz dieses Beitrags besprochen. Doch vom Standpunkt der Instandhaltung aus, sind diese Störmuster voller Probleme, Rätsel und Widersprüche. Einige davon werden nachfolgend zusammengefasst:
Probengröße und -entwicklung:
Große Industrieprozesse besitzen normalerweise nur eine oder zwei Anlagen eines Typs. Sie werden eher nacheinander in Betrieb genommen als gleichzeitig. Das heißt die Probengröße ist eher zu klein für statistische Verfahren um sehr überzeugend zu wirken. Für neue Anlagen mit der modernsten Technologie sind sie immer zu klein.
  Diese Anlagen sind auch in einem kontinuierlichen Zustand der Weiterentwicklung und Änderung, speziell als Antwort auf neue Betriebsanforderungen und teilweise als Versuch Störungen zu beseitigen, die entweder ernsthafte Folgen haben oder die zu viel Kosten um sie zu verhindern. Das bedeutet, dass die Zeitspanne in der irgend eine Anlage in irgend einer speziellen Konfiguration betrieben wird, relativ kurz ist.
  Deshalb sind versicherungsstatistische Verfahren von wenig Nutzen, da die Datenbasis sehr klein ist und sich dauernd ändert. (Die wichtigste Erwartung ist, Unternehmen benutzen eine große Zahl identischer Geräte in fast gleicher Weise.)
Komplexität:
Die reine Anzahl und Ungleichheit von vorhandenen Anlagen in den meisten Industrieunternehmen bedeutet, dass es einfach unmöglich ist eine komplette analytische Beschreibung der Zuverlässigkeitscharakteristiken eines ganzen Unternehmens zu erstellen - oder auch nur einer wichtigen Anlage im Unternehmen.
  Dieses wird durch die Tatsache erschwert, dass viele Funktionsstörungen nicht durch zwei oder drei Störungsarten verursacht werden, sondern durch zwei oder drei Dutzend Störungsarten. Ein Ergebnis ist, während es sein mag, dass es recht einfach ist die Funktionsstörungen aufzulisten, ist es ein großes statistisches Unterfangen jedes Störungsmuster zu ermitteln und zu beschreiben, welches für jede Störart gilt. Dieses allein macht vernünftige versicherungsstatistische Analysen nahezu unmöglich.
Störungsmeldung:
Weitere Komplikationen treten auf durch unterschiedliche Meldeverfahren von einem Unternehmen zum anderen. Zum Beispiel, ein Teil mag in einer Fabrik ausgetauscht werden weil sich ein Ausfall anbahnt, während es in einer anderen Fabrik ausgetauscht wird weil es ausgefallen ist.
  Ähnliche Unterschiede werden durch unterschiedliche Leistungserwartungen verursacht. Eine Funktionsstörung ist definiert als die Unfähigkeit eines Teils die gewünschte Leistungsnorm zu erfüllen. Diese Leistungsnormen können natürlich für dieselbe Anlage unterschiedlich sein wenn die Betriebsbedingungen unterschiedlich sind, weshalb die Ansicht was gestört bedeutet ebenfalls unterschiedlich ist. Zum Beispiel die Pumpe in Abbildung 1 ist gestört, wenn sie unter den einen Bedingungen nicht in der Lage ist 300 Liter pro Minute zu liefern und unter anderen Bedingungen 350 Liter pro Minute.
  Diese Beispiele zeigen, eine Störung in einem Unternehmen - oder auch nur einem Teil eines Unternehmens muss nicht eine Störung in einem anderen sein. Dieses kann sich in zwei durchaus unterschiedlichen Stördaten für offensichtlich identische Teile ausdrücken.
Der grundlegende Widerspruch:
Ein Punkt der die ganze Frage der technischen Historie verhext ist die Tatsache, wenn wir Daten über Störungen sammeln ist es weil wir sie nicht verhindern. Die Einbeziehung dessen wird prägnant von Resnikoff (1978) in folgender Aussage zusammengefasst:
  "Die Gewinnung der Informationen welche Instandhaltungsplaner glauben zu benötigen - Informationen über kritische Störungen - ist im Prinzip unakzeptabel und ist Beweis für das Versagen des Instandhaltungsprogramms. Das ist so, weil kritische Störungen potentiell (in manchen Fällen sicher) den Verlust von Leben beinhalten, es jedoch keine Rate für den Verlust von Leben gibt, die für eine (jegliche) Organisation als Preis für Informationen über Störungen akzeptabel ist, welche zur Erstellung einer Instandhaltungspolitik benötigt werden. So ist der Instandhaltungsplaner mit dem Problem konfrontiert, ein Instandhaltungssystem zu entwerfen, für das der erwartete Verlust an Leben kleiner sein wird als eins über die geplante Betriebslebensdauer der Anlage. Das bedeutet, beides in der Praxis und im Prinzip, die Politik muss erstellt werden ohne Benutzung von Erfahrungsdaten welche vom Auftreten der Störung, die eigentlich verhindert werden sollen, gewonnen werden."
  Trotz großer Anstrengungen der Instandhaltungsplaner, wenn eine kritische Störung aktuell auftritt, geben Nowlan und Heap (1978) folgenden Kommentar über die Rolle von versicherungsstatistischen Analysen:
  "Die Entwicklung eines Zusammenhangs von Alter und Zuverlässigkeit, ausgedrückt durch eine Kurve der zustandsbedingten Wahrscheinlichkeit einer Störung, erfordert eine beträchtliche Menge an Daten. Wenn die Störung eine mit ernsthaften Folgen ist, wird dieser Datenpool nicht vorhanden sein, weil vorbeugende Maßnahmen notwendiger weise erst nach der ersten Störung getroffen werden können. So können versicherungs- statistische Analysen nicht benutzt werden um mit größter Sorgfalt Altersgrenzen festzustellen - welche notwendig sind die Betriebssicherheit zu schützen."
  Dieses führt zu dem grundlegenden Widerspruch die Vorbeugung von Störungen mit ernsten Folgen betreffend und den historischen Daten über solche Störungen: erfolgreiche vorbeugende Instandhaltung beinhaltet die Verhinderung des Sammelns historischer Daten welche wir glauben zu benötigen, um zu entscheiden welche vorbeugende Instandhaltungen wir tun sollten.
  Dieser Widerspruch gilt umgekehrt für das andere Ende der Skala von Folgen. Störungen mit geringen Folgen tendieren dazu genau deshalb erlaubt zu sein, weil sie nicht von großer Bedeutung sind. Als ein Ergebnis sind eine grosse Menge historischer Daten über diese Störungen verfügbar, das heisst es gibt ausreichendes Material für genaue versicherungsstatistische Analysen. Diese können sogar einige Altersgrenzen enthüllen. Trotzdem, da die Störung nicht von Bedeutung ist, ist es ziemlich unwahrscheinlich, dass die daraus folgende Instandhaltungsmaßnahme in festen Intervallen kosteneffektiv sein wird. Während also die versicherungstechnische Analyse dieser Informationen exakt sein mögen, ist sie aber wahrscheinlich reine Zeitverschwendung.
Schlussfolgerung:
  Die vielleicht wichtigste Schlussfolgerung aus den obigen Kommentaren ist, dass Instandhaltungsprofis ihre Aufmerksamkeit weg vom Störungszählen (in der Hoffnung eine elegant aufgebaute Punktetabelle wird uns sagen wie das Spiel in Zukunft zu spielen ist), hin zum vorhersehen oder vorbeugen von bedeutenden Störungen.
  Deshalb, um wirklich effektiv zu sein, müssen wir uns einfach mit dem Gedanken der Unbestimmtheit anfreunden und Strategien entwickeln welche uns in die Lage versetzen damit vertrauensvoll umzugehen. Wir müssen auch registrieren, dass wenn die Folgen von zu großer Unbestimmtheit nicht toleriert werden können, müssen wir die Folgen ändern. In extremen Fällen ist die einzige Möglichkeit dies zu tun, indem der betroffene Prozess aufgegeben wird.
Zum Anfang

Maxime 6

ALT: Es gibt drei Basistypen der Instandhaltung: vorhersehende, vorbeugende, korrektive
NEU: Es gibt vier Basistypen der Instandhaltung: vorhersehende, vorbeugende, korrektive, detektive

Fast alles was bis jetzt zum allgemeinen Thema Instandhaltungsstrategie geschrieben wurde, bezieht sich auf drei - und nur drei - Typen von Instandhaltung: vorhersehende, vorbeugende, korrektive. Vorhersehende (oder zustandsorientierte) Maßnahmen beinhalten das Prüfen ob sich eine Störung anbahnt. Vorbeugende Instandhaltung bedeutet üblicherweise Teile in festen Intervallen zu überholen oder auszutauschen. Korrektive Instandhaltung, oder Instandsetzung, bedeutet die Dinge reparieren entweder wenn man feststellt, dass sich ihr Zustand verschlechtert oder wenn sie ausgefallen sind.
  Trotzdem gibt es eine ganze Familie von Maßnahmen die nicht in eine der obigen Kategorien fällt. Wenn wir zum Beispiel periodisch den Feueralarm aktivieren, prüfen wir nicht ob sich eine Störung anbahnt. Wir machen auch sicherlich keine Überholung oder Austausch, und wir reparieren ihn auch nicht.
  Wir prüfen nur ob er immer noch funktioniert.
Maßnahmen die erdacht wurden zu prüfen ob etwas immer noch arbeitet sind bekannt als "Funktionsprüfung" oder "Fehler-Such-Maßnahmen". (Um die gleiche Begriffswelt wie die anderen drei Maßnahmen zu benutzen, nennt der Autor und seine Kollegen diese auch "detektive" Maßnahmen, weil sie dazu dienen eine aufgetretene Störung zu ermitteln.)
  Detektive Instandhaltung oder Fehler-Suche kann nur für verdeckte oder nicht offensichtliche Störungen angewandt werden, und verdeckte Störungen wiederum betreffen nur Schutzeinrichtungen.
  Wenn man eine wissenschaftliche Analysetechnik zur Ermittlung der Instandhaltungsstrategie auf nahezu jedes moderne, komplexe Industriesystem anwendet, findet man bis zu 40% Störarten welche in die verdeckte Kategorie fallen. Weiterhin bis zu 80% dieser Störarten erfordern Fehler-Suche, so ist typischer weise, ein Drittel der Maßnahmen die durch ein umfassendes, korrekt angewendetes Instandhaltungs- Strategie-Entwicklungsprogramm erzeugt werden, detektive Maßnahmen.
  Andererseits zeigt die gleiche Analysetechnik, dass es nicht ungewöhnlich ist, wenn Zustandsüberwachung für nur 20% der Störarten technisch machbar ist und eine Investition sich nur bei der Hälfte dieser Fälle lohnt. (Dieses bedeutet nicht, dass Zustandsüberwachung nicht genutzt werden soll - wo es geht, ist es sehr, sehr gut - aber wir müssen daran denken passende Strategien für die Handhabung der anderen 90% Störarten zu finden.)
Eine eher beunruhigende Erkenntnis ist, dass die meisten traditionellen Instandhaltungsprogramme weniger als ein Drittel der Schutzeinrichtungen überhaupt berücksichtigen (und dann noch in ungeeigneten Intervallen). Die Personen welche die Fabrik mit diesen traditionellen Programmen betreiben und instand halten sind sich bewusst, dass ein weiteres Drittel dieser Schutzeinrichtungen existiert, aber nicht beachtet wird. Es ist auch nicht unüblich, dass sogar niemand von der Existenz des restlichen Drittels weiß. Dieser Mangel an Bewusstsein und Aufmerksamkeit bedeutet, dass die meisten Schutzeinrichtungen in der Industrie - unsere letzte Schutzlinie wenn etwas schief geht - schlecht oder gar nicht instand gehalten werden.

Diese Situation ist komplett unhaltbar.

Wenn die Industrie es ernst meint mit Sicherheit und Umweltschutz, dann muss der gesamten Frage von detektiver Instandhaltung - Fehler-Suche - höchste Priorität gegeben werden, als eine vordringliche Angelegenheit. Weil mehr und mehr Instandhaltungsprofis sich dieses vernachlässigten Bereichs der Instandhaltung bewusst werden, wird es wahrscheinlich ein größeres Thema der Instandhaltungsstrategie in der nächsten Dekade werden, als es die voraussehende Instandhaltung in den letzten zehn Jahren war.
Zum Anfang