Sie möchten von Lissabon nach Warschau fliegen? Oder von Edinburgh nach Oslo? Ryanair bringt Sie hin – und an so gut wie jedes andere Ziel in Europa. Mit 600.000 Flügen pro Jahr ist Ryanair Europas kostengünstigste und pünktlichste Fluggesellschaft.

Seit dem Start ihrer ersten Route im Jahr 1985 mit einer 15-sitzigen Maschine befördert Ryanair heute auf täglich über 1.800 Flügen fast 120 Millionen Passagiere pro Jahr an mehr als 200 Ziele.

Bei Preisen von beispielsweise 5,76 € für einen einfachen Flug von London nach Straßburg ist es kein Wunder, dass die Ryanair-Website jeden Tag mehr als 1,3 Millionen Besucher verzeichnet. Für Declan Costello, Infrastructure and Operations Manager bei Ryanair, gehört die Website damit zu den wichtigsten Aufgaben seines Teams. Denn wenn auf der Ryanair-Website irgendetwas nicht richtig funktioniert, sind die Passagiere nicht in der Lage, Flüge zu buchen, einzuchecken, Autos zu mieten oder Bordkarten auszudrucken.

Einblick verschaffen

Noch vor nicht allzu langer Zeit hatten Costello und sein Team nur wenig Einblick in Performance und Troubleshooting der Website. Anhand der Ladezeiten der Seiten konnten die vier Mitglieder des für die Website verantwortlichen Teams zwar erkennen, dass etwas nicht stimmte, aber auch nicht viel mehr. „Wir wussten dann zwar, dass die Website langsamer oder gar nicht mehr funktionierte, hatten aber keine Ahnung, wo das Problem lag, und auch keine Daten, an denen wir es hätten feststellen können“, sagt er.

Die Ryanair-Website ist mit den unternehmenseigenen Backend-Systemen sowie mit externen Services wie Autovermietung, Hotelbuchung, Parkplatzreservierung und anderen Reiseangeboten verbunden, die ebenfalls durch Ryanair vermittelt werden. Wenn also irgendwo in diesem Ökosystem ein Fehler auftrat, musste Costellos Team versuchen herauszubekommen, was passiert war. „Wir gerieten dann in helle Aufregung und begannen, die Website zu testen und die Seite zu suchen, die für die Leistungsabfälle, Fehler oder Timeouts im gesamten System verantwortlich sein könnte“, blickt Costello zurück.

Echtzeitdaten jede Minute – Tag für Tag

Ein Architekt in Costellos Team hörte von der New Relic platform und beschloss, sie auf der mobilen Ryanair-Website zu testen. New Relic bestand den Test mit Bravour, woraufhin Ryanair das System auch auf der Hauptwebsite einrichtete. Schon bald diente es nicht nur Costellos Team, sondern der gesamten IT und dem ganzen Unternehmen als zentrale Quelle für Performancedaten.

„Inzwischen haben wir unsere bisherigen Überwachungskomponenten abgeschaltet, weil New Relic längst unsere globale ‚Bibel‘ für die Website ist“, berichtet Costello. „Ich nutze New Relic jede Minute – Tag für Tag.“ An einer Wand im Büro von Ryanair werden auf neun verschiedenen Bildschirmen Echtzeit-Dashboards von New Relic angezeigt, während woanders im Büro weitere Monitore mit nützlichen Echtzeitdaten aus New Relic Insights zu finden sind.

Neben dem Operations-Team haben auch alle Entwickler bei Ryanair Zugriff auf New Relic. „Genau wie wir“, sagt Costello, „sind auch alle anderen Umgebungen komplett ausgestattet, bis hin zur Entwicklungs-, Integrations-, Benutzerakzeptanztest-, Produktionsvorbereitungs-, Staging- und Produktionsumgebung.“

Benötigte Metriken sichtbar machen

Was beobachten die Mitarbeiter in den New Relic-Dashboards? Die wichtigste Metrik im gesamten Unternehmen ist die Anzahl der verkauften Sitzplätze oder Flüge. „Diese Zahl haben alle im Blick“, so Costello, „vom Commercial Yields-Team bis zur Chefetage. Sie beobachten sie tagein, tagaus auf ihren Mobiltelefonen und ein Manager hat sie sogar an seiner Wand.“

Vor New Relic musste man Daten aus einer E-Mail übernehmen, die alle 30 Minuten von der Backend-Buchungsengine versendet wurde, und in eine Tabelle eintragen, um diese Zahl zu erhalten. „Irgendjemand musste diese Tabelle Stunde für Stunde den ganzen Tag über aktualisieren“, erinnert sich Costello. Heute ist diese Information auf einen Blick in Echtzeit verfügbar.

„Dank New Relic arbeiten wir jetzt alle besser und schneller. Ohne New Relic wäre das Troubleshooting in dieser Umgebung gar nicht möglich.“

Declan Costello Infrastructure and Operations Manager, Ryanair

Über das Troubleshooting der Website-Performance hinaus

Neben den verkauften Flügen verfolgt Ryanair noch viele weitere Metriken wie Online-Checkins, Suchen nach verfügbaren Flügen, Antwortzeiten bei Zahlungen, Kontoregistrierungen für MyRyanair, fehlgeschlagene Logins, Zahlungsfreigaberaten und Fehlerraten, und zwar sowohl auf der Hauptwebsite als auch auf der mobilen Variante. Costellos Team und andere Bereiche des Unternehmens nutzen diese Metriken wie folgt:

  • Trends und Muster aufdecken: Mit dem Timepicker in New Relic Insights kann Ryanair rasch und mühelos Metriken über verschiedene Zeiträume hinweg vergleichen. „Auf diese Weise können wir zum Beispiel erkennen, dass die Anzahl der verkauften Sitzplätze und der Checkins in der vergangenen Woche am selben Tag zur selben Uhrzeit eingebrochen ist“, erklärt Costello.
  • Performanceprobleme mit externen Services identifizieren: Ob eine Bank mit langsamen Genehmigungszeiten für Kreditkarten, eine falsche IP-Adresse bei PayPal oder eine Buchungsengine für eine Mietwagenfirma, die langsame Aufrufe verursacht – mit der New Relic Query Language (NRQL) kann Costellos Team in rascher Folge immer wieder eine Reihe komplexer Fragen zum System stellen und schnell Kontext aufbauen, bis es Hinweise darauf findet, wo das Problem liegen könnte.
  • Cyberangriffe erkennen: Screenscraper, die die Gesamtleistung beeinträchtigen können, sind für Ryanair ein großes Problem. Mithilfe von New Relic kann das Operations-Team Screenscraper aufspüren und dafür sorgen, dass derartige Angriffe von der Anti-Scraping-Technologie des Unternehmens blockiert werden.
  • Zunahme von Zahlungsbetrugsversuchen erkennen: Anhand des Verhältnisses zwischen offenen Zahlungen und Zahlungsgenehmigungen kann Ryanair feststellen, ob Betrugsversuche zunehmen oder Änderungen an der Betrugserkennungstechnologie unbeabsichtigte Auswirkungen haben. In diesem kritischen Bereich wird Costellos Team durch New Relic NRQL-Alarme automatisch benachrichtigt, wenn Metriken zu Zahlungsvorgängen bestimmte Schwellwerte überschreiten.

Ein besseres, schnelleres, flexibleres und unabhängigeres Team

Costello ist überzeugt, dass sein Operations-Team dank der New Relic Digital Intelligence Platform unabhängiger geworden ist. Es ist nicht mehr darauf angewiesen, dass ihm ein Softwarearchitekt mitteilt, welcher Bereich der Website oder welches externe System Fehler verursacht, sondern kann die Performance selbst überwachen und Probleme in Echtzeit diagnostizieren. „Dank New Relic arbeiten wir jetzt alle besser und schneller“, sagt Costello.

Außerdem ist das IT-Operations-Team von Ryanair heute in der Lage, deutlich mehr Verantwortung zu übernehmen und mit derselben kleinen Gruppe von vier Mitarbeitern mehr kundenorientierte Infrastruktur zu unterstützen. „Früher hatten wir nur eine Website zu überwachen, doch inzwischen sind es fünf Websites mit neun verschiedenen Microservices, die alle miteinander vernetzt sind und miteinander kommunizieren“, gibt Costello zu bedenken. „Ohne New Relic wäre das Troubleshooting in dieser Umgebung gar nicht möglich.“ Doch mit New Relic kann die Ryanair-Website auch weiterhin dem Firmenmotto „Always Getting Better“ gerecht werden und bietet heute dank Full-Stack-Transparenz und digitaler Intelligenz ein noch besseres Kundenerlebnis.