Andreas Kandlbinder ist einer unserer Spezialisten in Sachen Data Warehouse, ETL und Datenintegration. Er berichtet über einige Anwendungsfälle seiner Kunden, in denen die Datenreplikation zum Einsatz kommt.
Andreas, du bist bei der mip Senior Consultant und siehst deine Schwerpunkte in der Implementierung und dem Testen in den Bereichen ETL, Datenintegration, DWH und Business Intelligence. Eines deiner Lieblingsthemen dreht sich um die Datenreplikation. Dazu habe ich ein paar Fragen an dich.
Wofür benötigt man die Replikation von Daten?
Ganz einfach – um homogene und heterogene Datenbanken miteinander zu verbinden. Der simpelste Fall ist, es gibt eine Quell-Datenbank und eine Ziel-Datenbank. Doch ca. 80 % meiner Kunden haben verschiedene Datenbanken im Einsatz, auch in komplexen Umgebungen und nutzen die Replikation, um Daten zeitnah auszutauschen.
In welchen speziellen Fällen wird sie eingesetzt?
Es spielen viele Faktoren dabei eine Rolle. Die Replikation kommt in den verschiedensten Fällen zum Einsatz. Beispielsweise, wenn ich die Daten near-real-time auf dem Zielsystem benötige.
Oder oftmals ist für einen ETL-Prozess die Datenmenge einfach zu groß, um diese in der Nacht in einem Schwung zu laden.
Manches Mal ist eine Delta-Ladung datentechnisch nicht möglich, weil das dafür notwendige Änderungsdatum fehlt. Auch da kann die Replikation die bessere Methode sein.
Wenn ein gegenseitiger Austausch zwischen zwei Datenbank-Systemen stattfinden muss, d. h. die Replikation wird bei einer bi-direktionalen Spiegelung eingesetzt.
Angebracht ist sie oft, wenn die Systeme nicht mit einer „Hauruck“ Datenladung nachts belastet werden sollen.
Oder wenn es vorteilhafter ist, über die Verbindungen zwischen den Rechenzentren kontinuierlich kleine Datenpakete zu schicken, als über Nacht ein großes Paket.
Wie setzen unsere Kunden das ein?
Einer unserer Kunden, ein Unternehmen, das elektronische Bausteine und Sensoren für die Fabrikautomatisierung herstellt, hat verschiedenen Standorte weltweit. Aus Kostengründen ist die Datenverbindung zwischen den Standorten eingeschränkt. Durch die Datenreplikation ist es möglich, kontinuierlich die Datenbanken gegeneinander abzugleichen. Das Gute daran ist, dass so die Leitungen nachts nicht durch zu große Datenladungen blockiert werden.
Hast Du noch ein weiteres Praxisbeispiel?
Ja sicher, ein Unternehmen aus der chemischen Industrie, hat mehrere Herausforderungen. Zum einen wird die Produktiv-Datenbank durch das Reporting, das zeitnah und aktuell erfolgen soll, zu sehr belastet. Zum anderen muss dafür gesorgt werden, dass die Satelliten-Datenbanken für die Produktionsstraßen, im Falle eines Ausfalles der Haupt-Datenbank noch für mehrere Stunden die Produktion am Laufen halten. Für beide Herausforderungen ist Replikation hervorragend geeignet. Die Daten werden beim Entstehen in der Haupt-Datenbank near-real-time sowohl in die Reporting- als auch in die Satelliten-Datenbanken übertragen. Dadurch können die Daten im Reporting jederzeit ausgewertet werden, ohne dass die Produktiv-Datenbank belastet wird. Und es wird gewährleistet, dass bei einer geplanten oder auch ungeplanten Downtime – was hoffentlich selten vorkommt – trotzdem über mehrere Stunden weiter produziert werden kann.
Wie kannst du hierbei unsere Kunden unterstützen?
Ich helfe meinen Kunden, genau diese Lösungen zu entwickeln, die ihre Datenladeprozesse für homogene und heterogene Datenbanken optimieren. Je nach Anforderung können das bewährte ETL-Prozesse sein oder speziell zugeschnittene Lösungen der Datenreplikation. Ich berate meine Kunden und wir finden zusammen die richtige Lösung, die für seine Zwecke passt. Weiterhin installiere ich die Software und übernehme die Ersteinrichtung ebenso wie Inbetriebnahme, die Überwachung und Optimierung des Replikationsprozesses und gerne auch die weiterführende Betreuung im Betrieb.
Für Kunden, die sich diese Leistungen als regelmäßigen Service holen wollen, haben wir auch ein spezielles Rundum-Sorglos Paket. Da ist auch ein Cockpit zur Traffic und Datenstromanalyse und dem Betrieb der Konfiguration beinhaltet.
Hast du ein Lieblings-produkt?
Ja, eines meiner bevorzugten Tools ist IBM Data Replication, da es für alle gängigen Datenbanken explizite Konnektoren gibt, die sehr gut kommunizieren und zusammenarbeiten können. Es werden beispielsweise alle gängigen Relational Database Management Systeme (RDBMS) als Quelle und Ziel unterstützt, wie Db2, Informix, MS SQL, Oracle und viele mehr. Es gibt auf unserer Webseite eine Übersicht aller Systeme dazu.
IBM Data Replication habe ich schon in unzähligen Kunden-Projekten eingesetzt und sie hat sich immer bewährt. Meine Erfahrungen daraus gebe ich sehr gerne weiter.
Andreas, es ist doch beeindruckend, in welch unterschiedlichen Anwendungsfällen die Replikation von Daten eine wichtige Rolle spielt. Vielen Dank, dass du uns das Thema Datenreplikation aus deiner Praxisperspektive nähergebracht hast.
Das Interview führte Gabriela von Bargen / Marketing.
Wenn Sie mehr darüber erfahren möchten, wie wir Sie bei Ihren Herausforderungen der Datenreplikation unterstützen können, dann werfen Sie einen Blick auf unsere Kompetenzseite