ETL Extraktionsprozess
Im ETL Extraktionsprozess werden Konventionen für die Verbindungsarten zu den Quellsystemen und Übertragungsarten der Daten definiert.
Des Weiteren wird der Zeitpunkt für die Aktualisierung der Daten definiert. Bei der Aktualisierung der Datenbestände wird zwischen der synchronen und asynchronen Extraktion unterschieden:
Bei einer synchronen Extraktion wird die Aktualität der Daten stets gewährleistet und befindet sich immer auf dem aktuellen Stand. Das hat den Nachteil, dass ein erhöhter Ressourcenanspruch der Netzwerkauslastung entsteht.
Bei der asynchronen Extraktion werden Daten ressourcensparend repliziert, d. h. wenn genügend Ressourcen vorhanden sind.
Oft werden solche Vorgänge über den Tag oder in die Nacht verlagert, um so wenige Probleme wie möglich zu verursachen. Ferner wird zwischen der statischen und inkrementellen Extraktion unterschieden:
Die statische Extraktion erzeugt ein komplettes Abbild (Snapshot) einer Datenbank. Dieser Vorgang wird bei der Erstbefüllung oder der Wiederherstellung eines bestimmten Systemzustandes verwendet.
Die inkrementelle Extraktion liest nur die Änderungen zwischen dem aktuellem und letztem Extraktionsschritt aus. Diese Unterschiede werden mittels des Transaction-Logs unterschieden.