🏠 » Datenmodellierung » Normalisierung » Vierte Normalform (4NF)

Vierte Normalform (4NF)

Die Vierte Normalform schließt an die Boyce-Codd-Normalform und deren normalisierte Datenmodellierung an.

Zusätzlich muss zum Erreichen der Vierten Normalform (4NF) die Bedingung erfüllt sein, dass Abhängigkeiten von mehrwertigen Attributmengen trivial sind und eine Attributmenge der Schlüsselkandidat der Relation ist.

Das bedeutet, dass keine Redundazen in funktional abhängigen Attributen existieren können.

Vierte Normalform Definition

Ein Relationstyp befindet sich genau dann in der vierten Normalform (4NF), wenn er sich in der Bocye Codd Normalform (BCNF) befindet und für jede mehrwertige Abhängigkeit einer Attributmenge Y von einer Attributmenge X gilt: - Die mehrwertige Abhängigkeit ist trivial ist oder - X ist ein Schlüsselkandidat der Relation.

Vierte Normalform - Beispiel für eine triviale Abhängigkeit

Ein Beispiel für eine triviale Abhängigkeit ist beispielsweise, dass zu einem Kunden alle bestellten Artikel gespeichert werden. Identifiziert die KundenNr nicht nur einen Artikel sondern eine ganze Liste verschiedener Artikel, spricht man von einer mehrwertigen Abhängigkeit. Die Relation ist dennoch in der 4. NF, da die Abhängigkeit trivial und die KundenNr der Schlüsselkandidat der Tabelle ist.

KundenNrArtNr
0061010
0071010
0071020
0071050

Vierte Normalform Beispiel

Ausgangspunkt der folgenden Betrachtung ist die Tabelle, die Auskunft gibt, welche Artikel von einem Kunden an welche Adresse verschickt wurden. Hier liegen gleich zwei mehrwertige Abhängigkeiten zwischen KundenNr-ArtNr und KundenNr-Lieferanschrift vor. Zwischen ArtNr und Lieferanschrift gibt es keine Abhängigkeit, weswegen keine funktionale Abhängigkeit besteht.

KundenNrArtNrLieferanschrift
0071010Musterstr. 1
0061010Blumenweg 4
0071020Beispielweg 13
0071050Beispielweg 13
0071010Musterstr. 1

Um die mehrwertigen Abhängigkeiten aufzulösen, muss die Tabelle aufgeteilt werden. Hier ergibt sich wieder die Tabelle 1 aus dem eingangs beschriebenen Beispiel, da die mehrwertige Abhängigkeit in eine triviale aufgelöst wird.

KundenNrArtNr
0061010
0071010
0071020
0071050

Neue Tabelle: "Kunde-Lieferanschriften"

KundenNrLieferanschrift
006Blumenweg 4
007Musterstr. 1
007Beispielweg 13

Dadurch entsteht eine zusätzliche Referenztabelle, die meist nur eine neue Spalte enthält. Die Primär-Fremdschlüssel-Beziehungen bleiben weiterhin bestehen. Die Aufteilung muss sicherstellen, dass alle Daten der Ausgangstabelle wieder zusammengesetzt werden können. Darüber hinaus dürfen keine Daten verloren gehen, wenn ein Datensatz gelöscht wird.

Warum wird die Vierte Normalform in der Praxis nicht verwendet?

Bei der Erstellung relationaler Datenmodelle hat sich die 3. NF als praxistauglich erwiesen und wird in der überwältigenden Mehrheit relationaler Datenmodelle eingesetzt. 1. und 2. NF kommen dann zum Einsatz, wenn Daten in Systeme geladen werden (z. B. im DWH Bereich) oder eine Normalisierung, aufgrund einer geringeren Relevanz und zugunsten von besserer Performance, in den Hintergrund tritt (z. B. Reporting).

Warum normalisiert man nicht alle Datenmodelle?

Eine zu starke Normalisierung der Daten hat negative Folgen. Durch die Normalisierung werden zusätzliche Tabellen benötigt, die administrativen Aufwand erzeugen (z. B. Speicherplatz, Berechtigung, referenzielle Integrität). Zudem verlangsamt es die Abfragegeschwindigkeit, da die Tabellen erst mithilfe von Joins verknüpft werden müssen. Daher wird besonders in der Datenanalyse und dem Reporting die Normalisierung aufgehoben, um durch Redundanz Ergebnisse schneller abzurufen.

Weiterführende Artikel