Vierte Normalform (4NF)

Die Vierte Normalform schließt an die Boyce-Codd-Normalform und deren normalisierte Datenmodellierung an.

Zusätzlich muss zum Erreichen der Vierten Normalform (4NF) die Bedingung erfüllt sein, dass Abhängigkeiten von mehrwertigen Attributmengen trivial sind und eine Attributmenge der Schlüsselkandidat der Relation ist.

Das bedeutet, dass keine Redundazen in funktional abhängigen Attributen existieren können.

Vierte Normalform Definition

Ein Relationstyp befindet sich genau dann in der vierten Normalform (4NF), wenn er sich in der Bocye Codd Normalform (BCNF) befindet und für jede mehrwertige Abhängigkeit einer Attributmenge Y von einer Attributmenge X gilt: - Die mehrwertige Abhängigkeit ist trivial ist oder - X ist ein Schlüsselkandidat der Relation.

Vierte Normalform - Beispiel für eine triviale Abhängigkeit

Ein Beispiel für eine triviale Abhängigkeit ist beispielsweise, dass zu einem Kunden alle bestellten Artikel gespeichert werden. Identifiziert die KundenNr nicht nur einen Artikel sondern eine ganze Liste verschiedener Artikel, spricht man von einer mehrwertigen Abhängigkeit. Die Relation ist dennoch in der 4. NF, da die Abhängigkeit trivial und die KundenNr der Schlüsselkandidat der Tabelle ist.

KundenNr	ArtNr
006	1010
007	1010
007	1020
007	1050

Vierte Normalform Beispiel

Ausgangspunkt der folgenden Betrachtung ist die Tabelle, die Auskunft gibt, welche Artikel von einem Kunden an welche Adresse verschickt wurden. Hier liegen gleich zwei mehrwertige Abhängigkeiten zwischen KundenNr-ArtNr und KundenNr-Lieferanschrift vor. Zwischen ArtNr und Lieferanschrift gibt es keine Abhängigkeit, weswegen keine funktionale Abhängigkeit besteht.

KundenNr	ArtNr	Lieferanschrift
007	1010	Musterstr. 1
006	1010	Blumenweg 4
007	1020	Beispielweg 13
007	1050	Beispielweg 13
007	1010	Musterstr. 1

Um die mehrwertigen Abhängigkeiten aufzulösen, muss die Tabelle aufgeteilt werden. Hier ergibt sich wieder die Tabelle 1 aus dem eingangs beschriebenen Beispiel, da die mehrwertige Abhängigkeit in eine triviale aufgelöst wird.

KundenNr	ArtNr
006	1010
007	1010
007	1020
007	1050

Neue Tabelle: "Kunde-Lieferanschriften"

KundenNr	Lieferanschrift
006	Blumenweg 4
007	Musterstr. 1
007	Beispielweg 13

Dadurch entsteht eine zusätzliche Referenztabelle, die meist nur eine neue Spalte enthält. Die Primär-Fremdschlüssel-Beziehungen bleiben weiterhin bestehen. Die Aufteilung muss sicherstellen, dass alle Daten der Ausgangstabelle wieder zusammengesetzt werden können. Darüber hinaus dürfen keine Daten verloren gehen, wenn ein Datensatz gelöscht wird.

Warum wird die Vierte Normalform in der Praxis nicht verwendet?

Bei der Erstellung relationaler Datenmodelle hat sich die 3. NF als praxistauglich erwiesen und wird in der überwältigenden Mehrheit relationaler Datenmodelle eingesetzt. 1. und 2. NF kommen dann zum Einsatz, wenn Daten in Systeme geladen werden (z. B. im DWH Bereich) oder eine Normalisierung, aufgrund einer geringeren Relevanz und zugunsten von besserer Performance, in den Hintergrund tritt (z. B. Reporting).

Warum normalisiert man nicht alle Datenmodelle?

Eine zu starke Normalisierung der Daten hat negative Folgen. Durch die Normalisierung werden zusätzliche Tabellen benötigt, die administrativen Aufwand erzeugen (z. B. Speicherplatz, Berechtigung, referenzielle Integrität). Zudem verlangsamt es die Abfragegeschwindigkeit, da die Tabellen erst mithilfe von Joins verknüpft werden müssen. Daher wird besonders in der Datenanalyse und dem Reporting die Normalisierung aufgehoben, um durch Redundanz Ergebnisse schneller abzurufen.

Weiterführende Artikel

Fünfte Normalform (5NF)

🏠 » Datenmodellierung » Normalisierung » Vierte Normalform (4NF)