データベース正規形は、リレーショナルデータベース設計においてデータの重複を排除し、一貫性と整合性を保つために定められた段階的な規則群です。1970年代にエドガー・F・コッドによって提唱されたこの概念は、現代のデータベース設計において依然として重要な基礎理論となっています。
正規化の主な目的は、データの挿入、更新、削除時に発生する可能性のある異常を防ぐことにあります。非正規化されたテーブルでは、同じデータが複数箇所に存在するため、一部だけが更新されて不整合が生じるリスクがあります。正規化によりこのような更新異常を防ぎ、データの信頼性を高めることができます。
第1正規形では、各セルに単一の値のみを格納し、繰り返しグループを排除します。第2正規形では、主キーに対する部分関数従属を解消し、第3正規形では非キー属性間の推移的関数従属を排除します。実務上、多くのデータベース設計で第3正規形まで適用することで十分なデータ品質が確保されます。
より高度な正規形として、ボイス・コッド正規形(BCNF)、第4正規形(4NF)、第5正規形(5NF)が存在します。これらは特殊なデータ依存関係を持つケースで適用されますが、過度な正規化はテーブル数の増加とクエリの複雑化を招くため、データ整合性とパフォーマンスのバランスを考慮した設計が求められます。