Giới thiệu
chuẩn hóa dữ liệu là quá trình biểu diễn cơ sở dữ liệu dưới dạng chuẩn. Đây là một kỹ thuật thiết kế bảng trong cơ sở dữ liệu, chia các bảng lớn thành các bảng nhỏ hơn và liên kết chúng bằng các mối quan hệ. Quá trình này giúp loại bỏ hoặc làm giảm sự dư thừa và phụ thuộc của dữ liệu.
1. Chuẩn hóa dữ liệu là gì?
Chuẩn hóa dữ liệu là một yếu tố quan trọng không thể bỏ qua trong việc cập nhật cơ sở dữ liệu để đảm bảo tính chính xác và nhanh chóng khi truy vấn. Quá trình này giúp loại bỏ hoặc làm giảm sự dư thừa và phụ thuộc của dữ liệu.
Chuẩn hóa cơ sở dữ liệu
2. Các dạng chuẩn hóa cơ bản
Có 4 dạng chuẩn hóa cơ bản là dạng chuẩn 1NF, 2NF, 3NF và BCNF. Các dạng chuẩn hóa được sắp xếp từ thấp đến cao. Để chuẩn hóa đạt chuẩn 2NF, cơ sở dữ liệu phải đạt chuẩn 1NF. Tương tự, để đạt chuẩn 3NF, cơ sở dữ liệu phải đạt chuẩn 1NF và 2NF. Chuẩn BCNF bao gồm 3 loại chuẩn là 1NF, 2NF và 3NF.
2.1 Dạng chuẩn 1NF (First Normal Form)
Một bảng cơ sở dữ liệu được gọi là ở dạng chuẩn hóa dữ liệu 1NF khi toàn bộ các miền giá trị của các cột trong bảng đều chỉ chứa các giá trị nguyên tử (nguyên tố) và mỗi cột chỉ chứa một giá trị từ miền.
Ví dụ về bảng lưu trữ tên và số điện thoại của khách hàng:
- Customer ID
- First Name
- Surname
- Telephone Number
Bảng này vi phạm 1NF vì cột Telephone Number chứa nhiều giá trị (nhiều số điện thoại) nên các giá trị trong cột không phải là nguyên tử mà có thể được chia thành hai số.
Chỉnh sửa để đưa về dạng chuẩn 1NF:
- Customer ID
- First Name
- Surname
- Telephone Number
2.2 Dạng chuẩn 2NF (Second Normal Form)
Một quan hệ đạt chuẩn 2NF nếu:
- Quan hệ đạt chuẩn 1NF.
- Các thuộc tính không khoá phụ thuộc hàm đầy đủ vào khoá chính.
2.3 Dạng chuẩn 3NF (Third Normal Form)
Một quan hệ đạt chuẩn 3NF nếu:
- Quan hệ đạt chuẩn 2NF.
- Các thuộc tính không khoá phụ thuộc trực tiếp vào khoá chính.
2.4 Dạng chuẩn BCNF (Boyce - Codd Normal Form)
Một quan hệ đạt chuẩn BCNF nếu:
- Quan hệ đạt chuẩn 3NF.
- Không có thuộc tính khoá mà phụ thuộc hàm vào thuộc tính không khoá.
2.5 Dạng chuẩn 4NF (Four Normal Form)
Một quan hệ ở dạng chuẩn 4NF không chứa bất kỳ cá thể nào có hai hoặc nhiều dữ liệu độc lập và đa trị mô tả thực thể có liên quan.
2.6 Dạng chuẩn 5NF (Five Normal Form)
Một bảng ở dạng chuẩn 5NF khi nó đạt chuẩn 4NF và không thể phân tách thành các bảng nhỏ hơn mà không mất dữ liệu.
2.7 Đề xuất 6NF (Six Normal Form)
Dạng chuẩn 6NF đang được các chuyên gia cơ sở dữ liệu quan tâm và nghiên cứu.
Chuẩn hóa cơ sở dữ liệu
3. Kết luận
Chuẩn hóa cơ sở dữ liệu giúp giảm thiểu sự dư thừa và loại bỏ các bất thường trong cập nhật dữ liệu. Có 4 dạng chuẩn hóa dữ liệu cơ bản là First Normal Form (1NF), Second Normal Form (2NF), Third Normal Form (3NF) và Boyce-Codd Normal Form (BCNF).