Cộng đồng chia sẻ tri thức Lib24.vn

4.2. Thiết kế CSDL cho hệ trợ giúp ra quyết định

Gửi bởi: Đỗ Thị Ngọc Dung 19 tháng 2 2020 lúc 14:11:21


Mục lục
* * * * *

Việc thiết kế CSDL cho hệ trợ giúp ra quyết định được thực hiện ít nhất qua hai bước là bước thiết kế logic và thiết kế vật lý:

1.  Thiết kế logic: tập trung vào việc chỉnh lý các quan niệm theo lý thuyết quan hệ. Các bảng dữ liệu ứng với các quan hệ. Người ta xác định các miền ứng với các kiểu dữ liệu, xác định các mối liên kết giữa các cột cảu bảng. Tiếp theo là việc chuẩn hóa các bảng và xác định các điều kiện ràng buộc dữ liệu.

2.   Bước thiết kế vật lý: tập trung vào tính hiệu quả của lưu trữ và hiệu suất của hệ thống. Về nguyên tắc, người ta có thể lựa chọn bất kì một cách tổ chức dữ liệu nào, nhưng việc chuyển hóa mô hình logic sang mô hình vật lý theo đại số quan hệ là hợp lý hơn cả.

4.2.1. Thiết kế logic.

Các quy luật thiết kế logic không phụ thuộc vào việc sử dụng CSDL, tức là không ph ụ thuộc vào loại ứng dụng trên CSDL. Do vậy thiết kế cho hệ thống tác nghiệp hay cho hệ trợ giúp quyết định như sau:

1.  Tổ hợp các cột và ít phụ thuộc: Các câu hỏi trợ giúp quyết định thường xử lý tổ hợp các cột, chứ không dùng các c ột đơn. Có thể gọi tổ hợp các cột như một cột tổ hợp. Theo quan điểm thiết kế logic, các cột tổ hợp có tư cách như cột bình tưhờng. Điều này có tác d ụng giảm số các phụ thuộc hàm giữa các cột đơn. Việc này dẫn đến thiết kế logic đơn giản hơn, cũng như tạo thuận lợi đối với những kiểu dữ liệu do người dùng xác định.

2. Các ràng bu ộc về tính toàn vẹn: hệ trợ giúp quyết định là hệ thống cho phép chỉ đọc dữ liệu và tính toàn vẹn dữ liệu chỉ được kiểm tra lúc tải dữ liệu cho nên trong lược đồ logic người ta không đặt ra các điểm kiểm tra tính toán vẹn.

Các khóa về thời gian: Các CSDL tác nghiệp thường chỉ cần các dữ liệu hiện tại. Các CSDL trợ giúp quyết đinh thường cần đến các dữ liệu lịch sử, nên người ta cần tính đến việc đánh dấu thời gian trên hầu hết các dữ liệu hay trên một vài dữ liệu. Để quản lý các mốc thời gian, các thuộc tính khóa cũng cần được đánh dấu thời gian. Việc làm này cần được quá trình thiết kế logic lưu ý khi xác định các phụ thuộc hàm giữa các cột đánh dấu mới và các c ột trong bảng.

4.2.2. Thiết kế vật lý

CSDL trong hệ thống trợ giúp quyết định có xu hướng nặng nề, kích thước lớn, và đòi hỏi nhiều loại dư thừa dữ liệu có kiểm soát. người ta thường đề cập khái niệm phân đoạn và chỉ số hoá. Việc phân đoạn nhằm vào CSDL lớn, chia các bảng dữ liệu thanh tập các phần, hay các đoạn rời nhau, phù hợp với cô ng việc lưu trữ vật lý . Công việc này giúp người ta quản lý và trả lời các câu hỏi trên các bảng dễ hơn. Điển hình là mỗi đoạn dữ liệu gắn với một số tài nguyên tin học như phần cứng, thời gian, bộ xử lý trung tâm. Điều này có thể giảm thiểu các cạnh tranh về tài nguyên trên mỗi đoạn dữ liệu.

Việc dùng các bảng chỉ số giảm được thời gian vào/ra khi cần truy cập dữ liệu. Nhiều sản phẩm hệ quản trị CSDL cung cấp cho người dù ng chỉ một loại chỉ số là cây cân đối, nhưng còn có nhiều loại chỉ số khác được dùng trong hệ thống trợ giúp quyết định là bảng bit, hàm băm.

Dư thừa dữ liệu có điều khiển là công cụ quan trọng để giảm các thao tác vào/ra và tối thiểu hoá các nội dung. Tính dư thừa dữ liệu được hệ quản trị CSDL quản lý mà người dù ng khô ng cần quan tâm:

  • Quản lý các bản sao chính các của dữ liệu cơ bản và quản lý các bản sao.
  • Quản lý các dữ liệu suy diễn bên cạnh dữ liệu cơ bản. Thô ng thường người ta sử dụng các bảng tổng hợp và /hoặc các cột thu được bằng cách tính toán hay suy diễn

Được cập nhật: hôm kia lúc 14:05:38 | Lượt xem: 619