Khác nhau giữa hqtcsdl và bảng tính vd Excel là gì

Bảng tính: rộng và có hai chiều

Bảng tính được trình bày theo hai chiều. Đó có lẽ là tính năng cơ bản nhất và quan trọng nhất của chúng. Chúng có ý nghĩa đối với chúng ta vì chúng ta có thể dễ dàng suy nghĩ và sắp xếp mọi thứ theo cách hợp lý.


Bố cục lưới trong trường hợp này vô cùng hiệu quả vì bạn không phải lặp lại những gì đang được hiển thị. Trong ví dụ về dữ liệu thất nghiệp này, mỗi hàng là một năm và mỗi cột một tháng. Nếu bạn đang tìm kiếm, giả sử vào tháng 4 năm 2010, bạn biết phải tìm ở đâu. Và bạn có thể dễ dàng đọc thời gian của năm tiếp theo hoặc năm trước đó, tùy thuộc vào việc bạn đang muốn so sánh giữa các tháng hoặc năm qua năm.

Các phép tính cũng dễ thực hiện: tính tổng các hàng trên, tính tổng các cột xuống, lấy giá trị trung bình, tạo một cột mới với sự khác biệt của mỗi hàng so với giá trị trung bình tổng thể, ...

Tất nhiên là có những hạn chế. Nếu bạn muốn chia nhỏ dữ liệu theo nhiều cách, bạn cần tạo nhiều bảng. Điều này cũng đúng khi thêm nhiều số hơn vào mỗi ô. Bạn có thể muốn so sánh tỷ lệ thất nghiệp với lực lượng lao động hoặc trình độ học vấn, nhưng chúng ở các bảng khác nhau, khiến cho việc so sánh trở nên phức tạp.

Đối với các công cụ phân tích dữ liệu, bảng tính cũng đặt ra thách thức là định dạng của chúng có thể rất khác nhau và thường không nhất quán . Một vấn đề khác nữa là thường có nhiều thứ xung quanh dữ liệu thực tế, để giải thích mọi thứ, khiến một chương trình khó có thể nhận ra dữ liệu thực tế là gì.

Bên cạnh đó các tiêu đề cột không cho bạn biết ý nghĩa của chúng. Trong ví dụ trên, Năm có nghĩa là mỗi số trong cột đó là một năm. Nhưng tháng 1 , tháng 2 , ... thì không, chúng thực sự là một phần của ngày tháng và do đó, cũng là một phần của dữ liệu. Làm thế nào để một chương trình có thể nhận ra và phân biệt chúng?

Mọi người có thể dễ dàng hiểu các quy ước trong một bảng tính, ví dụ như các cột trong bảng bên dưới này giống như trong bảng ở trên, nhãn duy nhất đó áp dụng cho tất cả các hàng,... nhưng máy tính thì không thể tìm ra.

Cơ Sở Dữ Liệu Là Gì

Cơ sở dữ liệu là tập hợp các dữ liệu được tổ chức theo một cấu trúc nhất định để có thể dễ dàng quản lý [đọc, thêm, xóa, sửa dữ liệu].

Ví dụ: Một danh sách sinh viên của một trường với 5 trường dữ liệu là họ và tên sinh viên, năm sinh, mã số sinh viên, lớp học và khóa học được coi là một cơ sở dữ liệu.

Họ Tên Ngày Sinh MSSV Khóa
Nguyên Lê Hoài Anh 21/07/1993 BK15200 K15
Nguyễn Văn Bình 15/05/1993 BK15201 K15
Trần Hoàng Chiến 15/07/1993 BK15202 K15

Sự khác biệt cơ bản giữa cơ sở dữ liệu và dữ liệu thông thường đó là tính cấu trúc sắp xếp có hệ thống. Dữ liệu không thôi có thể là bất cứ thông tin nào chưa được sắp xếp hay cấu trúc theo một trật tự cụ thể ví dụ văn bản trên một file được coi là dữ liệu, hay dữ liệu trên một video hay tập tin.

Ngược lại với cữ liệu, cơ sở dữ liệu bao gồm dữ liệu dược cấu trúc một cách rõ ràng. Một tập hợp dữ liệu không có cấu trúc hệ thống nhất định không được coi là một cơ sở dữ liệu.

Tìm hiểu thêm về mối quan hệ giữa các bảng trong Excel

  • Ghi chú về mối quan hệ

  • Ví dụ: Liên kết dữ liệu hiển thị thời gian thông minh với dữ liệu chuyến bay hàng không

  • “Có thể cần phải có mối quan hệ giữa các bảng”

    • Bước 1: Xác định bảng nào cần được chỉ rõ trong mối quan hệ

    • Bước 2: Tìm các cột có thể được dùng để tạo đường dẫn từ một bảng đến bảng tiếp theo

Ghi chú về mối quan hệ

  • Bạn sẽ biết mối quan hệ có tồn tại hay không khi bạn kéo các trường từ các bảng khác nhau vào danh sách Trường PivotTable. Nếu bạn không được nhắc tạo mối quan hệ, thì có nghĩa là Excel đã có thông tin mối quan hệ cần thiết để liên kết dữ liệu.

  • Việc tạo mối quan hệ cũng tương tự như việc dùng VLOOKUP: bạn cần các cột có chứa dữ liệu khớp để Excel có thể tham chiếu chéo các hàng trong một bảng với các hàng trong bảng khác. Trong ví dụ hiển thị thời gian thông minh, bảng Khách hàng sẽ cần có các giá trị ngày mà những giá trị này cũng tồn tại trong bảng hiển thị thời gian thông minh.

  • Trong mô hình dữ liệu, mối quan hệ bảng có thể là một-một [mỗi hành khách có một thẻ lên máy bay] hoặc một-nhiều [mỗi chuyến bay có nhiều hành khách] nhưng không thể là nhiều-nhiều. Mối quan hệ nhiều-nhiều gây ra lỗi phụ thuộc vòng tròn, chẳng hạn như “Đã phát hiện sự phụ thuộc vòng tròn”. Lỗi này sẽ xảy ra nếu bạn đặt kết nối trực tiếp giữa hai bảng có quan hệ nhiều-nhiều hoặc kết nối gián tiếp [một chuỗi các mối quan hệ bảng là quan hệ một-nhiều trong từng mối quan hệ nhưng là quan hệ nhiều-nhiều khi xem từ đầu này đến đầu kia. Đọc thêm về Mối quan hệ giữa các bảng trong Mô hình Dữ liệu.

  • Kiểu dữ liệu trong hai cột phải tương thích. Hãy xem Kiểu dữ liệu trong Mô hình Dữ liệu Excel để biết chi tiết.

  • Có thể có các cách khác trực quan hơn để tạo mối quan hệ, đặc biệt là khi bạn không biết chắc cần dùng cột nào. Hãy xem Tạo mối quan hệ trong Dạng xem Sơ đồ trong Power Pivot.

Ví dụ: Liên kết dữ liệu hiển thị thời gian thông minh với dữ liệu chuyến bay hàng không

Bạn có thể tìm hiểu về cả mối quan hệ bảng và hiển thị thời gian thông minh bằng cách dùng dữ liệu miễn phí trên Microsoft Azure Marketplace. Một vài bộ trong số các bộ dữ liệu này rất lớn, đòi hỏi phải có kết nối internet nhanh để hoàn thành tải xuống dữ liệu trong một khoảng thời gian hợp lý.

  1. Bắt đầu Power Pivot trong bổ trợ Microsoft Excel và mở cửa sổ Power Pivot.

  2. Bấm vào Nhận Dữ liệu Ngoài > Từ Dịch vụ Dữ liệu > Từ Microsoft Azure Marketplace. Trang đầu Microsoft Azure Marketplace mở ra trong Trình hướng dẫn Nhập Bảng.

  3. Dưới Giá, hãy bấm Miễn phí.

  4. Dưới Thể loại, hãy bấm Khoa học & Thống kê.

  5. Tìm DateStream và bấm Đăng ký.

  6. Nhập tài khoản Microsoft của bạn và bấm Đăng nhập. Xem trước dữ liệu sẽ xuất hiện trong cửa sổ.

  7. Cuộn xuống dưới và bấm Chọn Truy vấn.

  8. Bấm Tiếp.

  9. Chọn BasicCalendarUS rồi bấm Kết thúc để nhập dữ liệu. Với kết nối internet nhanh, quá trình nhập sẽ mất khoảng một phút. Khi kết thúc, bạn sẽ thấy báo cáo trạng thái có 73.414 hàng được truyền. Bấm Đóng.

  10. Bấm Nhận Dữ liệu Ngoài > Từ Dịch vụ Dữ liệu > Từ Microsoft Azure Marketplace để nhập bộ dữ liệu thứ hai.

  11. Dưới Kiểu, hãy bấm Dữ liệu.

  12. Dưới Giá, hãy bấm Miễn phí.

  13. Tìm Các Chuyến bay Trễ của US Air Carrier và bấm Chọn.

  14. Cuộn xuống dưới và bấm Chọn Truy vấn.

  15. Bấm Tiếp.

  16. Bấm Kết thúc để nhập dữ liệu. Với kết nối internet nhanh, quá trình nhập có thể mất 15 phút. Khi kết thúc, bạn sẽ thấy báo cáo trạng thái 2.427.284 hàng được truyền. Bấm Đóng. Bây giờ hẳn là bạn đã có hai bảng trong mô hình dữ liệu. Để liên kết các bảng này, chúng ta sẽ cần các cột tương thích trong mỗi bảng.

  17. Lưu ý rằng DateKey trong BasicCalendarUS có định dạng 1/1/2012 12:00:00 SA. Bảng On_Time_Performance cũng có cột ngàygiờ, FlightDate, mà các giá trị trong cột này được xác định ở cùng một định dạng: 1/1/2012 12:00:00 SA. Hai cột chứa dữ liệu khớp nhau, có cùng một kiểu dữ liệu và tối thiểu một trong các cột [DateKey] chỉ chứa giá trị duy nhất. Trong một vài bước tiếp theo, bạn sẽ dùng các cột này để liên kết bảng.

  18. Trong cửa sổ Power Pivot, hãy bấmPivotTable để tạo PivotTable trong trang tính mới hoặc trang tính hiện có.

  19. Trong Danh sách Trường, hãy bung rộng On_Time_Performance và bấm ArrDelayMinutes để thêm vào vùng Giá trị. Trong PivotTable, bạn sẽ thấy tổng số thời gian các chuyến bay bị hoãn, được tính bằng phút.

  20. Hãy bung rộng BasicCalendarUS và bấm MonthInCalendar để thêm nó vào vùng Hàng.

  21. Lưu ý rằng bây giờ PivotTable liệt kê các tháng nhưng tổng cộng số phút giống nhau cho mọi tháng. Các giá trị lặp lại, giống hệt nhau cho thấy rằng cần có một mối quan hệ.

  22. Trong Danh sách Trường, trong “Có thể cần mối quan hệ giữa các bảng”, hãy bấm Tạo.

  23. Trong Bảng Liên quan, hãy chọn On_Time_Performance và trong Cột Liên quan [Chính] chọn FlightDate.

  24. Trong Bảng, hãy chọn BasicCalendarUS và trong Cột [Ngoại] chọn DateKey. Bấm OK để tạo mối quan hệ.

  25. Lưu ý rằng tổng số phút bị hủy của mỗi tháng bây giờ đã khác nhau.

  26. Trong BasicCalendarUS và kéo YearKey đến vùng Hàng, ở trên MonthInCalendar.

Bây giờ bạn có thể phân chia các chuyến bay đến bị hoãn theo năm và tháng hoặc các giá trị khác trong lịch.

Mẹo: Theo mặc định, các tháng được liệt kê theo thứ tự bảng chữ cái. Dùng bổ trợ Power Pivot, bạn có thể thay đổi cách sắp xếp để các tháng xuất hiện theo thứ tự thời gian.

  1. Hãy bảo đảm bảng BasicCalendarUS đang mở trong cửa sổ Power Pivot.

  2. Trên bảng Trang đầu, hãy bấm Sắp xếp theo Cột.

  3. Trong Sắp xếp, hãy chọn MonthInCalendar

  4. Trong Theo, hãy chọn MonthOfYear.

Bây giờ PivotTable sắp xếp từng kết hợp tháng-năm [Tháng 10 năm 2011, Tháng 11 năm 2011] theo số tháng trong năm [10, 11]. Thay đổi thứ tự sắp xếp thật dễ dàng vì nguồn cấp DateStream cung cấp tất cả các cột cần thiết để thực hiện thành công tình huống này. Nếu bạn đang dùng bảng hiển thị thời gian thông minh khác, bạn sẽ thực hiện bước khác.

Trong bài viết này

  • Một số điều khoản về cơ sở dữ liệu cần biết

  • Thiết kế cơ sở dữ liệu tốt là gì?

  • Quy trình thiết kế

  • Xác định mục đích của cơ sở dữ liệu

  • Tìm và sắp xếp thông tin cần thiết

  • Phân chia thông tin vào các bảng

  • Biến mục thông tin thành các cột

  • Chỉ định khóa chính

  • Tạo mối quan hệ cho bảng

  • Tinh chỉnh thiết kế

  • Áp dụng các quy tắc chuẩn hóa


Trong bài viết này

  • Tổng quan

  • Tạo một cơ sở dữ liệu bằng cách sử dụng mẫu

  • Tạo một cơ sở dữ liệu mà không sử dụng mẫu

  • Sao chép dữ liệu từ một nguồn khác vào bảng Access

  • Nhập, gắn thêm hoặc liên kết đến dữ liệu từ một nguồn khác

  • Thêm một phần ứng dụng

  • Mở cơ sở dữ liệu Access hiện có

Những khác biệt về cú pháp và biểu thức

Có một số điểm khác biệt về cú pháp và biểu thức yêu cầu chuyển đổi. Bảng dưới đây liệt kê các tùy chọn phổ biến nhất.

Khác biệt

Access SQL

SQL Server TSQL

Thuộc tính cơ sở dữ liệu có quan hệ

Thông thường được gọi là trường

Thông thường được gọi là cột

Ký tự chuỗi

Dấu ngoặc kép ["], chẳng hạn như "Mary Q. Contrary"

Dấu nháy đơn ['], chẳng hạn như 'Mary Q. Contrary'

Ký tự ngày

Dấu thăng [#], chẳng hạn như #01/01/2019#

Dấu nháy đơn ['], chẳng hạn như '01/01/2019'

Nhiều ký tự đại diện

Dấu sao [*], chẳng hạn như "Cath*"

Dấu tỷ lệ phần trăm [%], chẳng hạn như 'Cath%'

Một ký tự đại diện

Dấu chấm hỏi [?], chẳng hạn như "Cath?"

Dấu gạch dưới [_], chẳng hạn như "Cath_"

Toán tử mô-đun

Toán tử MOD, như Value1 MOD Value2

Tỷ lệ phần trăm [%], như Value1 % Value2

Các giá trị boolean

KHI Bitvalue = [True | False]

Hoặc

KHI Bitvalue = [-1 | 0]

KHI Bitvalue = [1 | 0]

Tham số

[]

Hoặc

Trong SQL View, hãy sử dụng Khai báo SQL Parameters

@ParamName

Ghi chú

  • Access sử dụng ký tự dấu ngoặc kép ["] quanh tên bảng và đối tượng. T-SQL có thể sử dụng các tên bảng có chứa khoảng trắng nhưng đây không phải là cách đặt tên tiêu chuẩn. Trong hầu hết các trường hợp, tên đối tượng nên được đổi để không chứa khoảng trắng nhưng các truy vấn cũng phải được viết lại để phản ánh các tên bảng mới. Sử dụng dấu ngoặc vuông [ ] đối với các bảng không thể đổi tên nhưng không phù hợp với tiêu chuẩn đặt tên. Access cũng bổ sung thêm dấu ngoặc đơn xung quanh tham số trong truy vấn nhưng có thể loại bỏ dấu ngoặc đơn ctrong T-SQL.

  • Cân nhắc sử dụng định dạng ngày chính tắc, yyyy-mm-dd hh:nn:ss, là một tiêu chuẩn ODBC cho ngày tháng được lưu trữ dưới dạng ký tự để cung cấp một cách nhất quán để thể hiện thời gian trên nhiều cơ sở dữ liệu và giữ nguyên thứ tự sắp xếp ngày.

  • Để tránh nhầm lẫn khi so sánh các giá trị Boolean, bạn có thể sử dụng so sánh sau đây cho Access và SQL Server:

    • Kiểm tra giá trị False KHI Bitvalue = 0

    • Kiểm tra giá trị True KHI Bitvalue 0

1. Cơ sở dữ liệu là gì?

Cơ sở dữ liệu [CSDL – Database] là hệ thống các dữ liệu có liên quan mật thiết với nhau. Những dữ liệu này chứa thông tin của một đối tượng nào đó [bệnh viên, ngân hàng, nhà máy hay trường học,…]. Chúng được lưu trữ trên bộ nhớ máy tính nhằm đáp ứng nhu cầu khai thác thông tin của nhiều người dùng với các mục đích khác nhau.

Sự khác biệt lớn nhất của CSDL với dữ liệu thông thường chính là tính cấu trúc sắp xếp có hệ thống. Nếu chỉ là dữ liệu thì chúng có thể là bất cứ thông tin nào chưa được sắp xếp hay cấu trúc theo một trật tự nhất định. Ví dụ, văn bản trên một file, dữ liệu trên một tập tin, thông tin trên một video đều được coi là dữ liệu.

Cơ sở dữ liệu là hệ thống các dữ liệu có liên quan mật thiết với nhau – Nguồn Unsplash

Video liên quan

Chủ Đề