Thống kê mô tả là gì?
Thống kê mô tả là các hệ số mô tả ngắn gọn tóm tắt một tập dữ liệu nhất định, có thể là đại diện của toàn bộ tập hợp hoặc một mẫu của tổng thể. Thống kê mô tả được chia thành các thước đo về xu hướng trung tâm và các thước đo về độ biến thiên (lan truyền). Các phép đo xu hướng trung tâm bao gồm giá trị trung bình, giá trị trung bình và phương thức, trong khi các phép đo độ biến thiên bao gồm độ lệch chuẩn, phương sai, các biến số tối thiểu và tối đa, kurtosis và độ lệch.
Tóm tắt ý kiến chính
- Thống kê mô tả tóm tắt hoặc mô tả các đặc điểm của tập dữ liệu.
- Thống kê mô tả bao gồm hai loại thước đo cơ bản: thước đo xu hướng trung tâm và thước đo độ biến thiên (hoặc độ lan tỏa).
- Các thước đo về xu hướng trung tâm mô tả trung tâm của một tập dữ liệu.
- Các phép đo về độ biến thiên hoặc độ lan truyền mô tả sự phân tán của dữ liệu trong tập hợp.
Thống kê mô tả là gì?
Hiểu thống kê mô tả
Tóm lại, thống kê mô tả giúp mô tả và hiểu các tính năng của một tập dữ liệu cụ thể bằng cách đưa ra các tóm tắt ngắn về mẫu và các thước đo của dữ liệu. Các loại thống kê mô tả được công nhận nhiều nhất là các phép đo trung tâm: giá trị trung bình, giá trị trung bình và chế độ, được sử dụng ở hầu hết các cấp độ toán học và thống kê. Giá trị trung bình hay giá trị trung bình được tính bằng cách cộng tất cả các số liệu trong tập dữ liệu và sau đó chia cho số lượng các số liệu trong tập hợp.
Ví dụ, tổng của tập dữ liệu sau là 20: (2, 3, 4, 5, 6). Giá trị trung bình là 4 (20/5). Chế độ của tập dữ liệu là giá trị xuất hiện thường xuyên nhất và giá trị trung bình là hình nằm ở giữa tập dữ liệu. Nó là con số phân tách các số liệu cao hơn với các số liệu thấp hơn trong một tập dữ liệu. Tuy nhiên, có những loại thống kê mô tả ít phổ biến hơn nhưng vẫn rất quan trọng.
Mọi người sử dụng thống kê mô tả để sử dụng lại những thông tin chi tiết định lượng khó hiểu trên một tập dữ liệu lớn thành các mô tả nhỏ. Ví dụ: điểm trung bình (GPA) của học sinh giúp hiểu rõ về thống kê mô tả. Ý tưởng của điểm trung bình là nó lấy điểm dữ liệu từ một loạt các bài kiểm tra, lớp học và điểm, và tính trung bình chúng với nhau để cung cấp sự hiểu biết chung về kết quả học tập tổng thể của học sinh. Điểm trung bình cá nhân của học sinh phản ánh kết quả học tập trung bình của họ.
Các loại thống kê mô tả
Tất cả các số liệu thống kê mô tả hoặc là các thước đo của xu hướng trung tâm hoặc các thước đo của sự thay đổi, còn được gọi là các thước đo của sự phân tán.
Xu hướng tập trung
Các phép đo về xu hướng trung tâm tập trung vào các giá trị trung bình hoặc giữa của các tập dữ liệu, trong khi các phép đo về độ biến thiên tập trung vào sự phân tán của dữ liệu. Hai biện pháp này sử dụng đồ thị, bảng biểu và các cuộc thảo luận chung để giúp mọi người hiểu được ý nghĩa của dữ liệu được phân tích.
Các phép đo về xu hướng trung tâm mô tả vị trí trung tâm của một phân phối đối với một tập dữ liệu. Một người phân tích tần suất của từng điểm dữ liệu trong phân phối và mô tả nó bằng cách sử dụng giá trị trung bình, trung vị hoặc chế độ đo lường các mẫu phổ biến nhất của tập dữ liệu được phân tích.
Các thước đo của sự thay đổi
Các thước đo về độ biến thiên (hoặc các thước đo về mức độ lan truyền) hỗ trợ trong việc phân tích mức độ phân tán của sự phân bố đối với một tập hợp dữ liệu. Ví dụ, trong khi các thước đo của xu hướng trung tâm có thể cung cấp cho một người giá trị trung bình của một tập dữ liệu, nó không mô tả cách dữ liệu được phân phối trong tập hợp đó.
Vì vậy, mặc dù mức trung bình của dữ liệu có thể là 65 trên 100, nhưng vẫn có thể có các điểm dữ liệu ở cả 1 và 100. Các phép đo độ biến thiên giúp truyền đạt điều này bằng cách mô tả hình dạng và mức độ trải rộng của tập dữ liệu. Phạm vi, phần tư, độ lệch tuyệt đối và phương sai là tất cả các ví dụ về các phép đo biến thiên.
Hãy xem xét tập dữ liệu sau: 5, 19, 24, 62, 91, 100. Phạm vi của tập dữ liệu đó là 95, được tính bằng cách lấy số cao nhất (100) trừ đi số thấp nhất (5) trong tập dữ liệu.
Tại sao chúng ta cần số liệu thống kê chỉ đơn giản là mô tả dữ liệu?
Thống kê mô tả được sử dụng để mô tả hoặc tóm tắt các đặc điểm của mẫu hoặc tập dữ liệu, chẳng hạn như giá trị trung bình, độ lệch chuẩn hoặc tần suất của một biến. Thống kê tham chiếu có thể giúp chúng ta hiểu các thuộc tính tập hợp của các phần tử của một mẫu dữ liệu. Biết giá trị trung bình mẫu, phương sai và phân phối của một biến có thể giúp chúng ta hiểu thế giới xung quanh.
Giá trị trung bình và độ lệch chuẩn là gì?
Đây là hai thống kê mô tả thường được sử dụng. Trung bình là mức trung bình quan sát được trong một số phần dữ liệu, trong khi độ lệch chuẩn mô tả phương sai hoặc mức độ phân tán của dữ liệu được quan sát trong biến đó được phân phối xung quanh giá trị trung bình của nó.
Thống kê mô tả có thể được sử dụng để suy luận hoặc dự đoán không?
Không. Mặc dù những mô tả này giúp hiểu các thuộc tính dữ liệu, nhưng các kỹ thuật thống kê suy diễn – một nhánh thống kê riêng biệt – được yêu cầu để hiểu cách các biến tương tác với nhau trong tập dữ liệu.
Nguồn tham khảo: investmentopedia