Goodness-of-Fit là gì?

16

Goodness-of-Fit là gì?

Thuật ngữ độ phù hợp đề cập đến một thử nghiệm thống kê để xác định mức độ phù hợp của dữ liệu mẫu với phân phối từ một tập hợp có phân phối chuẩn. Nói một cách đơn giản, nó đưa ra giả thuyết liệu một mẫu có bị lệch hay đại diện cho dữ liệu bạn mong đợi tìm thấy trong dân số thực tế hay không.

Sự phù hợp thiết lập sự khác biệt giữa các giá trị quan sát và giá trị mong đợi của mô hình trong trường hợp phân phối chuẩn. Có nhiều phương pháp để xác định độ phù hợp, bao gồm cả chi-square.

Tóm tắt ý kiến chính

  • Mức độ phù hợp là một phép thử thống kê để cố gắng xác định xem liệu một tập hợp các giá trị quan sát có khớp với những giá trị được mong đợi trong mô hình áp dụng hay không.
  • Họ có thể cho bạn biết liệu dữ liệu mẫu của bạn có phù hợp với tập dữ liệu dự kiến từ một tập hợp có phân phối chuẩn hay không.
  • Có nhiều loại kiểm tra độ phù hợp, nhưng phổ biến nhất là kiểm tra chi-square.
  • Kiểm tra chi bình phương xác định xem có tồn tại mối quan hệ giữa dữ liệu phân loại hay không.
  • Kiểm tra Kolmogorov-Smirnov xác định xem một mẫu có đến từ một phân bố cụ thể của một quần thể hay không.

Hiểu lòng tốt của sự phù hợp

Kiểm tra độ phù hợp là phương pháp thống kê đưa ra suy luận về các giá trị quan sát được. Ví dụ: bạn có thể xác định xem một nhóm mẫu có thực sự đại diện cho toàn bộ dân số hay không. Do đó, chúng xác định các giá trị thực tế có liên quan như thế nào với các giá trị dự đoán trong một mô hình. Khi được sử dụng trong quá trình ra quyết định, các bài kiểm tra mức độ phù hợp giúp dự đoán xu hướng và mô hình trong tương lai dễ dàng hơn.

Như đã lưu ý ở trên, có một số loại kiểm tra mức độ phù hợp. Chúng bao gồm phép thử chi-square, là phép thử phổ biến nhất, cũng như phép thử Kolmogorov-Smirnov và phép thử Shipiro-Wilk. Các bài kiểm tra thường được tiến hành bằng phần mềm máy tính. Nhưng các nhà thống kê có thể thực hiện các bài kiểm tra này bằng cách sử dụng các công thức được điều chỉnh cho phù hợp với loại bài kiểm tra cụ thể.

Để tiến hành kiểm tra, bạn cần một biến nhất định, cùng với giả định về cách nó được phân phối. Bạn cũng cần một tập dữ liệu với các giá trị rõ ràng và rõ ràng, chẳng hạn như:

  • Các giá trị quan sát, được lấy từ tập dữ liệu thực tế
  • Các giá trị mong đợi, được lấy từ các giả định được đưa ra
  • Tổng số danh mục trong tập hợp

Thử nghiệm độ phù hợp thường được sử dụng để kiểm tra tính chuẩn mực của lượng dư hoặc để xác định xem hai mẫu có được tập hợp từ các phân phối giống hệt nhau hay không.

Cân nhắc đặc biệt

Để diễn giải một bài kiểm tra về độ phù hợp, điều quan trọng đối với các nhà thống kê là phải thiết lập một mức alpha, chẳng hạn như giá trị p cho phép thử chi-square. Giá trị p đề cập đến xác suất nhận được kết quả gần với cực trị của kết quả quan sát được. Điều này giả định rằng giả thuyết vô hiệu là đúng. Giả thuyết rỗng khẳng định rằng không có mối quan hệ nào tồn tại giữa các biến và giả thuyết thay thế giả định rằng một mối quan hệ tồn tại.

Thay vào đó, tần số của các giá trị quan sát được đo và sau đó được sử dụng với các giá trị mong đợi và bậc tự do để tính toán chi-bình phương. Nếu kết quả thấp hơn alpha, giả thuyết null không hợp lệ, cho thấy mối quan hệ tồn tại giữa các biến.

Các loại kiểm tra độ tốt

Kiểm định chi bình phương

χ 2 = tôi = 1 k ( O tôi E tôi ) 2 / E tôi chi ^ 2 = sum limit ^ k_ {i = 1} (O_i-E_i) ^ 2 / E_i

χ 2 =i = 1 k ( Ơ i E i ) 2 / E i

Kiểm định chi bình phương, còn được gọi là kiểm định chi bình phương về tính độc lập, là một phương pháp thống kê suy luận để kiểm tra tính hợp lệ của một tuyên bố được đưa ra về một tập hợp dựa trên một mẫu ngẫu nhiên.

Được sử dụng riêng cho dữ liệu được tách thành các lớp (thùng), nó yêu cầu kích thước mẫu đủ để tạo ra kết quả chính xác. Nhưng nó không chỉ ra loại hoặc cường độ của mối quan hệ. Ví dụ, nó không kết luận mối quan hệ là tích cực hay tiêu cực.

Để tính toán độ phù hợp chi-bình phương, hãy đặt mức ý nghĩa alpha mong muốn. Vì vậy, nếu mức độ tin cậy của bạn là 95% (hoặc 0,95), thì alpha là 0,05. Tiếp theo, xác định các biến phân loại để kiểm tra, sau đó xác định các phát biểu giả thuyết về mối quan hệ giữa chúng.

Các biến phải loại trừ lẫn nhau để đủ điều kiện cho phép kiểm tra chi bình phương về tính độc lập. Và kiểm tra độ phù hợp chi không nên được sử dụng cho dữ liệu liên tục.

Kiểm tra Kolmogorov-Smirnov

D = tối đa 1 tôi N ( F ( Y tôi ) tôi 1 N , tôi N F ( Y tôi ) ) D = max limit_ {1 leq i leq N} expand (F (Y_i) – frac {i-1} {N}, frac {i} {N} -F (Y_i) cỡ)

D =1 i N max ( F ( Y i ) N i 1 , N i F ( Y i ) )

Được đặt theo tên của các nhà toán học Nga Andrey Kolmogorov và Nikolai Smirnov, kiểm tra Kolmogorov-Smirnov (còn được gọi là kiểm tra KS) là một phương pháp thống kê để xác định xem một mẫu có phải từ một phân bố cụ thể trong một quần thể hay không.

Thử nghiệm này, được khuyến nghị cho các mẫu lớn (ví dụ, trên 2000), là không tham số. Điều đó có nghĩa là nó không dựa trên bất kỳ phân phối nào để có giá trị. Mục đích là để chứng minh giả thuyết rỗng, là mẫu của phân phối chuẩn.

Giống như chi-square, nó sử dụng giả thuyết rỗng và thay thế và mức ý nghĩa alpha. Null chỉ ra rằng dữ liệu tuân theo một phân bố cụ thể trong tổng thể và phương án thay thế chỉ ra rằng dữ liệu không tuân theo một phân bố cụ thể trong tập hợp. Alpha được sử dụng để xác định giá trị tới hạn được sử dụng trong thử nghiệm. Nhưng khác với phép thử chi bình phương, phép thử Kolmogorov-Smirnov áp dụng cho các phân phối liên tục.

Thống kê kiểm định được tính toán thường được ký hiệu là D. Nó xác định liệu giả thuyết rỗng được chấp nhận hay bị bác bỏ. Nếu D lớn hơn giá trị tới hạn tại alpha, thì giả thuyết vô hiệu bị bác bỏ. Nếu D nhỏ hơn giá trị tới hạn, giả thuyết vô hiệu được chấp nhận.

Thử nghiệm Shipiro-Wilk

W = ( tôi = 1 N một tôi ( x ( tôi ) ) 2 tôi = 1 N ( x tôi x ˉ ) 2 , W = frac { big ( sum ^ n_ {i = 1} a_i (x _ {(i)} big) ^ 2} { sum ^ n_ {i = 1} (x_i- bar {x}) ^ 2},

W = i = 1 n ( x i x ˉ ) 2( i = 1 nmột tôi(x ( i )) 2,

Thử nghiệm Shipiro-Wilk xác định xem một mẫu có tuân theo phân phối chuẩn hay không. Thử nghiệm chỉ kiểm tra tính chuẩn khi sử dụng mẫu có một biến dữ liệu liên tục và được khuyến nghị cho các cỡ mẫu nhỏ đến 2000.

Bài kiểm tra Shipiro-Wilk sử dụng một biểu đồ xác suất được gọi là QQ Plot, biểu đồ này hiển thị hai bộ lượng tử trên trục y được sắp xếp từ nhỏ nhất đến lớn nhất. Nếu mỗi tập lượng tử đến từ cùng một phân phối, chuỗi các đồ thị là tuyến tính.

Lô QQ được sử dụng để ước tính phương sai. Sử dụng phương sai QQ Plot cùng với phương sai ước tính của tổng thể, người ta có thể xác định xem mẫu có thuộc phân phối chuẩn hay không. Nếu thương số của cả hai phương sai bằng hoặc gần bằng 1, thì giả thuyết rỗng có thể được chấp nhận. Nếu thấp hơn đáng kể 1, nó có thể bị từ chối.

Cũng giống như các bài kiểm tra được đề cập ở trên, bài kiểm tra này sử dụng alpha và tạo thành hai giả thuyết: null và thay thế. Giả thuyết rỗng nói rằng mẫu đến từ phân phối chuẩn, trong khi giả thuyết thay thế nói rằng mẫu không đến từ phân phối chuẩn.

Ví dụ về Goodness-of-Fit

Dưới đây là một ví dụ giả định để cho thấy cách thức hoạt động của bài kiểm tra mức độ phù hợp.

Giả sử một phòng tập thể dục cộng đồng nhỏ hoạt động theo giả định rằng số người tham dự cao nhất là vào các ngày Thứ Hai, Thứ Ba và Thứ Bảy, số người tham dự trung bình vào các ngày Thứ Tư và Thứ Năm, và số người tham dự thấp nhất vào Thứ Sáu và Chủ Nhật. Dựa trên những giả định này, phòng tập thể dục sử dụng một số lượng nhân viên nhất định mỗi ngày để kiểm tra thành viên, dọn dẹp cơ sở vật chất, cung cấp dịch vụ đào tạo và dạy các lớp học.

Nhưng phòng tập thể dục không hoạt động tốt về mặt tài chính và chủ sở hữu muốn biết liệu các giả định về lượng người tham dự và mức nhân viên này có đúng hay không. Chủ sở hữu quyết định đếm số người tham dự phòng tập thể dục mỗi ngày trong sáu tuần. Sau đó, họ có thể so sánh tỷ lệ tham dự giả định của phòng tập thể dục với tỷ lệ tham gia quan sát được bằng cách sử dụng một bài kiểm tra độ phù hợp chi-bình phương chẳng hạn.

Giờ đây, khi có dữ liệu mới, họ có thể xác định cách quản lý phòng tập thể dục tốt nhất và cải thiện lợi nhuận.

Lòng tốt có nghĩa là gì?

Goodness-of-Fit là một bài kiểm tra giả thuyết thống kê được sử dụng để xem dữ liệu được quan sát gần phản ánh dữ liệu mong đợi như thế nào. Kiểm tra độ phù hợp có thể giúp xác định xem một mẫu có tuân theo phân phối chuẩn hay không, nếu các biến phân loại có liên quan với nhau hoặc nếu các mẫu ngẫu nhiên thuộc cùng một phân phối.

Tại sao Goodness-of-Fit lại quan trọng?

Kiểm tra độ tốt giúp xác định xem dữ liệu quan sát có phù hợp với những gì dự kiến hay không. Các quyết định có thể được đưa ra dựa trên kết quả của việc kiểm tra giả thuyết được tiến hành. Ví dụ, một nhà bán lẻ muốn biết sản phẩm cung cấp nào hấp dẫn giới trẻ. Nhà bán lẻ khảo sát một mẫu ngẫu nhiên gồm những người già và trẻ để xác định sản phẩm nào được ưa thích hơn. Sử dụng chi-square, họ xác định rằng, với độ tin cậy 95%, mối quan hệ tồn tại giữa sản phẩm A và những người trẻ tuổi. Dựa trên những kết quả này, có thể xác định rằng mẫu này đại diện cho dân số thanh niên. Các nhà tiếp thị bán lẻ có thể sử dụng điều này để cải cách các chiến dịch của họ.

Độ tốt của Độ vừa vặn trong Phép thử Chi-Square là gì?

Kiểm định chi-bình phương liệu có tồn tại mối quan hệ giữa các biến phân loại và mẫu có đại diện cho tổng thể hay không. Nó ước tính mức độ chặt chẽ của dữ liệu quan sát được đối chiếu với dữ liệu dự kiến hoặc mức độ phù hợp của chúng.

Làm thế nào để bạn làm bài kiểm tra độ phù hợp?

Kiểm tra Goodness-of-FIt bao gồm các phương pháp kiểm tra khác nhau. Mục tiêu của bài kiểm tra sẽ giúp xác định phương pháp nào sẽ sử dụng. Ví dụ, nếu mục tiêu là kiểm tra tính chuẩn trên một mẫu tương đối nhỏ, thì phép thử Shipiro-Wilk có thể phù hợp. Nếu muốn xác định xem một mẫu có đến từ một phân bố cụ thể trong một quần thể hay không, thì phép thử Kolmogorov-Smirnov sẽ được sử dụng. Mỗi bài kiểm tra sử dụng công thức độc đáo của riêng nó. Tuy nhiên, chúng có những điểm chung, chẳng hạn như giả thuyết vô hiệu và mức độ ý nghĩa.

Điểm mấu chốt

Kiểm tra độ phù hợp xác định mức độ phù hợp của dữ liệu mẫu với những gì được mong đợi của một quần thể. Từ dữ liệu mẫu, một giá trị quan sát được thu thập và so sánh với giá trị kỳ vọng được tính toán bằng cách sử dụng thước đo chênh lệch. Có sẵn các bài kiểm tra giả thuyết về mức độ phù hợp khác nhau tùy thuộc vào kết quả bạn đang tìm kiếm.

Việc lựa chọn phép thử phù hợp phần lớn phụ thuộc vào những gì bạn muốn biết về một mẫu và độ lớn của mẫu. Ví dụ: nếu muốn biết liệu các giá trị được quan sát cho dữ liệu phân loại có khớp với các giá trị mong đợi cho dữ liệu phân loại hay không, hãy sử dụng chi-square. Nếu muốn biết liệu một mẫu nhỏ có tuân theo phân phối chuẩn hay không, thì phép thử Shipiro-Wilk có thể có lợi. Có nhiều bài kiểm tra có sẵn để xác định độ phù hợp.

Nguồn tham khảo: investmentopedia