Homoskedastic là gì?

28

Homoskedastic là gì?

Homoskedastic (còn được đánh vần là “homoscedastic”) đề cập đến một điều kiện trong đó phương sai của phần dư, hoặc thuật ngữ lỗi, trong một mô hình hồi quy là không đổi. Nghĩa là, thuật ngữ sai số không thay đổi nhiều khi giá trị của biến dự báo thay đổi. Một cách khác để nói điều này là phương sai của các điểm dữ liệu gần như giống nhau cho tất cả các điểm dữ liệu.

Điều này cho thấy mức độ nhất quán và làm cho việc lập mô hình và làm việc với dữ liệu dễ dàng hơn thông qua hồi quy; tuy nhiên, việc thiếu tính tương đồng có thể gợi ý rằng mô hình hồi quy có thể cần phải bao gồm các biến dự báo bổ sung để giải thích hiệu suất của biến phụ thuộc.

Tóm tắt ý kiến chính

  • Độ co giãn đồng nhất xảy ra khi phương sai của thuật ngữ sai số trong mô hình hồi quy là không đổi.
  • Nếu phương sai của thuật ngữ lỗi là đồng biến thì mô hình đã được xác định rõ. Nếu có quá nhiều phương sai, mô hình có thể không được xác định rõ.
  • Việc thêm các biến dự báo bổ sung có thể giúp giải thích hiệu suất của biến phụ thuộc.
  • Ngược lại, phương sai thay đổi xảy ra khi phương sai của thuật ngữ sai số không phải là hằng số.

Cách hoạt động của tính đồng nhất

Homoskedasticity là một giả định của mô hình hồi quy tuyến tính và dữ liệu kiểu này hoạt động tốt với phương pháp bình phương nhỏ nhất. Nếu phương sai của các lỗi xung quanh đường hồi quy thay đổi nhiều, thì mô hình hồi quy có thể được xác định kém.

Đối lập của đồng biến là phương sai thay đổi cũng như đối lập của “đồng nhất” là “không đồng nhất.” Phương sai thay đổi (còn được đánh vần là “phương sai thay đổi”) đề cập đến một điều kiện trong đó phương sai của thuật ngữ lỗi trong một phương trình hồi quy không phải là hằng số.

Cân nhắc đặc biệt

Một mô hình hồi quy đơn giản, hay phương trình, bao gồm bốn số hạng. Ở phía bên trái là biến phụ thuộc. Nó đại diện cho hiện tượng mà mô hình tìm cách “giải thích”. Ở phía bên phải là một hằng số, một biến dự đoán và một số hạng còn lại hoặc sai số. Thuật ngữ sai số cho biết mức độ thay đổi trong biến phụ thuộc mà biến dự đoán không được giải thích.

Ví dụ về Homoskedastic

Ví dụ: giả sử bạn muốn giải thích điểm kiểm tra của học sinh bằng cách sử dụng lượng thời gian học tập của mỗi học sinh. Trong trường hợp này, điểm kiểm tra sẽ là biến phụ thuộc và thời gian dành cho việc học sẽ là biến dự đoán.

Thuật ngữ sai số sẽ hiển thị số lượng phương sai trong điểm kiểm tra mà không được giải thích bởi lượng thời gian học tập. Nếu phương sai đó là đồng nhất, hoặc đồng biến, thì điều đó sẽ gợi ý rằng mô hình có thể là một lời giải thích đầy đủ cho hiệu suất thử nghiệm — giải thích nó theo thời gian nghiên cứu.

Nhưng phương sai có thể là phương sai thay đổi. Một biểu đồ của dữ liệu thuật ngữ lỗi có thể cho thấy một lượng lớn thời gian học tập tương ứng rất chặt chẽ với điểm kiểm tra cao nhưng điểm kiểm tra thời gian học tập thấp đó rất khác nhau và thậm chí bao gồm một số điểm rất cao.

Vì vậy, phương sai của điểm số sẽ không được giải thích rõ ràng chỉ bằng một biến dự báo — lượng thời gian nghiên cứu. Trong trường hợp này, một số yếu tố khác có thể đang hoạt động và mô hình có thể cần được cải thiện để xác định nó hoặc chúng.

Khi coi phương sai là sự khác biệt đo được giữa kết quả dự đoán và kết quả thực tế của một tình huống nhất định, việc xác định phương sai tương đồng có thể giúp xác định yếu tố nào cần được điều chỉnh cho chính xác.

Điều tra sâu hơn có thể cho thấy rằng một số học sinh đã xem trước câu trả lời của bài kiểm tra hoặc trước đó họ đã làm bài kiểm tra tương tự, và do đó không cần phải học cho bài kiểm tra cụ thể này. Đối với vấn đề đó, có thể chỉ ra rằng học sinh có khả năng vượt qua các cấp độ khác nhau của bài kiểm tra độc lập với thời gian học tập và kết quả của họ trong các bài kiểm tra trước đó, bất kể môn học.

Để cải thiện mô hình hồi quy, nhà nghiên cứu sẽ phải thử các biến giải thích khác có thể cung cấp sự phù hợp chính xác hơn với dữ liệu. Ví dụ, nếu một số sinh viên đã xem trước câu trả lời, thì mô hình hồi quy sẽ có hai biến giải thích: thời gian nghiên cứu và liệu sinh viên có biết trước về câu trả lời hay không.

Với hai biến này, nhiều phương sai của điểm kiểm tra sẽ được giải thích và phương sai của thuật ngữ lỗi sau đó có thể là đồng biến, cho thấy rằng mô hình đã được xác định rõ ràng.

Heteroskedasticity có nghĩa là gì?

Phương sai sai lệch trong thống kê là phương sai của sai số. Đây là sự phụ thuộc của tán xạ xảy ra trong một mẫu với tối thiểu một biến độc lập. Điều này có nghĩa là độ lệch chuẩn của một biến có thể dự đoán được là không đổi.

Làm thế nào bạn có thể biết nếu một hồi quy là đồng nhất?

Bạn có thể biết liệu một hồi quy có phải là đồng biến hay không bằng cách xem xét tỷ lệ giữa phương sai lớn nhất và phương sai nhỏ nhất. Nếu tỷ số này là 1,5 hoặc nhỏ hơn, thì hồi quy là đồng biến.

Tại sao Homoskedasticity lại quan trọng?

Độ đồng đều rất quan trọng vì nó xác định các điểm khác biệt trong một quần thể. Bất kỳ phương sai nào trong tổng thể hoặc mẫu không đồng đều sẽ tạo ra kết quả sai lệch hoặc sai lệch, làm cho phân tích không chính xác hoặc vô giá trị.

Nguồn tham khảo: investmentopedia