Đa cộng tuyến ( tiếng Anh : Multicollinearity ) hiện tượng những biến độc lập trong quy mô hồi qui phụ thuộc vào tuyến tính lẫn nhau, biểu lộ dưới dạng hàm số ( vi phạm giả định 5 của quy mô hồi qui tuyến tính ) .Đa cộng tuyến (Multicollinearity) là gì? Hậu quả - Ảnh 1.

Hình minh họa. Nguồn: Xử lý số liệu SPSS

Hiện tượng đa cộng tuyến

Khái niệm

Đa cộng tuyến trong tiếng Anh là Multicollinearity.

Đa cộng tuyến là hiện tượng các biến độc lập trong mô hình hồi qui phụ thuộc tuyến tính lẫn nhau, thể hiện dưới dạng hàm số (vi phạm giả định 5 của mô hình hồi qui tuyến tính).

Hậu quả của đa cộng tuyến

Mặc dù sự hiện hữu của đa cộng tuyến không tác động ảnh hưởng đến tính đồng nhất của những ước tính OLS của những thông số hồi qui. Tuy nhiên, những ước tính sẽ trở nên không đúng mực và không đáng đáng tin cậy .Hơn nữa, trong thực tiễn không hề phân biệt những ảnh hưởng tác động riêng không liên quan gì đến nhau của những biến độc lập lên biến nhờ vào. Hậu quả là sai số chuẩn của tham số hồi qui tăng cao. Từ đó dẫn đến t-tests trên những thông số có ít năng lực bác bỏ giả thuyết không .Trong đó, OLS ( Ordinary least squares ) là chiêu thức bình phương nhỏ nhất. Đây là một chiêu thức ước tính dựa trên tiêu chuẩn tối thiểu hóa tổng phần dư bình phương của hồi qui .

Phát hiện đa cộng tuyến

Dấu hiệu điển hình nổi bật của đa cộng tuyến là thông số xác lập R2 cao mặc dầu t-statistics về những thông số của độ dốc ước tính không đáng kể, biểu lộ sai số chuẩn tăng cao. Mặc dù những thông số hoàn toàn có thể được ước tính thiếu đúng chuẩn, nhưng những biến độc lập có vai trò lý giải biến phụ thuộc vào, điều này biểu lộ trải qua việc R2 cao .

Xét ví dụ minh họa: Đa cộng tuyến trong việc giải thích về lợi nhuận của cổ phiếu công nghệ Fidelity Select Technology Portfolio (FSPTX).

Dưới đây là hiệu quả của phương trình hồi qui của doanh thu CP này dựa trên chỉ số tăng trưởng của S&P 500 và chỉ số giá trị của S&P 500 .Đa cộng tuyến (Multicollinearity) là gì? Hậu quả - Ảnh 2.

Khoảng thời gian nghiên cứu: 1/2009 – 12/2013

Giá trị t-statistic bằng 5.9286 của chỉ số tăng trưởng ( lớn hơn 2 ) cho thấy sự tăng trưởng có độc lạ đáng kể so với mức độ tiêu chuẩn ( có giá trị là 0 ). Mặt khác, t-statistic của chỉ số giá trị là − 0.9012 không có ý nghĩa thống kê .Kết quả này cho thấy doanh thu của FSPTX có mối tương quan với chỉ số tăng trưởng và không tương quan ngặt nghèo với chỉ số giá trị. Tuy nhiên, thông số ( coefficient ) của chỉ số tăng trưởng là 1.4697 biểu lộ rằng doanh thu của FSPTX có nhiều dịch chuyển hơn so với doanh thu của chỉ số tăng trưởng .Lưu ý rằng hồi qui này lý giải phương sai của doanh thu FSPTX. Cụ thể, R2 của hồi qui này là 0,7996. Do đó, khoảng chừng 80 % phương sai của doanh thu của FSPTX được lý giải bằng doanh thu chỉ số tăng trưởng và chỉ số giá trị S&P 500. Giả sử, tất cả chúng ta chạy quy mô hồi qui tuyến tính khác có thêm chỉ số S&P 500. Dưới đây là hiệu quả của quy mô :Đa cộng tuyến (Multicollinearity) trong mô hình hồi qui là gì? Hậu quả - Ảnh 3.Khoảng thời hạn nghiên cứu và điều tra : 1/2009 – 12/2013Lưu ý rằng R2 trong hồi qui này đã biến hóa không đáng kể so với R2 trong hồi qui trước đó ( tăng từ 0,7996 lên 0,8084 ), nhưng sai số chuẩn của những thông số của những biến độc lập đã lớn hơn nhiều .

Việc thêm chỉ sô S&P 500 vào mô hình hồi qui không giải thích thêm bất kì phương sai của lợi nhuận của FSPTX so với trước đó, nhưng không có hệ số nào có ý nghĩa thống kê. Đây là trường hợp kinh điển của đa hiện tượng đa cộng tuyếnKhắc phục hiện tượng đa cộng tuyến.

Cách khắc phục hiện tượng đa cộng tuyến

Giải pháp trực tiếp nhất cho đa cộng tuyến là loại trừ một hoặc nhiều biến hồi qui.

Trong ví dụ trên, tất cả chúng ta hoàn toàn có thể thấy rằng không nên cho chỉ số S&P 500 nếu trong quy mô hồi qui gồm có cả hai chỉ số tăng trưởng và giá trị S&P 500, vì doanh thu chỉ số S&P 500 là bình quân gia quyền của tăng trưởng CP và giá trị CP .Tuy nhiên, trong nhiều trường hợp, không thuận tiện để có giải pháp cho hiện tượng đa cộng tuyến, tất cả chúng ta cần thử nghiệm thêm hoặc loại trừ những biến độc lập khác nhau để xác lập nguồn gốc của đa cộng tuyến .

(Tài liệu tham khảo: CFA level II, 2020, Quantitative methods)

Để lại một bình luận

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *