Đa cộng tuyến là một hiện tượng xảy ra khá phổ biến khi phân tích hồi quy đối với các nghiên cứu định lượng. Hiện tượng này ảnh hưởng rất lớn đối với tính chính xác của kết quả nghiên cứu. Trong bài viết này, Marketing Du Ký sẽ làm rõ hiện tượng đa cộng tuyến là gì cũng như hướng dẫn bạn cách khắc phục.


    Hiện Tượng Đa Cộng Tuyến Là Gì? Cách Khắc Phục Đa Cộng Tuyến

    1. Hiện tượng đa cộng tuyến là gì?

    Đa cộng tuyến (multicollinearity) là hiện tượng xảy ra trong phân tích hồi quy khi hai hoặc nhiều biến độc lập có mối quan hệ tương quan mạnh mẽ với nhau. Điều này gây ra một số vấn đề trong việc ước lượng và giải thích mô hình hồi quy.

    Hiện tượng đa cộng tuyến là một vấn đề quan trọng cần được nhận diện và khắc phục nhằm đảm bảo tính chính xác và độ tin cậy của các mô hình hồi quy.

    2. Nguyên nhân gây ra hiện tượng đa cộng tuyến

    Trên thực tế, có rất nhiều nguyên nhân dẫn đến hiện tượng đa cộng tuyến khi phân tích dữ liệu. Dưới đây là một số nguyên nhân chính dẫn đến tình trạng này.

    2.1. Bảng câu hỏi khảo sát

    Việc lập bảng câu hỏi có vai trò rất quan trọng đối với kết quả phân tích dữ liệu. Nếu bạn đưa vào bảng khảo sát các câu hỏi có nội dung tương đồng hoặc dễ gây hiểu lầm, rất có thể đáp viên sẽ chọn những phương án giống nhau. Đây là một trong những nguyên nhân chính dẫn đến hiện tượng đa cộng tuyến.

    2.2. Số lượng biến độc lập

    Khi số lượng biến độc lập trong mô hình nghiên cứu quá nhiều, khả năng xảy ra hiện tượng đa cộng tuyến ngày càng tăng cao. Nguyên nhân là vì các biến độc lập có khả năng sẽ có mối tương quan cao với nhau. Điều này thường diễn ra ở các nghiên cứu có quy mô nhỏ.

    2.3. Lỗi thiết kế nghiên cứu

    Một thiết kế nghiên cứu không phù hợp, chẳng hạn như không kiểm soát tốt các yếu tố bên ngoài, có thể dẫn đến việc các biến độc lập trở nên tương quan mạnh với nhau. Từ đó, gây nên hiện tượng đa cộng tuyến.

    3. Cách phát hiện đa cộng tuyến

    3.1. Phần mềm SPSS

    Đối với phần mềm SPSS, bạn có thể phát hiện đa cộng tuyến tại bảng Coefficients trong phân tích hồi quy. Theo Hair và cộng sự (2016), hiện tượng đa cộng tuyến xảy ra khi dung sai < 0.2 hoặc hệ số phóng đại phương sai (VIF) > 5.

    Nhận biết hiện tượng đa cộng tuyến bằng SPSS

    3.2. Phần mềm Smart Pls

    Đối với phần mềm Smart Pls, bạn có thể kiểm tra đa cộng tuyến tại phần kiểm định mô hình cấu trúc. Tương tự, kiểm định đa cộng tuyến cần thỏa mãn điều kiện hệ số phóng đại phương sai (Inner VIF) > 5.

    Nhận biết hiện tượng đa cộng tuyến bằng Smart Pls

    4. Cách khắc phục đa cộng tuyến

    4.1. Xem xét bảng câu hỏi

    Như đã đề cập, các câu hỏi có nội dung trùng lặp hoặc dễ gây hiểu nhầm có thể khiến đáp viên lựa chọn các đáp án giống nhau. Do đó, bạn cần phải xem xét thật kỹ nội dung bảng câu hỏi trước khi tiến hành khảo sát.

    Ngoài ra, sau khi hoàn thành bảng câu hỏi, bạn nên nhờ bạn bè hoặc người thân đọc qua thử và đưa ra góp ý trước khi tiến hành khảo sát diện rộng.

    4.2. Giảm số biến độc lập

    Sau khi thực hiện nghiên cứu sơ bộ, bạn nên phân tích bộ dữ liệu sơ bộ để kịp thời loại bỏ các biến độc lập có mối tương quan cao với nhau nhằm tránh hiện tượng đa cộng tuyến khi nghiên cứu chính thức.

    4.3. Thu thập thêm mẫu khảo sát

    Việc thu thập thêm số mẫu khảo sát có thể làm gia tăng kích thước mẫu, từ đó làm giảm hiệu ứng của đa cộng tuyến và giúp các ước lượng trở nên ổn định hơn.

    Tóm lại, hiện tượng đa cộng tuyến có thể ảnh hưởng đến tính chính xác và khả năng giải thích của mô hình nghiên cứu. Do đó, khắc phục đa cộng tuyến là một việc làm hết sức cần thiết để đảm bảo tính hiệu quả của nghiên cứu. Marketing Du Ký hy vọng rằng bạn đã biết cách khắc phục tình trạng trên.