Hồi quy tuyến tính bội là một kỹ thuật phổ biến để phân tích mối quan hệ giữa nhiều biến trong mô hình. Với các nghiên cứu xã hội, hồi quy giúp các nhà nghiên cứu hiểu rõ hơn về các yếu tố ảnh hưởng đến kết quả. Trong bài viết này, Marketing Du Ký sẽ hướng dẫn các bạn cách phân tích hồi quy tuyến tính bội với SPSS.
1. Hồi quy tuyến tính bội là gì?
Hồi quy tuyến tính bội là một phương pháp thống kê dùng để phân tích mối quan hệ giữa một biến phụ thuộc và nhiều biến độc lập. Nói theo cách khác, mô hình hồi quy bội giúp nhà nghiên cứu tìm ra một phương trình toán học để mô tả mối liên hệ giữa các biến này.
Mô hình hồi quy tuyến tính bội được thể hiện dựa trên công thức tổng quát dưới dạng như sau:
Y = β0 + β1X1 + β2X2 + ... + βnXn + ε
Trong đó:
Y: Biến phụ thuộc
X1, X2, ..., Xn: Các biến độc lập
β0: Hệ số cắt trục
β1, β2, ..., βn: Các hệ số hồi quy
ε: Sai số ngẫu nhiên
2. Cách phân tích hồi quy tuyến tính bội
Để thực hiện phân tích hồi quy bội, đầu tiên bạn hãy lần lượt chọn Analyze ➪ Regression ➪ Linear.
Sau khi bảng Linear Regression hiện lên, bạn lần lượt đưa biến phụ thuộc trung sang cột Dependent và tất cả các biến độc lập trung bình sang cột Independent.
Tiếp đến, bạn hãy nhấp vào Statistics và chọn các ô sau: Estimates, Durbin-Watson, Model fit, Descriptives và Collinearity diagnostics.
Nếu bạn muốn vẽ biểu đồ, hãy chọn Plots và lần lượt đưa giá trị *ZRESID sang Y và ZPRSED sang X. Và đừng quên nhấp chọn Histogram và Normal probability plot nữa nhé.
Cuối cùng, bạn chọn Continue để quay về bảng Linear Regression và nhấn OK để phần mềm SPSS tiến hành phân tích dữ liệu.
Hai chỉ số đầu tiên mà bạn cần lưu ý là R Square (R bình phương) và Ajusted R Square (R bình phương hiệu chỉnh). Cả 2 chỉ số này đều có khoảng giá trị dao động từ 0 đến 1, tuy nhiên, ý nghĩa thực tế của chúng lại có sự khác nhau.
Chỉ số R Square cho biết các biến độc lập giải thích được bao nhiêu phần trăm biến thiên của biến phụ thuộc. Nếu R Square càng tiến về 1 thì chứng tỏ các biến độc lập giải thích được phần lớn sự biến thiên của biến phụ thuộc. Trong trường hợp R Square càng tiến về 0 thì biến độc lập càng giải thích được ít sự biến thiên của biến phụ thuộc.
Tuy nhiên, nếu chúng ta thêm một số biến độc lập vào mô hình nghiên cứu sẽ làm chỉ số R Square tăng cao (dù các biến đó có thật sự ảnh hưởng đến biến phụ thuộc hay không). Do đó, chỉ số Adjusted R Square đã được sử dụng nhằm kiểm soát sự "lạm phát" này.
Dựa trên kết quả từ phần mềm SPSS, chỉ số R bình phương hiệu chỉnh là 0.439, do đó, bạn có thể kết luận rằng các biến độc lập trong mô hình nghiên cứu đã giải thích được 43.9% sự biến thiên của biến phụ thuộc (sự hài lòng). 56.1% còn lại là do sai số ngẫu nhiên và các yếu tố khác ngoài mô hình nghiên cứu.
Durbin Watson là một chỉ số dùng để đánh giá hiện tượng tự tương quan chuỗi bậc nhất của mô hình nghiên cứu. Theo Qiao (2011), giá trị Durbin Watson cần nằm trong phạm vi từ 1.5 đến 2.5 để không vi phạm tiêu chí tự tương quan chuỗi bậc nhất. Theo đó, chỉ số này của mô hình nghiên cứu là 1.998 nên không vi phạm giả định tương quan chuỗi bậc nhất.
3.2. Bảng ANOVA
Đối với bảng ANOVA, bạn cần quan tâm đến chỉ số sig của mô hình nghiên cứu. Chỉ số sig dùng để đánh giá mức độ phù hợp của phương trình hồi quy dựa trên các giả thuyết ban đầu. Theo đó:
Sig ≤ 0.05: Mô hình hồi quy phù hợp (bác bỏ giả thuyết H0).
Sig > 0.05: Mô hình hồi quy không phù hợp (chấp nhận giả thuyết H0).
Căn cứ theo kết quả từ bảng ANOVA, có thể thấy chỉ số sig của kiểm định F hiển thị với giá trị 0.000 (≤ 0.05). Do đó, mô hình hồi quy này là hoàn toàn phù hợp.
Chỉ số sig ở bảng Coefficients cho biết ý nghĩa của phép kiểm định t đối với mối quan hệ giữa biến độc lập và biến phụ thuộc tương ứng.
Sig ≤ 0.05: Biến độc lập có sự tác động lên biến phụ thuộc (bác bỏ giả thuyết H0).
Sig > 0.05: Biến độc lập không có sự tác động lên biến phụ thuộc (chấp nhận giả thuyết H0).
Từ kết quả trên, có thể thấy chỉ có CT, HH và TC là có sự tác động lên HL (biến phụ thuộc). Các biến DU và DB ảnh hưởng đến HL vì có chỉ số sig > 0.05.
Đối với hồi quy, có 2 chỉ số bao gồm Beta chưa chuẩn hóa (Unstandardized Coefficients Beta) và chỉ số Beta đã chuẩn hóa (Standardized Coefficients Beta). Tuy nhiên, đối với dạng nghiên cứu xem xét mối quan hệ giữa các biến độc lập với biến phụ thuộc thì bạn nên kết luận dựa trên chỉ số Beta đã chuẩn hóa. Trong đó:
Beta dương (không mang dấu) chứng tỏ biến độc lập tác động cùng chiều lên biến phụ thuộc.
Beta âm (mang dấu trừ) chứng tỏ biến độc lập tác động ngược chiều lên biến phụ thuộc.
Ngoài ra, nếu giá trị tuyệt đối của Beta càng lớn thì biến độc lập có tác động càng lớn lên biến phụ thuộc, và ngược lại.
Dựa vào bảng Coefficients, có thể thấy TC có sự tác động lớn nhất đến với HL. Ngoài ra, các mối quan hệ có ý nghĩa thống kê đều có sự tác động cùng chiều (Beta dương) đến sự biến thiên của HL.
3.3.3. Chỉ số VIF
Cuối cùng, chỉ số VIF (Variance Inflation Factor) được dùng để đánh giá hiện tượng đa cộng tuyến của mô hình hồi quy. Theo Hair và cộng sự (2016), hiện tượng đa cộng tuyến xảy ra khi dung sai < 0.2 hoặc hệ số phóng đại phương sai (VIF) > 5.
Căn cứ vào kết quả từ cột VIF của bảng Coefficients, có thể thấy hiện tượng đa cộng tuyến đã không xảy ra do các giá trị đều nhỏ hơn 5.
4. Cách viết phương trình hồi quy tuyến tính bội
Như đã trình bày, phương trình hồi quy tuyến tính bội được viết dưới công thức tổng quát như sau:
Y = β0 + β1X1 + β2X2 + ... + βnXn + ε
Do đó, phương trình hồi quy của mô hình nghiên cứu trên được trình bày như sau:
HL = 0.183*CT + 0.174*HH + 0.426*TC + ε
Lưu ý: Các biến có chỉ số sig > 0.05 trong bảng Coefficients sẽ không được phép đưa vào phương trình hồi quy tuyến tính bội.
Trên đây là những hướng dẫn chi tiết của Marketing Du Ký về cách phân tích hồi quy tuyến tính bội với SPSS. Mong rằng bạn đã có thể nắm được cách triển khai sau khi đọc qua bài viết này.