Khi tiến hành phân tích dữ liệu với phần mềm SPSS, giá trị ngoại lai có thể là một trong những nguyên nhân khiến kết quả phân tích dữ liệu không được "đẹp" cho lắm. Trong bài viết này, Marketing Du Ký sẽ hướng dẫn các bạn cách loại giá trị ngoại lai bằng phương pháp Z-score trong SPSS.


    Cách Loại Giá Trị Ngoại Lai Bằng Phương Pháp Z-score Trong SPSS

    1. Giá trị ngoại lai là gì?

    Giá trị ngoại lai (outlier) là các điểm dữ liệu nằm ngoài phạm vi thông thường của một tập dữ liệu. Chúng thường quá lớn, quá nhỏ, hoặc không tuân theo bất cứ một xu hướng chung nào.

    Ví dụ: Trong một nghiên cứu về thu nhập hộ gia đình tại Việt Nam, nếu hầu hết thu nhập dao động từ 5-20 triệu đồng/tháng, nhưng có một giá trị là 500 triệu đồng/tháng, đây rất có thể là một giá trị ngoại lai.

    2. Cách loại giá trị ngoại lai bằng Z-score trong SPSS

    Để loại giá trị ngoại lai bằng phương pháp Z-score thì việc làm đầu tiên là bạn cần khởi động phần mềm SPSS. Tại giao diện chính của phần mềm, bạn hãy lần lượt lựa chọn Analyze ➪ Descriptive Statistics ➪ Descriptives.

    Analyze ➪ Descriptive Statistics ➪ Descriptives

    Tại Bảng Descriptives, bạn hãy lần lượt đưa các biến cần xem xét giá trị ngoại lai sang cột Variable(s). Sau đó, bạn hãy nhấp chọn ô Save standardized values as variables để phần mềm SPSS tự tính toán giá trị Z-score cho bạn.

    Save standardized values as variables

    Sau khi chọn OK, phần mềm SPSS sẽ tự động tính toán giá trị Z-score của các biến mà bạn vừa chọn tại các cột mới. Tại đây. bạn hãy sắp xếp dữ liệu theo thứ tự tăng dần (hoặc ngược lại) để loại giá trị ngoại lai.

    Theo đó, Z-score lớn hơn 3 hoặc nhỏ hơn -3 (|Z| > 3) thường được xem là giá trị ngoại lai. Do đó, bạn có thể cân nhắc loại bỏ chúng đi.

    |Z| > 3 được xem là giá trị ngoại lai

    Như vậy, Marketing Du Ký đã hướng dẫn các bạn cách loại giá trị ngoại lai bằng phương pháp Z-score trong SPSS. Hy vọng bạn sẽ dễ dàng áp dụng phương pháp này trong quá trình sàng lọc và phân tích dữ liệu.