Giá trị ngoại lai (outlier) là các điểm dữ liệu nằm ngoài phạm vi thông thường của một tập dữ liệu. Chúng thường quá lớn, quá nhỏ, hoặc không tuân theo bất cứ một xu hướng chung nào.
Ví dụ: Trong một nghiên cứu về thu nhập hộ gia đình tại Việt Nam, nếu hầu hết thu nhập dao động từ 5-20 triệu đồng/tháng, nhưng có một giá trị là 500 triệu đồng/tháng, đây rất có thể là một giá trị ngoại lai.
2. Cách loại giá trị ngoại lai bằng Z-score trong SPSS
Để loại giá trị ngoại lai bằng phương pháp Z-score thì việc làm đầu tiên là bạn cần khởi động phần mềm SPSS. Tại giao diện chính của phần mềm, bạn hãy lần lượt lựa chọn Analyze➪ Descriptive Statistics ➪ Descriptives.
Tại Bảng Descriptives, bạn hãy lần lượt đưa các biến cần xem xét giá trị ngoại lai sang cột Variable(s). Sau đó, bạn hãy nhấp chọn ô Save standardized values as variables để phần mềm SPSS tự tính toán giá trị Z-score cho bạn.
Sau khi chọn OK, phần mềm SPSS sẽ tự động tính toán giá trị Z-score của các biến mà bạn vừa chọn tại các cột mới. Tại đây. bạn hãy sắp xếp dữ liệu theo thứ tự tăng dần (hoặc ngược lại) để loại giá trị ngoại lai.
Theo đó, Z-score lớn hơn 3 hoặc nhỏ hơn -3 (|Z| > 3) thường được xem là giá trị ngoại lai. Do đó, bạn có thể cân nhắc loại bỏ chúng đi.
Như vậy, Marketing Du Ký đã hướng dẫn các bạn cách loại giá trị ngoại lai bằng phương pháp Z-score trong SPSS. Hy vọng bạn sẽ dễ dàng áp dụng phương pháp này trong quá trình sàng lọc và phân tích dữ liệu.