SAT Problem-Solving: thống kê và phân tích dữ liệu
Trung bình vs trung vị (và ảnh hưởng của giá trị ngoại lai), so sánh độ lệch chuẩn, biểu đồ tán xạ, bảng hai chiều, và cái bẫy tương quan-nhân quả mà SAT rất thích giăng.
Thống kê xuất hiện 2–4 lần mỗi Digital SAT — trung bình, trung vị, độ lệch chuẩn, tán xạ và lấy mẫu. Phần lớn sẽ nhanh nếu các em nhớ đại lượng nào nhạy với ngoại lai và cái nào không.
Các đại lượng đo xu hướng trung tâm
- Trung bình = tổng / số phần tử — nhạy với ngoại lai
- Trung vị = giá trị ở giữa (sắp xếp trước!) — chống ngoại lai
- Mốt = giá trị xuất hiện nhiều nhất — hiếm khi hỏi trực tiếp
Khi ngoại lai có ảnh hưởng
SAT thích mẫu này: "Nếu giá trị lớn nhất tăng thêm 100, trung bình và trung vị thay đổi ra sao?" Trung bình tăng 100/n; trung vị không dời (trừ khi giá trị lớn nhất trước đó chính là giá trị giữa).
Độ lệch chuẩn = độ trải
Trong SAT các em không phải tính độ lệch chuẩn bằng tay — nhưng phải so sánh giữa các bộ dữ liệu.
Biểu đồ tán xạ và đường hồi quy tốt nhất
Câu tán xạ thường hỏi một trong ba điều:
- Hệ số góc của đường hồi quy tốt nhất — hiểu là "y thay đổi m mỗi khi x tăng 1"
- Tung độ gốc của đường hồi quy tốt nhất — y dự đoán khi x = 0
- Dự đoán một giá trị y — thế x vào phương trình đường
SAT sẽ gài "dữ liệu cho thấy X gây ra Y". Từ chối mọi khẳng định nhân quả rút từ dữ liệu quan sát — chỉ thí nghiệm mới hỗ trợ ngôn ngữ nhân quả.
Sai số biên và lấy mẫu
SAT kiểm tra khái niệm lấy mẫu khá nhẹ. Hai quy tắc:
- Mẫu lớn hơn → sai số biên nhỏ hơn. Nhân đôi cỡ mẫu, sai số giảm.
- Mẫu ngẫu nhiên = có thể tổng quát hoá. Mẫu phi ngẫu nhiên (ví dụ tình nguyện) không thể tổng quát, dù lớn cỡ nào.
Xác suất cơ bản
Câu bảng hai chiều
Bảng hai chiều là "đạo cụ" thống kê SAT yêu thích. Mẹo là đọc xem câu hỏi đang điều kiện hoá theo cái gì:
- "Có bao nhiêu % trong toàn bộ học sinh là X?" → chia ô cho tổng chung
- "Có bao nhiêu % trong nhóm lớp 11 là X?" → chia ô cho tổng dòng (hoặc cột)
- "Cho biết một học sinh là X, ..." → xác suất có điều kiện, mẫu số là tổng của X
Tìm giá trị thiếu từ trung bình đã biết
Mẫu SAT quen thuộc: cho trung bình và hỏi một giá trị còn thiếu.
Lỗi thường gặp
- Quên sắp xếp trước khi tìm trung vị
- Nhầm độ lệch chuẩn (độ trải) với trung bình (trung tâm)
- Kết luận nhân quả từ biểu đồ tán xạ
- Chia sai tổng khi tính từ bảng hai chiều
- Tổng quát hoá từ mẫu phi ngẫu nhiên ra toàn bộ dân số