Statistics are like bikinis; what they reveal is suggestive, but what they conceal is vital. Aaron Levenstein

Monday, December 27, 2010

Phát hiện phân bố lệch từ số liệu tổng kết

Douglas G Altman, J Martin Bland

(Nguyên văn Statistics Notes: Detecting skewness from summary information

có thể đọc tại http://www.bmj.com/content/313/7066/1200.1.full)

Như chúng ta đã ghi nhận trước đây, nhiều phương pháp phân tích có giả định rằng dữ liệu có phân phối thường (normal distribution). Khi dữ liệu không đạt tiêu chuẩn đó chúng ta thường chuyển dạng dữ liệu để nó trở nên gần phân phối bình thường hơn. Độc giả có thể có ý muốn được bảo đảm là các tác giả tiến hành các phân tích phù hợp. Khi các tác giả trình bày dữ liệu dưới dạng histogram hoặc sơ đồ phân tán (scatter diagram) thì độc giả có thể hình dung là giả định về phân phối có đạt được hay không. Tuy nhiên, nếu chỉ có các tóm tắt con số thông kê được trình bày, là trường hợp hay gặp, thì việc này rất khó khăn. Nếu việc tổng kết số liệu bao gồm cả range (max - min) thì ta có thể có một ý niệm về phân phối.