Chủ Nhật, 7 tháng 7, 2013

Các đặc điểm của phân phối xác suất

Đo lường xu hướng trung tâm
 Giá trị kỳ vọng (giá trị trung bình-mean)
Giá trị kỳ vọng của một biến ngẫu nhiên là trung bình có trọng số của các giá trị có thể có của biến đó, với xác suất của các giá trị này đóng vai trò như các trọng số.
 Trung vị (median) là giá trị của số liệu có vị trị nằm giữa bộ số liệu sắp xếp theo trật tự. Đây chính là điểm giữa của phân phối. Khi số quan sát là chẵn, trung vị là giá trị trung bình hai quan sát ở vị trí trung tâm.
 Mode là giá trị của quan sát có tần suất xuất hiện nhiều nhất trong bộ dữ liệu.
 Khoảng cách (range) là giá trị khác biệt giữa con số lớn nhất và nhỏ nhất trong bộ dữ liệu.

Đo lường tính biến thiên
 Phương sai tổng thể (variance)
Giá trị kỳ vọng của một biến ngẫu nhiên đơn giản chỉ cho biết trọng tâm của biến đó ở đâu chứ không cho biết các giá trị riêng lẻ của biến đó phân tán như thế nào xung quanh giá trị trung bình. Thước đo phổ biến nhất cho sự phân tán này là phương sai.
 Độ lệch chuẩn (standard deviation,SD)
 Sai số chuẩn của giá trị trung bình (standard error of the mean,s.e) đo lường phạm vi mà giá trị trung bình của quần thể (μ) có thể xuất hiện với một xác suất cho trước dựa trên giá trị trung bình của mẫu (mean).

Hiệp phương sai tổng thể
Giá trị kỳ vọng và phương sai là hai thước đo đc sử dụng phổ biến nhất của hàm phân phối xác suất một biến. Nhưng khi muốn xem xét các hàm phân phối xác suất đa biến, ta thường quan tâm đến hai thước đo khác là hiệp phương sai và hệ số tương quan.
Hiệp phương sai giữa hai biến có thể dương, âm, hoặc bằng không. Nếu hai biến vận động theo cùng chiều, thì hiệp phương sai sẽ dương, nếu khác chiều, thì hiệp phương sai sẽ âm. Nếu hiệp phương sai giữa hai biến bằng không, thì điều này có nghĩa là không có mối quan hệ tuyến tính nào giữa hai biến đó. Nói cách khác, đó là hai biến độc lập hoàn toàn.

Hệ số tương quan tổng thể
Do hiệp phương sai phụ thuộc vào thước đo của hai biến, nên chúng khó có thể so sánh mối quan hệ giữa các cặp biến có thước đo khác nhau. Để khắc phục vấn đề này, người ta thường sử dụng hệ số tương quan. Hệ số tương quan là thước đo mối quan hệ tuyến tính giữa hai biến ngẫu nhiên, nghĩa là nó cho biết hai biến đó có quan hệ với nhau như thế nào: mạnh hay yếu.

Độ nghiêng và độ nhọn tổng thể
Độ nghiêng và độ nhọn cho ta biết điều gì đó về hình dạng phân phối xác suất. Độ nghiêng (S) là một thước đo sự mất cân xứng của đồ thị phân phối xác suất, và đồ nhọn (K) là một thước đo độ cao hay thấp của đồ thị phân phối xác suất.
Để tính các thước đo độ nghiêng và độ nhọn, ta cần biết mô men thứ ba và mô men thứ tư của một hàm phân phối xác suất


  • Nếu S=0, hàm ppxs đối xứng quanh giá trị trung bình.
  • Nếu S>0, hàm ppxs bị nghiêng phải
  • Nếu S<0, hàm ppxs bị nghiêng trái.



  • Nếu K=3, hàm ppxs có độ nhọn chuẩn và đc gọi là mesokurtic
  • Nếu K<3, hàm ppxs có đuôi ngắn và đc gọi platykurtic.
  • Nếu K>3, hàm ppxs có đuôi dài và dc gọi là leptokurtic.


Đo lường dạng hình của phân phối (Measures of Shape)
Độ nhọn (kurtosis) đo lường mức độ nhọn hay bẹt của phân phối so với phân phối bình thường (có độ nhọn bằng 0). Phân phối có dạng nhọn khi giá trị kurtosis dương và có dạng bẹt khi giá trị kurtosis âm. 
Với phân phối bình thường, giá trị của độ méo và độ nhọn bằng 0. Căn cứ trên tỷ số giữa giá trị skewness và kurtosis và sai số chuẩn của nó, ta có thể đánh giá phân phối có bình thường hay không (khi tỷ số này nhỏ hơn -2 và lớn hơn +2, phân phối là không bình thường).

Không có nhận xét nào:

Đăng nhận xét