Trong lý thuyết xác suất và thống kê, phương sai của một biến ngẫu nhiên là một độ đo sự phân tán thống kê của biến đó, nó hàm ý các giá trị của biến đó thường ở cách giá trị kỳ vọng bao xa.

Phương sai của biến ngẫu nhiên giá trị thực là moment trung tâm, nó còn là nửa bất biến (cumulant) thứ hai của nó. Phương sai của một biến ngẫu nhiên là bình phương của độ lệch chuẩn.

Nếu

μ
=
E

(
X
)

{\displaystyle \mu =\operatorname {E} (X)}

{\displaystyle \mu =\operatorname {E} (X)} là giá trị kỳ vọng của biến ngẫu nhiên X, thì phương sai là

var

(
X
)
=
E

(
(
X

μ

)

2

)
.

{\displaystyle \operatorname {var} (X)=\operatorname {E} ((X-\mu )^{2}).}

Bạn đang đọc: Phương sai.

{\displaystyle \operatorname {var} (X)=\operatorname {E} ((X-\mu )^{2}).}

Nghĩa là, phương sai là giá trị kỳ vọng của bình phương của độ lệch của X so với giá trị trung bình của nó. Nói nôm na, phương sai là “trung bình của bình phương khoảng cách của mỗi điểm dữ liệu tới điểm trung bình”. Do đó, nó là giá trị trung bình của bình phương độ lệch. Phương sai của biến ngẫu nhiên X thường được ký hiệu là

var

(
X
)

{\displaystyle \operatorname {var} (X)}

{\displaystyle \operatorname {var} (X)},

σ

X

2

{\displaystyle \sigma _{X}^{2}}

{\displaystyle \sigma _{X}^{2}}, hoặc đơn giản là

σ

2

{\displaystyle \sigma ^{2}}

\sigma ^{2}.

Lưu ý : định nghĩa trên vận dụng cho cả những biến ngẫu nhiên rời rạc và liên tục .Nhiều phân phối, ví dụ như phân phối Cauchy, là không có phương sai, do tích phân có được từ định nghĩa phương sai là phân kỳ. Một phân phối không sống sót giá trị kỳ vọng thì cũng không sống sót phương sai. Nhưng điều ngược lại thì không đúng : có những phân phối mà giá trị kì vọng sống sót nhưng không sống sót phương sai .

Các đặc thù.

  • Nếu phương sai tồn tại, thì nó không bao giờ âm, vì bình phương một số luôn dương hoặc bằng 0.
  • Đơn vị của phương sai là bình phương đơn vị của giá trị quan sát được của biến ngẫu nhiên. Ví dụ, phương sai của tập hợp các chiều cao đo được tính theo centimet (cm) có đơn vị là cm bình phương. Đơn vị này gây bất tiện nên các nhà thống kê thường sử dụng căn bậc hai của phương sai, gọi là độ lệch chuẩn, coi như là tổng của các phân tán.
  • Nếu ab là các hằng số thực, X là một biến ngẫu nhiên, thì a X + b { \ displaystyle aX + b }{\displaystyle aX+b}
var ⁡ ( a X + b ) = a 2 var ⁡ ( X ). { \ displaystyle \ operatorname { var } ( aX + b ) = a ^ { 2 } \ operatorname { var } ( X ). }{\displaystyle \operatorname {var} (aX+b)=a^{2}\operatorname {var} (X).}
  • Khi tính phương sai, để thuận tiện ta thường dùng công thức:
var ⁡ ( X ) = E ⁡ ( X 2 − 2 X E ⁡ ( X ) + ( E ⁡ ( X ) ) 2 ) = E ⁡ ( X 2 ) − 2 ( E ⁡ ( X ) ) 2 + ( E ⁡ ( X ) ) 2 = E ⁡ ( X 2 ) − ( E ⁡ ( X ) ) 2. { \ displaystyle \ operatorname { var } ( X ) = \ operatorname { E } ( X ^ { 2 } – 2 \, X \, \ operatorname { E } ( X ) + ( \ operatorname { E } ( X ) ) ^ { 2 } ) = \ operatorname { E } ( X ^ { 2 } ) – 2 ( \ operatorname { E } ( X ) ) ^ { 2 } + ( \ operatorname { E } ( X ) ) ^ { 2 } = \ operatorname { E } ( X ^ { 2 } ) – ( \ operatorname { E } ( X ) ) ^ { 2 }. }{\displaystyle \operatorname {var} (X)=\operatorname {E} (X^{2}-2\,X\,\operatorname {E} (X)+(\operatorname {E} (X))^{2})=\operatorname {E} (X^{2})-2(\operatorname {E} (X))^{2}+(\operatorname {E} (X))^{2}=\operatorname {E} (X^{2})-(\operatorname {E} (X))^{2}.}
  • var ⁡ ( a X + b Y ) = a 2 var ⁡ ( X ) + b 2 var ⁡ ( Y ) + 2 a b cov ⁡ ( X, Y ). { \ displaystyle \ operatorname { var } ( aX + bY ) = a ^ { 2 } \ operatorname { var } ( X ) + b ^ { 2 } \ operatorname { var } ( Y ) + 2 ab \, \ operatorname { cov } ( X, Y ). }{\displaystyle \operatorname {var} (aX+bY)=a^{2}\operatorname {var} (X)+b^{2}\operatorname {var} (Y)+2ab\,\operatorname {cov} (X,Y).}

Với

cov

{\displaystyle \operatorname {cov} }

{\displaystyle \operatorname {cov} } là hiệp phương sai, bằng 0 nếu X và Y là 2 biến ngẫu nhiên độc lập lẫn nhau.

Xấp xỉ phương sai của một hàm số.

Phương pháp Delta sử dụng khai triển Taylor bậc hai để xê dịch phương sai của hàm số của một hay nhiều biến ngẫu nhiên. Ví dụ, phương sai của hàm số theo một biến ngẫu nhiên được xê dịch bởi :

var ⁡ [ f ( X ) ] ≈ ( f ′ ( E ⁡ [ X ] ) ) 2 var ⁡ [ X ] { \ displaystyle \ operatorname { var } \ left [ f ( X ) \ right ] \ approx \ left ( f ‘ ( \ operatorname { E } \ left [ X \ right ] ) \ right ) ^ { 2 } \ operatorname { var } \ left [ X \ right ] }{\displaystyle \operatorname {var} \left[f(X)\right]\approx \left(f'(\operatorname {E} \left[X\right])\right)^{2}\operatorname {var} \left[X\right]}

với giả thiết

f
(

)

{\displaystyle f(\cdot )}

f(\cdot ) khả vi bậc hai, trung bình và phương sai của

X

{\displaystyle X}

X là hữu hạn (tức tồn tại).

Phương sai của toàn diện và tổng thể chung và phương sai mẫu.

Trên nhiều trường hợp trong thực tiễn, giá trị đúng mực của phương sai của một tổng thể và toàn diện, ký hiệu bởi σ 2 { \ displaystyle \ sigma ^ { 2 } } là không hề xác lập trước được .

Phương pháp chung để ước lượng phương sai của một tổng thể (hữu hạn hoặc vô hạn) là ta sẽ lấy một mẫu hữu hạn các cá thể từ quần thể. Giả sử rằng mẫu thu được có các giá trị đo được là

x

1

,

,

x

N

{\displaystyle x_{1},\dots ,x_{N}}

{\displaystyle x_{1},\dots ,x_{N}}.

Phương sai của mẫu (gọi tắt là phương sai mẫu)

(

x

1

,

,

x

N

)

{\displaystyle (x_{1},\dots ,x_{N})}

{\displaystyle (x_{1},\dots ,x_{N})}, được tính bởi:

σ ^ 2 = 1 N ∑ i = 1 N ( x i − x ¯ ) 2, { \ displaystyle { \ hat { \ sigma } } ^ { 2 } = { \ frac { 1 } { N } } \ sum _ { i = 1 } ^ { N } \ left ( x_ { i } – { \ overline { x } } \ right ) ^ { 2 }, }{\displaystyle {\hat {\sigma }}^{2}={\frac {1}{N}}\sum _{i=1}^{N}\left(x_{i}-{\overline {x}}\right)^{2},}

trong đó

x
¯

{\displaystyle {\overline {x}}}

{\displaystyle {\overline {x}}} là số bình quân số học của mẫu.

Tuy nhiên,

σ

2

^

{\displaystyle {\hat {\sigma ^{2}}}}

{\displaystyle {\hat {\sigma ^{2}}}} là một ước lượng chệch (biased) của phương sai quần thể. Ước lượng sau là một ước lượng không chệch (unbiased) của phương sai quần thể:

s 2 = 1 N − 1 ∑ i = 1 N ( x i − x ¯ ) 2, { \ displaystyle s ^ { 2 } = { \ frac { 1 } { N-1 } } \ sum _ { i = 1 } ^ { N } \ left ( x_ { i } – { \ overline { x } } \ right ) ^ { 2 }, }{\displaystyle s^{2}={\frac {1}{N-1}}\sum _{i=1}^{N}\left(x_{i}-{\overline {x}}\right)^{2},}

Chứng minh 1.

Phần sau đây chứng minh

s

2

{\displaystyle s^{2}}

{\displaystyle s^{2}} là một ước lượng không chệch của phương sai quần thể. Một ước lượng

θ
^

{\displaystyle {\hat {\theta }}}

{\displaystyle {\hat {\theta }}} của tham số

θ

{\displaystyle \theta }

\theta được gọi là ước lượng không chệch nếu

E

{

θ
^

}
=
θ

{\displaystyle \operatorname {E} \{{\hat {\theta }}\}=\theta }

{\displaystyle \operatorname {E} \{{\hat {\theta }}\}=\theta }.

Ký hiệu

μ

{\displaystyle \mu }

\mu

σ

2

{\displaystyle \sigma ^{2}}

lần lượt là trung bình và phương sai của quần thể. Để chứng minh

s

2

{\displaystyle s^{2}}

là ước lượng không chệch, ta sẽ chứng minh rằng

E

{

s

2

}
=

σ

2

{\displaystyle \operatorname {E} \{s^{2}\}=\sigma ^{2}}

{\displaystyle \operatorname {E} \{s^{2}\}=\sigma ^{2}}. Ta có:

E ⁡ { s 2 } = E ⁡ { 1 n − 1 ∑ i = 1 n ( x i − x ¯ ) 2 } { \ displaystyle \ operatorname { E } \ { s ^ { 2 } \ } = \ operatorname { E } \ left \ { { \ frac { 1 } { n-1 } } \ sum _ { i = 1 } ^ { n } \ left ( x_ { i } – { \ overline { x } } \ right ) ^ { 2 } \ right \ } }{\displaystyle \operatorname {E} \{s^{2}\}=\operatorname {E} \left\{{\frac {1}{n-1}}\sum _{i=1}^{n}\left(x_{i}-{\overline {x}}\right)^{2}\right\}}
= 1 n − 1 ∑ i = 1 n E ⁡ { ( x i − x ¯ ) 2 } { \ displaystyle = { \ frac { 1 } { n-1 } } \ sum _ { i = 1 } ^ { n } \ operatorname { E } \ left \ { \ left ( x_ { i } – { \ overline { x } } \ right ) ^ { 2 } \ right \ } }{\displaystyle ={\frac {1}{n-1}}\sum _{i=1}^{n}\operatorname {E} \left\{\left(x_{i}-{\overline {x}}\right)^{2}\right\}}
= 1 n − 1 ∑ i = 1 n E ⁡ { ( ( x i − μ ) − ( x ¯ − μ ) ) 2 } { \ displaystyle = { \ frac { 1 } { n-1 } } \ sum _ { i = 1 } ^ { n } \ operatorname { E } \ left \ { \ left ( ( x_ { i } – \ mu ) – ( { \ overline { x } } – \ mu ) \ right ) ^ { 2 } \ right \ } }{\displaystyle ={\frac {1}{n-1}}\sum _{i=1}^{n}\operatorname {E} \left\{\left((x_{i}-\mu )-({\overline {x}}-\mu )\right)^{2}\right\}}
= 1 n − 1 ∑ i = 1 n { E ⁡ { ( x i − μ ) 2 } − 2 E ⁡ { ( x i − μ ) ( x ¯ − μ ) } + E ⁡ { ( x ¯ − μ ) 2 } } { \ displaystyle = { \ frac { 1 } { n-1 } } \ sum _ { i = 1 } ^ { n } \ left \ { \ operatorname { E } \ left \ { ( x_ { i } – \ mu ) ^ { 2 } \ right \ } – 2 \ operatorname { E } \ left \ { ( x_ { i } – \ mu ) ( { \ overline { x } } – \ mu ) \ right \ } + \ operatorname { E } \ left \ { ( { \ overline { x } } – \ mu ) ^ { 2 } \ right \ } \ right \ } }{\displaystyle ={\frac {1}{n-1}}\sum _{i=1}^{n}\left\{\operatorname {E} \left\{(x_{i}-\mu )^{2}\right\}-2\operatorname {E} \left\{(x_{i}-\mu )({\overline {x}}-\mu )\right\}+\operatorname {E} \left\{({\overline {x}}-\mu )^{2}\right\}\right\}}
= 1 n − 1 ∑ i = 1 n { σ 2 − 2 ( 1 n ∑ j = 1 n E ⁡ { ( x i − μ ) ( x j − μ ) } ) + 1 n 2 ∑ j = 1 n ∑ k = 1 n E ⁡ { ( x j − μ ) ( x k − μ ) } } { \ displaystyle = { \ frac { 1 } { n-1 } } \ sum _ { i = 1 } ^ { n } \ left \ { \ sigma ^ { 2 } – 2 \ left ( { \ frac { 1 } { n } } \ sum _ { j = 1 } ^ { n } \ operatorname { E } \ left \ { ( x_ { i } – \ mu ) ( x_ { j } – \ mu ) \ right \ } \ right ) + { \ frac { 1 } { n ^ { 2 } } } \ sum _ { j = 1 } ^ { n } \ sum _ { k = 1 } ^ { n } \ operatorname { E } \ left \ { ( x_ { j } – \ mu ) ( x_ { k } – \ mu ) \ right \ } \ right \ } }{\displaystyle ={\frac {1}{n-1}}\sum _{i=1}^{n}\left\{\sigma ^{2}-2\left({\frac {1}{n}}\sum _{j=1}^{n}\operatorname {E} \left\{(x_{i}-\mu )(x_{j}-\mu )\right\}\right)+{\frac {1}{n^{2}}}\sum _{j=1}^{n}\sum _{k=1}^{n}\operatorname {E} \left\{(x_{j}-\mu )(x_{k}-\mu )\right\}\right\}}
= 1 n − 1 ∑ i = 1 n { σ 2 − 2 σ 2 n + σ 2 n } { \ displaystyle = { \ frac { 1 } { n-1 } } \ sum _ { i = 1 } ^ { n } \ left \ { \ sigma ^ { 2 } – { \ frac { 2 \ sigma ^ { 2 } } { n } } + { \ frac { \ sigma ^ { 2 } } { n } } \ right \ } }{\displaystyle ={\frac {1}{n-1}}\sum _{i=1}^{n}\left\{\sigma ^{2}-{\frac {2\sigma ^{2}}{n}}+{\frac {\sigma ^{2}}{n}}\right\}}
= 1 n − 1 ∑ i = 1 n ( n − 1 ) σ 2 n { \ displaystyle = { \ frac { 1 } { n-1 } } \ sum _ { i = 1 } ^ { n } { \ frac { ( n-1 ) \ sigma ^ { 2 } } { n } } }{\displaystyle ={\frac {1}{n-1}}\sum _{i=1}^{n}{\frac {(n-1)\sigma ^{2}}{n}}}
= ( n − 1 ) σ 2 n − 1 = σ 2 { \ displaystyle = { \ frac { ( n-1 ) \ sigma ^ { 2 } } { n-1 } } = \ sigma ^ { 2 } }{\displaystyle ={\frac {(n-1)\sigma ^{2}}{n-1}}=\sigma ^{2}}

Chứng minh 2.

Ta cũng hoàn toàn có thể chứng tỏ bằng cách sau :

E [ ∑ i = 1 n ( x i − x ¯ ) 2 ] = E [ ∑ i = 1 n x i 2 ] − n E [ x ¯ 2 ] { \ displaystyle E \ left [ \ sum _ { i = 1 } ^ { n } { ( x_ { i } – { \ overline { x } } ) ^ { 2 } } \ right ] = E \ left [ \ sum _ { i = 1 } ^ { n } { x_ { i } ^ { 2 } } \ right ] – nE [ { \ overline { x } } ^ { 2 } ] }{\displaystyle E\left[\sum _{i=1}^{n}{(x_{i}-{\overline {x}})^{2}}\right]=E\left[\sum _{i=1}^{n}{x_{i}^{2}}\right]-nE[{\overline {x}}^{2}]}
= n E [ x i 2 ] − 1 n E [ ( ∑ i = 1 n x i ) 2 ] { \ displaystyle = nE [ x_ { i } ^ { 2 } ] – { \ frac { 1 } { n } } E \ left [ \ left ( \ sum _ { i = 1 } ^ { n } x_ { i } \ right ) ^ { 2 } \ right ] }{\displaystyle =nE[x_{i}^{2}]-{\frac {1}{n}}E\left[\left(\sum _{i=1}^{n}x_{i}\right)^{2}\right]}
= n ( var ⁡ [ x i ] + ( E [ x i ] ) 2 ) − 1 n E [ ( ∑ i = 1 n x i ) 2 ] { \ displaystyle = n ( \ operatorname { var } [ x_ { i } ] + ( E [ x_ { i } ] ) ^ { 2 } ) – { \ frac { 1 } { n } } E \ left [ \ left ( \ sum _ { i = 1 } ^ { n } x_ { i } \ right ) ^ { 2 } \ right ] }{\displaystyle =n(\operatorname {var} [x_{i}]+(E[x_{i}])^{2})-{\frac {1}{n}}E\left[\left(\sum _{i=1}^{n}x_{i}\right)^{2}\right]}
= n σ 2 + 1 n ( n E [ x i ] ) 2 − 1 n E [ ( ∑ i = 1 n x i ) 2 ] { \ displaystyle = n \ sigma ^ { 2 } + { \ frac { 1 } { n } } ( nE [ x_ { i } ] ) ^ { 2 } – { \ frac { 1 } { n } } E \ left [ \ left ( \ sum _ { i = 1 } ^ { n } x_ { i } \ right ) ^ { 2 } \ right ] }{\displaystyle =n\sigma ^{2}+{\frac {1}{n}}(nE[x_{i}])^{2}-{\frac {1}{n}}E\left[\left(\sum _{i=1}^{n}x_{i}\right)^{2}\right]}
= n σ 2 − 1 n ( E [ ( ∑ i = 1 n x i ) 2 ] − ( E [ ∑ i = 1 n x i ] ) 2 ) { \ displaystyle = n \ sigma ^ { 2 } – { \ frac { 1 } { n } } \ left ( E \ left [ \ left ( \ sum _ { i = 1 } ^ { n } x_ { i } \ right ) ^ { 2 } \ right ] – \ left ( E \ left [ \ sum _ { i = 1 } ^ { n } x_ { i } \ right ] \ right ) ^ { 2 } \ right ) }{\displaystyle =n\sigma ^{2}-{\frac {1}{n}}\left(E\left[\left(\sum _{i=1}^{n}x_{i}\right)^{2}\right]-\left(E\left[\sum _{i=1}^{n}x_{i}\right]\right)^{2}\right)}
= n σ 2 − 1 n ( var ⁡ [ ∑ i = 1 n x i ] ) = n σ 2 − 1 n ( n σ 2 ) = ( n − 1 ) σ 2. { \ displaystyle = n \ sigma ^ { 2 } – { \ frac { 1 } { n } } \ left ( \ operatorname { var } \ left [ \ sum _ { i = 1 } ^ { n } x_ { i } \ right ] \ right ) = n \ sigma ^ { 2 } – { \ frac { 1 } { n } } ( n \ sigma ^ { 2 } ) = ( n-1 ) \ sigma ^ { 2 }. }{\displaystyle =n\sigma ^{2}-{\frac {1}{n}}\left(\operatorname {var} \left[\sum _{i=1}^{n}x_{i}\right]\right)=n\sigma ^{2}-{\frac {1}{n}}(n\sigma ^{2})=(n-1)\sigma ^{2}.}

Nếu X là một véc tơ ngẫu nhiên, xác định trên Rn, thì phương sai của X được xác định bởi:

E[(X − μ)(X − μ)T]

với μ = E(X) và XT là ma trận chuyển vị của X. Phương sai này là một ma trận vuông xác định dương. Nó thường được gọi là ma trận hiệp phương sai.

Thuật ngữ phương sai được sử dụng lần đầu tiên bởi Ronald Fisher trong một bài báo của ông vào năm 1918 với tựa đề The Correlation Between Relatives on the Supposition of Mendelian Inheritance.

Liên kết ngoài.

Source: http://139.180.218.5
Category: tản mạn

Để lại một bình luận

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *