Trong lý thuyết xác suất và thống kê, số trung vị (tiếng Anh: median) là một số tách giữa nửa lớn hơn và nửa bé hơn của một mẫu, một quần thể, hay một phân bố xác suất. Nó là giá trị giữa trong một phân bố, mà số các số nằm trên hay dưới con số đó là bằng nhau. Điều đó có nghĩa rằng 1/2 quần thể sẽ có các giá trị nhỏ hơn hay bằng số trung vị, và một nửa quần thể sẽ có giá trị bằng hoặc lớn hơn số trung vị.

Nội dung chính

  • Mục lục
  • Cách giải thích dễ hiểuSửa đổi
  • Không duy nhất: có thể có nhiều hơn một số trung vịSửa đổi
  • Đo đạc sự phân tán thống kêSửa đổi
  • Trung vị của các phân bố xác suấtSửa đổi
  • Số trung vị của các phân bố cụ thểSửa đổi
  • Số trung vị trong thống kê mô tảSửa đổi
  • Các tính chất lý thuyếtSửa đổi
  • Tính chất tối ưu hóaSửa đổi
  • Bất đẳng thức liên quan tới giá trị trung bình và số trung vịSửa đổi
  • Tính toán hiệu quảSửa đổi
  • Xem thêmSửa đổi
  • Tham khảoSửa đổi
  • Liên kết ngoàiSửa đổi

Để tìm số trung vị của một list hữu hạn các số, ta xếp tăng dần tổng thể các quan sát, rồi lấy giá trị nằm giữa list. Nếu số quan sát là số chẵn, người ta thường lấy trung bình của hai giá trị nằm giữa .

Mục lục

  • 1 Cách giải thích dễ hiểu
  • 2 Không duy nhất: có thể có nhiều hơn một số trung vị
  • 3 Đo đạc sự phân tán thống kê
  • 4 Trung vị của các phân bố xác suất
  • 4.1 Số trung vị của các phân bố cụ thể
  • 5 Số trung vị trong thống kê mô tả
  • 6 Các tính chất lý thuyết
  • 6.1 Tính chất tối ưu hóa
  • 6.2 Bất đẳng thức liên quan tới giá trị trung bình và số trung vị
  • 7 Tính toán hiệu quả
  • 8 Xem thêm
  • 9 Tham khảo
  • 10 Liên kết ngoài

Cách giải thích dễ hiểuSửa đổi

Giả sử có 19 người nghèo và 1 tỉ phú trong một căn phòng. Mọi người đều bỏ tất cả tiền trong túi mình ra và đặt lên một cái bàn. Mỗi người nghèo đặt 5 đồng lên bàn; người tỉ phú đặt 1 tỷ đồng (109 đồng) lên đó. Khi đó, tổng số là 1.000.000.095 đồng. Nếu đem chia đều số tiền đó cho 20 người, mỗi người được 50.000.004 đồng và 75 xu. Số tiền đó là trung bình của số tiền mà mỗi người đã đem vào phòng. Nhưng số trung vị lại là 5 đồng, vì ta có thể chia thành 2 nhóm mỗi nhóm 10 người, và nói rằng mọi người trong nhóm thứ nhất mang không nhiều hơn 5 đồng và mọi người trong nhóm thứ hai mang không dưới 5 đồng. Theo nghĩa đó, số trung vị là số tiền mà một người điển hình mang tới. Ngược lại, giá trị trung bình không điển hình chút nào, do không có ai – người nghèo hoặc tỉ phú – mang đến một số tiền xấp xỉ 50.000.004,75 đồng.

Không duy nhất: có thể có nhiều hơn một số trung vịSửa đổi

Có thể có nhiều hơn một số ít trung vị : ví dụ nếu số các trường hợp là một số chẵn thì không có 1 số ít trung vị duy nhất. Lưu ý rằng 50% số các số trong list có giá trị nhỏ hơn hoặc bằng một trong hai giá trị giữa, và 50% lớn hơn hay bằng một trong hai giá trị đó, so với bất kể số nào nằm nữa hai giá trị đó cũng vậy. Do vậy, trong trường hợp đó, cả hai số nằm giữa và mọi giá trị nằm giữa chúng đều là số trung vị .

Đo đạc sự phân tán thống kêSửa đổi

Khi trung vị được dùng với vai trò tham số vị trí trong thống kê miêu tả, có một vài lựa chọn một độ đo độ biến hóa : khoảng chừng biến thiên giao độ ( range ), khoảng chừng tứ phân vị ( interquartile range ), và độ lệch tuyệt đối ( absolute deviation ). Do trung vị chính là tứ phân vị thứ hai, việc thống kê giám sát nó được minh họa trong bài về các tứ phân vị .

Trung vị của các phân bố xác suấtSửa đổi

Phân biệt các giá trị yếu vị, trung vị, và trung bình trong một phân bổ Xác Suất .Cho một phân bổ Tỷ Lệ bất kể trên tập số thực với hàm phân bổ tích góp F, bất kể nó thuộc loại phân bổ Xác Suất liên tục nào, một phân bổ liên tục tuyệt đối ( và do đó có một hàm tỷ lệ Xác Suất ) hay một phân bổ Xác Suất rời rạc. Giá trị trung vị m của nó thỏa mãn nhu cầu đẳng thức P. ( X m ) = P ( X m ) = m d F ( x ) { \ displaystyle P. ( X \ leq m ) = P ( X \ geq m ) = \ int _ { – \ infty } ^ { m } dF ( x ) }{\displaystyle P(X\leq m)=P(X\geq m)=\int _{-\infty }^{m}dF(x)}

trong đó sử dụng tích phân Riemann-Stieltjes. Với một phân bố liên tục tuyệt đối với hàm mật độ xác suất f, ta có  P ( X m ) = P ( X m ) = m f ( x ) d x = 0.5. {\displaystyle P(X\leq m)=P(X\geq m)=\int _{-\infty }^{m}f(x)\,dx=0.5.}

{\displaystyle P(X\leq m)=P(X\geq m)=\int _{-\infty }^{m}f(x)\,dx=0.5.}

Số trung vị của các phân bố cụ thểSửa đổi

  • Số trung vị của một phân bố chuẩn với giá trị trung bình μ và độ biến thiên σ2 là μ. Thực ra, với phân bố chuẩn, giá trị trung bình = median = mode.
  • Số trung vị của một phân bố đều trong khoảng [a, b] là (a + b) / 2, đó cũng là giá trị trung bình.
  • Số trung vị của một phân bố Cauchy với tham số vị trí x0 và tham số tỉ lệ (scale parameter) y là x0, tham số vị trí.
  • Số trung vị của một phân phối mũ với tham số λ là tham số tỉ lệ (scale parameter) nhân với lôga tự nhiên của 2, λln 2.
  • Số trung vị của một phân bố Weibull với tham số hình dạng (shape parameter) k và tham số tỉ lệ λ là λ(log 2)1/k.

Số trung vị trong thống kê mô tảSửa đổi

Số trung vị thường dùng đa phần cho các phân bổ lệch, do nó biểu lộ đúng chuẩn hơn trung bình cộng. Xét tập { 1, 2, 2, 2, 3, 9 }. Trong trường hợp đó, số trung vị bằng 2 và bằng mode, và nó hoàn toàn có thể được coi là chỉ định tốt hơn về xu thế TT ( central tendency ) hơn là trung bình số học có giá trị 3,166 .Tính toán số trung vị là một kỹ thuật thông dụng trong thống kê tổng kết ( summary statistics ) và tài liệu thống kê tổng kết ( summarizing statistical data ), do nó dễ hiểu và dễ tính, trong khi vẫn cho ra một độ đo tốt hơn giá trị kỳ vọng trong trường hợp xuất hiện các giá trị ngoại lệ ( outlier ) .

Các tính chất lý thuyếtSửa đổi

Tính chất tối ưu hóaSửa đổi

Số trung vị còn là điểm TT, nơi cực tiểu hóa trung bình của các độ lệch tuyệt đối ; trong ví dụ trên, nó sẽ là ( 1 + 0 + 0 + 0 + 1 + 7 ) / 6 = 0.5 bằng cách sử dụng trung vị, trong khi nếu sử dụng giá trị trung binh, tác dụng sẽ là 1.5. Trong ngôn từ của kim chỉ nan Tỷ Lệ, giá trị của c mà làm cực tiểu E ( | X c | ) { \ displaystyle E ( \ left | X-c \ right | ) \, }{\displaystyle E(\left|X-c\right|)\,}là số trung vị của phân bổ Phần Trăm của biến ngẫu nhiên X .

Bất đẳng thức liên quan tới giá trị trung bình và số trung vịSửa đổi

Đối với các phân bổ Xác Suất liên tục, hiệu giữa số trung vị và giá trị trung bình nhỏ hơn hay bằng độ lệnh chuẩn. Xem bất đẳng thức giữa các tham số vị trí và tỉ lệ ( an inequality on location and scale parameters ) .

Tính toán hiệu quảSửa đổi

Tuy việc sắp xếp n thành phần thường cần O ( n log n ) thao tác, bằng cách sử dụng một thuật toán ” chia để trị “, số trung vị của n thành phần hoàn toàn có thể được tính với chỉ O ( n ) thao tác ( thực ra, ta luôn hoàn toàn có thể tìm thấy thành phần thứ k của một list các giá trị với giải pháp này ; nó có tên thuật toán lựa chọn ( selection algorithm ) ) .

Xem thêmSửa đổi

  • Số trung vị đa chiều (Multidimensional median)
  • Order statistic
  • bất đẳng thức giữa các tham số vị trí và tỉ lệ (an inequality on location and scale parameters)

Tham khảoSửa đổi

Liên kết ngoàiSửa đổi

  • Tính trung vị
  • Một bài toán về giá trị trung bình, trung vị, và mode.
  • mathworld: trung vị thống kê

trung vị của một phân bổ tại trang PlanetMath. org .

Source: http://139.180.218.5
Category: tản mạn

Để lại một bình luận

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *