Thống kê là nghiên cứu của tập hợp nhiều lĩnh vực khác nhau, bao gồm phân tích, giải thích, trình bày và tổ chức dữ liệu[1]. Khi áp dụng thống kê trong khoa học, công nghiệp hoặc các vấn đề xã hội, thông lệ là bắt đầu với tổng thể thống kê hoặc một quá trình mô hình thống kê sẽ được nghiên cứu. Tổng thế có thể gồm nhiều loại khác nhau như “tất cả mọi người đang sống trong một đất nước” hay “tập hợp các phân tử của tinh thể”. Nó đề cập tới tất cả các khía cạnh của dữ liệu bao gồm việc lập kế hoạch, thu thập dữ liệu mẫu cho các cuộc khảo sát và thí nghiệm.[1]
Bạn đang đọc: Thống kê – Wikipedia tiếng Việt
Khi không hề tích lũy được tài liệu tìm hiểu dân số, những nhà thống kê thu thập dữ liệu bằng cách tăng trưởng những mẫu thí nghiệm và mẫu khảo sát đơn cử. Quá trình lấy mẫu đại diện thay mặt bảo vệ rằng những suy luận và Tóm lại hoàn toàn có thể được vận dụng từ mẫu cho đến toàn diện và tổng thể. Một điều tra và nghiên cứu thực nghiệm gồm có việc đo lường và thống kê mạng lưới hệ thống được nghiên cứu và điều tra, thao tác trên mạng lưới hệ thống và sau đó đo lường và thống kê thêm, sử dụng cùng thủ tục mẫu để xác lập xem những thao tác có đổi khác giá trị thống kê giám sát hay không trái lại, một quan sát nghiên cứu và điều tra không tương quan đến thao tác thực nghiệm .Hai chiêu thức thống kê chính được sử dụng trong nghiên cứu và phân tích tài liệu : thống kê miêu tả, đây là chiêu thức tóm tắt tài liệu từ một mẫu sử dụng những chỉ số như thể giá trị trung bình hoặc độ lệch chuẩn, và thống kê suy luận, rút ra Kết luận từ tài liệu biến thiên ngẫu nhiên ( ví dụ : những sai số quan sát, mẫu của toàn diện và tổng thể ) [ 2 ]. Thống kê diễn đạt được sử dụng liên tục nhất với hai thuộc tính phân phối ( mẫu hoặc toàn diện và tổng thể ) : khunh hướng TT ( hoặc vị trí ) tìm cách để diễn đạt giá trị trung bình hoặc giá trị đặc trưng của phân phối, trong khi phân tán ( hoặc đổi khác ) mức độ đặc trưng mà những thuộc tính của phân phối đi trệch so với điều tra và nghiên cứu. Suy luận về thống kê toán học được triển khai trong khuôn khổ của triết lý Xác Suất, trong đó đề cập tới việc nghiên cứu và phân tích những hiện tượng kỳ lạ ngẫu nhiên. Để thực thi một suy luận khi chưa biết số lượng, hoặc nhiều ước đạt được nhìn nhận bằng cách sử dụng mẫu .Thủ tục thống kê tiêu chuẩn tương quan đến sự tăng trưởng của một giả thuyết không có ý nghĩa khởi đầu là không có mối quan hệ nào giữa hai đại lượng. Loại bỏ hoặc bác bỏ giả thuyết này là một trách nhiệm quan trọng trong việc lý giải những quan điểm mới của khoa học thống kê, đưa ra một ý nghĩa đúng mực trong đó một giả thuyết được chứng tỏ là sai. Những gì thống kê gọi là một giả thuyết khác chỉ đơn thuần là một giả thuyết trái với giả thuyết không có ý nghĩa. Phân tích từ một giả thuyết hai hình thức cơ bản của lỗi này được ghi nhận : sai số loại I ( giả thuyết không có ý nghĩa sai bị bác bỏ cho một đặc thù xác nhận không đúng ) và sai số loại II ( giả thuyết không được bác bỏ và sự độc lạ thật sự giữa những tổng thể và toàn diện được bỏ lỡ cho một phủ định sai ). Một việc quan trọng là tập hợp những giá trị của những ước đạt dẫn đến bác bỏ giả thuyết không có ý nghĩa. Do đó sai số của Xác Suất loại I là Tỷ Lệ những ước đạt thuộc những miền quan trọng cho rằng giả thuyết đúng ( có ý nghĩa thống kê ) và sai số của Xác Suất loại II là Tỷ Lệ mà những ước đạt không phụ thuộc vào những lớp quan trọng được đưa ra rằng giả thuyết sửa chữa thay thế là đúng. Các chủ trương thống kê của một bài nhìn nhận Phần Trăm đúng khi bác bỏ giả thuyết không có ý nghĩa khi giả thuyết là sai. Nhiều yếu tố đã được link với khôn khổ : từ việc có được một cỡ mẫu đủ để xác lập một giả thuyết không có ý nghĩa thích hợp .Quy trình giám sát để tạo ra những tài liệu thống kê cũng hoàn toàn có thể bị lỗi. Phần nhiều trong số những lỗi này được chia làm hai loại : ngẫu nhiên ( noise – tài liệu không có ý nghĩa ) hoặc có mạng lưới hệ thống ( bias – độ chệch ), nhưng những loại rơi lệch khác ( ví dụ, xô lệch khi người nghiên cứu và phân tích báo cáo giải trình sai những đơn vị chức năng giám sát ) cũng rất quan trọng. Sự Open của tài liệu bị thiếu hoặc sự kiểm duyệt hoàn toàn có thể dẫn đến những ước tính bị chệch và những kỹ thuật đơn cử đã được tăng trưởng để xử lý những yếu tố này .Thống kê hoàn toàn có thể được cho là đã khởi đầu trong nền văn minh cổ xưa, tối thiểu là từ cuối thế kỷ thứ 5 TCN, nhưng cho đến thế kỷ 18 thì nó mới chịu tác động ảnh hưởng nhiều hơn từ số học và triết lý thống kê. Thủ tướng Anh là Benjamin Disraeli nhận xét : có ba loại nói dối gồm nói dối, nói dối thậm tệ và thống kê [ 3 ]
Thống kê là một phần toán học của khoa học gắn liền với tập hợp tài liệu, nghiên cứu và phân tích, lý giải hoặc đàm đạo về một yếu tố nào đó, và trình diễn tài liệu [ 4 ], hay là một nhánh của toán học. [ 5 ] Có thể xem thống kê là một môn khoa học riêng không liên quan gì đến nhau chứ không phải là một nhánh của toán học. [ 6 ] [ 7 ]
Nội dung chính
Toán thống kê.
Toán thống kê là ứng dụng của toán học để thống kê, khởi đầu được hình thành như thể khoa học của nhà nước – tập hợp tài liệu và nghiên cứu và phân tích những tài liệu về một quốc gia : kinh tế tài chính, đất đai, quân sự chiến lược, dân số … Kỹ thuật toán học được sử dụng gồm có những nghiên cứu và phân tích toán học, đại số tuyến tính, nghiên cứu và phân tích ngẫu nhiên, phương trình vi phân, triết lý Xác Suất và thống kê toán. [ 8 ] [ 9 ]
Khi ứng dụng thống kê cho một yếu tố khoa học, ngành công nghiệp, hoặc một yếu tố xã hội … rất thiết yếu để mở màn với việc thống kê toàn diện và tổng thể hoặc tiến trình điều tra và nghiên cứu. Nghiên cứu về tổng thể và toàn diện hoàn toàn có thể có nhiều chủ đề như “ toàn bộ những người đang sống trong một nước ” hay “ mỗi nguyên tử tạo nên tinh thể ” .Các nhà thống kê tổng hợp tài liệu về hàng loạt toàn diện và tổng thể ( hoạt động giải trí tìm hiểu mẫu toàn diện và tổng thể ). Điều này hoàn toàn có thể được thống kê bởi Viện thống kê chính phủ nước nhà. Thống kê diễn đạt hoàn toàn có thể được sử dụng để tổng hợp những số liệu toàn diện và tổng thể. Mô tả bằng những số lượng gồm có để lệch trung bình và độ lệch chuẩn cho những tài liệu liên tục ( như thu nhập ), trong khi tần số và tỷ suất Xác Suất hiệu suất cao hơn khi miêu tả những loại tài liệu .Khi một cuộc tìm hiểu mẫu toàn diện và tổng thể không hề triển khai được, ta lựa chọn một tập hợp con của dân số, đó được gọi là một mẫu điều tra và nghiên cứu. Khi mẫu đó là đại diện thay mặt của mẫu tổng thể và toàn diện được xác lập, tài liệu được tập hợp cho những biến trong mẫu quan sát hoặc mẫu thực tiễn. Một lần nữa thống kê diễn đạt hoàn toàn có thể được sử dụng để tổng hợp những tài liệu mẫu. Tuy nhiên, những bản thiết kế mẫu đã bị tác động ảnh hưởng bởi một yếu tố ngẫu nhiên, do đó việc xây dựng số mẫu miêu tả cũng không được chắc như đinh. Để rút ra Kết luận có ý nghĩa về hàng loạt tổng thể và toàn diện, thống kê suy luận là rất thiết yếu. Nó sử dụng mẫu trong tài liệu mẫu để suy luận về tổng thể và toàn diện, diễn đạt ngẫu nhiên. Những suy luận hoàn toàn có thể mang hình thức vấn đáp có hoặc không những câu hỏi về tài liệu ( kiểm định giả thuyết ), ước tính số lượng tài liệu ( ước tính ), miêu tả những link của tài liệu ( đối sánh tương quan ) và những mối quan hệ của những mẫu trong tài liệu ( ví dụ sử dụng nghiên cứu và phân tích hồi quy ). Suy luận hoàn toàn có thể lan rộng ra để dự báo, tiên đoán và ước tính giá trị không được quan tâm đến hoặc sự link với toàn diện và tổng thể được điều tra và nghiên cứu. Nó hoàn toàn có thể gồm có những biến ngoại suy hoặc biến nội suy của chuỗi thời hạn hoặc tài liệu khoảng trống, và khai thác tài liệu .
Thu thập dữ liệu.
Phương pháp chọn mẫu.
Trong bộ tài liệu tìm hiểu tổng thể và toàn diện, trường hợp không hề tích lũy số liệu, tài liệu thống kê nghiên cứu và phân tích được tăng trưởng bằng những phong cách thiết kế thử nghiệm đơn cử và những mẫu khảo sát. Thống kê chính là việc cung ứng công cụ để nói trước và dự báo việc sử dụng những tài liệu trải qua những quy mô thống kê. Để sử dụng một mẫu như một thông tin hướng dẫn cho hàng loạt toàn diện và tổng thể, điều quan trọng là nó thực sự đại diện thay mặt cho mẫu toàn diện và tổng thể. Lấy mẫu đại diện thay mặt phải bảo vệ rằng nó được suy luận và Kết luận một cách đúng mực từ việc chọn mẫu cho hàng loạt toàn diện và tổng thể. Một yếu tố lớn nhằm mục đích làm tăng kích cỡ mẫu được lựa chọn là mẫu đại diện thay mặt. Thống kê phân phối những giải pháp phong cách thiết kế thử nghiệm mẫu, những thử nghiệm này hoàn toàn có thể làm giảm bớt những yếu tố ở việc mở màn nghiên cứu và điều tra, tăng năng lực phân biệt những mẫu tin cậy về mẫu thống kê .Lý thuyết chọn mẫu là một phần của triết lý Xác Suất thống kê toán. Xác suất được sử dụng trong “ toán học thống kê ” ( cách khác “ triết lý thống kê ” ) để nghiên cứu và điều tra sự phân bổ lấy mẫu thống kê mẫu và những đặc thù của thủ tục thống kê. Việc sử dụng những giải pháp thống kê là được gật đầu khi những giải pháp hoặc thống kê mẫu toàn diện và tổng thể đủ thông tin để gật đầu giả thuyết .Sự độc lạ trong quan điểm giữa kim chỉ nan Tỷ Lệ cổ xưa và triết lý Xác Suất lấy mẫu là xê dịch, triết lý Phần Trăm mở màn từ những tham số cho tổng quy mô mẫu để suy ra Phần Trăm mẫu. Tuy nhiên giải pháp thống kê tăng trưởng theo hướng trái chiều – quy nạp từ những mẫu để những thông số kỹ thuật lớn hơn hoặc tổng quy mô mẫu .
Các nghiên cứu và điều tra thực nghiệm và quan sát.
Mục đích cho một dự án Bất Động Sản nghiên cứu và điều tra thống kê là tìm hiểu nguyên do, và từ đó rút ra Tóm lại của những đổi khác ảnh hưởng tác động đến giá trị những tác nhân ảnh hưởng tác động hoặc những biến độc lập dựa trên những biến phụ thuộc vào hoặc vấn đáp cho điều tra và nghiên cứu. Có hai loại chính của điều tra và nghiên cứu thống kê những biến nguyên do : nghiên cứu và điều tra thực nghiệm và điều tra và nghiên cứu quan sát. Cả hai loại điều tra và nghiên cứu này đều có sự ảnh hưởng tác động của biến độc lập ( hoặc những biến ) về hành vi của những biến nhờ vào được quan sát. Sự độc lạ giữa hai biến này nằm ở cách điều tra và nghiên cứu dựa trên trong thực tiễn. Mỗi biến hoàn toàn có thể có ý nghĩa. Nghiên cứu thực nghiệm tương quan đến việc lấy kích cỡ mẫu điều tra và nghiên cứu, thao tác mạng lưới hệ thống và thêm vào size mẫu sử dụng cho quy trình lấy mẫu, sau đó lấy mẫu bổ trợ để xác lập những thao tác sửa đổi giá trị của những phép đo. Ngược lại, một nghiên cứu và điều tra quan sát không tương quan đến thao tác thực nghiệm. Thay vào đó, tài liệu được tích lũy và mối đối sánh tương quan giữa những yếu tố dự báo và vấn đáp cho những tò mò và kiểm tra. Trong khi những công cụ của việc nghiên cứu và phân tích tài liệu có hiệu quả tốt từ việc nghiên cứu và phân tích ngẫu nhiên, cũng hoàn toàn có thể vận dụng cho những loại tài liệu khác – như điều tra và nghiên cứu tự nhiên và điều tra và nghiên cứu quan sát – mà một nhà thống kê sẽ sử dụng như biến thay thế sửa chữa, nhiều kim chỉ nan nhìn nhận có cấu trúc ( ví dụ : sự độc lạ trong những nhìn nhận khác nhau và biến thống kê giám sát thông tin, trong rất nhiều biến khác ) phân phối tác dụng tương thích cho những nhà nghiên cứu .
Các thực nghiệm.
Các bước cơ bản của một nghiên cứu và điều tra thống kê là :
- Lập kế hoạch nghiên cứu, bao gồm việc tìm kiếm số liệu để trả lời cho các nghiên cứu. Sử dụng các thông tin sau: ước tính sơ lược về kích thước của hiệu quả điều tra, các giả thuyết, các biến khảo sát dự định. Xem xét việc lựa chọn đối tượng khảo sát và đúng quy trình nghiên cứu. Các nhà thống kê cho rằng nên so sánh thử nghiệm một cách đáng tin cậy với tiêu chuẩn mẫu hoặc tiêu chuẩn so sánh một kết quả nghiên cứu. Chấp nhận ước lượng không chệch của mức ý nghĩa đáng tin cậy.
- Thiết kế nghiên cứu nhằm ngăn sự ảnh hưởng của các biến gây nhiễu và phân bố mẫu ngẫu nhiên của hệ số tin cậy cho các đối tượng để ước lượng không chệch của mức ý nghĩa đáng tin cậy và sai sót trong nghiên cứu. Ở giai đoạn này, các thí nghiệm và các thống kê viết giao thức nghiên cứu mà chính việc hướng dẫn thực hiện các thí nghiệm và chỉ ra những phân tích ban đầu của các dữ liệu nghiên cứu.
- Kiểm tra các nghiên cứu sau các giao thức thử nghiệm và phân tích dữ liệu và phân tích
- Kiểm tra thêm các dữ liệu thiết lập trong phân tích thứ cấp, đề xuất giả thuyết mới cho các nghiên cứu sau này.
- Tìm kiếm tài liệu và trình bày kết quả nghiên cứu.
Các thí nghiệm về nghiên cứu và điều tra hành vi con người có mối tương quan đặc biệt quan trọng. Các điều tra và nghiên cứu nổi tiếng của Hawthorne, nghiên cứu và điều tra về những đổi khác trong môi trường tự nhiên thao tác tại nhà máy sản xuất Hawthorne của Công ty Western Electric. Các nhà nghiên cứu đã chăm sóc đến việc xác định liệu tăng việc chiếu sáng có tăng hiệu suất thao tác của công nhân lắp ráp. Đầu tiên, những nhà nghiên cứu đã đo hiệu suất trong nhà máy sản xuất, sau đó biến hóa sự chiếu sáng trong một khu vực của nhà máy sản xuất và kiểm tra xem có tác động ảnh hưởng của biến hóa ánh sáng đến hiệu suất hay không. Nghiên cứu cho thấy hiệu suất thực sự được cải tổ ( dựa theo những điều kiện kèm theo thử nghiệm ). Tuy nhiên, điều tra và nghiên cứu này chỉ ra những sai sót trong quy trình thí nghiệm, đặc biệt quan trọng là thiếu những nhóm trấn áp và thông tin mờ nhạt. Các hiệu ứng Hawthorne đề cập đến việc tìm kiếm một tác dụng ( trong trường hợp này là hiệu suất lao động ) biến hóa do sự quan sát. Những người trong những điều tra và nghiên cứu Hawthorne thao tác có hiệu suất cao không phải vì biến hóa ánh sáng, mà vì họ đang được quan sát. [ 10 ]
Nghiên cứu quan sát.
Một ví dụ của nghiên cứu và điều tra quan sát là một trong những mày mò sự đối sánh tương quan giữa giữa việc hút thuốc lá và ung thư phổi. Nghiên cứu này thường sử dụng việc tìm hiểu để tích lũy những quan sát về những khu vực tham gia nghiên cứu và điều tra và sau đó thực thi những nghiên cứu và phân tích thống kê. Trong trường hợp này, những nhà nghiên cứu tích lũy những quan sát của những người hút thuốc và không hút thuốc, hoàn toàn có thể trải qua một điều tra và nghiên cứu về bệnh chứng, và sau đó tìm số liệu những trường hợp ung thư phổi trong mỗi nhóm tìm hiểu .
Các kiểu tài liệu.
Các biến thử khác nhau đã được tạo ra để phân loại mức độ thống kê giám sát. Các nhà tâm ý Stanley Smith Stevens đã xác lập thang đo danh nghĩa, thứ tự, khoảng chừng thời hạn và tỷ suất đo. Thang đo danh nghĩa không có thứ tự xếp hạng có ý nghĩa trong những giá trị, và được cho phép quy đổi một-một. Thang đo thứ tự có sự độc lạ đúng mực giữa những giá trị liên tục, nhưng có một thứ tự có ý nghĩa giá trị và được cho phép bất kể quy đổi nào để quy đổi. Đo khoảng chừng thời hạn có ý nghĩa và khoảng cách giữa những phép đo được xác lập, nhưng giá trị bằng không là tùy ý ( như trong trường hợp số dôi kinh độ và độ C hoặc độ F ), và được cho phép bất kể quy đổi tuyến tính. Đo tỷ suất có cả một giá trị số không có ý nghĩa và khoảng cách giữa những phép đo khác nhau được xác lập, và được cho phép quy đổi sang sự biến hóa tỷ suất .Vì những biến chỉ tương thích cho thang đo danh nghĩa hoặc thang đo thứ tự, không hề giám sát một cách hài hòa và hợp lý về số lượng, đôi lúc chúng được nhóm lại với nhau như những biến phân loại, trong khi thang đo tỷ suất và thang đo thời hạn được nhóm lại với nhau như thể những biến định tính, những biến hoàn toàn có thể rời rạc hoặc liên tục do đặc thù số lượng. Chúng thường được phân biệt như vậy thường ít đối sánh tương quan với những tài liệu trong nghiên cứu và điều tra khoa học tàng trữ và nghiên cứu và phân tích thông tin được đưa vào. Trong đó những biến phân loại phân đôi hoàn toàn có thể được đại diện thay mặt với những kiểu tài liệu Boolean ( sử dụng mạng lưới hệ thống tài liệu lý luận như AND, OR, NOT để xác lập quan hệ giữa những thực thể ), biến phân loại Polytomous với số nguyên …. và những biến liên tục với những loại tài liệu điều tra và nghiên cứu khoa học tàng trữ và nghiên cứu và phân tích thông tin được đưa vào. Nhưng những map của những kiểu tài liệu khoa học tàng trữ và nghiên cứu và phân tích thông tin đưa vào với những loại tài liệu thống kê nhờ vào vào phân loại sau khi được triển khai .Có nhiều nghiên cứu và phân tích khác đã được đề xuất kiến nghị. Ví dụ, Mosteller và Tukey ( 1977 ) [ 11 ] phân lớp, phân bậc, tính phân số, đếm, tổng số lượng và cân đối. Nelder ( 1990 ) [ 12 ] miêu tả tính liên tục, chỉ số liên tục, tính tỷ suất và chính sách phân loại của tài liệu. Cũng như Chrisman ( 1998 ) [ 13 ] và Van Den Berg ( 1991 ) [ 14 ] .Vấn đề có thích hợp hay không để vận dụng những loại khác nhau của những giải pháp thống kê số liệu thu được từ những loại khác nhau của những giải pháp giám sát phức tạp do những yếu tố tương quan đến việc quy đổi những biến và lý giải đúng chuẩn những câu hỏi đặt ra điều tra và nghiên cứu. “ mối quan hệ giữa những tài liệu và những gì tài liệu diễn đạt đơn thuần phản ánh một thực tiễn là một số ít loại báo cáo giải trình thống kê hoàn toàn có thể có giá trị chân lý đó không phải là không bao giờ thay đổi theo một số ít biến đổi khác. Có hay không một sự quy đổi hài hòa và hợp lý để chiêm ngưỡng và thưởng thức phụ thuộc vào vào câu hỏi ai đang nỗ lực để vấn đáp ”. ( Hand, 2004, p. 82 ) [ 15 ]
Thuật ngữ và triết lý của thống kê suy luận.
Thống kê, ước tính và số lượng chính.
Hãy xem xét một mẫu những phân phối độc lập có cùng đặc thù, những biến ngẫu nhiên với một phân phối Xác Suất nhất định : suy luận thống kê và triết lý thống kê giám sát xác lập một mẫu ngẫu nhiên là véc tơ ngẫu nhiên được đưa ra bởi những véc tơ theo cột của những biến phân phối độc lập có cùng đặc thù. [ 16 ] Tổng thể được chọn làm mẫu được miêu tả bởi một phân phối Phần Trăm mà hoàn toàn có thể có tham số chưa biết .Một thống kê là một biến ngẫu nhiên, đó là một công dụng của những mẫu ngẫu nhiên, nhưng không phải là công dụng của những tham số chưa biết. Mặc dù những phân phối mẫu của Phần Trăm thống kê hoàn toàn có thể có tham số chưa biết .Xem xét công dụng của những tham số chưa biết : một ước đạt là một thống kê được sử dụng để ước đạt hàm này. Ước lượng thường được sử dụng gồm có ý nghĩa của mẫu khảo sát, không gồm mẫu phương sai và hiệp phương sai mẫu .Biến ngẫu nhiên là một hàm của mẫu ngẫu nhiên và những tham số chưa biết, nhưng có phân phối Phần Trăm không nhờ vào vào những tham số chưa biết, được gọi là một đại lượng quan trọng hay biến nhờ vào. Sử dụng biến phụ thuộc vào gồm có những chỉ số z, những số liệu thống kê chi bình phương và giá trị t-value của phân phối Student .Giữa hai ước đạt của một tham số cho trước, với ước đạt điểm trung bình bình phương được cho rằng có hiệu suất cao hơn. Hơn nữa một ước đạt được cho là giá trị tiệm cận nếu giá trị kỳ vọng của nó bằng với giá trị thực của tham số chưa biết được ước tính, và là giá trị tiệm cận nếu giá trị kỳ vọng của nó quy tụ ở số lượng giới hạn với giá trị thực của tham số như vậy. Các đặc tính thích hợp để ước đạt gồm có : ước đạt UMVUE có phương sai nhỏ nhất cho tổng thể những giá trị hoàn toàn có thể có của những tham số ước đạt ( đây thường là những đặc tính thuận tiện để xác định hiệu suất cao ) và nhìn nhận tương thích cùng quy về trong Tỷ Lệ để đúng với giá trị của tham số .Điều này vẫn còn để lại những câu hỏi làm thế nào để có ước đạt trong một trường hợp nhất định và thực thi những đo lường và thống kê, một chiêu thức đã được yêu cầu : những giải pháp trong thời gian hiện tại, những chiêu thức likelihood lớn nhất, chiêu thức bình phương nhỏ nhất và giải pháp gần nhất của ước đạt phương trình .
Giả thuyết không có ý nghĩa và những giả thuyết sửa chữa thay thế.
Giải thích thông tin thống kê hoàn toàn có thể gồm có sự tăng trưởng của một giả thuyết trong đó giả định rằng bất kỳ điều gì xảy ra được yêu cầu như thể một nguyên do không có hiệu suất cao trên những biến thống kê giám sát .Minh họa tốt nhất cho một người mới làm thống kê là gặp phải thực trạng khó khăn vất vả khi thử nghiệm với những người khảo sát. Các giả thuyết không có giá trị H0, chứng minh và khẳng định rằng bị cáo là vô tội, trong khi những giả thuyết khác H1, chứng minh và khẳng định rằng bị cáo có tội. Bản cáo trạng đưa ra những hoài nghi về việc có tội. Các giả thuyết H0 ( thực trạng ) trái chiều với giả thuyết H1 và được sống sót khi H1 được tương hỗ bằng những chứng cứ “ bác bỏ những điều vô lý ”. Tuy nhiên “ không đạt nhu yếu để bác bỏ giả thuyết H0 ” trong trường hợp không gồm có tính vô tội, nhưng chỉ đơn thuần là không đủ vật chứng để buộc tội. Vì vậy, người được khảo sát không nhất thiết phải đồng ý H0 nhưng không bác bỏ H0. Trong khi người ta không hề “ chứng tỏ ” một giả thuyết, người ta hoàn toàn có thể kiểm tra giao động để đưa ra chiêu thức thử nghiệm, chiêu thức kiểm tra những sai số loại II .Những gì những nhà thống kê gọi là một giả thuyết có một hoặc hai năng lực xảy ra chỉ đơn thuần là một giả thuyết trái ngược với giả thuyết không có ý nghĩa .
Tác động từ giả thuyết hai loại sai số cơ bản được ghi nhận :
- Sai số loại I là giả thuyết rỗng bị bác bỏ là sai khi “bác bỏ phủ định”.
- Sai số lại II là giả thuyết không rỗng được bác bỏ để loại bỏ và sự khác biệt trên thực tế giữa các quần thể được bỏ qua cho một “bác bỏ khẳng định”
Độ lệch chuẩn đề cập đến mức độ những quan sát cá thể trong mẫu khác với một giá trị TT, ví dụ điển hình như những mẫu hoặc ý nghĩa tổng thể và toàn diện, trong khi sai số chuẩn đề cập đến một ước tính của sự độc lạ giữa trung bình mẫu và ý nghĩa tổng thể và toàn diện .
Một lỗi thống kê là số lượng mà một quan sát khác với giá tị kỳ vọng của nó, giá trị thặng dư là số lượng một quan sát khác với giá trị ước lượng giả định giá trị dự kiến về một mẫu nhất định (còn gọi là dự đoán).
Sai số bình phương có nghĩa khi được sử dụng cho việc ước đạt hiệu suất cao thu thập dữ liệu, một lớp được sử dụng thoáng đãng trong ước đạt. Sai số căn bậc hai đơn thuần là căn bậc hai của sai số căn bậc hai có nghĩa .Nhiều chiêu thức thống kê nhằm mục đích giảm thiểu tổng giá trị thặng dư của bình phương, và chúng được gọi là “ giải pháp bình phương nhỏ nhất ” trái ngược với độ lệch chuẩn nhỏ nhất. Sau đó phân phối cung ứng số lượng bằng với những lỗi nhỏ và lớn, trong khi trước đây chỉ ra rõ những sai số lớn hơn. Tổng giá trị thặng dư của giá trị bình phương hoàn toàn có thể phân biệt được, nó phân phối thuộc tính có ích để tính hàm hồi quy. Bình phương tối thiểu vận dụng hồi quy tuyến tính được gọi là bình phương nhỏ nhất thường thì và bình phương nhỏ nhất đồng ý cho hàm hồi quy phi tuyến tính được gọi là bình phương tối thiểu phi tuyến tính. Cũng trong một quy mô hồi quy tuyến tính những phần không xác lập của quy mô được gọi là sai số số lượng giới hạn, bị nhiễu hoặc hoàn toàn có thể là tài liệu thừa .Tiến trình giám sát tạo ra số liệu thống kê cũng hoàn toàn có thể có sai số. Nhiều trong số những sai số này được phân loại ngẫu nhiên ( tài liệu thừa ) hoặc mạng lưới hệ thống ( độ xô lệch ), nhưng những loại sai số khác ( ví dụ : rơi lệch, ví dụ điển hình như khi một báo cáo giải trình nghiên cứu và phân tích của những đơn vị chức năng không đúng mực ) cũng quan trọng. Sự Open của tài liệu bị mất và / hoặc kiểm định, điều này hoàn toàn có thể dẫn đến ước đạt xô lệch và từ đó đã tăng trưởng một chiêu thức đơn cử để xử lý yếu tố này. [ 17 ]
Ước lượng theo khoảng chừng.
Mức ý nghĩa.
- Một sự khác biệt đó là có ý nghĩa thống kê cao vẫn có thể không có ý nghĩa, nhưng nó có thể phát biểu đúng các kiểm định trong thống kê. Một câu trả lời trở thành giả thuyết chỉ có mức ý nghĩa bao gồm các giá trị p-value, tuy nhiên không biết được kích thước hay tầm quan trọng của kiểm định quan sát được và cũng có thể kết luận được tầm quan trọng của các khác biệt nhỏ trong các nghiên cứu lớn. Một cách tiếp cận tốt hơn và ngày càng phổ biến là để báo cáo khoảng tin cậy. Mặc dù chúng được đưa ra từ việc tính toán tương tự như những kiểm định giả thuyết hoặc giá trị p-value, mô tả kích thước của ảnh hưởng và những điều không chắc chắn.
- Độ sai lệch của thay đổi điều kiện, những ý kiến sai lầm của Aka: những lời phê bình chỉ ra các giá trị để kiểm định giả thuyết (giả thuyết vô nghĩa) được ưa chuộng, vì xác suất của kết quả của giả thuyết vô nghĩa đưa ra kết quả quan sát được. Một thay thế cho phương pháp này được đưa ra bởi suy luận Bayesian, mặc dù nó đòi hỏi việc một xác suất cho trước.[18]
- Bác bỏ giả thuyết không tự động chứng minh được giả thuyết thay thế.
- Như tất cả mọi thứ trong thống kê suy luận nó dựa vào kích thước mẫu, và do đó dưới miền giá trị p-value giá trị có thể không được tính.
Các ví dụ.
Một số thử nghiệm và thống kê nổi tiếng là :
- Phân tích phương sai (ANOVA)
- Kiểm định chi bình phương
- Sự tương quan
- Phân tích nhân tố
- Mann-Whiteney
- Độ lệch chuẩn ý nghĩa bình phương
- Hệ số tương quan Pearson
- Phân tích hồi quy
- Thứ bậc hệ số tương quan của Spearman
- Kiểm định t-test
- Chuỗi thời gian
Sử dụng thống kê sai.
Sử dụng sai mục tiêu những số liệu thống kê hoàn toàn có thể có những hiệu quả không lường được, những sai số nghiêm trọng trong miêu tả và lý giải sai ý nghĩa ngay cả những chuyên viên có kinh nghiệm tay nghề cũng có những lỗi như vậy, và nghiêm trọng là chúng hoàn toàn có thể dẫn đến đưa ra quyết định hành động sai. Ví dụ chính sách xã hội, nghề thuốc, và độ đáng tin cậy của cấu trúc dựa trên những số liệu thống kê .Ngay cả khi những kỹ thuật thống kê được vận dụng một cách đúng mực, tác dụng hoàn toàn có thể khó để lý giải cho những người thiếu trình độ. Ý nghĩa thống kê của một giải pháp hoàn toàn có thể được gây ra bởi sự đổi khác ngẫu nhiên trong mẫu, hoàn toàn có thể hoặc không hề đồng ý chấp thuận với nhìn nhận trực quan của mức ý nghĩa. Tập hợp những kiến thức và kỹ năng thống kê cơ bản mà mọi người cần phải thỏa thuận hợp tác với những thông tin trong đời sống hàng ngày như một kiến thức và kỹ năng trong nghành thống kê .Có quan điểm cho rằng kiến thức và kỹ năng thống kê được cho là bị lạm dụng một cách quá thông thường bằng cách tìm ra hướng để lý giải những tài liệu có ích cho người trình diễn. [ 19 ] Một sự hoài nghi và khám phá sai về số liệu thống kê được tích hợp với những trích dẫn, “ có ba loại của sự lừa dối : gián trá, rất gián trá và thống kê ”. Lạm dụng những số liệu thống kê hoàn toàn có thể có được kể cả vô ý và có chủ ý, và cuốn sách làm thế nào để nói dối những nhà thống kê [ 19 ] đã chỉ ra một loạt những quyết định hành động. Trong một nỗ lực để làm sáng tỏ việc sử dụng và lạm dụng những số liệu thống kê, nhìn nhận những kỹ thuật thống kê được sử dụng trong những nghành đơn cử được thực thi ( ví dụ : Warne, Lazo, Ramos, and Ritter ). [ 20 ]Cách để tránh số liệu thống kê gồm có sử dụng sơ đồ thích hợp và ngăn ngừa sai số. [ 21 ] Sử dụng sai số hoàn toàn có thể xảy ra khi Kết luận là sai số quá lớn và nhu yếu có tính đại diện thay mặt hơn so với giá trị thật, thường là cố ý hay vô ý không nhận thấy ra sai số mẫu. [ 22 ] Đồ thị dạng cột được cho là biểu đồ đơn thuần nhất để sử dụng và hiểu, những biểu đồ này hoàn toàn có thể vẽ bằng tay hoặc bằng những chương trình máy tính đơn thuần [ 21 ]. Nhưng hầu hết mọi người đều không nhìn ra giá trị rơi lệch hay sai số, thế cho nên những lỗi sai này không được thay thế sửa chữa. Nên mọi người thường tin vào hiệu quả ngay cả khi nó không phải là tác dụng tốt. [ 22 ] Để làm cho tài liệu tích lũy được từ những số liệu thống kê đáng an toàn và đáng tin cậy và đúng chuẩn, mẫu được chọn phải có tính toàn diện và tổng thể. [ 23 ] Theo Huff, “ độ đáng tin cậy của một mẫu hoàn toàn có thể bị tàn phá giá trị xô lệch, được cho phép một số ít mức độ thiếu tín nhiệm ”. [ 24 ]Để tương hỗ cho sự hiểu biết của những số liệu thống kê, Huff đã đề xuất kiến nghị một loạt những câu hỏi được hỏi trong mỗi trường hợp : [ 19 ]
- Ai nói vậy?
- Làm thế nào để anh/chị biết?
- Những gì còn thiếu?
- Có ai thay đổi nội dung?
- Nó có ý nghĩa không?
Hiểu sai mối đối sánh tương quan.
Lịch sử của khoa học thống kê.
Các nghành nghề dịch vụ văn minh của số liệu thống kê Open vào cuối thế kỷ 19 và đầu thế kỷ 20 trong 3 quá trình. [ 26 ] Giai đoạn tiên phong, vào thời gian chuyển giao thế kỷ, được dẫn dắt bởi những việc làm của Sir Francis Galton và Karl Pearson, đã trở thành một mạng lưới hệ thống thống kê toán học sử dụng trong nghiên cứu và phân tích, không riêng gì trong những điều tra và nghiên cứu khoa học, mà còn sử dụng trong những ngành công nghiệp và chính trị. Sự góp phần của Galton trong nghành này gồm có ra mắt những khái niệm về độ lệch chuẩn, đối sánh tương quan, hồi quy và những ứng dụng của những chiêu thức này để nghiên cứu và điều tra về đặc thù của con người, chiều cao, cân nặng, chiều dài của lông mi và những đặc thù khác. [ 27 ] Pearson phát triền những thông số đối sánh tương quan, được định nghĩa như là tích số quan trọng [ 28 ]. Phương pháp của hiện tại cho việc kiểm soát và điều chỉnh phân phối màu và mạng lưới hệ thống những đường cong liên tục, trong số những mẫu khác [ 29 ]. Galton và Pearson xây dựng Biometrika là cuốn sách tiên phong của thống kê toán và sinh học, xây dựng ban thống kê tiên phong tại trường ĐH London. [ 30 ]Giai đoạn thứ hai của những năm 1910 và 1920 đã được khởi xướng bởi William Gosset, và đỉnh điểm trong tri thức của Sir Ronald Fisher, người đã viết cuốn sách để xác lập những ngành học trong những trường ĐH trên toàn quốc tế. Ấn phẩm quan trọng nhất của Fissher là 1916 trang, những đối sánh tương quan giữa mối liên hệ với giả thuyết, thừa kế của Mendelian và 1925 cách sử dụng chiêu thức thống kê cho những nhà nghiên cứu. Bài viết của ông là người tiên phong sử dụng những thuật ngữ thống kê, phương sai. Ông đã tăng trưởng quy mô thử nghiệm khắt khe và cũng mạng lưới hệ thống không thiếu tài liệu, thống kê nhờ vào, phân biệt tuyến tính của Fisher và thông tin Fisher. [ 31 ]Giai đoạn sau cuối, trong đó đa phần là nhận thấy sự tinh xảo và lan rộng ra tăng trưởng trước đó, nổi lên từ sự hợp tác giữa Egon Pearson và Jerzy Neyman trong năm 1930. Họ trình làng những khái niệm về sai số “ loại II ”, sức mạnh của một thử nghiệm và khoảng chừng thời hạn đáng tin cậy. Năm 1934, Jerzy Neyman cho thấy việc chọn mẫu ngẫu nhiên phân lớp là một chiêu thức tốt hơn của ước đạt so với chọn mẫu có mục tiêu. [ 32 ]Ngày nay giải pháp thống kê được vận dụng trong tổng thể những nghành nghề dịch vụ có tương quan đến việc ra quyết định hành động, để cho những Tóm lại đúng mực từ một bộ phận so với những tài liệu và đưa ra quyết định hành động khi đương đầu với Tóm lại không chắc như đinh dựa trên chiêu thức thống kê. Việc sử dụng máy tính tân tiến đã giám sát nhanh những đo lường và thống kê thống kê quy mô lớn, và cũng đã có những giải pháp mới hoàn toàn có thể không đúng chuẩn bằng việc tính bằng tay. Thống kê liên tục là một nghành nghề dịch vụ nghiên cứu và điều tra thiết thực, ví dụ như yếu tố làm thế nào để nghiên cứu và phân tích tài liệu lớn. [ 33 ]
Ứng dụng thống kê, triết lý thống kê và toán thống kê.
“ Thống kê ứng dụng ” gồm có thống kê miêu tả và những ứng dụng của thống kê suy luận ( vật chứng thiết yếu ) [ 34 ]. Lý thuyết thống kê tương quan tới những lập luận logic cơ bản lý giải của giải pháp tiếp cận Kết luận thống kê, cũng gồm có toán thống kê. Toán thống kê không chỉ gồm có những thao tác của phân phối Xác Suất thiết yếu cho tác dụng phát sinh tương quan đến những chiêu thức thống kê giám sát và suy luận, nhưng còn góc nhìn khác nhau của những số liệu thống kê thống kê giám sát và phong cách thiết kế những thử nghiệm .
Học qua máy và khai thác tài liệu.
Có hai ứng dụng cho học qua máy móc và khai thác tài liệu : quản trị tài liệu và nghiên cứu và phân tích tài liệu. Các công cụ thống kê thiết yếu cho việc nghiên cứu và phân tích tài liệu .
Thống kê trong xã hội học.
Thống kê được vận dụng cho một loạt những môn học, gồm có cả khoa học tự nhiên và xã hội, chính trị và kinh doanh thương mại. Thống kê tư vấn hoàn toàn có thể giúp những tổ chức triển khai và công ty không có trình độ vấn đáp những vướng mắc .
Tính toán thống kê.
Thống kê vận dụng cho toán học hay thẩm mỹ và nghệ thuật.
Theo truyền thống, thống kê có liên quan tới sự suy luận bản vẽ qua việc sử dụng một phương pháp bán tiêu chuẩn đã được “yêu cầu thử nghiệm” trong hầu hết các ngành khoa học. Điều này đã thay đổi việc sử dụng số liệu thống kê trong các bối cảnh không có kết luận. Những gì đã được coi là một chủ đề vô vị, thực hiện trong nhiều lĩnh vực như một mức yêu cầu, bây giờ được xem một cách nhiệt tình. Ban đầu một số người khó tính đã cười nhạo, nhưng hiện nay lại được coi là phương pháp cần thiết trong mọi lĩnh vực.
Xem thêm: Đầu số 0127 đổi thành gì? Chuyển đổi đầu số VinaPhone có ý nghĩa gì? – http://139.180.218.5
- Lý thuyết số tự nhiên n, biểu đồ phân rã của dữ liệu được tạo ra bởi một hàm phân phối có thể được chuyển đổi với các công cụ quen thuộc được sử dụng trong thống kê để cho thấy những điều cơ bản, mà sau đó có thể dẫn đến các giả thuyết.
- Phương pháp thống kê bao gồm các phương pháp dự báo được kết hợp với lý thuyết hỗn hợp và hình học nhân bản để tạo ra các tác phẩm video được đánh giá có vẻ đẹp tuyệt vời.
- Các quá trình nghệ thuật của Jackson Pollock dựa trên thí nghiệm nghệ thuật phân bố cơ bản trong tự nhiên được tiết lộ. Với sự ra đời của máy tính, các phương pháp thống kê được áp dụng để hợp thức hóa với các quá trình tự nhiên phân phối theo định hướng như vậy để thực hiện và phân tích nghệ thuật hình ảnh động.
- Phương pháp thống kê có thể được sử dụng để xác nhận trong nghệ thuật trình diễn, như trong một thẻ giả dựa trên quá trình Markov và chỉ hoạt động một thời gian nhất định, qua đó có thể dự đoán được việc sử dụng phương pháp thống kê.
- Thống kê có thể được sử dụng trong việc tạo hình nghệ thuật, như trong âm nhạc hay thống kê ngẫu nhiên phát minh bởi Lannis Xenakis, nơi âm nhạc biểu diễn rõ ràng. Mặc dù kiểu nghệ thuật không phải lúc nào cũng như mong đợi, nó diễn ra theo cách đó là được đoán trước và có hòa âm được bằng cách sử dụng thống kê.
Lĩnh vực trình độ.
Các kỹ thuật thống kê được sử dụng trong một loạt những điều tra và nghiên cứu khoa học và xã hội, gồm có : ngành sinh học, đo lường và thống kê sinh học, giám sát xã hội học, mạng lưới hệ thống sinh học, khoa học xã hội và nghiên cứu và điều tra xã hội. Một số nghành nghề dịch vụ sử dụng tìm hiểu thống kê được vận dụng thoáng rộng rằng họ có trình độ. Những ngành này gồm có :
- Khoa học tính toán bảo hiểm (đánh giá rủi ro trong các ngành công nghiệp bảo hiểm và tài chính)
- ứng dụng thông tin kinh tế
- thiên văn học (đánh giá thống kê của dữ liệu thiên văn)
- sinh học
- thống kê kinh doanh
- hóa học (phân tích dữ liệu hóa học)
- khai thác dữ liệu (áp dụng thống kê và nhận dạng mẫu để khám phá tri thức từ dữ liệu)
- dân số học
- kinh tế học (phân tích thống kê các số liệu kinh tế)
- thống kê năng lượng
- thống kê kỹ thuật
- khoa học nghiên cứu bệnh dịch (phân tích thống kê của bệnh)
- địa lý và hệ thống thông tin địa lý, đặc biệt trong phân tích không gian
- xử lý hình ảnh
- thống kê y tế
- thống kê về hành vi, tâm lý
- độ bền cơ khí
- thống kê xã hội
Ngoài ra còn có những loại đơn cử của nghiên cứu và phân tích thống kê cũng đã tăng trưởng những thuật ngữ chuyên ngành thống kê những chiêu thức thống kê :
- thống kê đa biến
- phân lớp thống kê
- phân tích dữ liệu có cấu trúc (thống kê)
- mô hình phương trình cấu trúc
- phương pháp điều tra
- phân tích sự tồn tại
- thống kê trong các môn thể thao khác nhau, đặc biệt là bóng chày và bóng bầu dục.
Thống kê là một công cụ quan trọng trong cơ sở sản xuất kinh doanh thương mại. Nó được sử dụng để hiểu mạng lưới hệ thống thống kê giám sát dịch chuyển, trấn áp quy trình ( như trong trấn áp quy trình thống kê hoặc trải qua mạng lưới hệ thống ), cho tài liệu tóm tắt, và đưa ra quyết định hành động dựa trên tài liệu. Nó đóng vai là một công cụ quan trọng, và là công cụ duy nhất đáng đáng tin cậy .
Liên kết ngoài.
Source: http://139.180.218.5
Category: Thuật ngữ đời thường