Xác suất là một nhánh của toán học liên quan đến các mô tả bằng số về khả năng xảy ra một sự kiện, hoặc khả năng một mệnh đề là đúng. Xác suất của một sự kiện là một số trong khoảng từ 0 đến 1, trong đó, nói một cách đại khái, 0 biểu thị sự bất khả thi của sự kiện và 1 biểu thị sự chắc chắn. [note 1] [1][2] Xác suất của sự kiện càng cao thì khả năng xảy ra sự kiện càng cao. Một ví dụ đơn giản là tung đồng xu công bằng (không thiên vị). Vì đồng xu là công bằng, nên cả hai kết quả (“sấp” và “ngửa”) đều có thể xảy ra như nhau; xác suất của “sấp” bằng xác suất của “ngửa”; và vì không có kết quả nào khác có thể xảy ra, xác suất xảy ra “sấp” hoặc “ngửa” là 1/2 (cũng có thể được viết là 0,5 hoặc 50%).
Những khái niệm này đã được chuẩn hóa toán học bằng tiên đề trong lý thuyết xác suất, được sử dụng rộng rãi trong các lĩnh vực nghiên cứu như toán học, thống kê, tài chính, cờ bạc, khoa học (đặc biệt là vật lý), trí tuệ nhân tạo, học máy, khoa học máy tính, lý thuyết trò chơi, và triết học, ví dụ, rút ra suy luận về tần suất dự kiến của các sự kiện. Lý thuyết xác suất cũng được sử dụng để mô tả cơ học và quy luật cơ bản của các hệ thống phức tạp.[3]
Bạn đang đọc: Xác suất.
Khi giải quyết và xử lý những thử nghiệm ngẫu nhiên và được xác lập rõ ràng trong toàn cảnh triết lý thuần túy ( như tung đồng xu công minh ), xác suất hoàn toàn có thể được diễn đạt bằng số bằng số lượng hiệu quả mong ước, chia cho tổng số toàn bộ những hiệu quả. Ví dụ : tung một đồng xu công minh hai lần sẽ mang lại tác dụng ” sấp-sấp “, ” sấp-ngửa “, ” ngửa-sấp ” và ” ngửa-ngửa “. Xác suất nhận được hiệu quả của ” sấp-sấp ” là 1 trong 4 hiệu quả, hoặc, về mặt số học, 1/4, 0,25 hoặc 25 %. Tuy nhiên, khi nói đến ứng dụng thực tiễn, có hai loại diễn giải xác suất cạnh tranh đối đầu chính, mà những người dùng nó có quan điểm khác nhau về thực chất cơ bản của xác suất :
Từ xác suất (probability) bắt nguồn từ chữ probabilitas trong tiếng Latin và có nghĩa là “để chứng minh, để kiểm chứng”. Nói một cách đơn giản, probable là một trong nhiều từ dùng để chỉ những sự kiện hoặc kiến thức chưa chắc chắn, và thường đi kèm với các từ như “có vẻ là”, “mạo hiểm”, “may rủi”, “không chắc chắn” hay “nghi ngờ”, tùy vào ngữ cảnh. Theo một nghĩa nào đó, điều này khác nhiều so với ý nghĩa hiện đại của xác suất, ngược lại, là thước đo trọng lượng của bằng chứng thực nghiệm, và được hình thành từ suy luận quy nạp và suy luận thống kê.[9]
“Cơ hội” (chance), “cá cược” (odds, bet) là những từ cho khái niệm tương tự. Nếu lý thuyết cơ học có định nghĩa chính xác cho “công” và “lực”, thì lý thuyết xác suất nhằm mục đích định nghĩa “khả năng”.
Nghiên cứu khoa học về xác suất là một bước phát triển hiện đại của toán học Cờ bạc cho thấy rằng đã có sự quan tâm đến việc định lượng các ý tưởng về xác suất trong nhiều thiên niên kỷ, nhưng các mô tả toán học chính xác đã xuất hiện muộn hơn nhiều. Có những lý do giải thích cho sự phát triển chậm chạp của toán học xác suất. Trong khi các trò chơi may rủi tạo động lực cho việc nghiên cứu toán học về xác suất,[cần giải thích] vẫn bị che lấp bởi những mê tín của những người chơi cờ bạc.[10]
Theo Richard Jeffrey, “Trước giữa thế kỷ XVII, thuật ngữ ‘có thể xảy ra’ (tiếng Latinh xác suất) có nghĩa là có thể chấp thuận được, và được áp dụng theo nghĩa đó, cho ý kiến và hành động. Một hành động hoặc ý kiến có thể xảy ra là một hành động chẳng hạn như những người hợp lý sẽ thực hiện hoặc nắm giữ, trong hoàn cảnh. ” [11] Tuy nhiên, đặc biệt là trong các bối cảnh pháp lý, ‘có thể xảy ra’ cũng có thể áp dụng cho các mệnh đề có bằng chứng xác đáng.[12]
Các dạng xác suất và thống kê sớm nhất được biết đến đã được phát triển bởi các nhà toán học Trung Đông nghiên cứu mật mã từ thế kỷ 8 đến thế kỷ 13. Al-Khalil (717–786) đã viết cuốn sách Thông điệp mật mã trong đó có lần đầu tiên sử dụng các hoán vị và tổ hợp để liệt kê tất cả các từ tiếng Ả Rập có thể có và không có nguyên âm. Al-Kindi (801–873) đã sử dụng suy luận thống kê sớm nhất được biết đến trong công việc của mình về phân tích mật mã và phân tích tần số. Một đóng góp quan trọng của Ibn Adlan (1187–1268) là về kích thước mẫu để sử dụng phân tích tần số.[13]
Nhà nghiên cứu đa ngành người Ý ở thế kỷ XVI Gerolamo Cardano đã chứng minh hiệu quả của việc xác định tỷ lệ cược là tỷ lệ giữa các kết quả thuận lợi và không thuận lợi (ngụ ý rằng xác suất của một sự kiện được cho bằng tỷ lệ các kết quả thuận lợi trên tổng số các kết quả có thể xảy ra [14]). Ngoài công trình cơ bản của Cardano, học thuyết về xác suất còn có từ sự tương ứng của Pierre de Fermat và Blaise Pascal (1654). Christiaan Huygens (1657) đã đưa ra phương pháp điều trị khoa học sớm nhất được biết đến đối với chủ đề này.[15] Ars Conjectandi của Jakob Bernoulli (di cảo, 1713) và Học thuyết Cơ hội của Abraham de Moivre (1718) coi chủ đề này như một nhánh của toán học.[16] Xem Sự xuất hiện của Xác suất [9] Ian Hacking và Khoa học về Phỏng đoán [17] của James Franklin để biết lịch sử về sự phát triển ban đầu của khái niệm xác suất toán học.
Lý thuyết sai số có thể bắt nguồn từ cuốn Opera Miscellanea của Roger Cotes (di cảo, 1722), nhưng một cuốn hồi ký do Thomas Simpson soạn năm 1755 (in năm 1756) lần đầu tiên áp dụng lý thuyết này vào cuộc thảo luận về sai số khi quan sát.[18] Lần tái bản (1757) của cuốn hồi ký này đưa ra tiên đề rằng các lỗi tích cực và tiêu cực đều có thể xảy ra như nhau, và các giới hạn có thể ấn định nhất định xác định phạm vi của tất cả các lỗi. Simpson cũng thảo luận về các lỗi liên tục và mô tả một đường cong xác suất.
Hai định luật sai số tiên phong được yêu cầu đều bắt nguồn từ Pierre-Simon Laplace. Luật tiên phong được xuất bản vào năm 1774, và công bố rằng tần suất của một lỗi hoàn toàn có thể được biểu lộ dưới dạng một hàm số mũ của mức độ lỗi – tín hiệu bỏ lỡ. Định luật sai số thứ hai được Laplace đề xuất kiến nghị vào năm 1778, và công bố rằng tần số của sai số là một hàm số mũ của bình phương sai số. [ 19 ] Luật sai số thứ hai được gọi là phân phối chuẩn hay luật Gauss. ” Về mặt lịch sử vẻ vang, rất khó để gán định luật đó cho Gauss, người mặc dầu có sự mưu trí nổi tiếng của mình nhưng có lẽ rằng đã không phát hiện ra điều này trước khi được hai tuổi. ” [ 19 ]Daniel Bernoulli ( 1778 ) đã đưa ra nguyên tắc tích cực đại của những xác suất của một mạng lưới hệ thống những lỗi đồng thời .
Adrien-Marie Legendre (1805) đã phát triển phương pháp bình phương nhỏ nhất và giới thiệu nó trong tác phẩm Nouvelles méthodes pour la détermination des obitanes des comètes (Phương pháp mới để xác định quỹ đạo của sao chổi).[20] Khi thiếu hiểu biết về đóng góp của Legendre, một nhà văn người Mỹ gốc Ireland, Robert Adrain, biên tập viên của “The Analyst” (1808), lần đầu tiên suy luận ra quy luật điều kiện của sai số,
- ϕ ( x ) = c e − h 2 x 2 { \ displaystyle \ phi ( x ) = ce ^ { – h ^ { 2 } x ^ { 2 } } }
Ở đây
h
{\displaystyle h}
c
{\displaystyle c}
Về cơ bản có một tập hợp những quy luật toán để hoàn toàn có thể biến hóa những giá trị của xác suất ; những quy luật nầy sẽ được liệt kê ra trong phần ” Sự hình thành của xác suất ” dưới đâỵ. ( Có một số ít những quy luật được khác dùng để định lượng sự ngẫu nhiên như trong kim chỉ nan Dempster-Shafer và kim chỉ nan khả tạo nhưng những quy luật này thì độc lạ từ thực chất và không tương hợp với cách hiểu thường thì những định luật về xác suất. Tuy nhiên, người ta vẫn còn tranh biện về những đối tượng người tiêu dùng đúng chuẩn nào mà trên đó những quy luật này được vận dụng. Đây là đầu đề của những diễn dịch của xác suất .Ý tưởng chung của xác suất thường được chia thành 2 khái niệm tương quan :
- Xác suất may rủi (aleatory probability), đề cập đến khả năng xảy ra của các sự kiện trong tương lai mà khả năng xảy ra của các sự kiện này phụ thuộc vào một hiện tượng vật lý nào đó mang tính ngẫu nhiên. Khái niệm này còn được chia ra thành (1) các hiện tượng vật lý, về cơ bản, có thể dự đoán được khi có đủ thông tin và (2) các hiện tượng không thể dự đoán được. Ví dụ của loại trước là việc thả một con súc sắc hay quay một bánh xe roulette; ví dụ của loại sau là sự phân rã hạt nhân.
- Xác suất trong tri thức (epistemic probability), đề cập đến sự không chắc chắn của chúng ta về một mệnh đề nào đó vì thiếu thông tin cung cấp để suy luận. Ví dụ việc xác định khả năng một nghi phạm là có phạm tội, dựa trên các chứng cứ cung cấp.
Nội dung chính
Sự hình thành xác suất.
Như những kim chỉ nan khác, kim chỉ nan xác suất là một trình diễn của khái niệm xác suất bằng những thuật ngữ hình thức – nghĩa là những thuật ngữ mà hoàn toàn có thể xác lập một cách độc lập với ý nghĩa của nó. Các thuật ngữ hình thức này được thao tác bởi những quy luật toán học và logic, và tác dụng thu được sẽ được chuyển dời trở lại miền ( domain ) của bài toán .Có hai hướng công thức hóa xác suất đã thành công xuất sắc là sự hình thành công thức Kolmogorov và sự hình thành công thức Cox. Trong công thức của Kolmogorov, những tập được hiểu là những sự kiện và xác suất chính là một phép đo trên một lớp những tập đó .Trong công thức của Cox, xác suất được xem là cái cơ bản ( primitive – không hề nghiên cứu và phân tích thêm được nữa ) và tập trung chuyên sâu nghiên cứu và điều tra vào việc kiến thiết xây dựng một phép gán tốt những giá trị xác suất đến những mệnh đề. Trong cả hai trường hợp, những định luật về xác suất là như nhau, ngoại trừ yếu tố cụ thể kĩ thuật :
- xác suất là một giá trị số trong khoảng 0 và 1;
- xác suất của một sự kiện hay mệnh đề và phần bù của nó cộng lại phải bằng 1; và
- xác suất kết hợp của hai sự kiện hay hai mệnh đề là tích của các xác suất của một trong chúng và xác suất của cái thứ hai với điều kiện biết cái trước xảy ra.
Cách màn biểu diễn và quy đổi những giá trị xác suất.
Xác suất của một sự kiện thương được biểu diễn bằng số thực trong khoảng 0 và 1, bao gồm 2 giá trị biên. Và một sự kiện không thể xảy ra thì có xác suất là 0, còn một sự kiện chắc chắn thì có xác suất là 1, nhưng điều ngược lại không đúng.
Sự khác biệt giữa “chắc chắn” và “xác suất xảy ra 1” là rất quan trọng.
Hầu hết những giá trị xác suất xảy ra trong trong thực tiễn là giữa 0 và 1 .
Sự phân bổ.
Một phân bổ xác suất là một hàm số nhằm mục đích gán những giá trị ( gọi là xác suất ) cho những sự kiện. Các giá trị số này đặc trưng cho năng lực xảy ra của những sự kiện. Với một tập bất kể những sự kiện, có rất nhiều cách để gán những xác suất, và thường dựa vào sự lựa chọn loại phân bổ của những sự kiện đang xem xét .
Có nhiều cách để chỉ định một phân bố xác suất. Thông thường nhất có lẽ là chỉ định một hàm mật độ xác suất (probability density function). Từ đó, xác suất của một sự kiện sẽ được bằng cách lấy tích phân hàm mật độ. Tuy nhiên, hàm phân bố cũng có thể được chỉ định rõ trực tiếp. Trong trường hợp chỉ có một biến (hay một chiều), thì hàm phân bố được gọi là hàm phân bố tích lũy (cumulative distribution function). Phân bố xác suất cũng có thể được chỉ định thông qua các giá trị mômen hay hàm đặc trưng (characteristic function), hay các cách khác nữa.
Một phân bố được gọi là phân bố rời rạc nếu nó được định ra trên một tập rời rạc, đếm được; ví dụ tập các số nguyên.
Một phân bố được gọi là phân bố liên tục nếu nó được định ra trên một tập vô hạn, không đếm được.
Hầu hết những phân bổ trong những ứng dụng trong thực tiễn đều hoặc là một trong hai, nhưng có 1 số ít ví dụ về phân bổ gồm có của cả hai, gọi là phân bổ hỗn hợp .Các phân bổ rời rạc quan trọng gồm có phân bổ giống hệt, phân bổ Poisson, phân bổ nhị thức, phân bổ nhị thức âm và phân bổ Maxwell-Boltzmann .
Các phân bố liên tục quan trọng bao gồm phân bố chuẩn (hay còn gọi là phân bố Gauss), phân bố gamma, phân bố-t của Student (Student’s t-distribution), và phân bố hàm mũ (exponential distribution).
Xác suất với toán học.
Tiên đề xác suất tạo thành nền tảng cho triết lý xác suất. Việc giám sát những xác suất thường dựa vào phép tổng hợp hoặc vận dụng trực tiếp những tiên đề. Các ứng dụng xác suất gồm có thống kê, nó dựa vào sáng tạo độc đáo phân bổ xác suất và định lý số lượng giới hạn TT .
Để minh họa, ta xem việc tung một đồng xu cân đối. Về mặt trực quan, xác suất để head xuất hiện phía trên là 50%; nhưng phát biểu này thiếu tính toán học – Vậy con số 50% có ý nghĩa thực sự thế nào trong ví dụ này?
Một hướng là dùng định luật số lớn. Giả sử là ta thực hiện một số lần gieo đồng xu, với mỗi lần gieo là độc lập nhau – nghĩa là, kết quả của 2 lần gieo khác nhau là độc lập nhau. Nếu ta tiến hành N lần gieo (trials), và đặt NH là số lần mà mặt head xuất hiện, thì với tỉ lệ NH/N.
Khi số lần gieo N trở nên lớn, ta kì vọng rằng tỉ lệ NH/N sẽ tiến gần hơn đến giá trị 1/2. Điều này cho phép ta định nghĩa xác suất Pr(H) của mặt head xuất hiện là giới hạn, khi N tiến ra vô cùng, của chuỗi các tỉ lệ này:
- Pr ( H ) = lim N → ∞ N H N { \ displaystyle \ Pr ( H ) = \ lim _ { N \ to \ infty } { N_ { H } \ over N } }
Trong thực tế, dĩ nhiên ta không thể tiến hành vô hạn lần các lần gieo được; vì thế, nói chung công thức này áp dụng chính xác cho tình huống khi mà chúng ta biết được một xác suất cho sẵn (a priori) cho một kết quả đầu ra nào đó (mà trong ví dụ này là thông tin đồng xu cân đối). Khi đó, định luật số lớn phát biểu rằng, khi cho biết Pr(H), và với một số nhỏ bất kì ε, luôn tồn tại một giá trị n sao cho với mọi N > n,
- | Pr ( H ) − N H N | < ϵ { \ displaystyle \ left | \ Pr ( H ) – { N_ { H } \ over N } \ right | < \ epsilon }
Khía cạnh thông tin cho sẵn a priori của hướng tiếp cận này đôi khi gặp khó khăn trong thực tiễn. Ví dụ, trong với kịch Rosencrantz and Guildenstern are Dead của Tom Stoppard, một nhân vật gieo đồng xu mà luôn xuất hiện mặt head, sau 100 lần gieo. Ông ta không thể xác định đây là sự kiện ngẫu nhiên hay không – vì dù sao, điều này vẫn có thể xảy ra với đồng xu cân đối (dù hiếm).
Những chú ý quan tâm khi đo lường và thống kê xác suất.
Khó khăn trong việc đo lường và thống kê xác suất nằm ở việc xác lập số sự kiện hoàn toàn có thể xảy ra ( possible events ) : đếm số lần Open của mỗi sự kiện, và đếm số lượng sự kiện hoàn toàn có thể xảy ra đó. Đặc biệt khó khăn vất vả trong việc rút ra một Kết luận có ý nghĩa từ những xác suất tính được. Một bài toán đố mê hoặc, bài toán Monty Hall sẽ cho thấy điều này .
Để học thêm về cơ bản của lý thuyết xác suất, xem bài viết về tiên đề xác suất và định lý Bayes giải thích việc sử dụng xác suất có điều kiện trong trường hợp sự xuất hiện của 2 sự kiện là có liên quan nhau.
Ứng dụng của xác suất với đời sống hàng ngày.
Ảnh hưởng chính của lý thuyết xác suất trong cuộc sống hằng ngày đó là việc xác định rủi ro và trong buôn bán hàng hóa. Chính phủ cũng áp dụng các phương pháp xác suất để điều tiết môi trường hay còn gọi là phân tích đường lối.
Lý thuyết game show cũng dựa trên nền tảng xác suất. Một ứng dụng khác là trong xác lập độ đáng tin cậy. Nhiều loại sản phẩm tiêu dùng như xe hơi, đồ điện tử sử dụng kim chỉ nan độ an toàn và đáng tin cậy trong phong cách thiết kế mẫu sản phẩm để giảm thiểu xác suất hỏng hóc. Xác suất hư hỏng cũng gắn liền với sự bh của mẫu sản phẩm .
Các câu nói nổi tiếng về xác suất.
- Damon Runyon: “It may be that the race is not always to the swift, nor the battle to the strong – but that is the way to bet.”
- Pierre-Simon Laplace: “It is remarkable that a science which began with the consideration of games of chance should have become the most important object of human knowledge.” Théorie Analytique des Probabilités, 1812.
- Richard von Mises: “The unlimited extension of the validity of the exact sciences was a characteristic feature of the exaggerated rationalism of the eighteenth century” (Probability, Statistics, and Truth, tr. 9. Ấn bản Dover, 1981 (tái bản ấn bản 2 bằng tiếng Anh, 1957).
- Richard von Mises: “LỪA DỐI” (Probability, Statistics, and Truth, tr. 9. Ấn bản Dover, 1981 (tái bản ấn bản 2 bằng tiếng Anh, 1957).
- ^ almost surely not be exactly 7. However, it does not mean that exactly 7 is impossible. Ultimately some specific outcome (with probability 0) will be observed, and one possibility for that specific outcome is exactly 7.Strictly speaking, a probability of 0 indicates that an event almost never takes place, whereas a probability of 1 indicates than an event almost certainly takes place. This is an important distinction when the sample space is infinite. For example, for the continuous uniform distribution on the real interval [5, 10], there are an infinite number of possible outcomes, and the probability of any given outcome being observed — for instance, exactly 7 — is 0. This means that when we make an observation, it willbe exactly 7. However, it doesmean that exactly 7 is. Ultimately some specific outcome (with probability 0) will be observed, and one possibility for that specific outcome is exactly 7.
- Kallenberg, O. (2005) Probabilistic Symmetries and Invariance Principles. Springer-Verlag, New York. 510 pp. ISBN 0-387-25115-4
- Kallenberg, O. (2002) Foundations of Modern Probability, 2nd ed. Springer Series in Statistics. 650 pp. ISBN 0-387-95313-2
- Olofsson, Peter (2005) Probability, Statistics, and Stochastic Processes, Wiley-Interscience. 504 pp ISBN 0-471-67969-0.
Liên kết ngoài.
Source: http://139.180.218.5
Category: tản mạn