Thuật ngữ đời thường

Bias trong Machine learning là gì

Byadnhacly

Th5 8, 2022

Nội dung chính

1 Giải thích về AI / ML Bias với các ví dụ
2 ML Model Fairness / Bias là gì?
3 Cách kiểm tra tính công bằng / mô hình ML
4 Các tính năng / thuộc tính liên quan đến thiên vị
5 Ví dụ: Các ngành bị tác động bởi AI Bias
6 Tài liệu tham khảo
7 Tóm lược
- 7.1 Share this:
- 7.2 Related

Giải thích về AI / ML Bias với các ví dụ

Tạ Hòa Thái ·

Tạ Hòa Thái

Bạn đang đọc: Bias trong Machine learning là gì

02:00 11/10/2018

4 giờ trướcTrong trí tuệ tự tạo ( AI ) và học máy ( ML ) quốc tế đầy sức mạnh nơi những quy mô Dự kiến đã mở màn được sử dụng liên tục hơn trong những khu vực ra quyết định hành động, mối chăm sóc chính của những nhà hoạch định chủ trương, kiểm toán viên và người dùng cuối đã bảo vệ rằng những quy mô này không đưa ra quyết định hành động xô lệch / không công minh dựa trên Dự kiến quy mô ( phân biệt đối xử có chủ ý hay vô ý ). Hãy tưởng tượng những ngành công nghiệp như ngân hàng nhà nước, bảo hiểm và việc làm trong đó những quy mô được sử dụng làm giải pháp cho những yếu tố ra quyết định hành động như đưa ra list ứng viên để phỏng vấn, phê duyệt khoản vay / tín dụng thanh toán, quyết định hành động phí bảo hiểm, v.v. những quyết định hành động hoàn toàn có thể ảnh hưởng tác động đến sinh kế của họ dựa trên những Dự kiến thiên vị được đưa ra bởi quy mô, do đó, dẫn đến những quyết định hành động không công minh / xô lệch. Do đó, điều quan trọng so với những nhà quản trị loại sản phẩm / nhà nghiên cứu và phân tích kinh doanh thương mại và nhà khoa học dữ liệu thao tác trên những yếu tố ML để hiểu những sắc thái khác nhau của khuynh hướng Dự kiến quy mô, ví dụ điển hình như 1 số ít điều sau đây sẽ được đàm đạo trong bài viết này :Nội dung chính

Giải thích về AI / ML Bias với các ví dụ
ML Model Fairness / Bias là gì?
Cách kiểm tra tính công bằng / mô hình ML
Các tính năng / thuộc tính liên quan đến thiên vị
Ví dụ: Các ngành bị tác động bởi AI Bias
Tài liệu tham khảo
Tóm lược
Video liên quan

ML Model Fairness / Bias là gì?
Cách kiểm tra tính công bằng / xu hướng của người mẫu
Các tính năng / thuộc tính liên quan đến thiên vị
Các ngành công nghiệp bị ảnh hưởng bởi AI Bias

ML Model Fairness / Bias là gì?

Sự rơi lệch trong quy mô Machine Learning hoàn toàn có thể được gây ra do thiếu những tính năng và bộ tài liệu tương quan được sử dụng để đào tạo và giảng dạy những quy mô. Cho rằng những tính năng và tài liệu tương quan được sử dụng để đào tạo và giảng dạy những quy mô được phong cách thiết kế và tích lũy bởi con người, cá thể ( nhà khoa học dữ liệu hoặc người quản trị loại sản phẩm ) hoàn toàn có thể đi vào cách chuẩn bị sẵn sàng tài liệu để đào tạo và giảng dạy quy mô. Điều này có nghĩa là một hoặc nhiều tính năng hoàn toàn có thể bị bỏ lỡ hoặc khoanh vùng phạm vi bảo hiểm của những bộ tài liệu được sử dụng cho huấn luyện và đào tạo là không đủ. Nói cách khác, quy mô hoàn toàn có thể không chớp lấy được những quy tắc thiết yếu có trong tập dữ liệu. Do đó, những quy mô Machine Learning tác dụng sẽ phản ánh sự thiên vị ( độ lệch cao ) .Xu hướng quy mô Machine Learning hoàn toàn có thể được hiểu theo 1 số ít điều sau đây :

Thiếu một bộ tính năng thích hợp có thể dẫn đến sai lệch. Trong một kịch bản như vậy, mô hình có thể được cho là bị thiếu. Nói cách khác, các mô hình như vậy có thể được tìm thấy để thể hiện độ lệch cao và phương sai thấp.
Thiếu bộ dữ liệu phù hợp: Mặc dù các tính năng là phù hợp, việc thiếu dữ liệu phù hợp có thể dẫn đến sai lệch. Đối với một khối lượng lớn dữ liệu có tính chất khác nhau (bao gồm các kịch bản khác nhau), vấn đề sai lệch có thể được giải quyết. Tuy nhiên, cần thận trọng để tránh vấn đề quá mức (phương sai cao) có thể ảnh hưởng đến hiệu suất mô hình theo nghĩa mô hình sẽ không thể khái quát hóa cho tất cả các loại bộ dữ liệu.

Trong trường hợp quy mô được phát hiện có độ lệch cao, quy mô sẽ được gọi là không công minh và ngược lại. Cần quan tâm rằng nỗ lực giảm rơi lệch dẫn đến những quy mô phức tạp cao có phương sai cao. Sơ đồ đưa ra dưới đây đại diện thay mặt cho độ phức tạp của quy mô về độ lệch và phương sai. Lưu ý trong thực tiễn là với sự giảm độ lệch, quy mô có khuynh hướng trở nên phức tạp và đồng thời, hoàn toàn có thể được tìm thấy có phương sai cao .

Cách kiểm tra tính công bằng / mô hình ML

Điều quan trọng là phải hiểu làm thế nào người ta hoàn toàn có thể đi về việc xác lập mức độ mà quy mô bị thiên vị, và, do đó không công minh. Một trong những cách tiếp cận thông dụng nhất là xác lập tầm quan trọng hoặc tầm quan trọng tương đối của những giá trị nguồn vào ( tương quan đến những tính năng ) trên Dự kiến / đầu ra của quy mô. Xác định tầm quan trọng tương đối của những giá trị nguồn vào sẽ giúp xác lập trong thực tiễn rằng những quy mô không phụ thuộc vào quá nhiều vào những thuộc tính được bảo vệ ( tuổi, giới tính, sắc tố, giáo dục, v.v. ) sẽ được luận bàn trong một trong những phần sau. Các kỹ thuật khác gồm có nghiên cứu và phân tích tài liệu truy thuế kiểm toán, đường ống quy mô ML, v.v. Theo đó, người ta hoàn toàn có thể nhìn nhận liệu quy mô có công minh ( không thiên vị ) hay không .

Xem thêm: 0225 là mã vùng ở đâu? Đầu số 0225 là mạng gì? – Edanhba

Để xác lập độ lệch của quy mô và tính công minh có tương quan, 1 số ít khung sau hoàn toàn có thể được sử dụng :

Vôi
Công bằng
CHIA SẺ
Google là gì nếu
Bộ công cụ đánh giá thiên vị của IBM

Các tính năng / thuộc tính liên quan đến thiên vị

Sau đây là một số ít thuộc tính / tính năng hoàn toàn có thể dẫn đến xô lệch :

Cuộc đua
Giới tính
Màu
Tôn giáo
Nguồn gốc quốc gia
Tình trạng hôn nhân
Xu hướng tính dục
Nền giáo dục
Nguồn thu nhập
Tuổi tác

Người ta muốn vận dụng những kế hoạch tương thích để huấn luyện và đào tạo và kiểm tra quy mô và hiệu suất tương quan với sự thiên vị được đưa ra do tài liệu tương quan đến những tính năng trên .

Ví dụ: Các ngành bị tác động bởi AI Bias

Sự thiên vị ( phân biệt đối xử có chủ ý hoặc không chủ ý ) hoàn toàn có thể phát sinh trong những trường hợp sử dụng khác nhau trong những ngành như một số ít điều sau đây :

Ngân hàng : Hãy tưởng tượng một kịch bản khi yêu cầu cho vay ứng viên hợp lệ không được chấp thuận. Điều này cũng có thể xảy ra do sự sai lệch trong hệ thống được giới thiệu với các tính năng và dữ liệu liên quan được sử dụng cho đào tạo người mẫu như giới tính, giáo dục, chủng tộc, địa điểm, v.v. Trong một ví dụ khác, hãy tưởng tượng một người nộp đơn được cho vay mặc dù anh ta không đủ phù hợp. Trong một ví dụ khác, hãy tưởng tượng một ứng dụng thẻ tín dụng của ứng viên bị từ chối mặc dù người nộp đơn là một người nộp đơn hợp lệ, đáp ứng tất cả các yêu cầu để có được thẻ tín dụng. Điều đó có thể xảy ra khi mô hình được sử dụng để phân loại ứng dụng thẻ tín dụng được chấp thuận hoặc từ chối có sự thiên vị cơ bản do trình độ học vấn của người nộp đơn.
Bảo hiểm : Hãy tưởng tượng một người được yêu cầu trả phí bảo hiểm cao hơn dựa trên các dự đoán được đưa ra bởi mô hình có tính đến một số thuộc tính như giới tính, cuộc đua để đưa ra dự đoán.
Việc làm : Tưởng tượng một mô hình Machine Learning lọc không đúng cách các ứng viên tiếp tục dựa trên các thuộc tính như chủng tộc, màu sắc, v.v. của các ứng viên. Điều này không chỉ có thể ảnh hưởng đến việc làm của các ứng viên phù hợp mà còn dẫn đến cơ hội bị bỏ lỡ của công ty để thuê một ứng viên tuyệt vời.
Nhà ở : Hãy tưởng tượng một mô hình có độ lệch cao đưa ra dự đoán không chính xác về giá nhà. Điều này có thể dẫn đến cả hai, chủ sở hữu nhà và người dùng cuối (người mua) bỏ lỡ cơ hội liên quan đến mua-bán. Sự thiên vị có thể được giới thiệu do dữ liệu liên quan đến vị trí, cộng đồng, địa lý, v.v.
Gian lận (Tội phạm / Khủng bố) : Tưởng tượng người mẫu phân loại không chính xác một người là kẻ phạm tội tiềm năng và khiến anh ta / cô ta bị thẩm vấn về hành vi phạm tội mà anh ta / cô ta không làm. Đó có thể là kết quả có thể dự đoán của một mô hình có thể thiên về chủng tộc, tôn giáo, nguồn gốc quốc gia, v.v. Ví dụ, ở một số quốc gia hoặc khu vực địa lý, một người thuộc tôn giáo hoặc nguồn gốc quốc gia bị nghi ngờ thực hiện một loại tội phạm nhất định như vậy như khủng bố. Bây giờ, điều này trở thành một phần của sự thiên vị cá nhân. Sự thiên vị này được phản ánh trong dự đoán mô hình.
Chính phủ : Hãy tưởng tượng các chương trình của chính phủ sẽ được cung cấp cho một bộ phận người nhất định và các mô hình Machine Learning đang được sử dụng để phân loại những người này sẽ nhận được lợi ích từ các chương trình này. Một sự thiên vị sẽ dẫn đến một số người đủ điều kiện không nhận được lợi ích (dương tính giả) hoặc một số người không đủ điều kiện nhận được lợi ích (phủ định sai).
Giáo dục : Hãy tưởng tượng một ứng dụng nhập học ứng viên bị từ chối do sai lệch mô hình Machine Learning cơ bản. Sự thiên vị có thể có kết quả do dữ liệu sử dụng mô hình nào đã được đào tạo.
Tài chính : Trong ngành tài chính, mô hình được xây dựng với dữ liệu sai lệch có thể dẫn đến dự đoán có thể vi phạm Đạo luật cơ hội tín dụng công bằng (cho vay công bằng) bằng cách không chấp thuận yêu cầu tín dụng của người nộp đơn đúng. Và, người dùng cuối có thể thách thức điều tương tự yêu cầu công ty đưa ra lời giải thích cho việc không chấp thuận yêu cầu tín dụng. Luật ban hành năm 1974, nghiêm cấm phân biệt tín dụng dựa trên các thuộc tính như chủng tộc, màu da, tôn giáo, giới tính, v.v. Trong khi xây dựng mô hình, các nhà quản lý sản phẩm (nhà phân tích kinh doanh) và các nhà khoa học dữ liệu thực hiện các bước để đảm bảo dữ liệu chính xác / chung chung các khía cạnh) liên quan đến một số tính năng nêu trên đã được sử dụng để xây dựng (đào tạo / kiểm tra) mô hình, việc loại trừ không chủ ý một số tính năng hoặc bộ dữ liệu quan trọng có thể dẫn đến sai lệch.

Tài liệu tham khảo

Bias-Variance Trade-off
Xu hướng khác nhau trong học máy
Nguy cơ của Xu hướng học máy và cách phòng ngừa

Tóm lược

Trong bài đăng này, bạn đã tìm hiểu và khám phá về những khái niệm tương quan đến khuynh hướng quy mô Machine Learning, những thuộc tính / tính năng tương quan đến thiên vị cùng với những ví dụ từ những ngành khác nhau. Ngoài ra, bạn cũng đã khám phá về 1 số ít khung hoàn toàn có thể được sử dụng để kiểm tra xô lệch. Chủ yếu, sự thiên vị trong những quy mô ML dẫn đến sự thiên vị hiện hữu trong tâm lý của những nhà quản trị mẫu sản phẩm / nhà khoa học dữ liệu thao tác về yếu tố Machine Learning. Họ không chớp lấy được những tính năng quan trọng và gồm có tổng thể những loại tài liệu để huấn luyện và đào tạo những quy mô dẫn đến rơi lệch quy mô. Và một quy mô Machine Learning với độ thiên vị cao hoàn toàn có thể dẫn đến những bên tương quan đưa ra những quyết định hành động không công minh / thiên vị, điều này sẽ tác động ảnh hưởng đến sinh kế và phúc lợi của người mua sau cuối được đưa ra những ví dụ được tranh luận trong bài đăng này. Vì vậy, điều quan trọng là những bên tương quan phải coi trọng việc kiểm tra những quy mô cho sự hiện hữu của xô lệch .