Liệu Ngôn Ngữ Có Khiến Trí Thông Minh Nhân Tạo Tạo Ra Các Thành Kiến Về Giới Tính?

Nếu bạn đã tham gia một lớp học ngôn ngữ, bạn có thể đã nghe đến hệ thống giới tính ngữ pháp. Đó là khi các từ được phân chia vào các nhóm phân loại tùy ý, tình cờ được định danh theo giới tính con người. Vì vậy, một chiếc bàn có tiếng Tây Ban Nha tên là ‘La mesa’, nghĩa là “phụ nữ”, mặc dù không có gì đặc biệt liên quan đến phụ nữ đối với chiếc bàn cả. Giáo viên thường cố hết sức để khiến bạn hiểu rằng hệ thống giới tính ngữ pháp không hề liên quan gì đến vấn đề nam và nữ. Tuy nhiên, các nghiên cứu gần đây chỉ ra rằng khi nhắc đến vấn đề này trong ngôn ngữ của trí tuệ nhân tạo, máy móc chưa bao giờ được lập trình để nhận biết sự khác biệt này.

💥RÔ-BỐT HỌC NÓI NHƯ THẾ NÀO?

Trước khi tìm hiểu lý do máy tính có vấn đề tiêu cực đối với giới tính, chúng ta cần hiểu cơ chế mà trí tuệ nhân tạo (AI) xử lý ngôn ngữ. Ngôn ngữ là một hệ thống phức tạp, vì vậy để thiết lập cho hệ thống AI nhận biết các từ có nghĩa liên quan đến nhau, các kỹ sư thường sử dụng một mô hình phổ biến được gọi là nhúng từ. Để xây dựng mô hình này, AI sẽ thu nhận một lượng lớn văn bản và sau đó sẽ “học” nó. Cách học này của AI nghe có vẻ giống như cách con người làm: bằng cách lắng nghe con người nói và sau cùng thử tự nói. Tuy nhiên, con người tiếp nhận phản hồi về ngôn ngữ liên tục để giúp họ ngày càng cải tiến.

Sau khi tiếp nhận tất cả ngôn ngữ này, AI cố gắng xây dựng một mạng lưới khổng lồ của riêng nó để định nghĩa cho các từ. Các từ được nhóm lại với các từ khác có cùng ý nghĩa với nhau. Ví dụ, từ “astronaut- ngoài không gian” sẽ có nghĩa gần với các từ “outer space” và “profession”, và nó có nghĩa khác xa với từ “fruit-trái cây” và “curse words-các từ nguyền rủa”. Bằng cách tạo ra một mạng lưới kết nối khổng lồ, phức tạp, hệ thống AI bắt đầu hiểu và đưa ra ngôn ngữ. Những hệ thống này biểu thị các từ ở dạng các vector dày đặc, được triển khai rộng rãi bổi các công ty AI như Google và Facebook.

💥NGUYÊN NHÂN DẪN ĐẾN CÁC THÀNH KIẾN CỦA CON NGƯỜI

Tuy nhiên, các vấn đề nảy sinh do các mô hình này là không khách quan. Nó đang học từ ngôn ngữ của con người, điều này khác xa với các định kiến tự do. Vào tháng 3 năm 2006, Microsoft cho ra mắt phần mềm TAY, một Twitterbot tiên tiến được tạo ra để tương tác với mọi người. Ý tưởng này càng có nhiều người tương tác thì nó sẽ càng học được nhiều hơn. Việc mọi người thực hiện các mẩu tin nhắn nhỏ với TAY, nó sẽ xử lý những gì đang được nói và dần cải thiện tiếng Anh của mình. Thay vì mục đích đó, Tay đã bị đóng bởi những kẻ chơi xấu, nó đã phải đóng cửa vì những lời lẽ phân biệt chủng tộc.

TAY là một ví dụ cực đoan, nhưng nó cho thấy rõ ràng cách mà AI có thể học được từ các hành vi xấu. Một bài báo được đăng trên tạp chí Khoa Học bàn luận nghiên cứu về những định kiến này, phát hiện ra thường được sử dụng AI. Về cơ bản, nó được phát hiện từ tên gọi “Brett” và “Allison” được diễn tả gần nghĩa với từ tích cực trong mạng lưới hơn “Alonzo” và “Shaniqua”, thể hiện rõ ràng các thành kiến về chủng tộc. Tương tự, họ phát hiện sự lệch lạc giới tính với tên gọi nam tính có nghĩa gần với các từ vựng nghề nghiệp, và các từ nữ tính gần nghĩa với các từ vựng gia đình. Loại định kiến tương tự này được phát hiện ở con người thông qua Bài Kiểm Tra Liên Kết Ngầm, cung cấp bằng chứng cho thấy những định kiến này được truyền trực tiếp từ người sang máy.

💥LÀM THẾ NÀO MÀ GIỚI TÍNH TRONG NGỮ PHÁP BỊ NHẦM LẪN VỚI GIỚI TÍNH CON NGƯỜI

Trong khi các định kiến này có vẻ khá rõ ràng và dễ dàng để hiểu đối với người, những các thành kiến tế nhị có thể ảnh hưởng tới cách mà AI nắm bắt khó hơn. Các thành kiến tế nhị đó cho chúng ta thấy các mô hình AI nhầm lẫn giữa giới tính con người và giới tính trong ngữ pháp như thế nào. Để hiểu được toàn bộ vấn đề này, chúng ta cần trò chuyện với một trong những kỹ sư ngôn ngữ học tính toán của Babbel, Kate McCurdy. Cô ấy nghiên cứu về giới tính và AI, và cách chúng giao thoa với các ngôn ngữ khác nhau. McCurdy nói rằng, giống như các nghiên cứu khác, việc xử lý ngôn ngữ bị chi phối bởi tiếng Anh đã gây ra vấn đề khi chúng được phổ quát sang một ngôn ngữ khác.

Kate McCurdy là một kỹ sư ngôn ngữ học tính toán tại Babbel và cô ấy đã diễn thuyết các bài nói chuyện về chủ đề giới tính trong AI ở một số hội nghị.

“Bởi vì các mô hình này phát triển trên các sáng kiến bằng tiếng anh, khi bạn đưa chúng vào một ngôn ngữ khác, nó có thể hiểu sai theo các cách khác nhau”. McCurdy nói “Với những ngôn ngữ có sự phân biệt giới tính trong ngữ pháp, những gì mà mô hình [AI] có thể làm đó là học cách liên kết giới tính của các đối tượng với giới tính của con người một cách vô tình.”

Như một ví dụ cụ thể về điều này, McCurdy đã tạo ra một chatbot sử dụng các mô hình AI hiện tại. Bạn sẽ yêu cầu chatbot đề xuất đồ chơi mà bạn nên mua cho con gái hoặc con trai của bạn, và bot sẽ gợi ý một quả bóng hoặc một con búp bê. Cô ấy phát hiện ra rằng trong tiếng Đức,quả bóng dành cho bé trai và búp bê dành cho bé gái, bot sẽ gợi ý đồ chơi theo mối quan hệ giới tính. Nhưng nếu được hỏi bằng tiếng Tây Ban Nha, cả hai đồ chơi đều dành cho nữ, thì nó sẽ gợi ý những bộ đồ chơi cặp cho cả hai.

Chatbot của McCurdy có vẻ không phải là một vấn đề lớn. Sau cùng, con người có thể can thiệp và sửa chữa điều đó. Vấn đề là những thành kiến ​​về giới tính đối với những ngôn ngữ này đã gắn liền với nhau nên rất khó để sửa chữa một hệ thống phức tạp như vậy. Bạn thực sự có thể chứng kiến ​​các vấn đề về giới tính bằng cách nhìn vào các công cụ dịch thuật. Một bài báo được đưa ra bởi Đại học Stanford đã xem xét các thành kiến ​​về giới tính trong công nghệ dịch thuật. Các nhà nghiên cứu cho thấy rằng nếu bạn sử dụng một ngôn ngữ có các đại từ trung lập về giới tính như tiếng Thổ Nhĩ Kỳ (không phải “anh ấy” hoặc “cô ấy”, chỉ là “it”), Google sẽ thường dịch theo các hướng giới tính nhận thức được . Bởi vì tiếng Anh cần phải có giới tính trên đại từ của nó, nó sẽ chỉ chọn giới tính dựa trên xác suất xuất hiện của câu trong tiếng Anh.

Is Language Making Artificial Intelligence Sexist?, babbel

💥GIẢI PHÁP CHO VẤN ĐỀ

Điều quan trọng cần lưu ý là giới tính là một trong rất nhiều yếu tố, vì vậy khó có thể sửa chữa được những thành kiến ​​và chúng không phải lúc nào cũng thể hiện theo những cách rõ ràng như vậy. Có những nỗ lực để điều chỉnh các định kiến, điều này sẽ cực kỳ quan trọng khi AI bắt đầu xâm chiếm hầu hết mọi khía cạnh của cuộc sống của chúng ta. Một trong những giải pháp là cách tiếp cận thuật toán, được thảo luận trong một nghiên cứu của các nhà nghiên cứu tại Đại học Boston. Họ đang hy vọng rằng họ có thể dạy cho máy móc tự động tìm và loại bỏ các định kiến trong AI. McCurdy cho biết chắc chắn có hy vọng rằng vấn đề này có thể được giải quyết, nhưng nó sẽ yêu cầu nghiên cứu trên các ngôn ngữ để xác định các vấn đề mà chúng ta đang đối mặt.

“Viễn cảnh lớn đáng quan tâm là các mô hình ngôn ngữ mà chúng ta sử dụng trong AI và công nghệ ngôn ngữ là vô cùng phức tạp và chúng có thể phản ánh rất nhiều thứ,” McCurdy nói. “Chúng có thể phản ánh những thứ đã được mã hóa, chúng có thể phản ánh những thành kiến ​​và định kiến ​​văn hóa hiện có trên thế giới, và chúng cũng có thể tương tác với các đặc điểm cụ thể của các ngôn ngữ khác nhau theo những cách khó có thể lường trước được, nhưng cuối cùng có thể ảnh hưởng đến những thế hệ về sau. ”

Trí tuệ nhân tạo có thể sẽ là cuộc tranh luận công nghệ quyết định của thế kỷ 21. Stephen Hawking đã cảnh báo rằng nó có thể là ngày tận thế của loài người như chúng ta biết được. Có lẽ cách tốt nhất để ngăn cản cuộc xâm lấn của rô-bốt là dạy rô-bốt không có những thành kiến ​​và vấn đề giống như con người. Tôi không gợi ý rằng việc nói với một robot rằng cả bé trai và bé gái đều có thể chơi với búp bê nếu họ muốn sẽ cứu thế giới, nhưng chắc chắn đó không phải là một nơi bắt đầu tồi.

________________________________

Xin chân thành cảm ơn tác giả vì những chia sẻ vô cùng bổ ích!

  • Theo: babbel
  • Người dịch: Phạm Thư Lê
  • Khi chia sẻ phải trích dẫn nguồn là “Người dịch: Phạm Thư Lê – Nguồn iVolunteer Vietnam”

Shortlink: https://ivolunteervietnam.com?p=97905

Trong quá trình tổng hợp và chia sẻ thông tin, các tình nguyện viên/ cộng tác viên/ thành viên rất khó tránh khỏi thiếu sót. Rất mong được độc giả cảm thông và góp ý tích cực để giúp iVolunteer Vietnam ngày một hoàn thiện & phát triển.

Latest breaking 24h news around the world Internet Explorer Channel Network


All the latest news in Vietnam