Sau hai năm sửa sai, trí tuệ nhân tạo Google vẫn nhận nhầm người Mỹ gốc Phi với khỉ đột

Sau hai năm sửa sai, trí tuệ nhân tạo Google vẫn nhận nhầm người Mỹ gốc Phi với khỉ đột
Theo: Dink Theo Trí Thức Trẻ
Thể loại: Khoa Học Công Nghệ
Và họ khắc phục lỗi nhận dạng khuôn mặt ấy bằng một biện pháp hơi thiếu hiệu quả, nếu không muốn nói là hơi... cùn.

Ngẫm lại hồi 2015, một nhà phát triển phần mềm da màu đã làm Google xấu mặt khi đăng tải trên Twitter rằng dịch vụ nhận dạng ảnh của Google đã nhận định anh và người bạn (cũng da màu) của mình là "hai con khỉ đột". Google đã có lời xin lỗi sâu sắc đến cá nhân người bị xúc phạm, một kỹ sư trong ngành nói rằng nhãn "khỉ đột" sẽ không được sử dụng để gắn vào một nhóm người nữa, và Google "đã đang tiến hành sửa chữa về lâu về dài".

Phốt của Google Photo - Google Phôt.

"Phốt" của Google Photo - Google "Phôt".

Đến thời điểm đầu năm 2018 này, ta có thể thấy rõ một trong những cách sửa chữa mà Google áp dụng: họ xóa luôn nhãn khỉ đột (cũng một số loài linh trưởng khác) khỏi cơ sở dữ liệu nhận dạng hình ảnh. Điều này đã cho ta thấy rõ rằng công ty công nghệ khổng lồ này và thậm chí là cả nhiều công ty khác đang gặp khó khăn đến nhường nào trong việc áp dụng công nghệ nhận dạng khuôn mặt nhận dạng tiên tiến lên đủ các thứ công nghệ như xe tự lái, trợ lý ảo, ...

Phóng viên tạp chí WIRED thử nghiệm Google Photo với một bộ sưu tập ảnh đồ sộ gồm 40.000 tấm ảnh động vật. Họ có một kết quả ấn tượng: Google Photo có thể có thể trả lại kết quả của vô vàn con vật, nhưng dịch vụ này đều báo "không kết quả" với những từ khóa "gorilla – khỉ đột", "chimpanzee – vượn", "chimp – viết tắt của chimpanzee" và "monkey – khỉ".

Google Photo hiện có trên cả ứng dụng di động và nền tảng web, cung cấp cho 500 triệu người dùng nơi để lưu trữ ảnh cá nhân của mình. Nó dùng công nghệ machine learning để tự động "nhóm" những ảnh có nội dung tương tự với nhau lại, ví dụ như "động vật", "ao hồ", "quần áo" v.v... Đây cũng là công nghệ cho phép người sử dụng tự tìm thấy bộ sưu tập ảnh cá nhân của mình.

Không có kết quả nào cho gorilla.

Không có kết quả nào cho "gorilla".

Trong bài thử của phóng viên WIRED, Google Photo cũng đưa ra một số hình ảnh loài linh trưởng. Đơn cử như "baboon – khỉ đầu chó", "gibbon – (một loài) vượn", "marmoset – khỉ đuôi sóc". Chỉ cần tìm tránh từ monkey – khỉ ra là mọi thứ lại đâu vào đấy.

Trong một bài thử khác nữa, phóng viên WIRED đã tải lên 20 tấm ảnh về vượn và khỉ đột từ một nguồn mở khác. Một số hình ảnh vẫn có thể tìm lại được với những từ khóa như "forest – rừng", "jungle - rừng rậm", "zoo - sở thú", nhưng lũ khỉ còn lại vẫn bặt vô âm tín.

Kết luận lại, ta thấy rằng với Google Photo thì khỉ đầu chó vẫn là khỉ đầu chó, nhưng khỉ thì không phải là khỉ, còn khỉ đột và vượn thì tàng hình.

Trong bài thử thứ ba, phóng viên WIRED muốn xem Google Photo nhìn thấy gì khi nhận mặt con người. Họ đăng tải lên đó một bộ ảnh gồm 10.000 tấm vón được dùng trong nghiên cứu nhận dạng khuôn mặt. Cụm từ "African american – người Mỹ gốc Phi" cho ra kết quả một con linh dương trên đồng cỏ. Với cụm từ "black man – anh da đen", "black woman – cô da đen", "black person – người da đen" thì Google Photo trả về ảnh đen trắng của người thật, hình ảnh đều được phân loại đúng giới tính nhưng không thỏa mãn yêu cầu "màu da".

Chỉ khi tìm cụm từ "afro – chỉ bộ tóc xoăn xù của người da màu" và "African – người gốc Phi" thì Google Photo mới trả đúng hình ảnh người da màu. Tuy nhiên, kết quả vẫn lẫn lộn không chính xác.

Ví dụ điển hình về bộ tóc afro.

Ví dụ điển hình về bộ tóc afro.

Người phát ngôn của Google xác nhận rằng cụm từ "gorilla – khỉ đột" đã bị lọc đi khỏi hệ thống tìm kiếm sau sự cố năm 2015, những từ khác như "chimpanzee – vượn" hay "monkey – khỉ" cũng chịu chung số phận. "Công nghệ dán nhãn hình ảnh dựa vào nội dung vẫn còn trong giai đoạn đầu phát triển và đáng buồn là còn lâu nó mới hoàn hảo được", người phát ngôn phía Google nói thêm.

Việc Google rất cẩn thận trong khâu nhận dạng hình ảnh này cho thấy công nghệ machine learning hiện tại vẫn còn hạn chế lắm. Với đủ dữ liệu và với một sức mạnh tính toán vượt trội, phần mềm có thể phân loại hình ảnh chính xác hoặc nháu lại lời nói tới một mức độ cao. Tuy nhiên, nó chưa đi được quá xa. Thuật toán khéo léo nhất thời điểm hiện tại cũng chưa thể có được một nhận định giống của con người.

Như một lẽ tất yếu, những nhà phát triển machine learning phải rất cẩn thận khi đưa sản phẩm của mình ra công chúng: vẫn còn những góc khuất mà các bài tập huấn luyện nhận dạng chưa dạy được cho thuật toán. "Rất khó để tạo khuôn mẫu cho mọi thứ hệ thống sẽ gặp phải trong đời thực", Vicente Ordóñez Román, giáo sư tại Đại học Virginia nhận định.

Lỗi không hoàn toàn nằm ở Google, khi mà bản thân những tấm ảnh được đưa lên Google Photo cũng không hoàn hảo. Người dùng đăng ảnh với mọi loại điều kiện ánh sáng, góc nhìn, ... Xét tới lượng ảnh nằm trong cơ sở dữ liệu, thì việc "nhầm nhọt" khỉ với người gần như là SẼ xảy ra.

Nhiều công ty lớn khác, trong số đó có cả công ty mẹ của Google là Alphabet, đối mặt với trở ngại này ở một mức độ cao hơn nhiều. Có thể nói đến ví dụ dễ thấy nhất là xe tự lái. Sau nhiều nghiên cứu, đã có những tiến bộ nhất định nhưng các nhà nghiên cứu, trong đó có cả giáo sư Román, thì vẫn chưa rõ cách thức vượt qua những giới hạn của hệ thống.

Vẫn có một vài hệ thống machine learning của Google có khả năng phát hiện ra khỉ đột ngoài đời thực. Ví dụ như dịch vụ có tên Cloud Vision API của họ vẫn nhận dạng được "khỉ đột" và "vượn" khi xem ảnh của chúng. Thậm chí độ chính xác cũng vẫn rất cao. Bạn có thể xem ở hình dưới.

Khỉ Lớn: 97% - Khỉ Phương Tây: 94% - Động vật có vú: 93% - Linh trưởng: 90%.

Khỉ Lớn: 97% - Khỉ Phương Tây: 94% - Động vật có vú: 93% - Linh trưởng: 90%.

Hệ thống thường thấy nhất của Google là Google Assistant – trợ lý ảo sinh ra để đáp trả lại Siri của Apple – cũng vẫn có thể xác định được khỉ đột: nó vẫn đủ tự tin để không nhầm hình ảnh loài linh trưởng này thành một người da màu. Thế mà, hệ thống Google Lens được Google quảng bá là "tiến bộ vượt bậc trong công nghệ thị lực máy tính" thì lại nhìn tấm ảnh khỉ đột, gãi cằm một lúc rồi nói rằng "Hmm ... chưa nhìn rõ được ảnh này là ảnh gì".

Hmmm.

Chiếc đĩa bí ẩn của nước Nga: Dù bé tẹo nhưng chẳng ai nhấc nổi, bên dưới ẩn giấu bí mật gây ngỡ ngàng

tinybook tinybook 3 ngày 8 giờ
Chiếc đĩa bí ẩn của nước Nga: Dù bé tẹo nhưng chẳng ai nhấc nổi, bên dưới ẩn giấu bí mật gây ngỡ ngàng
Chiếc đĩa bí ẩn này thực chất là gì? Nếu biết, bạn sẽ hết sức bất ngờ đấy.

Thế giới đang sử dụng những cách nào để xây dựng nhà chống lũ?

tinybook tinybook 3 ngày 9 giờ
Thế giới đang sử dụng những cách nào để xây dựng nhà chống lũ?
Bên cạnh chống lũ, việc sống chung với lũ cũng là một trong những phương án nhiều nước áp dụng ngày nay. Điểm thiết yếu của chính sách này là phải xây dựng được những ngôi nhà chống lũ cho người dân.

2 thầy trò sử dụng thuật toán để biến bản đồ từ thời cổ đại thành hình chụp rõ nét như bản đồ vệ tinh

tinybook tinybook 3 ngày 22 giờ
2 thầy trò sử dụng thuật toán để biến bản đồ từ thời cổ đại thành hình chụp rõ nét như bản đồ vệ tinh
Nhìn vào để thấy sự thay đổi chóng mặt của đô thị hóa.

Nghệ nhân Zimbabwea biến lốp xe hơi cũ thành những đôi dép độc đáo

tinybook tinybook 3 ngày 22 giờ
Nghệ nhân Zimbabwea biến lốp xe hơi cũ thành những đôi dép độc đáo
Dù tạo ra một đôi giày thoải mái từ lốp xe hơi cũ nghe có vẻ phi thực tế, nhưng theo những gì Chitukutuku đang làm, quy trình này có vẻ khá đơn giản, chỉ mất chưa đầy 1 tiếng đồng hồ.

Chàng thanh niên mang hoài bão dọn sạch biển hợp tác cùng Microsoft, chế tạo tàu gom rác tự hành chạy bằng năng lượng Mặt Trời

tinybook tinybook 3 ngày 23 giờ
Chàng thanh niên mang hoài bão dọn sạch biển hợp tác cùng Microsoft, chế tạo tàu gom rác tự hành chạy bằng năng lượng Mặt Trời
Dự kiến, hai điểm đến tiếp theo của những hệ thống tàu này là Việt Nam và Cộng hoà Dominica.

Giới khảo cổ phát hiện hình vẽ mèo khổng lồ 2000 năm tuổi nằm ngay giữa sa mạc tại Peru

tinybook tinybook 4 ngày 2 giờ
Giới khảo cổ phát hiện hình vẽ mèo khổng lồ 2000 năm tuổi nằm ngay giữa sa mạc tại Peru
Theo đó, các nhà khảo cổ học đã bất ngờ phát hiện hình vẽ con mèo khổng lồ này khi đang cải tạo lối đi để du khách có thể dễ tới chiêm ngưỡng những bức hình khổng lồ tạo nên Nazca Lines bí ẩn và nổi tiếng.

Tìm xuống vùng biển sâu nhất đại dương, khoa học phát hiện sự thật đau lòng: Biến đổi khí hậu đang nghiêm trọng hơn bao giờ hết rồi

tinybook tinybook 4 ngày 5 giờ
Tìm xuống vùng biển sâu nhất đại dương, khoa học phát hiện sự thật đau lòng: Biến đổi khí hậu đang nghiêm trọng hơn bao giờ hết rồi
Có một xu hướng đáng ngại đang tồn tại dưới đáy đại dương, và khoa học đang tích cực tìm hiểu thêm.

Các nhà thiên văn học hóa giải bí ẩn về thiên hà chứa 99,99% vật chất tối

tinybook tinybook 4 ngày 20 giờ
Các nhà thiên văn học hóa giải bí ẩn về thiên hà chứa 99,99% vật chất tối
Nhiều khả năng đội nghiên cứu đưa nhận định cũ sẽ tính toán lại để tranh cãi bằng được rằng mình đúng. Chúng ta cùng "lót dép" chờ xem.

Phát hiện ra "siêu sức mạnh" mới của loài gấu nước: một lá chắn cực tím bằng huỳnh quang

tinybook tinybook 4 ngày 23 giờ
Phát hiện ra "siêu sức mạnh" mới của loài gấu nước: một lá chắn cực tím bằng huỳnh quang
Gấu nước vẫn chưa thôi làm chúng ta bất ngờ.

7 việc cực đơn giản nhưng nếu làm được, bạn đặc biệt hơn 90% dân số thế giới đấy

tinybook tinybook 5 ngày 2 giờ
7 việc cực đơn giản nhưng nếu làm được, bạn đặc biệt hơn 90% dân số thế giới đấy
Hãy thử xem mình có phải là "của hiếm" của thế giới hay không nhé.

Giáo sư đại học Mỹ tuyên bố: Rất có thể chúng ta đang sống trong một thế giới giả lập

tinybook tinybook 5 ngày 4 giờ
Giáo sư đại học Mỹ tuyên bố: Rất có thể chúng ta đang sống trong một thế giới giả lập
Theo kết luận của giáo sư, tỉ lệ sống trong giả lập của chúng ta lên tới 50%.

6 ý nghĩa thực sự mỗi khi bạn cảm thấy "Deja vu" - hiện tượng rất nhiều người đã từng trải nghiệm mà không giải thích nổi

tinybook tinybook 5 ngày 4 giờ
6 ý nghĩa thực sự mỗi khi bạn cảm thấy "Deja vu" - hiện tượng rất nhiều người đã từng trải nghiệm mà không giải thích nổi
Deja vu đến nay vẫn là một hiện tượng khoa học chưa thể giải thích. Dẫu vậy, nó vẫn mang đến những ý nghĩa nhất định.

Khoa học "đập hộp" hang động tách biệt khỏi thế giới suốt 5 triệu năm, và đây là những gì được tìm thấy

tinybook tinybook 5 ngày 4 giờ
Khoa học "đập hộp" hang động tách biệt khỏi thế giới suốt 5 triệu năm, và đây là những gì được tìm thấy
Một hang động bị đóng kín suốt 5,5 triệu năm, chỉ được tìm ra từ cách đây hơn 30 năm và đến nay mới chỉ có chưa đến 100 người được phép xuống thám hiểm.

Ai đã tạo ra thế giới kỳ lạ của "Nghìn lẻ một đêm"?

tinybook tinybook 5 ngày 21 giờ
Ai đã tạo ra thế giới kỳ lạ của "Nghìn lẻ một đêm"?
Nghìn lẻ một đêm là bộ sưu tập các truyện dân gian Trung Đông và Nam Á được biên soạn bằng tiếng Ả Rập trong thời đại hoàng kim Hồi giáo.

Sự kiện Dust Bowl: "Cơn bão đen" kéo dài 10 năm trên khắp Bắc Mỹ

tinybook tinybook 5 ngày 21 giờ
Sự kiện Dust Bowl: "Cơn bão đen" kéo dài 10 năm trên khắp Bắc Mỹ
Sự kiện Dust Bowl nổi bật với hiện tượng rất nhiều cơn bão và lốc hoành hành ở các đồng cỏ tại khu vực Bắc Mỹ và gây ra nhiều thiệt hại kinh khủng.

Cùng nghe thứ âm thanh tuyệt diệu của vũ trụ, được tạo ra từ loạt ảnh chụp Dải Ngân hà của NASA

tinybook tinybook 5 ngày 23 giờ
Cùng nghe thứ âm thanh tuyệt diệu của vũ trụ, được tạo ra từ loạt ảnh chụp Dải Ngân hà của NASA
NASA đã sử dụng quá trình chuyển hóa dữ liệu thành âm thanh để đem tới cách nhận thức về vũ trụ theo một cách hoàn toàn mới, đó là hé “âm thanh” của Dải Ngân hà.

Bất chấp “Bão Facebook" - quét tài khoản, không cho chạy quảng cáo, doanh nghiệp này vẫn có thể đạt 1000 đơn đặt hàng/ngày nhờ 3 việc sau

tinybook tinybook 6 ngày 3 giờ
Bất chấp “Bão Facebook" - quét tài khoản, không cho chạy quảng cáo, doanh nghiệp này vẫn có thể đạt 1000 đơn đặt hàng/ngày nhờ 3 việc sau
"Bão Facebook" đang là từ khoá hot trong thời gian gần đây trong cộng đồng thương mại điện tử và những doanh nghiệp nào có Facebook là kênh quảng cáo, khi bỗng dưng một ngày nhận được thông báo "tài khoản quảng cáo bị vô hiệu hoá", dù không vi phạm hoặc nhận được bất kỳ cảnh báo nào.

Điều gì sẽ xảy ra nếu hai khối rác không gian va chạm vào nhau?

tinybook tinybook 6 ngày 5 giờ
Điều gì sẽ xảy ra nếu hai khối rác không gian va chạm vào nhau?
Hiệu ứng Domino có thể tạo ra lớp mảnh vỡ không thể xuyên thủng, giam giữ chúng ta trên Trái đất vĩnh viễn.

10 sai lầm hay mắc phải trong việc dọn dẹp nhà cửa

tinybook tinybook 6 ngày 11 giờ
10 sai lầm hay mắc phải trong việc dọn dẹp nhà cửa
Trong quá trình dọn dẹp và chăm sóc nhà cửa, chúng ta thường mắc phải những sai lầm không chỉ gây hại cho những đồ vật xung quanh mà còn cho chính bản thân chúng ta.

Phân tích đá Mặt Trăng cho thấy nhà chị Hằng từng phát ra từ trường, và nhờ nó sự sống trên Trái Đất mới xuất hiện

tinybook tinybook 6 ngày 21 giờ
Phân tích đá Mặt Trăng cho thấy nhà chị Hằng từng phát ra từ trường, và nhờ nó sự sống trên Trái Đất mới xuất hiện
Lấy được mẫu đá từ hai cực của Mặt Trăng, ta sẽ biết rõ khẳng định này là đúng hay sai.

Sử dụng năng lượng Mặt Trời, thiết bị này lấy được nước từ không khí khô hanh như sa mạc

tinybook tinybook 6 ngày 22 giờ
Sử dụng năng lượng Mặt Trời, thiết bị này lấy được nước từ không khí khô hanh như sa mạc
Toàn bộ hệ thống chỉ nặng 7kg.

Bay liên tục 13.000 km không cần nghỉ, loài chim 'máy bay phản lực' lập kỷ lục vô tiền khoáng hậu

tinybook tinybook 1 tuần 3 giờ
Bay liên tục 13.000 km không cần nghỉ, loài chim máy bay phản lực lập kỷ lục vô tiền khoáng hậu
Bay hơn 12.000km từ Alaska đến New Zealand trong 11 ngày không ngừng nghỉ, một con chim choắt mỏ thẳng đuôi vằn xác lập một kỷ lục vô tiền khoáng hậu trong thế giới động vật.

Đột phá: lần đầu tiên khoa học đạt được siêu dẫn ở nhiệt độ phòng

tinybook tinybook 1 tuần 23 giờ
Đột phá: lần đầu tiên khoa học đạt được siêu dẫn ở nhiệt độ phòng
"Trạng thái siêu dẫn" vẫn là mục tiêu của khoa học vật chất suốt nhiều thập kỷ nay, và chúng ta đã đi được nửa chặng đường với đột phá mới.

Não sôi lên, hộp sọ nổ tung, cơ bắp bốc hơi và mô bị thủy tinh hóa, khoảnh khắc bị núi lửa hủy diệt còn kinh hoàng hơn địa ngục

tinybook tinybook 1 tuần 1 ngày
Não sôi lên, hộp sọ nổ tung, cơ bắp bốc hơi và mô bị thủy tinh hóa, khoảnh khắc bị núi lửa hủy diệt còn kinh hoàng hơn địa ngục
Núi lửa là một vết đứt gãy trên lớp vỏ của một hành tinh, như là Trái Đất cho phép dung nham, tro núi lửa, và khí thoát ra từ một lò magma ở dưới bề mặt.

Khoa học tìm ra giới hạn trên của tốc độ âm thanh: 36 km/s

tinybook tinybook 1 tuần 1 ngày
Khoa học tìm ra giới hạn trên của tốc độ âm thanh: 36 km/s
Trên lý thuyết, âm thanh truyền qua vật liệu hydro kim loại (mới chỉ tồn tại trên lý thuyết) sẽ có tốc độ cao nhất, gần với mốc 36 km/s.

4 lý do khiến TMĐT ngày càng thu hút tín đồ công nghệ

tinybook tinybook 1 tuần 2 ngày
4 lý do khiến TMĐT ngày càng thu hút tín đồ công nghệ
Với hàng loạt ưu đãi độc quyền hấp dẫn, cam kết xuất xứ và chính sách hậu mãi “sang xịn”, sự bùng nổ đơn hàng công nghệ trong những Lễ Hội mua sắm đã và đang chứng tỏ vị thế của hệ thống gian hàng chính hãng trên TMĐT trong lòng fan công nghệ.

Nếu không ngửi được 2 mùi này thì nhiều khả năng bạn đã mắc phải COVID-19

tinybook tinybook 1 tuần 2 ngày
Nếu không ngửi được 2 mùi này thì nhiều khả năng bạn đã mắc phải COVID-19
Mất khứu giác và vị giác là một trong những triệu chứng do coronavirus được báo cáo phổ biến nhất, và cũng là một trong những dấu hiệu rõ ràng nhất về sự hiện diện của virus SARS-CoV-2.

Đây là lý do tại sao ta nên xây cơ sở hạ tầng internet lượng tử trên quỹ đạo

tinybook tinybook 1 tuần 2 ngày
Đây là lý do tại sao ta nên xây cơ sở hạ tầng internet lượng tử trên quỹ đạo
Nghiên cứu mới chỉ ra rằng với một dàn 400 vệ tinh lượng tử, ta sẽ "dễ dàng" có được internet lượng tử toàn cầu.

6 dấu hiệu cho thấy nhà bạn có vấn đề về điện, cần khắc phục 'càng sớm càng tốt'

tinybook tinybook 1 tuần 3 ngày
6 dấu hiệu cho thấy nhà bạn có vấn đề về điện, cần khắc phục càng sớm càng tốt
Các nghiên cứu đã chỉ ra rằng hầu hết các ngôi nhà không tuân theo các biện pháp an toàn được khuyến nghị để ngăn ngừa điện giật và hỏa hoạn, tuy nhiên một số dấu hiệu dễ nhận thấy có thể giúp tìm ra vấn đề trước khi mọi thứ vượt khỏi tầm tay.

Mổ xẻ trạm gốc 5G Huawei mới thấy công ty Trung Quốc cần linh kiện Mỹ đến mức nào

tinybook tinybook 1 tuần 3 ngày
Mổ xẻ trạm gốc 5G Huawei mới thấy công ty Trung Quốc cần linh kiện Mỹ đến mức nào
Gần 30% giá trị trạm gốc 5G của Huawei thuộc về các linh kiện Mỹ, hầu hết trong số đó là các con chip tối quan trọng cho việc xử lý tín hiệu radio, điều khiển nguồn năng lượng cũng như chip nhớ.
tinybook Công Nghệ Thông Tin








Chat