Mô hình “thần thánh” reCAPTCHA: Biến người dùng Internet thành “nhân công” miễn phí, điện tử hóa 17.600 quyển sách mỗi năm, khiến Google chi 30 triệu USD thâu tóm!

Mô hình “thần thánh” reCAPTCHA: Biến người dùng Internet thành “nhân công” miễn phí, điện tử hóa 17.600 quyển sách mỗi năm, khiến Google chi 30 triệu USD thâu tóm!
Theo: Lê Thanh Sang
Thể loại: Khoa Học Công Nghệ
Nếu đã từng trả lời một trong những mẫu reCAPTCHA dưới đây thì xin chúc mừng bạn! Chữ mà bạn nhập giờ đã nằm trong một bài báo của tờ New York Time lừng danh hoặc được lưu trữ tại thư viện lớn nhất thế giới Google Books.

Nội dung nổi bật:

Bối cảnh: Để phòng tránh các cuộc tấn công mạng, chủ website thường sử dụng CAPTCHA như một phương tiện vừa hiệu quả vừa miễn phí.

Kế hoạch: Phát hiện ra sự "lãng phí" của CAPTCHA, Luis von Ahn đã viết nên reCAPTCHA, với nhiệm vụ vừa bảo vệ website, vừa có khả năng dịch văn bản cực kỳ chính xác.

Kết quả: 17.600 quyển sách được số hóa chỉ trong một năm. reCAPTCHA nhanh chóng được Google mua lại sau 2 năm thành lập với giá gần 30 triệu USD!

Captcha và reCaptcha

Mô hình “thần thánh” reCAPTCHA: Biến người dùng Internet thành “nhân công” miễn phí, điện tử hóa 17.600 quyển sách mỗi năm, khiến Google chi 30 triệu USD thâu tóm! - Ảnh 1.

Đã quá quen thuộc với tất cả người dùng Internet, Captcha là một công đoạn phiền toái nhưng cũng dễ dàng vượt qua để chứng minh người dùng thật sự là con người chứ không phải robot.

Thuật ngữ CAPTCHA viết tắt từ Hệ thống Tự động Phân biệt Con người và Máy tính (Completely Automated Public Turing test to tell Computers and Humans Apart), và là đứa con tinh thần của Luis von Ahn từ Đại học Carnegie Mellon.

Captcha được nhiều trang web sử dụng để phòng tránh các cuộc tấn công từ chối dịch vụ hàng loạt hoặc đánh cắp dữ liệu vì sự hiệu quả cũng như giá thành "0 đồng" của mình.

Tuy nhiên, nhà sáng lập Luis nhanh chóng nhận ra rằng, tuy mỗi người chỉ tốn vài giây để hoàn tất một mẫu Captcha, nếu tính tổng cộng số người dùng khổng lồ trên Internet, mỗi ngày có đến hàng trăm ngàn giờ lao động "lãng phí" đang được đổ vào Captcha.

Mô hình “thần thánh” reCAPTCHA: Biến người dùng Internet thành “nhân công” miễn phí, điện tử hóa 17.600 quyển sách mỗi năm, khiến Google chi 30 triệu USD thâu tóm! - Ảnh 2.

Nhằm tận dụng những giờ lao động quý giá này, Luis cho ra đời reCAPTCHA vào năm 2007.

reCAPTCHA về cơ bản vẫn là một chương trình CAPTCHA thông thường, ngay từ lúc xuất hiện, reCAPTCHA đã chủ động giới thiệu bản thân là một dịch vụ hoàn toàn miễn phí và cực kỳ dễ sử dụng cho các chủ sở hữu website.

Không lâu sau đó, reCAPTCHA được sử dụng rộng rãi và trở thành chương trình phòng vệ mặc định của rất nhiều trang web lớn.

Nhưng ít ai biết được mô hình kinh doanh "thiên tài" đằng sau chương trình miễn phí này.

Hàng chục triệu người dùng Internet đang bị biến thành những "cỗ máy đánh chữ", đều đặn gõ hàng triệu chữ cái mỗi ngày, điện tử hóa hàng ngàn quyển sách, tạp chí, bài báo từ xa xưa mà không hề hay biết.

reCAPTCHA hoạt động như thế nào?

Mô hình “thần thánh” reCAPTCHA: Biến người dùng Internet thành “nhân công” miễn phí, điện tử hóa 17.600 quyển sách mỗi năm, khiến Google chi 30 triệu USD thâu tóm! - Ảnh 3.

So với các phần mềm nhận dạng khác, reCAPTCHA yêu cầu người dùng phải nhập 2 chữ cái khác nhau thay vì 1 chữ.

Và cũng không giống các CAPTCHA còn lại, reCAPTCHA không tự động "tạo" những chữ khó nhìn để đánh đố người dùng mà lấy hẳn hình ảnh từ các văn bản vật lý (sách, báo, tờ rơi…) mà phần mềm nhận diện mặt chữ (Optical Character Recognition - OCR) không thể giải quyết được.

Các phần mềm OCR luôn được sử dụng để chuyển các trang sách, tạp chí, bài báo từ bản in sang bản điện tử để lưu trữ cũng như phân phối. Nhưng OCR cũng chỉ là một phần mềm "bắt chước" khả năng đọc của con người, nếu như trang giấy có dấu hiệu sờn, cũ hoặc xuống cấp, OCR sẽ ngay lập tức không nhận diện được, dù một người bình thường có thể dễ dàng nhận ra chữ đó là gì.

Quay lại với reCAPTCHA, trong 2 chữ mà chương trình này "thách thức" người dùng, một chữ đã được nhận diện và lưu trong kho dữ liệu, một chữ còn lại sẽ đến từ danh sách các từ mà OCR không đọc được ở trên.

Nếu có ít nhất 6 người dùng cùng sử dụng một chữ để thay thế cho hình ảnh mà OCR không nhận diện được, reCAPTCHA sẽ xem nó như là một từ đã được "điện tử hóa" thành công.

reCAPTCHA "bán mình" như thế nào?

Mô hình “thần thánh” reCAPTCHA: Biến người dùng Internet thành “nhân công” miễn phí, điện tử hóa 17.600 quyển sách mỗi năm, khiến Google chi 30 triệu USD thâu tóm! - Ảnh 4.

Với khả năng đọc chữ chính xác "gấp 6 lần người thường", reCAPTCHA nhanh chóng ký hợp đồng với tờ báo danh tiếng New York Times để điện tử hóa tất cả bài viết cũ. Chỉ trong vài tháng hợp tác, reCAPTCHA đã dễ dàng điện tử hóa tất cả bài viết của New York Times trong vòng 20 năm trước khi có máy tính.

Và chỉ trong một năm hoạt động, hơn 440 triệu từ đã được điện tử hóa thành công, tương đương với gần 17.600 quyển sách!

Vào năm 2009, tức là chỉ 2 năm kể từ lúc thành lập, reCAPTCHA nhanh chóng được Google mua lại với một khoản tiền không được công bố (nhưng vài chuyên gia dự đoán giá trị ít nhất là 30 triệu USD).

Ngay sau khi thâu tóm, Google ngay lập tức sử dụng reCAPTCHA cho Google Books, biến đây trở thành thư viện điện tử lớn nhất thế giới chỉ sau vài năm.

Mô hình “thần thánh” reCAPTCHA: Biến người dùng Internet thành “nhân công” miễn phí, điện tử hóa 17.600 quyển sách mỗi năm, khiến Google chi 30 triệu USD thâu tóm! - Ảnh 5.

Không những thế, Google còn sử dụng reCAPTCHA cho nhiều mục đích khác, chẳng hạn như giải mã biển tên đường hay số nhà trên Google Maps Street View, phân biệt các phương tiện và biển hiệu giao thông cho dự án xe không người lái …

Có thể thấy rằng reCAPTCHA đã nhanh chóng chứng minh giá trị của mình và "hoàn vốn" nhanh chóng cho Google qua các ứng dụng trên.

reCAPTCHA là tấm gương của mô hình kinh doanh đơn giản mà hiệu quả. An ninh mạng và Nhận diện chữ viết là hai việc hoàn toàn không liên quan đến nhau, nhưng Luis đã kết nối được hai phạm trù này để "tận dụng" hàng triệu người trên khắp thế giới làm việc cho mình, tối ưu hóa nguồn lực của xã hội trước khi định nghĩa "kinh tế chia sẻ" được ra đời.

Làm sao để bắt chước reCAPTCHA?

Mô hình “thần thánh” reCAPTCHA: Biến người dùng Internet thành “nhân công” miễn phí, điện tử hóa 17.600 quyển sách mỗi năm, khiến Google chi 30 triệu USD thâu tóm! - Ảnh 6.

Để "tận dụng nguồn lực" nhàn rỗi như reCAPTCHA, một mô hình mới cần phải thỏa mãn các điều kiện sau:

- Phục vụ một nhu cầu trực tuyến (Chẳng hạn như xác nhận người dùng không phải là robot).

- Phân phối hoàn toàn miễn phí.

- Thu thập nguồn lực đến từ khắp nơi trên thế giới để tạo ra một giải pháp mà công nghệ chưa đủ phát triển để giải quyết.

- Tìm cách bán giải pháp đó.

Sau khi thành công với reCAPTCHA, Luis đã thành lập Duolingo vào năm 2011, nhằm cung cấp một dịch vụ học ngôn ngữ hoàn toàn miễn phí và đi kèm là "giải pháp" dịch thuật chính xác hơn bất kỳ trí thông minh nhân tạo nào.

Nhưng cho đến nay, Duolingo dần chuyển qua mô hình "khuyến khích" người dùng đóng phí để học hiệu quả hơn cho thấy thành công của reCAPTCHA khó lặp lại hơn mọi người nghĩ.

7 cơ hội việc làm mới đầy hấp dẫn hứa hẹn sẽ được tạo ra nhờ robot

tinybook tinybook 3 tháng 6 ngày
7 cơ hội việc làm mới đầy hấp dẫn hứa hẹn sẽ được tạo ra nhờ robot
Khác xa với sự bi quan của nhiều người về việc robot có thể thay thế con người làm nhiều việc và gián tiếp thúc đẩy tình trạng thất nghiệp, tuy nhiên robot hoàn toàn có thể tạo ra thêm nhiều việc làm mới.

[Video] Cận cảnh quá trình thử nghiệm hệ thống tên lửa đẩy trên tàu vũ trụ Orion của NASA

tinybook tinybook 3 tháng 6 ngày
[Video] Cận cảnh quá trình thử nghiệm hệ thống tên lửa đẩy trên tàu vũ trụ Orion của NASA
Quá trình thử nghiệm tên lửa đẩy rất quan trọng vì nó quyết định phần lớn sự thành công của việc đưa tàu vũ trụ Orion của NASA đi vào đúng quỹ đạo và tiếp cận được Mặt Trăng.

Cận cảnh chuyên gia Nhật Bản tắm nước sông Tô Lịch

tinybook tinybook 3 tháng 1 tuần
Cận cảnh chuyên gia Nhật Bản tắm nước sông Tô Lịch
Chuyên gia Nhật Bản hy vọng trong tương lai, khi cả sông được xử lý làm sạch bằng công nghệ Nano, nước sông Tô Lịch lại trong xanh.

Vệ tinh không chỉ dẫn đường, giám sát thiên tai mà đã có thể dự đoán khi nào một cây cầu sắp sập

tinybook tinybook 3 tháng 1 tuần
Vệ tinh không chỉ dẫn đường, giám sát thiên tai mà đã có thể dự đoán khi nào một cây cầu sắp sập
Vệ tinh không chỉ dẫn đường, giám sát thiên tai mà đã có thể dự đoán khi nào một cây cầu sắp sập

Tìm được loại men ủ hơn 4500 năm, nhà khoa học thử chế biến và thành công với món bánh mì nướng thơm ngon lạ lùng

tinybook tinybook 3 tháng 1 tuần
Tìm được loại men ủ hơn 4500 năm, nhà khoa học thử chế biến và thành công với món bánh mì nướng thơm ngon lạ lùng
Có thể bạn vẫn sẽ tin tưởng và ăn một chiếc bánh bị hết hạn một hoặc hai ngày. Nhưng bạn có dám ăn một chiếc bánh mì nướng đã hết hạn sử dụng quá 4500 năm hay không?

Chiêm ngưỡng ảnh đẹp như mơ chụp bằng smartphone OPPO

tinybook tinybook 3 tháng 1 tuần
Chiêm ngưỡng ảnh đẹp như mơ chụp bằng smartphone OPPO
Đây là những bức ảnh xuất sắc nhất đã thắng giải trrong cuộc thi OPPO Creators Awards năm 2019. Cuộc thi hướng đến cộng đồng người dùng smartphone đam mê nhiếp ảnh trên toàn cầu, với thông điệp :”See Beyond” (Vượt chuẩn tầm nhìn).

Cận cảnh dàn nội thất siêu hiện đại sắp được trang bị cho các máy bay của Airbus trong tương lai

tinybook tinybook 3 tháng 1 tuần
Cận cảnh dàn nội thất siêu hiện đại sắp được trang bị cho các máy bay của Airbus trong tương lai
Cụ thể, dàn nội thất này sẽ được mang lên các mẫu máy bay A330, với tên gọi mới là A330neo Airspace.

Một công ty xây dựng tại Mỹ cung cấp dịch vụ biến sân vườn thành bãi biển nhân tạo với biển xanh, cát trắng, nắng vàng

tinybook tinybook 3 tháng 1 tuần
Một công ty xây dựng tại Mỹ cung cấp dịch vụ biến sân vườn thành bãi biển nhân tạo với biển xanh, cát trắng, nắng vàng
Chỉ cần bỏ ra từ 20 ngàn USD, bạn có thể biến một khoảng sân nhà bạn trở thành bãi biển nhiệt đới đầy nắng và gió ngay trong đời thực.

Ngọn hải đăng bị cô lập ở Iceland này là nơi hoàn hảo để tránh một đại dịch zombie

tinybook tinybook 3 tháng 1 tuần
Ngọn hải đăng bị cô lập ở Iceland này là nơi hoàn hảo để tránh một đại dịch zombie
Một ngọn hải đăng đặc biệt ở Iceland được mệnh danh là địa điểm hoàn hảo để sống sót nếu như có một ngày đại dịch zombie xảy ra.

Các nhà khoa học Nhật chế tạo một chiếc đuôi máy, vì nghĩ rằng con người không có đuôi là một thiếu sót lớn

tinybook tinybook 3 tháng 1 tuần
Các nhà khoa học Nhật chế tạo một chiếc đuôi máy, vì nghĩ rằng con người không có đuôi là một thiếu sót lớn
Sẽ ra sao nếu con người có đuôi?

Đã có 'siêu thực phẩm' có thể cứu đói cả nhân loại: Tất cả chỉ nhờ loại thực vật nhỏ bé này!

tinybook tinybook 3 tháng 1 tuần
Đã có siêu thực phẩm có thể cứu đói cả nhân loại: Tất cả chỉ nhờ loại thực vật nhỏ bé này!
Một công ty khởi nghiệp ở Anh đã tạo ra một loại thực phẩm chỉ từ vi tảo nhưng đáp ứng đầy đủ mọi nhu cầu dưỡng chất cho cơ thể.

Kết hợp 2 kỹ thuật diệt muỗi bí truyền, các nhà khoa học triệt tiêu được 94% lượng muỗi tại hai hòn đảo Trung Quốc

tinybook tinybook 3 tháng 1 tuần
Kết hợp 2 kỹ thuật diệt muỗi bí truyền, các nhà khoa học triệt tiêu được 94% lượng muỗi tại hai hòn đảo Trung Quốc
Báo cáo khoa học mới cho ta hy vọng về một miền đất hứa, nơi con người không còn bị muỗi đốt mỗi khi hè tới.

Sự đáng sợ của biến đổi khí hậu: Đến động vật ở vùng lạnh nhất cũng không thể sống nổi nữa

tinybook tinybook 3 tháng 1 tuần
Sự đáng sợ của biến đổi khí hậu: Đến động vật ở vùng lạnh nhất cũng không thể sống nổi nữa
Biến đổi khí hậu đã khiến động vật chết hàng loạt khi nhiệt độ tăng đột biến tại một số khu vực.

Nhà hoạt động vì quyền động vật hô hào người dân "để yên cho muỗi hút máu vì nó còn phải nuôi con"

tinybook tinybook 3 tháng 1 tuần
Nhà hoạt động vì quyền động vật hô hào người dân "để yên cho muỗi hút máu vì nó còn phải nuôi con"
Trong khi cả thế giới đang ra sức diệt muỗi, người đàn ông này lại kêu gọi mọi người để loài côn trùng này được yên thân.

Khi bị ong bắp cày tấn công, ong mật Nhật Bản sẽ bu lấy đối thủ, đồng loạt rung lên để nướng chín kẻ địch

tinybook tinybook 3 tháng 1 tuần
Khi bị ong bắp cày tấn công, ong mật Nhật Bản sẽ bu lấy đối thủ, đồng loạt rung lên để nướng chín kẻ địch
Tự nhiên kỳ diệu làm sao!

Thứ gì chúng ta tạo ra được nhưng không thể chứa đựng được? Nếu bạn đoán "tình yêu dành cho crush" thì sai bét!

tinybook tinybook 3 tháng 1 tuần
Thứ gì chúng ta tạo ra được nhưng không thể chứa đựng được? Nếu bạn đoán "tình yêu dành cho crush" thì sai bét!
Hóa ra các nhà hóa học đang giữ đáp án cho câu hỏi này.

Tại sao hầu hết bảng mạch in lại có màu xanh lá cây trong khi của Apple lại màu đen?

tinybook tinybook 3 tháng 1 tuần
Tại sao hầu hết bảng mạch in lại có màu xanh lá cây trong khi của Apple lại màu đen?
Dù các bảng mạch màu xanh lá cây giúp việc kiểm tra bản mạch hiệu quả hơn, nhưng khi quá trình này được tự động hóa cao hơn, màu sắc của nó trở nên không còn quá quan trọng nữa.

Cách sử dụng phần mềm trên máy bay 300 triệu USD: cứ 149 tiếng thì nhớ phải tắt đi bật lại

tinybook tinybook 3 tháng 1 tuần
Cách sử dụng phần mềm trên máy bay 300 triệu USD: cứ 149 tiếng thì nhớ phải tắt đi bật lại
Bệnh "lag" không của riêng ai.

Bạn có biết: Quân đội Mỹ từng thả cả cả dàn nhạc cụ xuống căn cứ cho binh lính giải trí sau những giờ chiến đấu căng thẳng

tinybook tinybook 3 tháng 1 tuần
Bạn có biết: Quân đội Mỹ từng thả cả cả dàn nhạc cụ xuống căn cứ cho binh lính giải trí sau những giờ chiến đấu căng thẳng
Trong chiến tranh, người lính cũng cần được giải trí và quân đội Mỹ có một cách để giải trí rất hữu hiệu cho binh lính, đó là mang đàn piano và các nhạc cụ ra ngoài chiến trường.

Độc đáo ý tưởng khách sạn xây dựng sát vách núi với hồ bơi vô cực kéo dài ngoài mỏm đá

tinybook tinybook 3 tháng 1 tuần
Độc đáo ý tưởng khách sạn xây dựng sát vách núi với hồ bơi vô cực kéo dài ngoài mỏm đá
Nếu bạn đủ can đảm dạo bước ngoài ban công khách sạn, thậm chí là thả mình trong hồ bơi kéo dài ra ngoài vách núi, có lẽ bạn là một trong số những người gan dạ nhất trên hành tinh.

Lốc xoáy bình thường xưa rồi, đoạn video lốc xoáy... than này sẽ khiến bạn phải sững sờ

tinybook tinybook 3 tháng 1 tuần
Lốc xoáy bình thường xưa rồi, đoạn video lốc xoáy... than này sẽ khiến bạn phải sững sờ
Nếu như năm ngoái là năm của lốc xoáy lửa, thì năm nay chúng ta có lốc xoáy than.

Bằng dung dịch từ tính do NASA sáng chế, chàng trai 18 tuổi tìm ra cách lọc vi nhựa khỏi nước

tinybook tinybook 3 tháng 1 tuần
Bằng dung dịch từ tính do NASA sáng chế, chàng trai 18 tuổi tìm ra cách lọc vi nhựa khỏi nước
Fionn Ferreira nhận về 50.000 USD tiền thưởng từ Hội chợ Khoa học Google. Một phần thưởng xứng đáng cho nỗ lực cứu lấy nhân loại!

Chiếc xe đạp tự lái này cho thấy sự tiến bộ trong khả năng thiết kế chip của Trung Quốc

tinybook tinybook 3 tháng 1 tuần
Chiếc xe đạp tự lái này cho thấy sự tiến bộ trong khả năng thiết kế chip của Trung Quốc
Nhờ thiết kế lai giữa kiến trúc chip thông thường với các mạng lưới thần kinh nhân tạo, chip Tianjic có thể mang tới nhiều khả năng cao cấp cho chiếc xe đạp tự lái.

Đây là hệ thống dùng năng lượng Mặt Trời để biến nước biển thành nước ngọt, tạo ra được 75.000 lít nước/ngày với giá chỉ 58 VNĐ/lít

tinybook tinybook 3 tháng 1 tuần
Đây là hệ thống dùng năng lượng Mặt Trời để biến nước biển thành nước ngọt, tạo ra được 75.000 lít nước/ngày với giá chỉ 58 VNĐ/lít
Nó sẽ giải quyết được vấn nạn thiếu nước nhân loại đã đang đối mặt.

Nghiên cứu mới: Uống rượu vang đỏ giúp giảm stress và trầm cảm nhờ vào một hợp chất đặc biệt

tinybook tinybook 3 tháng 1 tuần
Nghiên cứu mới: Uống rượu vang đỏ giúp giảm stress và trầm cảm nhờ vào một hợp chất đặc biệt
Việc phát hiện một hợp chất đặc biệt trong rượu vang đỏ đã mở đường cho việc phát triển các loại thuốc chống trầm cảm và lo âu mới có nguồn gốc thiên nhiên.

Giải ngố về Eternals, tập hợp siêu anh hùng sở hữu quyền năng vô song sắp xuất hiện trong Vũ trụ Điện ảnh Marvel

tinybook tinybook 3 tháng 1 tuần
Giải ngố về Eternals, tập hợp siêu anh hùng sở hữu quyền năng vô song sắp xuất hiện trong Vũ trụ Điện ảnh Marvel
Trong bài viết này sẽ đi sâu hơn vào tiểu sử và các thông tin về nhóm siêu anh hùng the Eternals.

Hỏi khó: Thuốc độc lúc hết hạn sẽ không độc nữa hay còn nguy hiểm hơn?

tinybook tinybook 3 tháng 2 tuần
Hỏi khó: Thuốc độc lúc hết hạn sẽ không độc nữa hay còn nguy hiểm hơn?
Đã bao giờ bạn tự hỏi chuyện gì sẽ xảy ra với chai thuốc diệt chuột hết hạn từ năm ngoái của nhà mình chưa? Thời gian chắc chắn đã làm nó bị hỏng – nhưng mà "hỏng" theo cách nào nhỉ?

Chiếc xe đạp điện giá 3.000 USD được quảng cáo "không thể bị ăn trộm" bị phá khóa trong chưa đầy 60 giây

tinybook tinybook 3 tháng 2 tuần
Chiếc xe đạp điện giá 3.000 USD được quảng cáo "không thể bị ăn trộm" bị phá khóa trong chưa đầy 60 giây
Trên đời này không có thứ gì tuyệt đối cả.

Các nhà khoa học phát minh ra loại vải càng thơm khi càng thấm nhiều mồ hôi

tinybook tinybook 3 tháng 2 tuần
Các nhà khoa học phát minh ra loại vải càng thơm khi càng thấm nhiều mồ hôi
Bộ quần áo bạn mặc khi tập thể dục thể thao sẽ kiêm luôn vai trò máy lọc không khí!

Giải ngố về AGI: Trí tuệ nhân tạo có thể đưa nhân loại sang trang mới, lại vừa có thể dẫn đến họa diệt vong nếu rơi vào tay kẻ xấu

tinybook tinybook 3 tháng 2 tuần
Giải ngố về AGI: Trí tuệ nhân tạo có thể đưa nhân loại sang trang mới, lại vừa có thể dẫn đến họa diệt vong nếu rơi vào tay kẻ xấu
Giờ là thời điểm năm 2019, một loạt những công nghệ tưởng như bất khả thi đã đang tìm được đường ra tới đời thực. Trong số đó, ta có Trí tuệ Phổ biến Nhân tạo - Artificial General Intelligence.
tinybook Công Nghệ Thông Tin








Chat