Mô hình “thần thánh” reCAPTCHA: Biến người dùng Internet thành “nhân công” miễn phí, điện tử hóa 17.600 quyển sách mỗi năm, khiến Google chi 30 triệu USD thâu tóm!

Mô hình “thần thánh” reCAPTCHA: Biến người dùng Internet thành “nhân công” miễn phí, điện tử hóa 17.600 quyển sách mỗi năm, khiến Google chi 30 triệu USD thâu tóm!
Theo: Lê Thanh Sang
Thể loại: Khoa Học Công Nghệ
Nếu đã từng trả lời một trong những mẫu reCAPTCHA dưới đây thì xin chúc mừng bạn! Chữ mà bạn nhập giờ đã nằm trong một bài báo của tờ New York Time lừng danh hoặc được lưu trữ tại thư viện lớn nhất thế giới Google Books.

Nội dung nổi bật:

Bối cảnh: Để phòng tránh các cuộc tấn công mạng, chủ website thường sử dụng CAPTCHA như một phương tiện vừa hiệu quả vừa miễn phí.

Kế hoạch: Phát hiện ra sự "lãng phí" của CAPTCHA, Luis von Ahn đã viết nên reCAPTCHA, với nhiệm vụ vừa bảo vệ website, vừa có khả năng dịch văn bản cực kỳ chính xác.

Kết quả: 17.600 quyển sách được số hóa chỉ trong một năm. reCAPTCHA nhanh chóng được Google mua lại sau 2 năm thành lập với giá gần 30 triệu USD!

Captcha và reCaptcha

Mô hình “thần thánh” reCAPTCHA: Biến người dùng Internet thành “nhân công” miễn phí, điện tử hóa 17.600 quyển sách mỗi năm, khiến Google chi 30 triệu USD thâu tóm! - Ảnh 1.

Đã quá quen thuộc với tất cả người dùng Internet, Captcha là một công đoạn phiền toái nhưng cũng dễ dàng vượt qua để chứng minh người dùng thật sự là con người chứ không phải robot.

Thuật ngữ CAPTCHA viết tắt từ Hệ thống Tự động Phân biệt Con người và Máy tính (Completely Automated Public Turing test to tell Computers and Humans Apart), và là đứa con tinh thần của Luis von Ahn từ Đại học Carnegie Mellon.

Captcha được nhiều trang web sử dụng để phòng tránh các cuộc tấn công từ chối dịch vụ hàng loạt hoặc đánh cắp dữ liệu vì sự hiệu quả cũng như giá thành "0 đồng" của mình.

Tuy nhiên, nhà sáng lập Luis nhanh chóng nhận ra rằng, tuy mỗi người chỉ tốn vài giây để hoàn tất một mẫu Captcha, nếu tính tổng cộng số người dùng khổng lồ trên Internet, mỗi ngày có đến hàng trăm ngàn giờ lao động "lãng phí" đang được đổ vào Captcha.

Mô hình “thần thánh” reCAPTCHA: Biến người dùng Internet thành “nhân công” miễn phí, điện tử hóa 17.600 quyển sách mỗi năm, khiến Google chi 30 triệu USD thâu tóm! - Ảnh 2.

Nhằm tận dụng những giờ lao động quý giá này, Luis cho ra đời reCAPTCHA vào năm 2007.

reCAPTCHA về cơ bản vẫn là một chương trình CAPTCHA thông thường, ngay từ lúc xuất hiện, reCAPTCHA đã chủ động giới thiệu bản thân là một dịch vụ hoàn toàn miễn phí và cực kỳ dễ sử dụng cho các chủ sở hữu website.

Không lâu sau đó, reCAPTCHA được sử dụng rộng rãi và trở thành chương trình phòng vệ mặc định của rất nhiều trang web lớn.

Nhưng ít ai biết được mô hình kinh doanh "thiên tài" đằng sau chương trình miễn phí này.

Hàng chục triệu người dùng Internet đang bị biến thành những "cỗ máy đánh chữ", đều đặn gõ hàng triệu chữ cái mỗi ngày, điện tử hóa hàng ngàn quyển sách, tạp chí, bài báo từ xa xưa mà không hề hay biết.

reCAPTCHA hoạt động như thế nào?

Mô hình “thần thánh” reCAPTCHA: Biến người dùng Internet thành “nhân công” miễn phí, điện tử hóa 17.600 quyển sách mỗi năm, khiến Google chi 30 triệu USD thâu tóm! - Ảnh 3.

So với các phần mềm nhận dạng khác, reCAPTCHA yêu cầu người dùng phải nhập 2 chữ cái khác nhau thay vì 1 chữ.

Và cũng không giống các CAPTCHA còn lại, reCAPTCHA không tự động "tạo" những chữ khó nhìn để đánh đố người dùng mà lấy hẳn hình ảnh từ các văn bản vật lý (sách, báo, tờ rơi…) mà phần mềm nhận diện mặt chữ (Optical Character Recognition - OCR) không thể giải quyết được.

Các phần mềm OCR luôn được sử dụng để chuyển các trang sách, tạp chí, bài báo từ bản in sang bản điện tử để lưu trữ cũng như phân phối. Nhưng OCR cũng chỉ là một phần mềm "bắt chước" khả năng đọc của con người, nếu như trang giấy có dấu hiệu sờn, cũ hoặc xuống cấp, OCR sẽ ngay lập tức không nhận diện được, dù một người bình thường có thể dễ dàng nhận ra chữ đó là gì.

Quay lại với reCAPTCHA, trong 2 chữ mà chương trình này "thách thức" người dùng, một chữ đã được nhận diện và lưu trong kho dữ liệu, một chữ còn lại sẽ đến từ danh sách các từ mà OCR không đọc được ở trên.

Nếu có ít nhất 6 người dùng cùng sử dụng một chữ để thay thế cho hình ảnh mà OCR không nhận diện được, reCAPTCHA sẽ xem nó như là một từ đã được "điện tử hóa" thành công.

reCAPTCHA "bán mình" như thế nào?

Mô hình “thần thánh” reCAPTCHA: Biến người dùng Internet thành “nhân công” miễn phí, điện tử hóa 17.600 quyển sách mỗi năm, khiến Google chi 30 triệu USD thâu tóm! - Ảnh 4.

Với khả năng đọc chữ chính xác "gấp 6 lần người thường", reCAPTCHA nhanh chóng ký hợp đồng với tờ báo danh tiếng New York Times để điện tử hóa tất cả bài viết cũ. Chỉ trong vài tháng hợp tác, reCAPTCHA đã dễ dàng điện tử hóa tất cả bài viết của New York Times trong vòng 20 năm trước khi có máy tính.

Và chỉ trong một năm hoạt động, hơn 440 triệu từ đã được điện tử hóa thành công, tương đương với gần 17.600 quyển sách!

Vào năm 2009, tức là chỉ 2 năm kể từ lúc thành lập, reCAPTCHA nhanh chóng được Google mua lại với một khoản tiền không được công bố (nhưng vài chuyên gia dự đoán giá trị ít nhất là 30 triệu USD).

Ngay sau khi thâu tóm, Google ngay lập tức sử dụng reCAPTCHA cho Google Books, biến đây trở thành thư viện điện tử lớn nhất thế giới chỉ sau vài năm.

Mô hình “thần thánh” reCAPTCHA: Biến người dùng Internet thành “nhân công” miễn phí, điện tử hóa 17.600 quyển sách mỗi năm, khiến Google chi 30 triệu USD thâu tóm! - Ảnh 5.

Không những thế, Google còn sử dụng reCAPTCHA cho nhiều mục đích khác, chẳng hạn như giải mã biển tên đường hay số nhà trên Google Maps Street View, phân biệt các phương tiện và biển hiệu giao thông cho dự án xe không người lái …

Có thể thấy rằng reCAPTCHA đã nhanh chóng chứng minh giá trị của mình và "hoàn vốn" nhanh chóng cho Google qua các ứng dụng trên.

reCAPTCHA là tấm gương của mô hình kinh doanh đơn giản mà hiệu quả. An ninh mạng và Nhận diện chữ viết là hai việc hoàn toàn không liên quan đến nhau, nhưng Luis đã kết nối được hai phạm trù này để "tận dụng" hàng triệu người trên khắp thế giới làm việc cho mình, tối ưu hóa nguồn lực của xã hội trước khi định nghĩa "kinh tế chia sẻ" được ra đời.

Làm sao để bắt chước reCAPTCHA?

Mô hình “thần thánh” reCAPTCHA: Biến người dùng Internet thành “nhân công” miễn phí, điện tử hóa 17.600 quyển sách mỗi năm, khiến Google chi 30 triệu USD thâu tóm! - Ảnh 6.

Để "tận dụng nguồn lực" nhàn rỗi như reCAPTCHA, một mô hình mới cần phải thỏa mãn các điều kiện sau:

- Phục vụ một nhu cầu trực tuyến (Chẳng hạn như xác nhận người dùng không phải là robot).

- Phân phối hoàn toàn miễn phí.

- Thu thập nguồn lực đến từ khắp nơi trên thế giới để tạo ra một giải pháp mà công nghệ chưa đủ phát triển để giải quyết.

- Tìm cách bán giải pháp đó.

Sau khi thành công với reCAPTCHA, Luis đã thành lập Duolingo vào năm 2011, nhằm cung cấp một dịch vụ học ngôn ngữ hoàn toàn miễn phí và đi kèm là "giải pháp" dịch thuật chính xác hơn bất kỳ trí thông minh nhân tạo nào.

Nhưng cho đến nay, Duolingo dần chuyển qua mô hình "khuyến khích" người dùng đóng phí để học hiệu quả hơn cho thấy thành công của reCAPTCHA khó lặp lại hơn mọi người nghĩ.

4 smartphone bán chạy nhất năm 2018 đều là iPhone, nhưng là iPhone cũ

tinybook tinybook 2 tuần 6 ngày
4 smartphone bán chạy nhất năm 2018 đều là iPhone, nhưng là iPhone cũ
Mặc dù có một số thương hiệu khác như Xiaomi và Samsung cũng xuất hiện trong bảng xếp hạng, tuy nhiên phần lớn smartphone dẫn đầu đều đến từ Apple.

Mạng viễn thông Đông Dương ITelecom ra mắt: Dùng chung hạ tầng VinaPhone, 77.000 đồng được 90GB data/tháng, đầu số 087

tinybook tinybook 3 tuần 5 ngày
Mạng viễn thông Đông Dương ITelecom ra mắt: Dùng chung hạ tầng VinaPhone, 77.000 đồng được 90GB data/tháng, đầu số 087
ITelecom là nhà mạng đầu tiên tại Việt Nam hoạt động theo mô hình mạng viễn thông ảo (MVNO).

Apple bị kiện vì cố tình che giấu sự sụt giảm nhu cầu iPhone tại Trung Quốc

tinybook tinybook 1 tháng 2 ngày
Apple bị kiện vì cố tình che giấu sự sụt giảm nhu cầu iPhone tại Trung Quốc
Phía nguyên đơn cho biết việc Apple bưng bít thông tin là hành vi gian lận vì nó ảnh hưởng đến giá trị cổ phiếu cũng như định giá công ty.

Huawei: “Apple chưa hỏi mua chip 5G của chúng tôi”

tinybook tinybook 1 tháng 4 ngày
Huawei: “Apple chưa hỏi mua chip 5G của chúng tôi”
Huawei vừa chính thức bác bỏ tin đồn liên quan đến việc cung cấp chip mạng 5G cho các mẫu iPhone tiếp theo của Apple.

NASA cảnh báo các mối đe dọa đối với trái đất do thiên thạch gây ra phải được xem xét nghiêm túc

tinybook tinybook 2 tuần 6 ngày
NASA cảnh báo các mối đe dọa đối với trái đất do thiên thạch gây ra phải được xem xét nghiêm túc
Hôm thứ Hai, người đứng đầu NASA cho biết các thiên thạch có thể phá hủy toàn bộ một tiểu bang của Hoa Kỳ là mối đe dọa thực sự đối với trái đất.

Tiết lộ câu chuyện phía sau việc Steve Jobs chọn Tim Cook làm CEO của Apple

tinybook tinybook 3 tuần 6 giờ
Tiết lộ câu chuyện phía sau việc Steve Jobs chọn Tim Cook làm CEO của Apple
Tiếp nối di sản của người tiền nhiệm vĩ đại – Steve Jobs đã để lại không phải là một con đường dễ dàng dành cho Tim Cook.

Ở Hàn Quốc, người ta đang xây dựng một thành phố hiện đại, loại bỏ hoàn toàn nhu cầu sử dụng ô tô

tinybook tinybook 3 tuần 6 giờ
Ở Hàn Quốc, người ta đang xây dựng một thành phố hiện đại, loại bỏ hoàn toàn nhu cầu sử dụng ô tô
Chính phủ Hàn Quốc mong muốn Quận Thương mại Quốc tế IBD trở thành ngọn hải đăng mới trong khía cạnh quy hoạch các thành phố lớn.

Chú ong bắp cày này được đặt theo tên của Dracula vì một lý do ai cũng phải bất ngờ

tinybook tinybook 3 tuần 7 giờ
Chú ong bắp cày này được đặt theo tên của Dracula vì một lý do ai cũng phải bất ngờ
Chú ong bắp cày kỳ lạ này được bảo quản kỹ càng trong hổ phách, và nếu nhìn kỹ, bạn sẽ thấy nó có một tập hợp các bộ phận tạo thành cái miệng treo lủng lẳng từ trên đầu.

Khoảng cách giàu nghèo giữa các nước càng lúc càng lớn vì... biến đổi khí hậu

tinybook tinybook 3 tuần 11 giờ
Khoảng cách giàu nghèo giữa các nước càng lúc càng lớn vì... biến đổi khí hậu
Không chỉ làm chậm tiến trình thu hẹp bất bình đẳng, biến đổi khí hậu còn đang khiến cho khoảng cách giàu nghèo giữa những quốc gia đã phát triển thuộc khu vực hàn đới và các nước đang phát triển ở gần hơn so với xích đạo ngày một trầm trọng thêm.

WHO cấm trẻ dưới 2 tuổi tiếp xúc với màn hình điện tử

tinybook tinybook 3 tuần 18 giờ
WHO cấm trẻ dưới 2 tuổi tiếp xúc với màn hình điện tử
Tổ chức Y tế Thế giới (WHO) đang tiến hành một cách kiên quyết việc cấm cho trẻ nhỏ xem TV hoặc chơi điện thoại thông minh, đồng thời thúc đẩy các bậc cha mẹ giúp con cái họ vận động nhiều và ngủ đủ giấc.

Phát hiện lượng hạt nhân khổng lồ tích trữ trong các dòng sông băng của Trái đất

tinybook tinybook 3 tuần 18 giờ
Phát hiện lượng hạt nhân khổng lồ tích trữ trong các dòng sông băng của Trái đất
Nghiên cứu gần đây nhất được trình bày tại Đại hội đồng Liên minh khoa học địa chất châu Âu năm nay cho thấy các mảnh vụn phóng xạ lưu trữ trong dòng sông băng thực sự có thể trở thành một quả bom hẹn giờ.

Các nhà khoa học đã có thể mô phỏng giọng nói bằng tín hiệu não

tinybook tinybook 3 tuần 19 giờ
Các nhà khoa học đã có thể mô phỏng giọng nói bằng tín hiệu não
Bằng cách thu thập tần số não liên quan đến các chuyển động cơ hàm, môi và lưỡi, các nhà khoa học đã thiết lập nên một hệ thống tạo giọng nói ảo, được nghiên cứu cho những người mất khả năng nói.

[Vietsub] Kem được sản xuất như thế nào?

tinybook tinybook 3 tuần 1 ngày
[Vietsub] Kem được sản xuất như thế nào?
Nhân mấy hôm trời nóng, tranh thủ tìm hiểu quy trình sản xuất kem cho hạ nhiệt nào!

Nhờ hiệu ứng lượng tử, các nhà khoa học tìm được cách tạo nên siêu ổ cứng mới

tinybook tinybook 3 tuần 1 ngày
Nhờ hiệu ứng lượng tử, các nhà khoa học tìm được cách tạo nên siêu ổ cứng mới
Hiệu ứng lượng tử mới phát hiện cho phép các nhà khoa học kiểm soát được hướng quay của các hạt electron trên hợp kim làm nên ổ đĩa cứng, tạo nên các thiết bị lưu trữ mới nhanh hơn, dung lượng lớn hơn đáng kể so với trước.

Smartphone có hoạt động được ngoài không gian không, NASA có cả một dự án để trả lời cho bạn

tinybook tinybook 3 tuần 1 ngày
Smartphone có hoạt động được ngoài không gian không, NASA có cả một dự án để trả lời cho bạn
Không gian vũ trụ vẫn còn nhiều điều cần khám phá, smartphone là một trong những thứ đó.

7 sáng tạo trong ngành công nghiệp quốc phòng gợi nhắc chúng ta về sự nguy hiểm của Skynet và trí tuệ nhân tạo

tinybook tinybook 3 tuần 1 ngày
7 sáng tạo trong ngành công nghiệp quốc phòng gợi nhắc chúng ta về sự nguy hiểm của Skynet và trí tuệ nhân tạo
Những sáng tạo vũ khí ứng dụng trí tuệ nhân tạo trong ngành công nghiệp quốc phòng không đơn thuần chỉ đem lại lợi ích cho con người mà cũng có thể là một mối nguy trong tương lai nếu chúng ta không thể kiểm soát chúng.

50 tuổi vẫn có bộ não của thanh niên 25 tuổi nếu ngồi thiền mỗi ngày

tinybook tinybook 3 tuần 1 ngày
50 tuổi vẫn có bộ não của thanh niên 25 tuổi nếu ngồi thiền mỗi ngày
Trong khi hầu hết vỏ não của chúng ta teo đi theo thời gian thì các thiền giả 50 tuổi trong nghiên cứu có lượng chất xám tương đương với một nửa tuổi thọ của họ.

Nếu như Elon Musk được ví như Iron Man, thì đây chính là Superman của thế giới xe điện

tinybook tinybook 3 tuần 2 ngày
Nếu như Elon Musk được ví như Iron Man, thì đây chính là Superman của thế giới xe điện
Thị trường xe điện ngày một sôi nổi, đó chính là những gì Elon Musk hằng mong ước.

Tìm ra lý do vũ khí Đội quân đất nung của Tần Thủy Hoàng vẫn sáng bóng và sắc bén sau hơn 2000 năm

tinybook tinybook 3 tuần 2 ngày
Tìm ra lý do vũ khí Đội quân đất nung của Tần Thủy Hoàng vẫn sáng bóng và sắc bén sau hơn 2000 năm
Các chiến binh và ngựa bằng đất nung đứng bên trong hố số 1 của Bảo tàng Chiến binh và Ngựa đất nung ở Tây An, tỉnh Thiểm Tây, Trung Quốc

Start-up Trung Quốc thử nghiệm thành công tên lửa mini

tinybook tinybook 3 tuần 2 ngày
Start-up Trung Quốc thử nghiệm thành công tên lửa mini
Trong suốt cuộc thử nghiệm tên lửa tái sử dụng cao 8,1m, các kỹ sư thuộc start-up LinkSpace, do các doanh nhân trẻ nhất trong lĩnh vực không gian Trung Quốc thành lập, đã sử dụng dây bằng vật liệu Kevlar để đảm bảo tên lửa hạ cánh an toàn.

Trung Quốc: Lái xe buýt qua cầu kính khổng lồ để chứng minh độ an toàn của cây cầu

tinybook tinybook 3 tuần 2 ngày
Trung Quốc: Lái xe buýt qua cầu kính khổng lồ để chứng minh độ an toàn của cây cầu
Từng có hàng trăm lượt người đi qua cùng lúc mà chẳng làm sao nên một chiếc xe buýt chỉ nặng vài tấn cũng chẳng nhằm nhò gì với cây cầu kính khổng lồ tại công viên Trương Gia Giới, Hồ Nam.

Mỗi siêu xe Koenigsegg có giá 2 triệu USD, một năm chỉ có 16 chiếc. Vậy hãng kiểm tra độ bền ra sao cho đỡ phí?

tinybook tinybook 3 tuần 2 ngày
Mỗi siêu xe Koenigsegg có giá 2 triệu USD, một năm chỉ có 16 chiếc. Vậy hãng kiểm tra độ bền ra sao cho đỡ phí?
Họ phải dùng phương pháp thử nghiệm đặc biệt thay vì biến hàng loạt chiếc siêu xe thành phế liệu.

King Ghidorah - đối thủ truyền kiếp khiến vua quái vật Godzilla cũng phải e dè

tinybook tinybook 3 tuần 3 ngày
King Ghidorah - đối thủ truyền kiếp khiến vua quái vật Godzilla cũng phải e dè
Tháng 5 này, bộ phim Godzilla: King of the Monsters chính thức được chiếu trên màn ảnh rộng, Godzilla sẽ đối mặt với một đối thủ truyền kiếp và là thách thức lớn nhất từ trước tới nay của vua quái vật. Đó chính là King Ghidorah.

Kỳ công ghép hàng ngàn mảnh bìa carton thành mô hình xe tăng chiến đấu trông như thật với tỷ lệ 1:1

tinybook tinybook 3 tuần 3 ngày
Kỳ công ghép hàng ngàn mảnh bìa carton thành mô hình xe tăng chiến đấu trông như thật với tỷ lệ 1:1
Khó ai có thể tin mô hình xe tăng khổng lồ, tương đương với tỷ lệ thật này lại được làm nên từ những tấm bìa carton nhỏ.

Giả thuyết mới: Night King đang cưỡi rồng tới đánh phá King's Landing

tinybook tinybook 3 tuần 4 ngày
Giả thuyết mới: Night King đang cưỡi rồng tới đánh phá Kings Landing
Đây là lý do tại sao Viserion chưa xuất hiện trước cổng Winterfell.

Hàu là "công nhân vệ sinh" cho đại dương, nhưng chúng ta đã tiêu diệt đến 90% loài sinh vật này

tinybook tinybook 3 tuần 4 ngày
Hàu là "công nhân vệ sinh" cho đại dương, nhưng chúng ta đã tiêu diệt đến 90% loài sinh vật này
Chỉ một con hàu cũng có thể làm sạch đến 50 gallon (227 lít) nước mỗi ngày, giúp loại bỏ các nhân tố gây ô nhiễm và hòa chất độc hại. Tuy nhiên, quần thể hàu trên khắp thế giới đang bị hủy hoại. Hiện tại, các nhà khoa học đang nỗ lực tìm cách để tái sinh chúng ở một số vùng như Solent, bờ biển phía nam nước Anh, nơi số lượng hàu đang sụt giảm nghiêm trọng.

Pin thể rắn, hậu duệ thay thế hoàn toàn pin Li-ion, có được bước tiến quan trọng để ứng dụng vào smartphone

tinybook tinybook 3 tuần 4 ngày
Pin thể rắn, hậu duệ thay thế hoàn toàn pin Li-ion, có được bước tiến quan trọng để ứng dụng vào smartphone
Tương tự ổ đĩa thể rắn SSD là bước tiến của lưu trữ dữ liệu, pin thể rắn sẽ là bước tiến tiếp theo của công nghệ lưu trữ năng lượng.

Điều gì xảy ra khi Thanos xóa sổ một nửa số cá thể mỗi loài trên Trái Đất?

tinybook tinybook 3 tuần 5 ngày
Điều gì xảy ra khi Thanos xóa sổ một nửa số cá thể mỗi loài trên Trái Đất?
Đây là một kế hoạch toàn toàn ... ngu ngốc của gã khổng lồ điên loạn. Có lẽ là do Thanos điên thật.

Steam Cleaning - công nghệ dùng để làm sạch tường Đại Nội Huế cho thấy sức mạnh của nước có thể lớn đến mức nào

tinybook tinybook 3 tuần 5 ngày
Steam Cleaning - công nghệ dùng để làm sạch tường Đại Nội Huế cho thấy sức mạnh của nước có thể lớn đến mức nào
Nước hóa ra có rất nhiều công dụng đầy sức mạnh, từ khả năng... đánh vảy cá đến "thay áo" cho Đại Nội Huế. Tất cả mọi thứ đều nằm trong tầm tay của khoa học.

Bật mí những cực phẩm dành cho các fan Marvel thể hiện tình yêu với Avengers: Endgame

tinybook tinybook 3 tuần 5 ngày
Bật mí những cực phẩm dành cho các fan Marvel thể hiện tình yêu với Avengers: Endgame
Ngoài những items quen thuộc như áo phông, mô hình thì BST giày thể thao thiết kế dựa trên bộ 3 siêu anh hùng Ironman, Captain America và Thor đang là siêu phẩm hot hit được fans săn đón nhiệt tình.
tinybook Công Nghệ Thông Tin








Chat