Mô hình “thần thánh” reCAPTCHA: Biến người dùng Internet thành “nhân công” miễn phí, điện tử hóa 17.600 quyển sách mỗi năm, khiến Google chi 30 triệu USD thâu tóm!

Mô hình “thần thánh” reCAPTCHA: Biến người dùng Internet thành “nhân công” miễn phí, điện tử hóa 17.600 quyển sách mỗi năm, khiến Google chi 30 triệu USD thâu tóm!
Theo: Lê Thanh Sang
Thể loại: Khoa Học Công Nghệ
Nếu đã từng trả lời một trong những mẫu reCAPTCHA dưới đây thì xin chúc mừng bạn! Chữ mà bạn nhập giờ đã nằm trong một bài báo của tờ New York Time lừng danh hoặc được lưu trữ tại thư viện lớn nhất thế giới Google Books.

Nội dung nổi bật:

Bối cảnh: Để phòng tránh các cuộc tấn công mạng, chủ website thường sử dụng CAPTCHA như một phương tiện vừa hiệu quả vừa miễn phí.

Kế hoạch: Phát hiện ra sự "lãng phí" của CAPTCHA, Luis von Ahn đã viết nên reCAPTCHA, với nhiệm vụ vừa bảo vệ website, vừa có khả năng dịch văn bản cực kỳ chính xác.

Kết quả: 17.600 quyển sách được số hóa chỉ trong một năm. reCAPTCHA nhanh chóng được Google mua lại sau 2 năm thành lập với giá gần 30 triệu USD!

Captcha và reCaptcha

Mô hình “thần thánh” reCAPTCHA: Biến người dùng Internet thành “nhân công” miễn phí, điện tử hóa 17.600 quyển sách mỗi năm, khiến Google chi 30 triệu USD thâu tóm! - Ảnh 1.

Đã quá quen thuộc với tất cả người dùng Internet, Captcha là một công đoạn phiền toái nhưng cũng dễ dàng vượt qua để chứng minh người dùng thật sự là con người chứ không phải robot.

Thuật ngữ CAPTCHA viết tắt từ Hệ thống Tự động Phân biệt Con người và Máy tính (Completely Automated Public Turing test to tell Computers and Humans Apart), và là đứa con tinh thần của Luis von Ahn từ Đại học Carnegie Mellon.

Captcha được nhiều trang web sử dụng để phòng tránh các cuộc tấn công từ chối dịch vụ hàng loạt hoặc đánh cắp dữ liệu vì sự hiệu quả cũng như giá thành "0 đồng" của mình.

Tuy nhiên, nhà sáng lập Luis nhanh chóng nhận ra rằng, tuy mỗi người chỉ tốn vài giây để hoàn tất một mẫu Captcha, nếu tính tổng cộng số người dùng khổng lồ trên Internet, mỗi ngày có đến hàng trăm ngàn giờ lao động "lãng phí" đang được đổ vào Captcha.

Mô hình “thần thánh” reCAPTCHA: Biến người dùng Internet thành “nhân công” miễn phí, điện tử hóa 17.600 quyển sách mỗi năm, khiến Google chi 30 triệu USD thâu tóm! - Ảnh 2.

Nhằm tận dụng những giờ lao động quý giá này, Luis cho ra đời reCAPTCHA vào năm 2007.

reCAPTCHA về cơ bản vẫn là một chương trình CAPTCHA thông thường, ngay từ lúc xuất hiện, reCAPTCHA đã chủ động giới thiệu bản thân là một dịch vụ hoàn toàn miễn phí và cực kỳ dễ sử dụng cho các chủ sở hữu website.

Không lâu sau đó, reCAPTCHA được sử dụng rộng rãi và trở thành chương trình phòng vệ mặc định của rất nhiều trang web lớn.

Nhưng ít ai biết được mô hình kinh doanh "thiên tài" đằng sau chương trình miễn phí này.

Hàng chục triệu người dùng Internet đang bị biến thành những "cỗ máy đánh chữ", đều đặn gõ hàng triệu chữ cái mỗi ngày, điện tử hóa hàng ngàn quyển sách, tạp chí, bài báo từ xa xưa mà không hề hay biết.

reCAPTCHA hoạt động như thế nào?

Mô hình “thần thánh” reCAPTCHA: Biến người dùng Internet thành “nhân công” miễn phí, điện tử hóa 17.600 quyển sách mỗi năm, khiến Google chi 30 triệu USD thâu tóm! - Ảnh 3.

So với các phần mềm nhận dạng khác, reCAPTCHA yêu cầu người dùng phải nhập 2 chữ cái khác nhau thay vì 1 chữ.

Và cũng không giống các CAPTCHA còn lại, reCAPTCHA không tự động "tạo" những chữ khó nhìn để đánh đố người dùng mà lấy hẳn hình ảnh từ các văn bản vật lý (sách, báo, tờ rơi…) mà phần mềm nhận diện mặt chữ (Optical Character Recognition - OCR) không thể giải quyết được.

Các phần mềm OCR luôn được sử dụng để chuyển các trang sách, tạp chí, bài báo từ bản in sang bản điện tử để lưu trữ cũng như phân phối. Nhưng OCR cũng chỉ là một phần mềm "bắt chước" khả năng đọc của con người, nếu như trang giấy có dấu hiệu sờn, cũ hoặc xuống cấp, OCR sẽ ngay lập tức không nhận diện được, dù một người bình thường có thể dễ dàng nhận ra chữ đó là gì.

Quay lại với reCAPTCHA, trong 2 chữ mà chương trình này "thách thức" người dùng, một chữ đã được nhận diện và lưu trong kho dữ liệu, một chữ còn lại sẽ đến từ danh sách các từ mà OCR không đọc được ở trên.

Nếu có ít nhất 6 người dùng cùng sử dụng một chữ để thay thế cho hình ảnh mà OCR không nhận diện được, reCAPTCHA sẽ xem nó như là một từ đã được "điện tử hóa" thành công.

reCAPTCHA "bán mình" như thế nào?

Mô hình “thần thánh” reCAPTCHA: Biến người dùng Internet thành “nhân công” miễn phí, điện tử hóa 17.600 quyển sách mỗi năm, khiến Google chi 30 triệu USD thâu tóm! - Ảnh 4.

Với khả năng đọc chữ chính xác "gấp 6 lần người thường", reCAPTCHA nhanh chóng ký hợp đồng với tờ báo danh tiếng New York Times để điện tử hóa tất cả bài viết cũ. Chỉ trong vài tháng hợp tác, reCAPTCHA đã dễ dàng điện tử hóa tất cả bài viết của New York Times trong vòng 20 năm trước khi có máy tính.

Và chỉ trong một năm hoạt động, hơn 440 triệu từ đã được điện tử hóa thành công, tương đương với gần 17.600 quyển sách!

Vào năm 2009, tức là chỉ 2 năm kể từ lúc thành lập, reCAPTCHA nhanh chóng được Google mua lại với một khoản tiền không được công bố (nhưng vài chuyên gia dự đoán giá trị ít nhất là 30 triệu USD).

Ngay sau khi thâu tóm, Google ngay lập tức sử dụng reCAPTCHA cho Google Books, biến đây trở thành thư viện điện tử lớn nhất thế giới chỉ sau vài năm.

Mô hình “thần thánh” reCAPTCHA: Biến người dùng Internet thành “nhân công” miễn phí, điện tử hóa 17.600 quyển sách mỗi năm, khiến Google chi 30 triệu USD thâu tóm! - Ảnh 5.

Không những thế, Google còn sử dụng reCAPTCHA cho nhiều mục đích khác, chẳng hạn như giải mã biển tên đường hay số nhà trên Google Maps Street View, phân biệt các phương tiện và biển hiệu giao thông cho dự án xe không người lái …

Có thể thấy rằng reCAPTCHA đã nhanh chóng chứng minh giá trị của mình và "hoàn vốn" nhanh chóng cho Google qua các ứng dụng trên.

reCAPTCHA là tấm gương của mô hình kinh doanh đơn giản mà hiệu quả. An ninh mạng và Nhận diện chữ viết là hai việc hoàn toàn không liên quan đến nhau, nhưng Luis đã kết nối được hai phạm trù này để "tận dụng" hàng triệu người trên khắp thế giới làm việc cho mình, tối ưu hóa nguồn lực của xã hội trước khi định nghĩa "kinh tế chia sẻ" được ra đời.

Làm sao để bắt chước reCAPTCHA?

Mô hình “thần thánh” reCAPTCHA: Biến người dùng Internet thành “nhân công” miễn phí, điện tử hóa 17.600 quyển sách mỗi năm, khiến Google chi 30 triệu USD thâu tóm! - Ảnh 6.

Để "tận dụng nguồn lực" nhàn rỗi như reCAPTCHA, một mô hình mới cần phải thỏa mãn các điều kiện sau:

- Phục vụ một nhu cầu trực tuyến (Chẳng hạn như xác nhận người dùng không phải là robot).

- Phân phối hoàn toàn miễn phí.

- Thu thập nguồn lực đến từ khắp nơi trên thế giới để tạo ra một giải pháp mà công nghệ chưa đủ phát triển để giải quyết.

- Tìm cách bán giải pháp đó.

Sau khi thành công với reCAPTCHA, Luis đã thành lập Duolingo vào năm 2011, nhằm cung cấp một dịch vụ học ngôn ngữ hoàn toàn miễn phí và đi kèm là "giải pháp" dịch thuật chính xác hơn bất kỳ trí thông minh nhân tạo nào.

Nhưng cho đến nay, Duolingo dần chuyển qua mô hình "khuyến khích" người dùng đóng phí để học hiệu quả hơn cho thấy thành công của reCAPTCHA khó lặp lại hơn mọi người nghĩ.

Hạt giống đầu tiên nảy mầm trên Mặt trăng của Trung Quốc đã chết

tinybook tinybook 2 ngày 1 giờ
Hạt giống đầu tiên nảy mầm trên Mặt trăng của Trung Quốc đã chết
Thật đáng tiếc nhưng thử nghiệm này cũng đã kết thúc, do điều kiện khắc nghiệt trên Mặt trăng.

Bangkok sử dụng mưa nhân tạo để giải quyết ô nhiễm không khí

tinybook tinybook 2 ngày 1 giờ
Bangkok sử dụng mưa nhân tạo để giải quyết ô nhiễm không khí
Nếu bạn có ý định du lịch Thái Lan, hãy cân nhắc kỹ trước khi đặt chân tới Bangkok.

Hãy làm ra những quả cà chua cay như ớt, các nhà khoa học nói

tinybook tinybook 2 ngày 18 giờ
Hãy làm ra những quả cà chua cay như ớt, các nhà khoa học nói
Nhưng để làm gì?

Săn Deal Công Nghệ - Rinh Vàng Tài Lộc tại Lazada

tinybook tinybook 2 ngày 20 giờ
Săn Deal Công Nghệ - Rinh Vàng Tài Lộc tại Lazada
Tết Kỷ Hợi 2019 sắp đến gần cũng là tín hiệu của mùa mua sắm nhộn nhịp, đặc biệt là với các tín đồ công nghệ khi các hãng lớn và uy tín tung ra hàng loạt khuyến mãi hấp dẫn để thu hút khách hàng.

Lần đầu tiên trong lịch sử, hạt giống Trung Quốc trồng trên Mặt trăng đã nảy mầm

tinybook tinybook 2 ngày 23 giờ
Lần đầu tiên trong lịch sử, hạt giống Trung Quốc trồng trên Mặt trăng đã nảy mầm
Nếu có thể trồng lương thực trên Mặt trăng, sẽ cho phép con người xây dựng căn cứ không gian trong tương lai.

Gậy ông đập lưng ông, hệ thống reCAPTCHA của Google bị chính công cụ của Google đánh bại

tinybook tinybook 3 ngày 18 giờ
Gậy ông đập lưng ông, hệ thống reCAPTCHA của Google bị chính công cụ của Google đánh bại
Dù Google đã sửa đổi và nâng cấp các công cụ của mình, phương pháp mới của các nhà nghiên cứu vẫn đạt tỷ lệ thành công hơn 90%.

Khai trương trung tâm thương mại Gigamall – tổ hợp giải trí công nghệ hiện đại hàng đầu Việt Nam

tinybook tinybook 4 ngày 2 giờ
Khai trương trung tâm thương mại Gigamall – tổ hợp giải trí công nghệ hiện đại hàng đầu Việt Nam
Trung tâm Thương mại Gigamall, tọa lạc trên đường Phạm Văn Đồng, quận Thủ Đức, TP.HCM chính thức đi vào hoạt động từ ngày 12/1.

Được quỹ của Bill Gates tài trợ, bệ xí dùng giun để xử lý phân sẽ là tương lai vệ sinh toàn cầu

tinybook tinybook 4 ngày 2 giờ
Được quỹ của Bill Gates tài trợ, bệ xí dùng giun để xử lý phân sẽ là tương lai vệ sinh toàn cầu
Loài giun này không thể sống nếu không có phân, chúng là một công cụ hoàn hảo để lắp vào hố xí tự hoại.

Xoắn não đầu năm với 4 câu đố do nhân viên Cơ quan An ninh Quốc gia Mỹ soạn ra

tinybook tinybook 4 ngày 19 giờ
Xoắn não đầu năm với 4 câu đố do nhân viên Cơ quan An ninh Quốc gia Mỹ soạn ra
Chúc bạn thể dục não vui vẻ.

Quái thú ăn thịt người vùng Gévaudan: nỗi kinh hãi của người dân Pháp hồi thế kỷ 18

tinybook tinybook 4 ngày 19 giờ
Quái thú ăn thịt người vùng Gévaudan: nỗi kinh hãi của người dân Pháp hồi thế kỷ 18
Con quái thú hoành hành suốt 3 năm trời, hạ sát tới cả trăm người.

Đừng quên Google có dự án Soli cực kỳ tiềm năng nhé: vừa đạt thành tựu mới, sờ từ xa biết sách có bao nhiêu trang

tinybook tinybook 4 ngày 19 giờ
Đừng quên Google có dự án Soli cực kỳ tiềm năng nhé: vừa đạt thành tựu mới, sờ từ xa biết sách có bao nhiêu trang
Nhìn vào những ví dụ, ta mong chờ từng ngày đến lúc Dự án Soli thành công.

Có thể bạn không tin nhưng đây là những tác phẩm cắt giấy tỉ mỉ tới từng milimet của nghệ nhân người Nhật

tinybook tinybook 4 ngày 20 giờ
Có thể bạn không tin nhưng đây là những tác phẩm cắt giấy tỉ mỉ tới từng milimet của nghệ nhân người Nhật
Chỉ với một tờ giấy bình thường nhưng nữ nghệ nhân người Nhật này có thể xử lý tỉ mỉ đến từng milimet và thổi hồn nó trở thành những tác phẩm nghệ thuật cắt giấy xuất sắc.

Video ghi lại cảnh thỏ ăn thịt đồng loại làm bất ngờ giới khoa học

tinybook tinybook 5 ngày 2 giờ
Video ghi lại cảnh thỏ ăn thịt đồng loại làm bất ngờ giới khoa học
Đừng vội sợ hại chú thỏ cưng sống trong lồng: thỏ ăn thịt chỉ khi vào đường cùng, thức ăn cạn kiệt, chúng mới tìm tới xác thối để kiếm bữa.

Lý giải hiện tượng con người đi trên than hồng nhưng không bị bỏng

tinybook tinybook 5 ngày 3 giờ
Lý giải hiện tượng con người đi trên than hồng nhưng không bị bỏng
Chắc hẳn bạn đã từng xem những nghi lễ như đi trên lửa trên TV hoặc ngoài đời nhưng có bao giờ bạn thắc mắc, tại sao người đi trên than hồng lại không hề bị bỏng hay làm sao. Vậy nguyên lý khoa học nào giúp họ làm được điều đó?

Lấy ý tưởng từ chân máy ảnh, nhiếp ảnh gia Nhật Bản chế tạo móc treo bao súng giúp bắn nhanh như Lucky Luke

tinybook tinybook 6 ngày 32 phút
Lấy ý tưởng từ chân máy ảnh, nhiếp ảnh gia Nhật Bản chế tạo móc treo bao súng giúp bắn nhanh như Lucky Luke
Nhờ thiết bị này, xạ thủ sẽ có thể lấy súng ra khỏi bao nhanh hết mức có thể và đôi khi chỉ một phần nghìn giây cũng đã tạo ra sự khác biệt giữa các đối thủ.

Lý do đặc biệt khiến Mỹ không dùng hệ đo lường bằng mét như các nước khác

tinybook tinybook 6 ngày 20 giờ
Lý do đặc biệt khiến Mỹ không dùng hệ đo lường bằng mét như các nước khác
Cùng vài quốc gia ít ỏi trên thế giới, hiện giờ Hoa Kỹ vẫn sử dụng các đơn vì đo lường như feet, inch, pound thay vì km, m, kg, tại sao vậy?

Không cần đến Sing hay Nhật, giờ đây Việt Nam đã có khu giải trí công nghệ tương tác cực chất

tinybook tinybook 6 ngày 22 giờ
Không cần đến Sing hay Nhật, giờ đây Việt Nam đã có khu giải trí công nghệ tương tác cực chất
Mọi thứ đều trở thành hiện thực với người dân Sài Gòn khi tổ hợp giải trí công nghệ tương tác JP World đã chính thức ra mắt tại TTTM Gigamall.

Dưa chuột thì rẻ còn dưa chuột biển thì đắt như điên, có lý do cả đấy

tinybook tinybook 1 tuần 5 giờ
Dưa chuột thì rẻ còn dưa chuột biển thì đắt như điên, có lý do cả đấy
Dưa chuột thường giỏi lắm 70.000 đồng/kg, còn dưa chuột biển (hải sâm) lên tới 70 triệu đồng/kg.

[CES 2019] Với hệ thống IBM Q System One mạnh 20 qubit, IBM là hãng đầu tiên thương mại hóa máy tính lượng tử

tinybook tinybook 1 tuần 20 giờ
[CES 2019] Với hệ thống IBM Q System One mạnh 20 qubit, IBM là hãng đầu tiên thương mại hóa máy tính lượng tử
Tương lai của con người sẽ được gắn liền với từ "lượng tử", với một trong những người tiên phong là IBM.

Internet xôn xao về người phụ nữ Hà Giang bị đỉa kí sinh trong họng suốt 3 tháng

tinybook tinybook 2 ngày 1 giờ
Internet xôn xao về người phụ nữ Hà Giang bị đỉa kí sinh trong họng suốt 3 tháng
Các bác sĩ đã loại bỏ con đỉa kí sinh 3 tháng trong họng của người phụ nữ 63 tuổi ở tỉnh Hà Giang.

Đừng xem trang Instagram mê hoặc thị giác này kẻo lại thích thú quá quên hết thời gian!

tinybook tinybook 2 ngày 3 giờ
Đừng xem trang Instagram mê hoặc thị giác này kẻo lại thích thú quá quên hết thời gian!
Không thiếu những video gây lú trên Internet, nhưng để tập trung được nhiều thứ thú vị như trang Instagram này thì hơi hiếm.

Nhân viên Apple Store nhận được gói hàng tưởng là iPhone, nhưng hóa ra lại là nửa cân ma túy đá

tinybook tinybook 2 ngày 5 giờ
Nhân viên Apple Store nhận được gói hàng tưởng là iPhone, nhưng hóa ra lại là nửa cân ma túy đá
Một tai nạn hy hữu đã xảy ra.

Netflix tăng giá tất cả các gói thuê bao

tinybook tinybook 2 ngày 16 giờ
Netflix tăng giá tất cả các gói thuê bao
Các gói cước mới có giá 9 USD, 13 USD và 16 USD.

TikTok đe dọa WeChat bằng ứng dụng nhắn tin mới

tinybook tinybook 3 ngày 4 phút
TikTok đe dọa WeChat bằng ứng dụng nhắn tin mới
TikTok có hơn 500 triệu người dùng hàng tháng, trong khi WeChat đang có 1,1 tỷ người dùng.

Ứng dụng YouTube di động có thêm tính năng vuốt để chuyển video

tinybook tinybook 3 ngày 41 phút
Ứng dụng YouTube di động có thêm tính năng vuốt để chuyển video
Tính năng mới hứa hẹn sẽ làm thay đổi hoàn toàn cách bạn xem video trên ứng dụng YouTube.

Từ chuyện "Hộp Cao sao vàng 2.000 đồng bán trên Amazon 7 USD, chiếc nón lá rao bán giá gấp 10 lần", DN Việt sẽ hưởng lợi lớn khi Amazon chính thức vào Việt Nam?

tinybook tinybook 3 ngày 3 giờ
Từ chuyện "Hộp Cao sao vàng 2.000 đồng bán trên Amazon 7 USD, chiếc nón lá rao bán giá gấp 10 lần", DN Việt sẽ hưởng lợi lớn khi Amazon chính thức vào Việt Nam?
Từ chuyện "Hộp Cao sao vàng 2.000 đồng bán trên Amazon 7 USD, chiếc nón lá rao bán giá gấp 10 lần", DN Việt sẽ hưởng lợi lớn khi Amazon chính thức vào Việt Nam?

Phát hiện phần mềm mã độc “có tâm”, chỉ tấn công người giàu

tinybook tinybook 3 ngày 6 giờ
Phát hiện phần mềm mã độc “có tâm”, chỉ tấn công người giàu
Phần mềm mã độc này không sử dụng phương pháp thông thường, thay vào đó là chọn lọc và tối đa hóa thiệt hại.

Ghen tức trước cơn sốt 5G, ngành công nghiệp cáp nhanh tay đăng ký thương hiệu...10G cho to

tinybook tinybook 3 ngày 17 giờ
Ghen tức trước cơn sốt 5G, ngành công nghiệp cáp nhanh tay đăng ký thương hiệu...10G cho to
Tuy nhiên, 10G ở đây lại không phải là "thế hệ 10" đâu.

Trung Quốc có thể copy tất cả mọi thứ, nhưng sao họ vẫn chưa copy và đánh bại được Tesla?

tinybook tinybook 3 ngày 19 giờ
Trung Quốc có thể copy tất cả mọi thứ, nhưng sao họ vẫn chưa copy và đánh bại được Tesla?
Họ có công nghệ, có nhân lực, thậm chí có cả bằng sáng chế của Tesla luôn. Điều gì đã ngăn họ lại?

Trợ lý ảo Alexa của Amazon "ngắt lời" con người trên sân khấu CES 2019, phải chăng AI đã có suy nghĩ riêng?

tinybook tinybook 4 ngày 3 giờ
Trợ lý ảo Alexa của Amazon "ngắt lời" con người trên sân khấu CES 2019, phải chăng AI đã có suy nghĩ riêng?
Nghe có vẻ hơi sợ nhưng quả thực sợ thật bởi đây là khoảnh khắc hiếm thấy và không phải trợ lý ảo nào giống như Alexa cũng có thể tham gia trò chuyện, thậm chí ngắt lời của con người.
tinybook Công Nghệ Thông Tin








Chat