Google huấn luyện AI để... viết Wikipedia

Google huấn luyện AI để... viết Wikipedia
Theo: Tấn Minh Theo Trí Thức Trẻ
Thể loại: Khoa Học Công Nghệ
Một nhóm phát triển thuộc Google Brain - phòng nghiên cứu machine learning của Google - đã dạy AI cách viết các bài Wikipedia bằng cách tổng hợp thông tin từ các trang web, và đã đạt được những thành công nhất định.

Internet là một kho lưu trữ không giới hạn các bài báo, bài đăng trên mạng xã hội, meme, và các blog. Bạn không thể nào đọc hay theo dõi tất cả mọi thứ được. Việc sử dụng AI để xác định một chú chó hay mèo trong các bức hình là một ý tưởng thú vị, nhưng có bao giờ bạn nghĩ rằng sẽ tốt biết mấy nếu những AI đó biết cách tổng hợp và tóm tắt thông tin từ nhiều nguồn khác nhau thành những đoạn văn ngắn, giúp chúng ta dễ đọc và theo dõi hơn? Tất nhiên, việc này không dễ dàng chút nào.

Thật vậy, một bản báo cáo vừa được tung ra vào tháng trước đã miêu tả quá trình đầy khó khăn này. Các bạn có thể đọc nguyên văn tại đây.

Một vài công ty đã thử thực hiện điều này. Salesforce đã huấn luyện một mạng lưới thần kinh tái hồi sử dụng thuật toán học tăng cường để thu thập thông tin và kể lại chúng một cách tóm lược. Kết quả không tệ chút nào.

Tuy nhiên, các câu văn mà máy tính viết ra lại đơn giản và ngắn gọn. Chúng thiếu sự sáng tạo và vần điệu như các câu văn của con người. Nỗ lực mới nhất của Google Brain đã đạt được kết quả tốt hơn đôi chút: các câu văn đã dài hơn và đọc tự nhiên hơn.

Dưới đây là một ví dụ: ở bên phải bức hình là đoạn văn do con người viết về Wings over Kansas - một website về máy bay dành cho phi công và những người có cùng sở thích - được tìm thấy trên Wikipedia. Còn phía bên trái là đoạn văn do AI viết, với các thông tin được tổng hợp từ Internet.

Google huấn luyện AI để... viết Wikipedia - Ảnh 1.

Đoạn văn mà AI viết hơi khó đọc nếu không viết in hoa các chữ cái đầu câu, và hầu hết các câu văn đều có cấu trúc khá cứng nhắc. Tuy nhiên nhìn chung, đoạn văn vẫn có thể được đọc hiểu khá tốt, dù nội dung tóm tắt chưa thực sự là "tóm tắt" và vẫn dài hơn đoạn văn tương ứng trên Wikipedia.

AI này hoạt động bằng cách lấy thông tin từ top 10 website có liên quan đến chủ đề được đưa ra, ngoại trừ trang Wikipedia, hoặc lấy thông tin từ các đường dẫn trong mục tài liệu tham khảo của bài viết trên Wikipedia. Hầu hết các trang web được chọn được sử dụng vào việc huấn luyện, và một số trang khác được giữ lại để phát triển và kiểm tra hệ thống.

AI sẽ xếp hạng các đoạn văn từ mỗi trang, sau đó copy nội dung văn bản từ các trang này và đưa vào một tài liệu dài hơn, mã hoá và làm ngắn chúng lại theo phương thức tách chúng ra thành 32.000 từ riêng lẽ để làm "nguồn nguyên liệu" cho việc viết bài.

Những "nguyên liệu" này sau đó sẽ được đưa vào một bộ máy để cắt các câu dài thành các câu ngắn hơn. Đây là một "mánh" thông minh, vừa có thể ứng dụng để tạo lẫn tóm lược các đoạn văn bản. Các câu văn do AI tạo ra được lấy từ bước trích xuất nội dung trước đó và không phải xây dựng từ đầu, do đó dễ hiểu tại sao cấu trúc câu có vẻ lặp lại và cứng nhắc.

Google huấn luyện AI để... viết Wikipedia - Ảnh 2.

Mohammad Saleh - đồng tác giả bản báo cáo và là một kỹ sư phần mềm của nhóm Google AI cho biết: "Giai đoạn trích xuất giống như một chiếc cổ chai nhằm xác định phần nào của nội dung nhập vào có thể được chuyển sang giai đoạn 'trừu tượng hoá'. Nhóm chúng tôi muốn thu được mọi thông tin từ các tài liệu tham khảo".

"Thiết kế các hình mẫu và phần cứng có khả năng hỗ trợ các chuỗi nhập dài hơn hiện đang được chú trọng nghiên cứu nhằm loại bỏ mọi dưới hạn nêu trên".

Vẫn còn rất lâu nữa chúng ta mới thấy những nội dung tóm lược hiệu quả. Và dù dự án Google Brain khá thú vị, nhưng việc sử dụng một hệ thống như thế này để tự động tạo ra các bài viết Wikipedia thì quả là không sáng suốt.

Bên cạnh đó, AI này lệ thuộc vào độ phổ biến của 10 website đầu tiên trong kết quả tìm kiếm của Google, do đó nếu những trang như thế này đưa ra các thông tin không dáng tin cậy, thì việc viết bài sẽ không đạt tính chính xác cao được.

Tham khảo: TheRegister

Các nhà thiết kế đưa ra 3 kiểu gập khả thi của chiếc Galaxy X bí ẩn

tinybook tinybook 1 tuần 13 giờ
Các nhà thiết kế đưa ra 3 kiểu gập khả thi của chiếc Galaxy X bí ẩn
Nhiều tin đồn cho rằng Samsung sẽ cho ra mắt một chiếc smartphone với màn hình có thể gập lại được, với tên gọi là Galaxy X.

Nếu tin đồn này là thật, iPhone ra mắt năm 2019 của Apple có thể là chiếc điện thoại đầu tiên có 5G

tinybook tinybook 2 tuần 2 ngày
Nếu tin đồn này là thật, iPhone ra mắt năm 2019 của Apple có thể là chiếc điện thoại đầu tiên có 5G
Mạng 5G sẽ không chỉ còn là những kế hoạch hay dự kiến nữa mà có thể sẽ được ra mắt sớm hơn chúng ta tưởng.

Chiếc Mi 6X của Xiaomi sẽ có phiên bản đặc biệt dành riêng cho fan cuồng của cô ca sĩ ảo đến từ Nhật Bản, Hatsune Miku

tinybook tinybook 2 tuần 4 ngày
Chiếc Mi 6X của Xiaomi sẽ có phiên bản đặc biệt dành riêng cho fan cuồng của cô ca sĩ ảo đến từ Nhật Bản, Hatsune Miku
Từ khâu đóng gói cho đến chính chiếc điện thoại Mi 6X đều trông rất là ảo diệu nhé! Đây hẳn là một món đồ không thể bỏ qua nếu bạn là fan cuồng của cô ca sĩ Miku

"Hiệu ứng đêm đầu tiên" - lời lý giải cho việc tại sao bạn luôn thấy khó ngủ mỗi khi đặt lưng xuống nơi xa lạ

tinybook tinybook 6 ngày 12 giờ
"Hiệu ứng đêm đầu tiên" - lời lý giải cho việc tại sao bạn luôn thấy khó ngủ mỗi khi đặt lưng xuống nơi xa lạ
Đây chính là cách bộ não canh gác và bảo vệ cho sự an toàn của chính bạn.

Telemetron - Nhạc cụ được thiết kể để tạo ra âm thanh du dương lạ thường trong môi trường không trọng lực

tinybook tinybook 6 ngày 17 giờ
Telemetron - Nhạc cụ được thiết kể để tạo ra âm thanh du dương lạ thường trong môi trường không trọng lực
Đây là thứ để loài người "khám phá cách thức tiến hóa của thiết kế và sáng tạo, khi ta không chỉ đơn giản là sống sót trong không gian".

6 lý do phổ biến gây hiện tượng choáng váng mỗi khi đứng dậy đột ngột

tinybook tinybook 6 ngày 17 giờ
6 lý do phổ biến gây hiện tượng choáng váng mỗi khi đứng dậy đột ngột
Cơn choáng khi ngồi dậy đột ngột có thể không nguy hiểm nhưng nó có thể là dấu hiệu của một vấn đề sức khoẻ nghiêm trọng hơn.

Cùng xem nghệ nhân làm nên những chiếc bánh hình thú chân thực đến khó tin

tinybook tinybook 6 ngày 18 giờ
Cùng xem nghệ nhân làm nên những chiếc bánh hình thú chân thực đến khó tin
Nghệ nhân có biệt danh Cake Illusionist nổi tiếng với việc làm nên những chiếc bánh hình thú siêu chân thực, bánh cưới, và nhiều loại bánh khác nữa. Những tác phẩm của cô mất đến nhiều ngày mới hoàn thành.

Balo phản lực dưới nước CUDA được in 3D hoàn toàn sẽ cho bạn lướt đi với tốc độ 12 km/h

tinybook tinybook 1 tuần 10 giờ
Balo phản lực dưới nước CUDA được in 3D hoàn toàn sẽ cho bạn lướt đi với tốc độ 12 km/h
CUDA là đứa con tinh thần của Archie O'Brien trong công cuộc đi tìm một hệ thống phản lực dưới nước giá rẻ.

Ở Tây Ban Nha, có một khu vực nhà kính trồng cây san sát rộng 200 km vuông, nhìn thấy được từ quỹ đạo, cung cấp rau quả cho toàn bộ Châu Âu

tinybook tinybook 1 tuần 12 giờ
Ở Tây Ban Nha, có một khu vực nhà kính trồng cây san sát rộng 200 km vuông, nhìn thấy được từ quỹ đạo, cung cấp rau quả cho toàn bộ Châu Âu
Để bảo vệ cho hơn 200 km vuông nhà kính được an toàn, người ta thường xuyên sử dụng hóa chất để đánh tan mưa bão.

Đâu là lý do cho việc ăn ba bữa một ngày?

tinybook tinybook 1 tuần 14 giờ
Đâu là lý do cho việc ăn ba bữa một ngày?
Vì thời điểm của ba bữa ăn trong ngày tối ưu với nhịp sinh học của con người, hay vì đó là truyền thống đang dần bị phá bỏ?

Ở Mỹ có một cây sồi "thừa kế" đất từ chính "cha" của nó, được luật pháp bảo vệ nên không ai dám động tới

tinybook tinybook 1 tuần 15 giờ
Ở Mỹ có một cây sồi "thừa kế" đất từ chính "cha" của nó, được luật pháp bảo vệ nên không ai dám động tới
Cái cây này đã thừa hưởng mảnh đất từ chính cha của nó, một cây sồi trắng có tên Cái Cây Tự sở hữu mình.

Con robot "đầu chỉ để trồng cây" biết tìm tới ánh sáng để quang hợp, nhún nhảy báo hiệu mỗi khi cây khát nước

tinybook tinybook 1 tuần 15 giờ
Con robot "đầu chỉ để trồng cây" biết tìm tới ánh sáng để quang hợp, nhún nhảy báo hiệu mỗi khi cây khát nước
Sản phẩm xuất phát từ tình yêu cây cối của chuyên gia robot Sun Tianqi.

Điểm danh 12 vụ phóng tên lửa tai hại nhất lịch sử, có vụ tên lửa vừa phóng đã lao đầu xuống đất

tinybook tinybook 1 tuần 20 giờ
Điểm danh 12 vụ phóng tên lửa tai hại nhất lịch sử, có vụ tên lửa vừa phóng đã lao đầu xuống đất
Tưởng chừng là một trong những công việc có độ thành công cao nhất nhưng hóa ra, phóng tên lửa mới chính là việc dễ thất bại nhất.

Khoa học đã chứng minh: Trí thông minh của bạn sẽ suy giảm đáng kể nếu không có điều hòa

tinybook tinybook 1 tuần 1 ngày
Khoa học đã chứng minh: Trí thông minh của bạn sẽ suy giảm đáng kể nếu không có điều hòa
Các nghiên cứu đã chứng minh rằng não không thể thực hiện chức năng như bình thường ở môi trường có nhiệt độ cao.

Thế giới đang trong cuộc chạy đua mới về số lượng các tòa nhà chọc trời

tinybook tinybook 1 tuần 1 ngày
Thế giới đang trong cuộc chạy đua mới về số lượng các tòa nhà chọc trời
Cao ốc hay tòa nhà chọc trời đang dần trở thành thước đo cho sự phồn vinh của mỗi quốc gia, mỗi dân tộc. Do đó không có gì lạ khi thế giới đang trong một cuộc chạy đua mới về số lượng các tòa nhà chọc trời.

[Video slow-motion] Ngắm cận cảnh lúc máy cắt cỏ hoạt động dưới tốc độ quay cực chậm lên tới 50.000fps

tinybook tinybook 1 tuần 1 ngày
[Video slow-motion] Ngắm cận cảnh lúc máy cắt cỏ hoạt động dưới tốc độ quay cực chậm lên tới 50.000fps
Ở tốc độ cực chậm, lên tới 50.000fps, bạn có thể quan sát được cách lưỡi dao xén cỏ hoạt động như thế nào và cách một chiếc máy cắt cỏ dọn sạch khu vườn ra sao.

Tàu vũ trụ Nga xuất sắc phá ký lục “cập bến” trạm ISS chỉ sau 4 giờ phóng lên quỹ đạo

tinybook tinybook 1 tuần 1 ngày
Tàu vũ trụ Nga xuất sắc phá ký lục “cập bến” trạm ISS chỉ sau 4 giờ phóng lên quỹ đạo
Tàu vũ trụ chở hàng Progress 70 của Nga được phóng lên từ bãi phóng Baikonur và chỉ mất chưa đầy 4 giờ để tiếp cận thành công trạm vũ trụ ISS, phá kỷ lục 6 giờ bay đã từng được ghi nhận.

Trải nghiệm cảm giác sống tiện nghi như đất liền trên ngôi nhà thuyền chạy bằng điện Mặt Trời

tinybook tinybook 1 tuần 1 ngày
Trải nghiệm cảm giác sống tiện nghi như đất liền trên ngôi nhà thuyền chạy bằng điện Mặt Trời
Với kích thước chỉ vọn vẻn dài 7,3 mét và rộng 2,4 mét nhưng con tàu kiêm nhà thuyền di động Le Koroc vẫn có thể đem đến một trải nghiệm cuộc sống không khác gì trên đất liền.

Nhà chiêm tinh Hàn Quốc nhìn thấy một ngôi sao rực sáng trên trời, 600 năm sau các nhà khoa học mới biết đó là thứ gì

tinybook tinybook 1 tuần 2 ngày
Nhà chiêm tinh Hàn Quốc nhìn thấy một ngôi sao rực sáng trên trời, 600 năm sau các nhà khoa học mới biết đó là thứ gì
Nỗ lực nghiên cứu này cho thấy trí tò mò của con người là vô địch và chính nhờ sự tò mò ấy, ta mới phát triển được tới như ngày hôm nay.

Chính nhờ huấn luyện viên Ekapol Chanthawong dạy cho đội bóng Thái Lan cách thiền, các em nhỏ mới tĩnh tâm vượt qua được nỗi sợ hãi bị kẹt trong hang không rõ ngày trở về

tinybook tinybook 1 tuần 3 ngày
Chính nhờ huấn luyện viên Ekapol Chanthawong dạy cho đội bóng Thái Lan cách thiền, các em nhỏ mới tĩnh tâm vượt qua được nỗi sợ hãi bị kẹt trong hang không rõ ngày trở về
May mắn thay, 10 năm tu hành nơi cửa Phật của Ekapol Chanthawong đã dạy cho anh cách thiền hiệu quả nhất.

Nghiên cứu mới: Nhện có thể dùng điện để bay trong không khí

tinybook tinybook 1 tuần 3 ngày
Nghiên cứu mới: Nhện có thể dùng điện để bay trong không khí
Những sinh vật nhỏ bé này vẫn không ngừng khiến chúng ta ngạc nhiên.

Các nhà khoa học đang thuần hóa cá ngừ vây xanh đang trong diện nguy cấp để có đủ nguyên liệu mà làm sushi

tinybook tinybook 1 tuần 3 ngày
Các nhà khoa học đang thuần hóa cá ngừ vây xanh đang trong diện nguy cấp để có đủ nguyên liệu mà làm sushi
Phương pháp nuôi trồng hải sản này sẽ cho ta một nguồn cá ngừ vô tận để mà thưởng thức.

Sự ấm lên toàn cầu đang làm rã đông...những xác chết từ thời Thế chiến thứ nhất

tinybook tinybook 1 tuần 4 ngày
Sự ấm lên toàn cầu đang làm rã đông...những xác chết từ thời Thế chiến thứ nhất
Đầu tiên là những khẩu súng được rã đông, sau đó đến những cuốn nhật ký, những lá thư, và rồi...những cơ thể người!

Xì hơi trong thế giới động vật: có loài xì hơi, có loài không, có loài lại phải cố xì hơi để mà sống

tinybook tinybook 1 tuần 5 ngày
Xì hơi trong thế giới động vật: có loài xì hơi, có loài không, có loài lại phải cố xì hơi để mà sống
Xì hơi, phụ phẩm của việc tiêu hóa lại có muôn hình vạn trạng trong thế giới động vật.

Cùng dạo quanh cửa hàng mới của Alibaba tại Hồng Công: kết hợp trải nghiệm mua sắm online và offline

tinybook tinybook 1 tuần 5 ngày
Cùng dạo quanh cửa hàng mới của Alibaba tại Hồng Công: kết hợp trải nghiệm mua sắm online và offline
Có rất nhiều lý do để lựa chọn mua sắm online hơn là mua hàng trực tiếp tại của hàng: tránh nơi đông người, có thể xem tất cả các kích thước và màu sắc có sẵn, và không bị quyến rũ bởi vô số những món hàng hấp dẫn hiện ra ngay trước mắt.

Vẽ khuôn mặt đã tìm ra cách đánh bại được công nghệ nhận diện khuôn mặt, nhưng Face ID của Apple vẫn đứng vững

tinybook tinybook 1 tuần 5 ngày
Vẽ khuôn mặt đã tìm ra cách đánh bại được công nghệ nhận diện khuôn mặt, nhưng Face ID của Apple vẫn đứng vững
Có những điểm đặc biệt để cách trang điểm Juggalo này vượt mặt được các thuật toán machine learning của công nghệ nhận diện khuôn mặt.

Báo cáo khoa học cho thấy viện nghiên cứu Mỹ phát triển được công nghệ tàng hình, có khả năng vô hình khi nhìn từ mọi hướng

tinybook tinybook 1 tuần 5 ngày
Báo cáo khoa học cho thấy viện nghiên cứu Mỹ phát triển được công nghệ tàng hình, có khả năng vô hình khi nhìn từ mọi hướng
Tuy nhiên cần một số điều kiện nhất định, vật thể mới có thể tàng hình thực sự.

Một con sói xám đơn độc vừa rời "vùng cấm" tại Chernobyl

tinybook tinybook 1 tuần 5 ngày
Một con sói xám đơn độc vừa rời "vùng cấm" tại Chernobyl
Thiết bị GPS trên người con sói đã không còn gửi tín hiệu về nữa, các nhà khoa học không rõ chuyện gì đã xảy ra.

Các nhà khoa học nghĩ rằng đây là 8 trường hợp có khả năng xóa sổ sự sống cao nhất

tinybook tinybook 1 tuần 5 ngày
Các nhà khoa học nghĩ rằng đây là 8 trường hợp có khả năng xóa sổ sự sống cao nhất
Những mối nguy gần như toàn đến từ Vũ trụ, ta không thể ra tay ngăn chặn bất cứ trường hợp nào trong số này.

[ĐỒ HỌA] Hành trình ra khỏi hang "căng thẳng hơn phim kinh dị" của các cầu thủ Thái Lan

tinybook tinybook 1 tuần 5 ngày
[ĐỒ HỌA] Hành trình ra khỏi hang "căng thẳng hơn phim kinh dị" của các cầu thủ Thái Lan
Để ra được khỏi hang, các cầu thủ nhí phải vượt qua một đoạn "thắt cổ chai" vô cùng nguy hiểm.
tinybook Công Nghệ Thông Tin








Chat