Google huấn luyện AI để... viết Wikipedia

Google huấn luyện AI để... viết Wikipedia
Theo: Tấn Minh Theo Trí Thức Trẻ
Thể loại: Khoa Học Công Nghệ
Một nhóm phát triển thuộc Google Brain - phòng nghiên cứu machine learning của Google - đã dạy AI cách viết các bài Wikipedia bằng cách tổng hợp thông tin từ các trang web, và đã đạt được những thành công nhất định.

Internet là một kho lưu trữ không giới hạn các bài báo, bài đăng trên mạng xã hội, meme, và các blog. Bạn không thể nào đọc hay theo dõi tất cả mọi thứ được. Việc sử dụng AI để xác định một chú chó hay mèo trong các bức hình là một ý tưởng thú vị, nhưng có bao giờ bạn nghĩ rằng sẽ tốt biết mấy nếu những AI đó biết cách tổng hợp và tóm tắt thông tin từ nhiều nguồn khác nhau thành những đoạn văn ngắn, giúp chúng ta dễ đọc và theo dõi hơn? Tất nhiên, việc này không dễ dàng chút nào.

Thật vậy, một bản báo cáo vừa được tung ra vào tháng trước đã miêu tả quá trình đầy khó khăn này. Các bạn có thể đọc nguyên văn tại đây.

Một vài công ty đã thử thực hiện điều này. Salesforce đã huấn luyện một mạng lưới thần kinh tái hồi sử dụng thuật toán học tăng cường để thu thập thông tin và kể lại chúng một cách tóm lược. Kết quả không tệ chút nào.

Tuy nhiên, các câu văn mà máy tính viết ra lại đơn giản và ngắn gọn. Chúng thiếu sự sáng tạo và vần điệu như các câu văn của con người. Nỗ lực mới nhất của Google Brain đã đạt được kết quả tốt hơn đôi chút: các câu văn đã dài hơn và đọc tự nhiên hơn.

Dưới đây là một ví dụ: ở bên phải bức hình là đoạn văn do con người viết về Wings over Kansas - một website về máy bay dành cho phi công và những người có cùng sở thích - được tìm thấy trên Wikipedia. Còn phía bên trái là đoạn văn do AI viết, với các thông tin được tổng hợp từ Internet.

Google huấn luyện AI để... viết Wikipedia - Ảnh 1.

Đoạn văn mà AI viết hơi khó đọc nếu không viết in hoa các chữ cái đầu câu, và hầu hết các câu văn đều có cấu trúc khá cứng nhắc. Tuy nhiên nhìn chung, đoạn văn vẫn có thể được đọc hiểu khá tốt, dù nội dung tóm tắt chưa thực sự là "tóm tắt" và vẫn dài hơn đoạn văn tương ứng trên Wikipedia.

AI này hoạt động bằng cách lấy thông tin từ top 10 website có liên quan đến chủ đề được đưa ra, ngoại trừ trang Wikipedia, hoặc lấy thông tin từ các đường dẫn trong mục tài liệu tham khảo của bài viết trên Wikipedia. Hầu hết các trang web được chọn được sử dụng vào việc huấn luyện, và một số trang khác được giữ lại để phát triển và kiểm tra hệ thống.

AI sẽ xếp hạng các đoạn văn từ mỗi trang, sau đó copy nội dung văn bản từ các trang này và đưa vào một tài liệu dài hơn, mã hoá và làm ngắn chúng lại theo phương thức tách chúng ra thành 32.000 từ riêng lẽ để làm "nguồn nguyên liệu" cho việc viết bài.

Những "nguyên liệu" này sau đó sẽ được đưa vào một bộ máy để cắt các câu dài thành các câu ngắn hơn. Đây là một "mánh" thông minh, vừa có thể ứng dụng để tạo lẫn tóm lược các đoạn văn bản. Các câu văn do AI tạo ra được lấy từ bước trích xuất nội dung trước đó và không phải xây dựng từ đầu, do đó dễ hiểu tại sao cấu trúc câu có vẻ lặp lại và cứng nhắc.

Google huấn luyện AI để... viết Wikipedia - Ảnh 2.

Mohammad Saleh - đồng tác giả bản báo cáo và là một kỹ sư phần mềm của nhóm Google AI cho biết: "Giai đoạn trích xuất giống như một chiếc cổ chai nhằm xác định phần nào của nội dung nhập vào có thể được chuyển sang giai đoạn 'trừu tượng hoá'. Nhóm chúng tôi muốn thu được mọi thông tin từ các tài liệu tham khảo".

"Thiết kế các hình mẫu và phần cứng có khả năng hỗ trợ các chuỗi nhập dài hơn hiện đang được chú trọng nghiên cứu nhằm loại bỏ mọi dưới hạn nêu trên".

Vẫn còn rất lâu nữa chúng ta mới thấy những nội dung tóm lược hiệu quả. Và dù dự án Google Brain khá thú vị, nhưng việc sử dụng một hệ thống như thế này để tự động tạo ra các bài viết Wikipedia thì quả là không sáng suốt.

Bên cạnh đó, AI này lệ thuộc vào độ phổ biến của 10 website đầu tiên trong kết quả tìm kiếm của Google, do đó nếu những trang như thế này đưa ra các thông tin không dáng tin cậy, thì việc viết bài sẽ không đạt tính chính xác cao được.

Tham khảo: TheRegister

Bangkok lần đầu tiên sử dụng drone phun nước vào không khí để giảm bụi độc hại PM2.5

tinybook tinybook 3 tuần 2 ngày
Bangkok lần đầu tiên sử dụng drone phun nước vào không khí để giảm bụi độc hại PM2.5
Thống đốc thủ đô Bangkok, Thái Lan mới đây đã khởi động chiến dịch sử dụng drone để phun nước vào không khí nhằm giảm tình trạng khói bụi đang che phủ khắp thủ đô của Thái Lan.

Fan Liên Quân Mobile “phát sốt” với trend mới, Cris Devil Gamer, bé Chanh,Msuong cũng không đứng ngoài cuộc

tinybook tinybook 3 tuần 2 ngày
Fan Liên Quân Mobile “phát sốt” với trend mới, Cris Devil Gamer, bé Chanh,Msuong cũng không đứng ngoài cuộc
Tưởng chừng chủ đề gần đây không gì hot hơn Tết, nhưng với cộng đồng gamer rồi cả các streamer Liên Quân Mobile thì trend đang đứng top bảng chính là…đập bim bim!

Chiếc máy xúc chạy hoàn toàn bằng điện này có cục pin nặng 3,4 tấn, hoạt động 7 tiếng mỗi lần sạc

tinybook tinybook 3 tuần 2 ngày
Chiếc máy xúc chạy hoàn toàn bằng điện này có cục pin nặng 3,4 tấn, hoạt động 7 tiếng mỗi lần sạc
Các phương tiện chạy điện đang ngày càng trở nên đa dạng.

Lì xì Online lan tỏa mạnh mẽ tới nhiều triệu người dùng Việt Nam

tinybook tinybook 3 tuần 3 ngày
Lì xì Online lan tỏa mạnh mẽ tới nhiều triệu người dùng Việt Nam
Ông Nguyễn Bá Diệp – Phó chủ tịch Ví điện tử MoMo khẳng định chắc chắn lì xì online sẽ trở nên phổ biến bởi tiện lợi, an toàn mà vẫn mang đậm tính đặc trưng của Tết cổ truyền.

Phát hiện hóa thạch côn trùng cổ đại bị nhốt bên trong một viên đá mắt mèo

tinybook tinybook 3 tuần 3 ngày
Phát hiện hóa thạch côn trùng cổ đại bị nhốt bên trong một viên đá mắt mèo
Khá bất ngờ khi hóa thạch của một loài côn trùng cổ đại lại được bảo quan bên trong một viên đá opal hay còn gọi là đá mắt mèo vô cùng quý hiếm.

Dùng khoan nước nóng, các nhà khoa học khoan được hố sâu kỷ lục tại Nam Cực: tận 2.152 mét!

tinybook tinybook 3 tuần 3 ngày
Dùng khoan nước nóng, các nhà khoa học khoan được hố sâu kỷ lục tại Nam Cực: tận 2.152 mét!
Không giống như khoan bê tông hay khoan nền đất, khoan băng cần một hệ thống khoan đặc biệt.

Phát hiện siêu khuẩn kháng thuốc tại một trong những nơi nguyên sơ cuối cùng trên Trái đất: chuyện gì đang xảy ra thế?

tinybook tinybook 3 tuần 3 ngày
Phát hiện siêu khuẩn kháng thuốc tại một trong những nơi nguyên sơ cuối cùng trên Trái đất: chuyện gì đang xảy ra thế?
Người ta tìm thấy dấu hiệu của khuẩn kháng thuốc tại những nơi cách rất xa so với xã hội con người. Và tất nhiên, đây là tin chẳng vui chút nào.

Loại khăn giấy xì mũi này có gì đặc biệt mà người bị cúm sẵn sàng bỏ 1,9 triệu ra để mua 1 tờ?

tinybook tinybook 3 tuần 4 ngày
Loại khăn giấy xì mũi này có gì đặc biệt mà người bị cúm sẵn sàng bỏ 1,9 triệu ra để mua 1 tờ?
Liệu bạn có dám bỏ ra 80 USD chỉ để dùng một tờ khăn giấy xì mũi chứa đầy virus của người bị mắc bệnh cảm cúm?

3 Nghi thức thần thánh đón Tết đậm đà chỉ game thủ mới hiểu

tinybook tinybook 3 tuần 4 ngày
3 Nghi thức thần thánh đón Tết đậm đà chỉ game thủ mới hiểu
Tất cả thế giới ra đây mà xem, chỉ vài thao tác đơn giản như đang giỡn là cái Tết đậm đà đã về với bao bản đồ và hàng triệu gamer khắp mọi miền quê.

Tesla nên dè chừng: Porsche Taycan sạc 4 phút đi được 100 km, chủ xe được sạc miễn phí trong 3 năm

tinybook tinybook 3 tuần 4 ngày
Tesla nên dè chừng: Porsche Taycan sạc 4 phút đi được 100 km, chủ xe được sạc miễn phí trong 3 năm
Dự kiến cuối năm nay, chúng ta sẽ được tận mắt chiêm ngưỡng chiếc xe điện Porsche Taycan.

Start-up Nga tính biến bầu trời đêm trở thành biển quảng cáo khổng lồ cho các nhãn hàng

tinybook tinybook 3 tuần 4 ngày
Start-up Nga tính biến bầu trời đêm trở thành biển quảng cáo khổng lồ cho các nhãn hàng
Thử tưởng tượng xem một ngày nào đó bạn nhìn lên Mặt Trăng vào một đêm mùa hè và thấy một bầu trời đầy sao cùng một tấm biển quảng cáo khổng lồ. Đó là hình dung của một start-up Nga trong tương lai không xa.

Nghe về kim tự tháp nhiều rồi, đã có ai được vào hẳn bên trong chưa? Đó thực sự là một trải nghiệm... đáng quên

tinybook tinybook 3 tuần 4 ngày
Nghe về kim tự tháp nhiều rồi, đã có ai được vào hẳn bên trong chưa? Đó thực sự là một trải nghiệm... đáng quên
Nghe về kim tự tháp nhiều rồi, đã có ai được vào hẳn bên trong chưa? Đó thực sự là một trải nghiệm... đáng quên

Khoa học tìm ra cách biến sóng Wi-Fi thành dòng điện, điện thoại tương lai sẽ không cần pin!

tinybook tinybook 3 tuần 4 ngày
Khoa học tìm ra cách biến sóng Wi-Fi thành dòng điện, điện thoại tương lai sẽ không cần pin!
Tưởng tượng đến lúc bạn chỉ cần kết nối Wi-Fi, điện thoại của bạn đã được sạc. Cuộc đời sẽ tuyệt vời và tiện lợi tới mức nào!

Cụ Arthur Ashkin, người giành giải Nobel cao tuổi nhất thế giới đang phát triển công nghệ năng lượng "rẻ như đất" và cực sạch

tinybook tinybook 3 tuần 4 ngày
Cụ Arthur Ashkin, người giành giải Nobel cao tuổi nhất thế giới đang phát triển công nghệ năng lượng "rẻ như đất" và cực sạch
Nhà vật lý học già vẫn chưa muốn ngưng cống hiến.

Elon Musk hãy dè chừng, bức tâm thư gửi đi lúc 1 giờ 20 phút sáng của ông có thể chính là ngày tàn của Tesla

tinybook tinybook 3 tuần 5 ngày
Elon Musk hãy dè chừng, bức tâm thư gửi đi lúc 1 giờ 20 phút sáng của ông có thể chính là ngày tàn của Tesla
Nhà tâm lý học có tiếng bày tỏ lo lắng với tương lai của Tesla.

Sử dụng Heli và bằng một thử nghiệm tuyệt đẹp, các nhà khoa học tiến gần hơn tới trạng thái vật chất siêu rắn

tinybook tinybook 3 tuần 6 ngày
Sử dụng Heli và bằng một thử nghiệm tuyệt đẹp, các nhà khoa học tiến gần hơn tới trạng thái vật chất siêu rắn
“Siêu rắn” – super solid, một trạng thái vật chất có cấu trúc tinh thể của một chất rắn nhưng lại có thể chảy được như chất lỏng

Australia và Austria: Có điều gì liên quan đằng sau hai cái tên gần giống nhau?

tinybook tinybook 4 tuần 7 giờ
Australia và Austria: Có điều gì liên quan đằng sau hai cái tên gần giống nhau?
Áo và Úc trong tiếng Việt thì không sao, nhưng tiếng Anh thì lại rất dễ nhầm lẫn. Vậy có gì liên quan giữa 2 quốc gia này không, khi chúng cách nhau cả chục ngàn cây số.

Biết trước về iPhone và iOS đến hàng năm, vì sao Nokia vẫn sụp đổ? Apple liệu có nối gót Nokia?

tinybook tinybook 4 tuần 21 giờ
Biết trước về iPhone và iOS đến hàng năm, vì sao Nokia vẫn sụp đổ? Apple liệu có nối gót Nokia?
Cho dù biết trước về mối nguy hiểm của iPhone và iOS nhưng tại sao Nokia vẫn chậm chạp đối phó để rồi cuối cùng sụp đổ chỉ sau một thời gian ngắn? Và liệu Apple có đi theo vết xe đổ này?

Nước hoa không chỉ giúp tăng thêm nét quyến rũ, lịch lãm mà còn có thể tăng hiệu suất công việc

tinybook tinybook 4 tuần 23 giờ
Nước hoa không chỉ giúp tăng thêm nét quyến rũ, lịch lãm mà còn có thể tăng hiệu suất công việc
Công ty chuyên xây dựng mô hình làm việc chung Spaces mới đây đã hợp tác với thương hiệu phong cách sống Marie-Stella-Maris tạo ra “Spirit de Travail”, một loại nước hoa có thể khả năng tăng hiệu suất công việc.

Các nhà khoa học chế tạo thành công nhiên liệu lỏng có thể lưu trữ năng lượng Mặt Trời trong vòng 18 năm

tinybook tinybook 4 tuần 1 ngày
Các nhà khoa học chế tạo thành công nhiên liệu lỏng có thể lưu trữ năng lượng Mặt Trời trong vòng 18 năm
Nhiên liệu nhiệt Mặt Trời hứa hẹn sẽ trở thành một loại nhiên liệu mới của tương lai.

Nghiên cứu gây tranh cãi: viên đá cổ nhất Trái Đất đã được lấy về từ Mặt Trăng

tinybook tinybook 4 tuần 1 ngày
Nghiên cứu gây tranh cãi: viên đá cổ nhất Trái Đất đã được lấy về từ Mặt Trăng
Khi hoàn thành báo cáo nghiên cứu, các nhà khoa học biết mình sẽ bị nhiều người trong ngành phản đối.

Bệnh nhân với con mắt siêu hiếm trông như bánh pizza 8 miếng: Minh chứng cho thấy y học đã từng đáng sợ như thế nào

tinybook tinybook 4 tuần 2 ngày
Bệnh nhân với con mắt siêu hiếm trông như bánh pizza 8 miếng: Minh chứng cho thấy y học đã từng đáng sợ như thế nào
Đó là một thủ thuật xưa trong phẫu thuật giác mạc, có thể biến mắt bệnh nhân trông như một viên hồng ngọc nhưng đổi lại là những rủi ro kỳ lạ.

[Video time-lapse] Theo dõi trọn vẹn quy trình sản xuất một chiếc xe điện Tesla Model 3 trong công xưởng như thế nào?

tinybook tinybook 4 tuần 2 ngày
[Video time-lapse] Theo dõi trọn vẹn quy trình sản xuất một chiếc xe điện Tesla Model 3 trong công xưởng như thế nào?
Thông qua đoạn video time-lapse thú vị trong bài viết này, bạn sẽ có cơ hội biết được quy trình tạo ra những chiếc xe điện Tesla Model 3 vô cùng kỳ công.

Trung Quốc bắt đầu cuộc “xuân vận”: Ước tính có 3 tỷ chuyến đi trong vòng 40 ngày tới để về nhà ăn Tết

tinybook tinybook 4 tuần 2 ngày
Trung Quốc bắt đầu cuộc “xuân vận”: Ước tính có 3 tỷ chuyến đi trong vòng 40 ngày tới để về nhà ăn Tết
Lại một mùa xuân vận nữa đến với người dân Trung Quốc và năm nay ước tính sẽ có tới 3 tỷ lượt di chuyển về quê ăn Tết chỉ trong vòng 40 ngày.

Nghiên cứu mới cho thấy bộ não hoạt động mạnh nhất khi chúng ta không làm gì cả, lý giải vì sao những sáng kiến thường xuất hiện trong nhà vệ sinh

tinybook tinybook 1 tháng 14 giờ
Nghiên cứu mới cho thấy bộ não hoạt động mạnh nhất khi chúng ta không làm gì cả, lý giải vì sao những sáng kiến thường xuất hiện trong nhà vệ sinh
Khi không làm gì cả không có nghĩa là bộ não của bạn không có ích.

Nếu bạn thắc mắc cây hiện ra trong mắt chim như thế nào, thì mời bạn xem ảnh

tinybook tinybook 1 tháng 15 giờ
Nếu bạn thắc mắc cây hiện ra trong mắt chim như thế nào, thì mời bạn xem ảnh
"Em trong mắt tôi".

Nghiên cứu mới: thành phần tạo nên sự sống trên Trái Đất tới từ hành tinh khác

tinybook tinybook 1 tháng 19 giờ
Nghiên cứu mới: thành phần tạo nên sự sống trên Trái Đất tới từ hành tinh khác
Không phải sự sống tới từ hành tinh khác, chỉ là các thành phần cấu tạo nên nó thôi nhé!

[Góc mãn nhãn] Ngắm vẻ đẹp đầy kỳ ảo của những con sóng biển khi nhìn từ dưới lòng đại dương

tinybook tinybook 1 tháng 21 giờ
[Góc mãn nhãn] Ngắm vẻ đẹp đầy kỳ ảo của những con sóng biển khi nhìn từ dưới lòng đại dương
Khi nhìn những con sóng cuộn trào với góc nhìn từ dưới lòng biển, chúng ta mới thấy hết được vẻ đẹp thực sự của đại dương ấn tượng đến như thế nào.

Hệ thống laser 100 gigawatt có khả năng "đốt cháy cả một thành phố" sẽ là nguồn năng lượng đưa ta du hành sang hệ sao khác

tinybook tinybook 1 tháng 1 ngày
Hệ thống laser 100 gigawatt có khả năng "đốt cháy cả một thành phố" sẽ là nguồn năng lượng đưa ta du hành sang hệ sao khác
Sức mạnh khủng khiếp của hệ thống laser 100 gigawatt sẽ biến Trái Đất thành một ngọn hải đăng, thắp sáng cả một góc Ngân hà.

Ngày xưa tôi cứ nghĩ 8K là thừa thãi, nhưng giờ mới biết hoá ra TV nhà mình chưa đủ to

tinybook tinybook 1 tháng 1 ngày
Ngày xưa tôi cứ nghĩ 8K là thừa thãi, nhưng giờ mới biết hoá ra TV nhà mình chưa đủ to
Bất cứ ai đang sở hữu TV 4K cũng nghĩ rằng 8K là "mơ ước", rằng nội dung chưa có thì sao mà xem, rằng 8K chẳng khác gì với 4K qua đôi mắt người. Nhưng đó là khi bạn chưa nhìn thấy một chiếc TV 8K đủ lớn thực sự ngoài đời.
tinybook Công Nghệ Thông Tin








Chat