Facebook đang nỗ lực hết mình để dạy cho chatbot "tám chuyện"

Facebook đang nỗ lực hết mình để dạy cho chatbot "tám chuyện"
Theo: Tuấn Hưng Theo Trí Thức Trẻ
Thể loại: Khoa Học Công Nghệ
Mang tiếng là chatbot nhưng chúng lại không hề biết "tâm sự" với con người chúng ta. Và gã khổng lồ mạng xã hội này đang lên kế hoạch để thay đổi điều đó.

Mặc dù trợ lý ảo AI mang tên M của Facebook đã bị “khai tử”, thế nhưng gã khổng lồ mạng xã hội này vẫn chưa từ bỏ tham vọng về những con chatbot. Trong vài năm trở lại đây, nó đã dần dần cải thiện, tiến bộ hơn thời điểm mới được trình làng rất nhiều. Mặc dù vậy, thử thách sắp tới mà nó phải đạp đổ chính là thứ mà đến cả con người thông minh nhất cũng phải chật vật: nói chuyện phiếm.

Facebook đang nỗ lực hết mình để dạy cho chatbot tám chuyện - Ảnh 1.

M - trợ lý ảo đã bị dừng hoạt động

Mặc dù được đặt tên là chatbot (người máy tán gẫu) nhưng mà “Ngạc nhiên chưa?”, chúng lại không biết tám chuyện. Các nhà nghiên cứu của phòng thí nghiệm FAIR thuộc Facebook đã giải thích vấn đề này rằng, họ đã thất bại ở nhiều mức độ khác nhau.

Đầu tiên, chatbot không thể hiện một “tính cách đồng nhất” – đó là việc các câu nói của chúng có phần mâu thuẫn với nhau. Thứ hai, chatbot không nhớ nó hoặc đối tượng trò chuyện nói điều gì trong quá khứ. Và thứ ba, khi phải đối mặt với một câu hỏi mà chúng không hiểu, chatbot thường trả lời một cách chung chung hoặc đưa ra phản hồi được lập trình sẵn, ví dụ như “Tôi không biết đâu.”

Facebook đang nỗ lực hết mình để dạy cho chatbot tám chuyện - Ảnh 2.

Kể cả với rào cản này, chatbot vẫn có sức hút riêng và tỏ ra rất chủ động. (ELIZA – con chatbot đầu tiên ra đời năm 1960, được thiết kế để đóng vai trò làm một biện pháp điều trị tâm lý mới bằng máy tính, thường dựa dẫm vào những câu nói như “Vậy bây giờ bạn cảm thấy như thế nào?” là một ví dụ điển hình).

Tuy nhiên, mục tiêu của chatbot không phải là “máy hỏi, người trả lời” mà là nảy sinh ra cuộc trò chuyện giữa hai bên. Chính vì vậy mà các nhà khoa học đã tìm đến deep learning. Điều này đồng nghĩa với việc thay vì liệt kê sẵn hàng loạt những câu hỏi và câu trả lời, chatbot được dạy để tìm kiếm kiểu hành vi, lối trò chuyện trong cơ sở dữ liệu rất lớn của nó.

Facebook đang nỗ lực hết mình để dạy cho chatbot tám chuyện - Ảnh 3.

Tính tới thời điểm hiện tại, kết quả mà phương pháp này thu được là rất khả quan. Dẫu vậy, rắc rối nằm ở chỗ, biết lấy dữ liệu nào cho đúng bây giờ? Hiện nay, nhiều loại chatbot hiện đại được huấn luyện từ những cuộc đối thoại của kịch bản phim. Hậu quả là chúng thường đáp lại theo những cách rất dài dòng (không vào thẳng vấn đề khi thực hiện tác vụ như phụ vụ khách hàng) và cho ra các đoạn “đấu khẩu” vô nghĩa. Trong đoạn hội thoại dưới đây, Người 1 là con người, còn Người 2 là chatbot học nói chuyện từ phim ảnh:

[Người 1:] Thế à? Tao thích ăn bít tết lắm. Còn mày thì sao?

[Người 2:] Bố em thường bảo là, nếu như nhà mình có tiền thì bố con mình sẽ ăn bít tết với kem cả ngày luôn!

[Người 1:] Tao thích ăn cả bít tết, thịt gà lẫn thịt xông khói.

[Người 2:] Bố em thường bảo là, nếu như nhà mình có tiền thì bố con mình sẽ ăn bít tết với kem cả ngày luôn!

[Người 1:] Ừ biết rồi, mày vừa nói thế mà.

[Người 2:] Người càng to thì sức càng dai

[Người 1:] Đúng vậy. Tao tập thể hình nên tao biết điều đấy

[Người 2:] Thưa các quý ông và quý bà, người đàn ông khỏe nhất thế giới đang tu nước nóng

Facebook đang nỗ lực hết mình để dạy cho chatbot tám chuyện - Ảnh 4.

Chẳng ra gì nhỉ? Vì vậy, để thay đổi điều này, các kỹ sư của Facebook đã tự xây dựng nên cơ sở dữ liệu của riêng họ để rèn luyện cho chatbot. Nó được đặt tên là Persona-Chat và sở hữu tới hơn 160.000 đoạn đối thoại từ lấy từ các nhân viên của Amazon Mechanical Turk (dịch vụ web của Amazon, là trung tâm giao dịch các dự án cần người thực hiện các tác vụ nhằm phát triển dự án).

Điều thú vị ở Persona-Chat là phản hồi của nó không phải là lựa chọn ngẫu nhiên. Để đưa ra được cấu trúc cho dữ liệu, và để giải quyết tình trạng chatbot không có “cá tính, nhân cách thống nhất”, thì những người tham gia ở Mechanical Turk được yêu cầu tạo ra một nhân vật để định hướng cho cuộc trò chuyện. Điều này đồng nghĩa với việc họ phải nghĩ ra 5 điều về tiểu sử của nhân vật kia và sử dụng nó để làm chủ đề tán gẫu. Ví dụ, một nhân vật được xây dựng theo các chi tiết sau: “Tôi là một họa sỹ. Tôi có 4 đứa con. Mới đây, tôi đã nhận nuôi một con mèo. Tôi rất thích đi bộ để tập thể dục. Tôi rất mê bộ phim Game of Thrones.”

Facebook đang nỗ lực hết mình để dạy cho chatbot tám chuyện - Ảnh 5.

Dữ liệu này sau đó sẽ được dạy cho neural network đang được áp dụng cho các con chatbot cũ, và kết quả sẽ được một nhóm người ở Mechanical Turk khác đánh giá. Mỗi nhân viên được yêu cầu phải “tâm sự” với chatbot mới, và so sánh nó với chatbot cũ và người thật. Đúng như dự đoán, con chatbot có hồn không được điểm về “độ trôi chảy” cũng như “có tính cách đồng nhất” như con người nhưng lại vượt trội hơn hẳn so với chatbot dựa vào phim ảnh.

Dưới đây là một cuộc trò chuyện mẫu. Người 1 là người thật, và người 2 là chatbot dựa trên “nhân vật” do Mechanical Turk tạo nên. (Sở thích chính của nó và “viết tiểu thuyết lãng mạn” nhé.)

Facebook đang nỗ lực hết mình để dạy cho chatbot tám chuyện - Ảnh 6.

[Người 1:] Tớ vừa mới đá bóng xong. Cậu làm được những gì rồi?

[Người 2:] Tớ không nuôi chó mèo. Thời gian rảnh rỗi, tớ hay viết lách. Thế còn cậu thì sao?

[Người 1:] Vừa tốt nghiệp đại học, đang tìm việc làm thôi.

[Người 2:] Vậy hả? Tớ cũng tốt nghiệp đại học chuyên ngành viết văn và làm thơ.

[Người 1:] Cậu đã được xuất bản truyện hay thơ gì chưa?

[Người 2:] Thường thì tớ tập trung viết tiểu thuyết.

[Người 1:] Cậu có thích xem thể thao không?

[Người 2:] Cậu có thích ban nhạc Kings of Leon không? Bài yêu thích của tớ là Use somebody

[Người 1:] Cậu kết hôn chưa? Tớ sắp đi lấy chồng rồi đấy.

[Người 2:] Haha, thời gian đâu mà đi tìm nửa kia đây. Tớ còn phải viết nốt cuốn tiểu thuyết đã.

Facebook đang nỗ lực hết mình để dạy cho chatbot tám chuyện - Ảnh 7.

Điều đáng nói là, mặc dù con chatbot mới này ghi được điểm cao ở mục “trôi chảy” và “có tính cách”, những người tham gia thử nghiệm lại cho biết họ cảm thấy chatbot dùng hội thoại trong phim ảnh lại thú vị và hấp dẫn hơn. Các nhà nghiên cứu của Facebook không đi vào giải thích chi tiết về vấn đề này, nhưng có lẽ bản chất của việc “có hồn” (mỗi nhân vật chỉ dựa trên 5 câu nói mà thôi), những con bot này nhanh chóng hết chủ đề để nói chuyện.

Nghiên cứ này đã chỉ ra một lẽ thường tình, đó là nếu bạn muốn có một cuộc trò chuyện vui vẻ với ai đó – kể cả là người thật hay máy móc, thì việc họ có tính cách, đặc biệt là sở thích và tiểu tiết riêng tư, sẽ giúp ích rất nhiều. Chúng ta đang sống trong thời đại mà những trợ lý ảo như Siri hay Alexa đang trở nên phổ biến và gần gũi hơn bao giờ hết, vì vậy việc nhà sản xuất tạo cho chúng một nhân cách riêng không phải là điều không thể. Câu hỏi đặt ra ở đây, đó là liệu chúng có hợp với ta?

Theo TheVerge

Chiếc đĩa bí ẩn của nước Nga: Dù bé tẹo nhưng chẳng ai nhấc nổi, bên dưới ẩn giấu bí mật gây ngỡ ngàng

tinybook tinybook 5 ngày 3 giờ
Chiếc đĩa bí ẩn của nước Nga: Dù bé tẹo nhưng chẳng ai nhấc nổi, bên dưới ẩn giấu bí mật gây ngỡ ngàng
Chiếc đĩa bí ẩn này thực chất là gì? Nếu biết, bạn sẽ hết sức bất ngờ đấy.

Thế giới đang sử dụng những cách nào để xây dựng nhà chống lũ?

tinybook tinybook 5 ngày 4 giờ
Thế giới đang sử dụng những cách nào để xây dựng nhà chống lũ?
Bên cạnh chống lũ, việc sống chung với lũ cũng là một trong những phương án nhiều nước áp dụng ngày nay. Điểm thiết yếu của chính sách này là phải xây dựng được những ngôi nhà chống lũ cho người dân.

2 thầy trò sử dụng thuật toán để biến bản đồ từ thời cổ đại thành hình chụp rõ nét như bản đồ vệ tinh

tinybook tinybook 5 ngày 17 giờ
2 thầy trò sử dụng thuật toán để biến bản đồ từ thời cổ đại thành hình chụp rõ nét như bản đồ vệ tinh
Nhìn vào để thấy sự thay đổi chóng mặt của đô thị hóa.

Nghệ nhân Zimbabwea biến lốp xe hơi cũ thành những đôi dép độc đáo

tinybook tinybook 5 ngày 17 giờ
Nghệ nhân Zimbabwea biến lốp xe hơi cũ thành những đôi dép độc đáo
Dù tạo ra một đôi giày thoải mái từ lốp xe hơi cũ nghe có vẻ phi thực tế, nhưng theo những gì Chitukutuku đang làm, quy trình này có vẻ khá đơn giản, chỉ mất chưa đầy 1 tiếng đồng hồ.

Chàng thanh niên mang hoài bão dọn sạch biển hợp tác cùng Microsoft, chế tạo tàu gom rác tự hành chạy bằng năng lượng Mặt Trời

tinybook tinybook 5 ngày 18 giờ
Chàng thanh niên mang hoài bão dọn sạch biển hợp tác cùng Microsoft, chế tạo tàu gom rác tự hành chạy bằng năng lượng Mặt Trời
Dự kiến, hai điểm đến tiếp theo của những hệ thống tàu này là Việt Nam và Cộng hoà Dominica.

Giới khảo cổ phát hiện hình vẽ mèo khổng lồ 2000 năm tuổi nằm ngay giữa sa mạc tại Peru

tinybook tinybook 5 ngày 21 giờ
Giới khảo cổ phát hiện hình vẽ mèo khổng lồ 2000 năm tuổi nằm ngay giữa sa mạc tại Peru
Theo đó, các nhà khảo cổ học đã bất ngờ phát hiện hình vẽ con mèo khổng lồ này khi đang cải tạo lối đi để du khách có thể dễ tới chiêm ngưỡng những bức hình khổng lồ tạo nên Nazca Lines bí ẩn và nổi tiếng.

Tìm xuống vùng biển sâu nhất đại dương, khoa học phát hiện sự thật đau lòng: Biến đổi khí hậu đang nghiêm trọng hơn bao giờ hết rồi

tinybook tinybook 6 ngày 16 phút
Tìm xuống vùng biển sâu nhất đại dương, khoa học phát hiện sự thật đau lòng: Biến đổi khí hậu đang nghiêm trọng hơn bao giờ hết rồi
Có một xu hướng đáng ngại đang tồn tại dưới đáy đại dương, và khoa học đang tích cực tìm hiểu thêm.

Các nhà thiên văn học hóa giải bí ẩn về thiên hà chứa 99,99% vật chất tối

tinybook tinybook 6 ngày 15 giờ
Các nhà thiên văn học hóa giải bí ẩn về thiên hà chứa 99,99% vật chất tối
Nhiều khả năng đội nghiên cứu đưa nhận định cũ sẽ tính toán lại để tranh cãi bằng được rằng mình đúng. Chúng ta cùng "lót dép" chờ xem.

Phát hiện ra "siêu sức mạnh" mới của loài gấu nước: một lá chắn cực tím bằng huỳnh quang

tinybook tinybook 6 ngày 18 giờ
Phát hiện ra "siêu sức mạnh" mới của loài gấu nước: một lá chắn cực tím bằng huỳnh quang
Gấu nước vẫn chưa thôi làm chúng ta bất ngờ.

7 việc cực đơn giản nhưng nếu làm được, bạn đặc biệt hơn 90% dân số thế giới đấy

tinybook tinybook 6 ngày 21 giờ
7 việc cực đơn giản nhưng nếu làm được, bạn đặc biệt hơn 90% dân số thế giới đấy
Hãy thử xem mình có phải là "của hiếm" của thế giới hay không nhé.

Giáo sư đại học Mỹ tuyên bố: Rất có thể chúng ta đang sống trong một thế giới giả lập

tinybook tinybook 6 ngày 23 giờ
Giáo sư đại học Mỹ tuyên bố: Rất có thể chúng ta đang sống trong một thế giới giả lập
Theo kết luận của giáo sư, tỉ lệ sống trong giả lập của chúng ta lên tới 50%.

6 ý nghĩa thực sự mỗi khi bạn cảm thấy "Deja vu" - hiện tượng rất nhiều người đã từng trải nghiệm mà không giải thích nổi

tinybook tinybook 6 ngày 23 giờ
6 ý nghĩa thực sự mỗi khi bạn cảm thấy "Deja vu" - hiện tượng rất nhiều người đã từng trải nghiệm mà không giải thích nổi
Deja vu đến nay vẫn là một hiện tượng khoa học chưa thể giải thích. Dẫu vậy, nó vẫn mang đến những ý nghĩa nhất định.

Khoa học "đập hộp" hang động tách biệt khỏi thế giới suốt 5 triệu năm, và đây là những gì được tìm thấy

tinybook tinybook 6 ngày 23 giờ
Khoa học "đập hộp" hang động tách biệt khỏi thế giới suốt 5 triệu năm, và đây là những gì được tìm thấy
Một hang động bị đóng kín suốt 5,5 triệu năm, chỉ được tìm ra từ cách đây hơn 30 năm và đến nay mới chỉ có chưa đến 100 người được phép xuống thám hiểm.

Ai đã tạo ra thế giới kỳ lạ của "Nghìn lẻ một đêm"?

tinybook tinybook 1 tuần 16 giờ
Ai đã tạo ra thế giới kỳ lạ của "Nghìn lẻ một đêm"?
Nghìn lẻ một đêm là bộ sưu tập các truyện dân gian Trung Đông và Nam Á được biên soạn bằng tiếng Ả Rập trong thời đại hoàng kim Hồi giáo.

Sự kiện Dust Bowl: "Cơn bão đen" kéo dài 10 năm trên khắp Bắc Mỹ

tinybook tinybook 1 tuần 16 giờ
Sự kiện Dust Bowl: "Cơn bão đen" kéo dài 10 năm trên khắp Bắc Mỹ
Sự kiện Dust Bowl nổi bật với hiện tượng rất nhiều cơn bão và lốc hoành hành ở các đồng cỏ tại khu vực Bắc Mỹ và gây ra nhiều thiệt hại kinh khủng.

Cùng nghe thứ âm thanh tuyệt diệu của vũ trụ, được tạo ra từ loạt ảnh chụp Dải Ngân hà của NASA

tinybook tinybook 1 tuần 18 giờ
Cùng nghe thứ âm thanh tuyệt diệu của vũ trụ, được tạo ra từ loạt ảnh chụp Dải Ngân hà của NASA
NASA đã sử dụng quá trình chuyển hóa dữ liệu thành âm thanh để đem tới cách nhận thức về vũ trụ theo một cách hoàn toàn mới, đó là hé “âm thanh” của Dải Ngân hà.

Bất chấp “Bão Facebook" - quét tài khoản, không cho chạy quảng cáo, doanh nghiệp này vẫn có thể đạt 1000 đơn đặt hàng/ngày nhờ 3 việc sau

tinybook tinybook 1 tuần 22 giờ
Bất chấp “Bão Facebook" - quét tài khoản, không cho chạy quảng cáo, doanh nghiệp này vẫn có thể đạt 1000 đơn đặt hàng/ngày nhờ 3 việc sau
"Bão Facebook" đang là từ khoá hot trong thời gian gần đây trong cộng đồng thương mại điện tử và những doanh nghiệp nào có Facebook là kênh quảng cáo, khi bỗng dưng một ngày nhận được thông báo "tài khoản quảng cáo bị vô hiệu hoá", dù không vi phạm hoặc nhận được bất kỳ cảnh báo nào.

Điều gì sẽ xảy ra nếu hai khối rác không gian va chạm vào nhau?

tinybook tinybook 1 tuần 1 ngày
Điều gì sẽ xảy ra nếu hai khối rác không gian va chạm vào nhau?
Hiệu ứng Domino có thể tạo ra lớp mảnh vỡ không thể xuyên thủng, giam giữ chúng ta trên Trái đất vĩnh viễn.

10 sai lầm hay mắc phải trong việc dọn dẹp nhà cửa

tinybook tinybook 1 tuần 1 ngày
10 sai lầm hay mắc phải trong việc dọn dẹp nhà cửa
Trong quá trình dọn dẹp và chăm sóc nhà cửa, chúng ta thường mắc phải những sai lầm không chỉ gây hại cho những đồ vật xung quanh mà còn cho chính bản thân chúng ta.

Phân tích đá Mặt Trăng cho thấy nhà chị Hằng từng phát ra từ trường, và nhờ nó sự sống trên Trái Đất mới xuất hiện

tinybook tinybook 1 tuần 1 ngày
Phân tích đá Mặt Trăng cho thấy nhà chị Hằng từng phát ra từ trường, và nhờ nó sự sống trên Trái Đất mới xuất hiện
Lấy được mẫu đá từ hai cực của Mặt Trăng, ta sẽ biết rõ khẳng định này là đúng hay sai.

Sử dụng năng lượng Mặt Trời, thiết bị này lấy được nước từ không khí khô hanh như sa mạc

tinybook tinybook 1 tuần 1 ngày
Sử dụng năng lượng Mặt Trời, thiết bị này lấy được nước từ không khí khô hanh như sa mạc
Toàn bộ hệ thống chỉ nặng 7kg.

Bay liên tục 13.000 km không cần nghỉ, loài chim 'máy bay phản lực' lập kỷ lục vô tiền khoáng hậu

tinybook tinybook 1 tuần 1 ngày
Bay liên tục 13.000 km không cần nghỉ, loài chim máy bay phản lực lập kỷ lục vô tiền khoáng hậu
Bay hơn 12.000km từ Alaska đến New Zealand trong 11 ngày không ngừng nghỉ, một con chim choắt mỏ thẳng đuôi vằn xác lập một kỷ lục vô tiền khoáng hậu trong thế giới động vật.

Đột phá: lần đầu tiên khoa học đạt được siêu dẫn ở nhiệt độ phòng

tinybook tinybook 1 tuần 2 ngày
Đột phá: lần đầu tiên khoa học đạt được siêu dẫn ở nhiệt độ phòng
"Trạng thái siêu dẫn" vẫn là mục tiêu của khoa học vật chất suốt nhiều thập kỷ nay, và chúng ta đã đi được nửa chặng đường với đột phá mới.

Não sôi lên, hộp sọ nổ tung, cơ bắp bốc hơi và mô bị thủy tinh hóa, khoảnh khắc bị núi lửa hủy diệt còn kinh hoàng hơn địa ngục

tinybook tinybook 1 tuần 3 ngày
Não sôi lên, hộp sọ nổ tung, cơ bắp bốc hơi và mô bị thủy tinh hóa, khoảnh khắc bị núi lửa hủy diệt còn kinh hoàng hơn địa ngục
Núi lửa là một vết đứt gãy trên lớp vỏ của một hành tinh, như là Trái Đất cho phép dung nham, tro núi lửa, và khí thoát ra từ một lò magma ở dưới bề mặt.

Khoa học tìm ra giới hạn trên của tốc độ âm thanh: 36 km/s

tinybook tinybook 1 tuần 3 ngày
Khoa học tìm ra giới hạn trên của tốc độ âm thanh: 36 km/s
Trên lý thuyết, âm thanh truyền qua vật liệu hydro kim loại (mới chỉ tồn tại trên lý thuyết) sẽ có tốc độ cao nhất, gần với mốc 36 km/s.

4 lý do khiến TMĐT ngày càng thu hút tín đồ công nghệ

tinybook tinybook 1 tuần 3 ngày
4 lý do khiến TMĐT ngày càng thu hút tín đồ công nghệ
Với hàng loạt ưu đãi độc quyền hấp dẫn, cam kết xuất xứ và chính sách hậu mãi “sang xịn”, sự bùng nổ đơn hàng công nghệ trong những Lễ Hội mua sắm đã và đang chứng tỏ vị thế của hệ thống gian hàng chính hãng trên TMĐT trong lòng fan công nghệ.

Nếu không ngửi được 2 mùi này thì nhiều khả năng bạn đã mắc phải COVID-19

tinybook tinybook 1 tuần 3 ngày
Nếu không ngửi được 2 mùi này thì nhiều khả năng bạn đã mắc phải COVID-19
Mất khứu giác và vị giác là một trong những triệu chứng do coronavirus được báo cáo phổ biến nhất, và cũng là một trong những dấu hiệu rõ ràng nhất về sự hiện diện của virus SARS-CoV-2.

Đây là lý do tại sao ta nên xây cơ sở hạ tầng internet lượng tử trên quỹ đạo

tinybook tinybook 1 tuần 4 ngày
Đây là lý do tại sao ta nên xây cơ sở hạ tầng internet lượng tử trên quỹ đạo
Nghiên cứu mới chỉ ra rằng với một dàn 400 vệ tinh lượng tử, ta sẽ "dễ dàng" có được internet lượng tử toàn cầu.

6 dấu hiệu cho thấy nhà bạn có vấn đề về điện, cần khắc phục 'càng sớm càng tốt'

tinybook tinybook 1 tuần 4 ngày
6 dấu hiệu cho thấy nhà bạn có vấn đề về điện, cần khắc phục càng sớm càng tốt
Các nghiên cứu đã chỉ ra rằng hầu hết các ngôi nhà không tuân theo các biện pháp an toàn được khuyến nghị để ngăn ngừa điện giật và hỏa hoạn, tuy nhiên một số dấu hiệu dễ nhận thấy có thể giúp tìm ra vấn đề trước khi mọi thứ vượt khỏi tầm tay.

Mổ xẻ trạm gốc 5G Huawei mới thấy công ty Trung Quốc cần linh kiện Mỹ đến mức nào

tinybook tinybook 1 tuần 5 ngày
Mổ xẻ trạm gốc 5G Huawei mới thấy công ty Trung Quốc cần linh kiện Mỹ đến mức nào
Gần 30% giá trị trạm gốc 5G của Huawei thuộc về các linh kiện Mỹ, hầu hết trong số đó là các con chip tối quan trọng cho việc xử lý tín hiệu radio, điều khiển nguồn năng lượng cũng như chip nhớ.
tinybook Công Nghệ Thông Tin








Chat