Microsoft phát triển một cỗ máy có khả năng nhận diện giọng nói hội thoại ngang ngửa con người

Microsoft phát triển một cỗ máy có khả năng nhận diện giọng nói hội thoại ngang ngửa con người
Theo: Tấn Minh Theo Trí Thức Trẻ
Thể loại: Sản Phẩm Công Nghệ
Cứ mỗi ngày trôi qua, những kỹ năng vốn giúp phân biệt chúng ta với máy móc lại dần được những cỗ máy thực hiện một cách thành thục.

Máy móc đã vượt mặt con người trên nhiều lĩnh vực, từ chơi cờ, game show truyền hình (Jeopardy!), Go, nhận diện vật thể, nhận diện khuôn mặt, và cả chơi game máy tính. Nếu bạn nghĩ rằng loài người đang ngày một tụt hậu đằng sau máy móc, có lẽ bạn chẳng hề sai.

Nhưng chỉ cần thử sử dụng bất kỳ phần mềm nhận diện giọng nói nào, và niềm tin của bạn vào loài người sẽ nhanh chóng được khôi phục. Dù đã tốt và ngày một tốt hơn, những hệ thống này chưa bao giờ hoàn hảo. Bạn đang đặt hàng món kem (Ice Cream), hay bạn đang nói "I scream"? Có lẽ là cả hai - đó là những gì một cỗ máy sẽ nghĩ nếu bạn đang nói chuyện với nó.

Do đó, thật an tâm khi biết được nhận diện giọng nói hội thoại thông thường là một thứ mà máy móc vẫn đang gặp nhiều khó khăn, và loài người vẫn là những bậc thầy đối với ngôn ngữ của chính mình.

Microsoft phát triển một cỗ máy có khả năng nhận diện giọng nói hội thoại ngang ngửa con người - Ảnh 1.

Nhưng quan điểm đó có lẽ sẽ phải thay đổi. Rất sớm thôi. Khi mà hôm nay, Geoff Zweig và các nhà nghiên cứu tại Microsoft Research ở Redmond, Washington cho biết họ đã có một đột phá trong lĩnh vực nhận diện giọng nói và các thuật toán học máy của họ nay đã lần đầu vượt qua con người trong nhận diện giọng nói hội thoại thông thường.

Nghiên cứu nhận diện giọng nói có một lịch sử khá dài. Vào những năm 1950, các máy tính ban đầu có thể nhận diện tối đa 10 từ được nói rõ ràng bởi một người duy nhất. Đến những năm 1980, các nhà nghiên cứu đã phát triển những cỗ máy có khả năng ghi lại những bài nói đơn giản với số từ vựng khoảng 1000 từ. Những năm 1990, máy móc đã có thể ghi lại nội dung khi một người đọc tờ Wall Street Journal, và sau đó là cả một đoạn tin tức trên TV.

Có thể thấy tham vọng của các nhà nghiên cứu ngày một tăng lên theo thời gian. Nhưng những bài test đó lại đơn giản hơn so với các đoạn hội thoại thông thường vì nhiều lý do. Từ vựng trên tờ Wall Street Journal chủ yếu là về kinh doanh và tài chính, và câu văn cũng được viết mạch lạc, đúng ngữ pháp - một điều không phải lúc nào cũng đúng trong hội thoại thông thường. Các bản tin TV thì ít hình thức hơn, nhưng vẫn có tính mạch lạc cao và được phát âm rõ ràng. Mọi ví dụ nêu trên đều được máy móc chinh phục dễ dàng.

Nhưng tác vụ khó khăn nhất - ghi lại một đoạn hội thoại thông thường - vẫn là một thứ mà máy móc chưa với tới được.

Hội thoại thông thường khó hơn đáng kể bởi kích cỡ từ vựng, và bên cạnh từ ngữ con người tạo khi nói còn có tiếng ồn. Con người sử dụng rất nhiều tiếng ồn để quản lý lượt lời trong hội thoại - một loại hình giao tiếp mà các nhà ngôn ngữ học gọi là "kênh phụ" (backchannel).

Ví dụ, uh-huh được dùng để báo hiệu cho người nói rằng anh/cô ta nên tiếp tục nói. Nhưng "uh" là một từ ấp úng chỉ ra rằng người nói còn nhiều điều để nói, một cảnh báo rằng có nhiều thứ khác nữa. Trong quản lý lượt lời, "uh" đóng vai trò đối nghịch với "uh-huh".

Microsoft phát triển một cỗ máy có khả năng nhận diện giọng nói hội thoại ngang ngửa con người - Ảnh 2.

 Con người có thể phân tích những âm thanh như vậy một cách dễ dàng và hiểu được vai trò của chúng trong một đoạn hội thoại. Nhưng máy móc thì khác.

Năm 2000, Viện Quốc gia về Tiêu chuẩn và Công nghệ đã tung ra một bộ dữ liệu để giúp các nhà nghiên cứu đương đầu với vấn đề này. Bộ dữ liệu chứa các bản ghi của các đoạn hội thoại thông thường trên điện thoại. Một số đoạn nói về một chủ đề nhất định. Số còn lại là các đoạn hội thoại giữa bạn bè với nhau và liên quan đến bất kỳ chủ đề nào có thể.

Phần lớn dữ liệu có mục đích giúp huấn luyện một thuật toán học máy để nhận diện giọng nói. Phần còn lại của dữ liệu là một bài test mà máy móc phải diễn dịch.

Người ta đánh giá hiệu suất bằng số lượng từ mà máy nhận diện sai, và mục tiêu cuối cùng là giúp máy thực hiện việc nhận diện tốt hơn cả con người.

Con người nhận diện giọng nói tốt như thế nào? Khi diễn dịch, con người nhìn chung có tỉ lệ lỗi khoảng 4%. Nói cách khác, chúng ta diễn dịch không chính xác 4 từ trong mỗi 100 từ. Trong quá khứ, máy móc chưa bao giờ đạt kết quả được gần như thế này.

Nhưng Microsoft lần này tuyên bố họ cuối cùng cũng đã đạt được hiệu suất ngang ngửa con người, dù vẫn có một hạn chế quan trọng. Các nhà nghiên cứu Microsoft bắt đầu bằng cách tái định mức hiệu suất của con người trong các tác vụ diễn dịch, với việc gửi các đoạn ghi âm điện thoại trong bộ dữ liệu của NIST đến một dịch vụ diễn dịch chuyên nghiệp và đánh giá tỉ lệ lỗi.

Kết quả thu được khiến mọi người bất ngờ: dịch vụ này có tỉ lệ lỗi là 5,9% đối với các đoạn hội thoại về một chủ đề nhất định và 11,3% đối với các đoạn hội thoại giữa bạn bè và các thành viên trong gia đình với nhau. Hai kết quả này cao hơn nhiều so với chúng ta từng nghĩ.

Tiếp theo, Zweig và các đồng nghiệp tối ưu các hệ thống học sâu của họ dựa trên các mạng thần kinh xoắn với số lớp biến thiên, mỗi lớp lại xử lý một khía cạnh khác nhau của đoạn hội thoại. Sau đó họ sử dụng bộ dữ liệu huấn luyện để dạy cho máy hiểu các bài nói thông thường và để nó thử bộ dữ liệu thử nghiệm.

Kết quả: nhìn chung, hệ thống nhận diện giọng nói của Microsoft có tỉ lệ lỗi tương đương với con người, nhưng loại lỗi mà nó gặp phải lại khá khác biệt.

Lỗi thường gặp nhất mà cỗ máy của Microsoft gặp phải là nhầm lẫn các âm thanh kênh phụ "uh" và "uh-huh". Ngược lại, con người hiếm khi gặp lỗi này và thay vào đó, họ thường nhầm các từ như "a" và "the" hay "uh" và "a".

Không có lý do nào về mặt nguyên tắc giải thích tại sao một cỗ máy không thể được huấn luyện để nhận diện các âm thanh kênh phụ. Zweig và các đồng sự nghĩ  vấn đề mà máy móc gặp với những sai sót như trên có thể xuất phát từ cách mà những tiếng ồn được đánh dấu trong bộ dữ liệu huấn luyện. "Hiệu suất khá nghèo nàn của hệ thống tự động có lẽ đơn giản là do những nhầm lẫn trong chú giải của bộ dữ liệu huấn luyện" - nhóm nghiên cứu cho biết.

Nhìn chung, máy móc có tỉ lệ lỗi ngang ngửa con người ở mức 5,9% đối với các đoạn hội thoại về chủ đề cụ thể, nhưng vượt qua con người trong diễn dịch các đoạn hội thoại giữa bạn bè và gia đình, với tỉ lệ lỗi là 11,1%. "Lần đầu tiên, hệ thống nhận diện tự động đã có hiệu suất ngang ngửa với con người trong tác vụ này" - Zweig nói.

Đó quả là một kết quả thú vị. Microsoft có lẽ rất hào hứng với chiến thắng này của những cỗ máy của hãng, nhưng đây thực ra lại là một điềm gở. Máy móc đang trở nên tốt hơn con người trên lĩnh vực nhận diện giọng nói. Điều này sẽ dẫn đến những hệ quả đáng kể đối với phương thức chúng ta tương tác với máy móc trong tương lai.

Tham khảo: TechnologyReview

Điện thoại quả chuối Nokia 8110 phiên bản hiện đại chính thức ra mắt thị trường Việt Nam với giá 1,68 triệu đồng

tinybook tinybook 1 tuần 1 ngày
Điện thoại quả chuối Nokia 8110 phiên bản hiện đại chính thức ra mắt thị trường Việt Nam với giá 1,68 triệu đồng
Với hai màu sắc nổi bật là màu đen truyền thống và màu vàng chuối, Nokia 8110 sẽ tái hiện lại mọi thứ bạn ưa thích từ thương hiệu Nokia, bao gồm cả trò chơi "Rắn săn mồi".

iPhone SE (2018) sẽ được trình làng vào tháng Chín cùng iPhone Xs, Xs Plus và iPhone 9

tinybook tinybook 1 tuần 1 ngày
iPhone SE (2018) sẽ được trình làng vào tháng Chín cùng iPhone Xs, Xs Plus và iPhone 9
Trước đó, nhiều nguồn tin cho rằng iPhone SE (2018) sẽ được ra mắt ngay trong sự kiện WWDC diễn ra vào tháng Sáu tới.

iPhone 8 và iPhone 8 Plus màu đỏ chính thức mở bán tại Việt Nam, giá từ 20,99 triệu

tinybook tinybook 1 tuần 1 ngày
iPhone 8 và iPhone 8 Plus màu đỏ chính thức mở bán tại Việt Nam, giá từ 20,99 triệu
iPhone 8/8 Plus (PRODUCT) RED chính hãng (VN/A) sẽ chính thức lên kệ ngày hôm nay.

Qualcomm tuyên bố smartphone 5G đầu tiên sẽ xuất hiện vào cuối năm 2018

tinybook tinybook 1 tuần 1 ngày
Qualcomm tuyên bố smartphone 5G đầu tiên sẽ xuất hiện vào cuối năm 2018
Dường như công nghệ 5G đang phát triển với tốc độ cao hơn so với những gì chúng ta tưởng tượng.

Sẽ không có iPhone SE 2, thay vào đó là iPhone SE (2018)

tinybook tinybook 1 tuần 1 ngày
Sẽ không có iPhone SE 2, thay vào đó là iPhone SE (2018)
Giá bán của iPhone SE (2018) chưa được tiết lộ. Nhưng chúng ta có thể hy vọng rằng đây sẽ là chiếc iPhone có giá bán rẻ nhất của Apple trong năm nay.

Chip dành cho smartwatch sắp tới của Qualcomm sẽ hỗ trợ theo dõi ánh mắt

tinybook tinybook 1 tuần 1 ngày
Chip dành cho smartwatch sắp tới của Qualcomm sẽ hỗ trợ theo dõi ánh mắt
Một thông tin vừa xuất hiện hôm qua cho biết Qualcomm và Google đang hợp tác phát triển một con chip (SoC) mới dành cho các smartwatch Wear OS trong tương lai.

Không nghi ngờ gì nữa, nếu chọn smartphone selfie thật nữ tính thì đây là ứng viên hàng đầu rồi

tinybook tinybook 1 tuần 1 ngày
Không nghi ngờ gì nữa, nếu chọn smartphone selfie thật nữ tính thì đây là ứng viên hàng đầu rồi
Nếu bạn là fangirl của màu hồng thì điện thoại Huawei màu hồng (Sakura Pink) mới ra mắt vào ngày 05/05 vừa qua chắc chắn sẽ làm bạn hài lòng.

Cái chết của Windows Phone đã khiến Windows 10 bỗng chốc trở thành "kép phụ" ngay bên trong Microsoft

tinybook tinybook 1 tuần 1 ngày
Cái chết của Windows Phone đã khiến Windows 10 bỗng chốc trở thành "kép phụ" ngay bên trong Microsoft
Không còn khả năng duy trì sự thống trị lên chiến trường hệ điều hành, Microsoft buộc phải tìm đến một "tầng" công nghệ cao hơn để có thể tiếp tục kiểm soát cả thế giới. Sự kiện Build năm nay là minh chứng rõ ràng nhất cho sự đổi thay này.

Lộ báo cáo của EEC cho thấy toàn bộ smartphone mà Xiaomi có thể ra mắt trong năm 2018

tinybook tinybook 1 tuần 1 ngày
Lộ báo cáo của EEC cho thấy toàn bộ smartphone mà Xiaomi có thể ra mắt trong năm 2018
Danh sách này cho thấy Xiaomi vẫn sẽ tiếp tục tập trung vào các thị trường phân khúc tầm thấp với rất nhiều dòng smartphone giá rẻ.

Đánh giá Nokia 1: Khi phần mềm tốt không thể "gánh" nổi phần cứng tệ

tinybook tinybook 1 tuần 1 ngày
Đánh giá Nokia 1: Khi phần mềm tốt không thể "gánh" nổi phần cứng tệ
Mặc dù rất thích Android Go trên Nokia 1, tuy nhiên chúng tôi không thể khuyến cáo người dùng mua chiếc máy này, đặc biệt khi trên thị trường có những sản phẩm tốt hơn trong cùng tầm giá.

Amazon làm lộ hình ảnh OnePlus 6, hai màu sắc Mirror Black và Midnight Black, giá bán từ 519 USD

tinybook tinybook 1 tuần 1 ngày
Amazon làm lộ hình ảnh OnePlus 6, hai màu sắc Mirror Black và Midnight Black, giá bán từ 519 USD
OnePlus 6 sẽ là chiếc smartphone cạnh tranh với iPhone X và Galaxy S9, nhưng có giá chỉ bằng một nửa.

Để Galaxy S9 Plus dưới đường ray tàu hỏa và cái kết không thể đau lòng hơn

tinybook tinybook 1 tuần 1 ngày
Để Galaxy S9 Plus dưới đường ray tàu hỏa và cái kết không thể đau lòng hơn
Chiếc Galaxy S9 Plus lành lặn sẽ ra sao khi để trên đường ray tàu hỏa và mặc cho những bánh xe vô tư lăn qua?

Chuyến đi của "thái tử" Samsung tới Trung Quốc: Lá cờ trắng, hay cơ hội phản đòn lại người Trung Quốc?

tinybook tinybook 1 tuần 1 ngày
Chuyến đi của "thái tử" Samsung tới Trung Quốc: Lá cờ trắng, hay cơ hội phản đòn lại người Trung Quốc?
Có lẽ, trong thế giới smartphone đầy những lời cạnh khóe, bạn sẽ rất hiếm khi bắt gặp nhà lãnh đạo tối cao của một hãng lại cầm trên tay điện thoại của hãng khác. Khi đến Thâm Quyến những ngày vừa qua, Thái tử Samsung đã đến tận Mi Store để "trên tay" một chiếc Mi Mix 2S.

Microsoft sẽ thay thế miễn phí những máy Surface Pro 4 dính lỗi chớp màn hình

tinybook tinybook 1 tuần 2 ngày
Microsoft sẽ thay thế miễn phí những máy Surface Pro 4 dính lỗi chớp màn hình
Sau 3 tháng xảy ra lỗi chớp màn hình trên Surface Pro 4, Microsoft mới đây đã mở chính sách thay thế miễn phí màn hình của những máy gặp lỗi.

Nhà sản xuất case bảo vệ tiết lộ iPhone SE 2 sẽ giống bản thu nhỏ của iPhone X

tinybook tinybook 1 tuần 2 ngày
Nhà sản xuất case bảo vệ tiết lộ iPhone SE 2 sẽ giống bản thu nhỏ của iPhone X
Hình ảnh render về case bảo vệ cho iPhone SE 2 tiết lộ phần nào về thiết kế của máy giống với iPhone X.

Bằng sáng chế mới của Apple cho phép hiển thị 2 khung hình riêng biệt cho hệ thống dual-camera trên smartphone

tinybook tinybook 1 tuần 2 ngày
Bằng sáng chế mới của Apple cho phép hiển thị 2 khung hình riêng biệt cho hệ thống dual-camera trên smartphone
Người dùng có thể xem đồng thời hình ảnh từ 2 camera trên smartphone của Apple thay vì chỉ một như trước.

Không cần thị trường Mỹ, những nhãn hiệu smartphone Trung Quốc này cực kỳ thành công tại châu Âu

tinybook tinybook 1 tuần 2 ngày
Không cần thị trường Mỹ, những nhãn hiệu smartphone Trung Quốc này cực kỳ thành công tại châu Âu
Có hai trong số các công ty smartphone lớn trên thế giới vẫn đang đợi cơ hội để tấn công thị trường Mỹ. Trong lúc đó, họ lại nhận được sự chào đón nồng nhiệt từ người tiêu dùng bên kia Đại Tây Dương.

Một startup ốp lưng điện thoại đã kiếm hàng triệu USD bằng cách phá hủy những chiếc iPhone X như thế nào?

tinybook tinybook 1 tuần 2 ngày
Một startup ốp lưng điện thoại đã kiếm hàng triệu USD bằng cách phá hủy những chiếc iPhone X như thế nào?
Hãy hình dung có một người lạ đến chỗ bạn bên ngoài một cửa hàng flagship của Apple vào ngày iPhone X ra mắt. Anh ta lấy một chiếc điện thoại iPhone mới mua, lắp ốp lưng vào chiếc điện thoại đó và mời bạn ném nó vào vỉa hè. Bạn sẽ cảm thấy như thế nào?

Ngoài iPhone X, đây là những smartphone "tai thỏ" tốt nhất mà bạn có thể sở hữu ngay bây giờ

tinybook tinybook 1 tuần 2 ngày
Ngoài iPhone X, đây là những smartphone "tai thỏ" tốt nhất mà bạn có thể sở hữu ngay bây giờ
Đây là danh sách tổng hợp smartphone tai thỏ chạy Android với cấu hình tốt, hiệu năng cao chụp ảnh đẹp nhất trên thị trường ở mọi mức giá.

Microsoft hé lộ bằng sáng chế Surface Phone với 3 màn hình có thể gập lại được

tinybook tinybook 1 tuần 3 ngày
Microsoft hé lộ bằng sáng chế Surface Phone với 3 màn hình có thể gập lại được
Trong đó, một màn hình phụ sẽ nằm trên phần bản lề kết nối hai màn hình chính còn lại.

Tiki.vn mở bán độc quyền Xiaomi Mi Mix 2S – Tặng quà 1,5 triệu đồng chỉ trong ngày 15/05/2018

tinybook tinybook 1 tuần 3 ngày
Tiki.vn mở bán độc quyền Xiaomi Mi Mix 2S – Tặng quà 1,5 triệu đồng chỉ trong ngày 15/05/2018
Từ ngày 07/05/2018, siêu phẩm Xiaomi Mi Mix 2S đã chính thức ra mắt tại Việt Nam và là đối thủ “nặng ký” trong phân khúc smartphone từ 12 đến 15 triệu đồng. Được đánh giá là “Iphone X của thế giới Android”, sản phẩm này có thiết kế viền màn hình siêu mỏng, camera tích hợp trí tuệ nhân tạo cùng công nghệ sạc không dây đột phá.

Apple sẽ sử dụng nhôm thân thiện với môi trường để sản xuất MacBook và iPhone

tinybook tinybook 1 tuần 3 ngày
Apple sẽ sử dụng nhôm thân thiện với môi trường để sản xuất MacBook và iPhone
Apple có rất nhiều sáng kiến thân thiện với môi trường, như sử dụng năng lượng tái tạo được để cấp điện cho các nhà máy và khuyến khích các nhà cung ứng làm điều tương tự.

BlackBerry KEY2 có thể sử dụng chip Snapdragon 660 và RAM 6 GB

tinybook tinybook 1 tuần 3 ngày
BlackBerry KEY2 có thể sử dụng chip Snapdragon 660 và RAM 6 GB
BlackBerry KEY2 hầu như sẽ giữ lại thiết kế của người tiền nhiệm nhưng sẽ được nâng cấp về phần cứng.

Asus ra mắt smartphone chơi game ROG vào tháng 6

tinybook tinybook 1 tuần 3 ngày
Asus ra mắt smartphone chơi game ROG vào tháng 6
Sau Razer, Xiaomi, ZTE, có lẽ sẽ đến lượt Asus ra mắt smartphone chuyên trị game trong thời gian tới.

Nhờ iPad, một công ty xây dựng tiết kiệm được 1,8 triệu USD và 55.000 giờ làm việc mỗi năm

tinybook tinybook 1 tuần 3 ngày
Nhờ iPad, một công ty xây dựng tiết kiệm được 1,8 triệu USD và 55.000 giờ làm việc mỗi năm
Mọi nhân viên công ty có thể cùng nhau làm việc với các bản kế hoạch có thể chỉnh sửa theo thời gian thực nhờ lưu trữ trên đám mây.

Test pin Xiaomi Mi Mix 2s với iPhone và Galaxy S

tinybook tinybook 1 tuần 3 ngày
Test pin Xiaomi Mi Mix 2s với iPhone và Galaxy S
Thời lượng pin của Mi Mix 2s chỉ mở mức trung bình so với nhiều flagship khác trên thị trường.

Đi chụp hoàng hôn lại quên mang máy ảnh, tôi đã dùng iPhone X và Galaxy S9+ để chụp ra những bức ảnh này

tinybook tinybook 1 tuần 3 ngày
Đi chụp hoàng hôn lại quên mang máy ảnh, tôi đã dùng iPhone X và Galaxy S9+ để chụp ra những bức ảnh này
iPhone X hay Galaxy S9+, đâu mới là cứu cánh lớn nhất cho buổi chiều hôm ấy?

Qualcomm: Smartphone đầu tiên hỗ trợ kết nối 5G sẽ ra mắt ngay trong năm nay

tinybook tinybook 1 tuần 4 ngày
Qualcomm: Smartphone đầu tiên hỗ trợ kết nối 5G sẽ ra mắt ngay trong năm nay
Qualcomm cũng khẳng định 5G sẽ sớm có mặt trên tất cả các phân khúc smartphone và các thiết bị khác như tablet hay notebook.

YouTube chính thức hỗ trợ video HDR cho iPhone X và bộ đôi iPhone 8/8 Plus

tinybook tinybook 1 tuần 4 ngày
YouTube chính thức hỗ trợ video HDR cho iPhone X và bộ đôi iPhone 8/8 Plus
Người dùng iPhone cũng có thể trải nghiệm những video này ở rất nhiều độ phân giải khác nhau, từ 480p cho đến 1080p.

Samsung thực hiện cuộc kiểm tra quy mô lớn tại Mỹ vì doanh số Galaxy S9 không được như mong đợi?

tinybook tinybook 1 tuần 4 ngày
Samsung thực hiện cuộc kiểm tra quy mô lớn tại Mỹ vì doanh số Galaxy S9 không được như mong đợi?
Dù Samsung phủ nhận nhưng nhiều chuyên gia nhận định chính việc doanh số Galaxy S9 không như mong muốn đã khiến công ty phải tiến hành tổng kiểm tra các hoạt động kinh doanh tại Mỹ.
tinybook Công Nghệ Thông Tin








Chat