Trợ lý ảo được đánh giá là xu hướng của tương lai, mang lại tiềm năng ứng dụng trong nhiều lĩnh vực, hỗ trợ thực hiện các tác vụ nhanh chóng, hiệu quả và nâng cao trải nghiệm người dùng. Từ đó giúp các doanh nghiệp tối ưu hóa chu trình, giảm thiểu chi phí, gia tăng lợi nhuận. Hãy cùng VinBigData tìm hiểu một số ứng dụng của trợ lý ảo trong nhiều lĩnh vực thông qua bài viết dưới đây nhé!

Ứng dụng của trợ lý ảo trong chu trình vận hành doanh nghiệp
Trợ lý văn phòng “ảo”
Theo Gartner, 50% nhân viên tri thức sẽ sử dụng trợ lý ảo mỗi ngày vào năm 2025, con số này chỉ là 2% vào năm 2019. Những trợ lý ảo bằng giọng nói có thể được tích hợp vào nhiều công cụ và phần mềm hiện tại các doanh nghiệp đang sử dụng, nhằm hỗ trợ thực hiện một số nhiệm vụ văn phòng, chẳng hạn như lên lịch họp, gửi email, ghi chép biên bản họp… Điều này giúp các doanh nghiệp cải thiện năng suất làm việc và tối ưu nguồn lực cho các công việc mang tính chuyên môn hơn.
Quản lý chuỗi cung ứng và hàng tồn kho
Đối với các doanh nghiệp có chuỗi cung ứng trên toàn cầu, công nghệ giọng nói có thể được sử dụng để truy cập dữ liệu liên quan nhanh hơn. Thay vì theo dõi lộ trình chi tiết và luồng email để phát hiện trạng thái mới nhất của một mặt hàng, doanh nghiệp có thể sử dụng các truy vấn thoại để tìm ra trạng thái vận chuyển hàng hóa hoặc vị trí đơn hàng.
Tại văn phòng, công nghệ giọng nói cũng có thể được ứng dụng để đặt các thiết bị thiết yếu thay vì phải nhập liệu chi tiết trên máy tính hoặc thu thập thông tin theo cách thủ công. Việc tích hợp giọng nói với các hệ thống khác trong văn phòng sẽ cho phép các thiết bị tự quét mức tồn kho hiện tại để có số lượng đặt hàng tối ưu hơn.
Quản lý Quan hệ khách hàng & Nhân sự
Với công nghệ giọng nói, hệ thống có thể tự động cập nhật các bản ghi chứa thông tin liên quan và cung cấp cho những người đang tìm kiếm nó. Các trợ lý giọng nói này cũng có thể giúp các bộ phận nhân sự lên lịch đào tạo, đánh giá hiệu suất và thời gian nghỉ phép cho nhân viên tại văn phòng và hỗ trợ quản lý nhân viên làm việc từ xa.
Với sự phổ biến của các cuộc họp qua Zoom và các công cụ hội nghị truyền hình khác, công nghệ giọng nói có thể được sử dụng để ghi và chép lại cuộc họp, xác định người nói và gắn thẻ các khu vực chính để có thể tìm kiếm biên bản cuộc họp sau này. Những khả năng phiên âm này cũng có thể giúp các nhóm nhân sự tổ chức quá trình tuyển dụng cũng như dán nhãn các kỹ năng chính được liệt kê trong mô tả công việc trong các cuộc phỏng vấn video.
Ứng dụng của trợ lý ảo nâng tầm trải nghiệm khách hàng cá nhân
Loa thông minh
Ngoài các ứng dụng phục vụ mục đích giải trí, trợ lý ảo giúp người dùng có nhiều trải nghiệm khác biệt với loa thông minh. Tự động phát nhạc, tìm kiếm thông tin, mua sắm trực tuyến… chỉ là một trong nhiều tính năng đột phá mà trợ lý ảo có thể đáp ứng người dùng thông qua loa thông minh.
Thiết bị thông minh
Các thiết bị gia đình thông minh hỗ trợ giọng nói không chỉ giới hạn ở loa thông minh. Hệ thống an ninh gia đình, thiết bị nhà bếp, đèn chiếu sáng và thậm chí cả máy hút bụi sử dụng công nghệ giọng nói hiện đang được phát triển trên toàn cầu. Các thiết bị giặt là và nhà bếp được kích hoạt bằng giọng nói có thể bắt đầu quá trình nấu nướng và giặt là bằng các lệnh đơn giản, đồng thời giúp người dùng tiết kiệm thời gian trong khi thực hiện những việc khác trong nhà.
Trợ lý ảo thông minh trên ô tô
Tích hợp sâu với các tính năng cho phép điều khiển xe thông minh, điều hướng, dẫn đường, đảm bảo an ninh an toàn, hỗ trợ nhiều tiện ích gia đình & văn phòng, thực hiện mua sắm sản phẩm dịch vụ trực tuyến, cập nhật phần mềm từ xa…
Ứng dụng của trợ lý ảo cụ thể trong nhiều lĩnh vực
Ứng dụng của trợ lý ảo trong ngành ngân hàng
Khách hàng tại các ngân hàng có thể nhận thông tin tài khoản như số dư và các giao dịch mới nhất của họ, chuyển tiền, thanh toán hóa đơn, thu thập thông tin lãi suất và tỷ giá hối đoái… cùng nhiều tiện ích khác thông qua trợ lý ảo. Chu trình xử lý thủ tục giờ đây nhanh chóng và thuận tiện hơn rất nhiều.
Ứng dụng của trợ lý ảo trong lĩnh vực chăm sóc sức khỏe
Một số ứng dụng bao gồm trợ lý sức khỏe cá nhân có thể hoạt động như huấn luyện viên cá nhân, giúp đặt lịch hẹn với bác sĩ, gọi y tá và nhận lời nhắc uống thuốc đúng giờ. Ngoài ra, những người mắc bệnh tiểu đường có thể sử dụng thang đo hỗ trợ giọng nói để theo dõi lượng đường trong máu.
Ứng dụng của trợ lý ảo trong ngành khách sạn
Ngành công nghiệp khách sạn cũng đã và đang áp dụng công nghệ giọng nói. Du khách có thể sử dụng lệnh thoại để vận hành các thiết bị, tìm các đề xuất về các điểm du lịch trong khu vực, đặt phương tiện đi lại, đặt dịch vụ phòng và truy vấn thông tin về khách sạn mong muốn.
Ứng dụng của trợ lý ảo trong các đại lý xe hơi
Công nghệ giọng nói không chỉ được sử dụng trên ô tô mà các đại lý cũng đang tận dụng công nghệ này để nâng cao trải nghiệm của khách hàng. Người tiêu dùng có thể nhận được hỗ trợ bán hàng, đặt vé lái thử và các buổi trình chiếu cũng như nhận được lời nhắc dịch vụ và đặt lịch hẹn bằng công nghệ thoại.
Mặc dù trợ lý ảo đang là một mảng công nghệ được đầu tư phát triển mạnh mẽ, nhưng vẫn còn nhiều thách thức dành cho các đơn vị phát triển sản phẩm. Bởi nội dung giọng nói trong ngữ cảnh phức tạp hơn rất nhiều so với nội dung viết, có rất nhiều điều cần phải xem xét, từ âm lượng, sắc thái cảm xúc cho đến khác biệt trong văn hóa và sử dụng phương ngữ. Các nhà phát triển đang cố gắng nghiên cứu và hoàn thiện công nghệ, để có thể mang đến phiên bản tốt hơn của trợ lý ảo trong tương lai gần.
Giải pháp trợ lý ảo của VinBigData – ViVi được xây dựng dựa trên công nghệ Xử lý ngôn ngữ tự nhiên (NLP) và các thuật toán trí tuệ nhân tạo (AI) tiên tiến, sở hữu nhiều ưu thế vượt trội như nhận diện ngôn ngữ Tiếng Việt chính xác tới 98% với nhóm từ phổ thông. Trợ lý ảo tiếng Việt hiện nay đang được trang bị trên xe điện VF e34, kỳ vọng mang đến những trải nghiệm khác biệt và tuyệt vời cho người lái trên hành trình di chuyển. Tìm hiểu thêm về ViVi và các sản phẩm khác của VinBigData tại: https://product.vinbigdata.org/ |
Nguồn tham khảo: Storyblok
Trợ lý ảo là một thuật ngữ không quá xa lạ trong thời gian gần đây, bởi chúng được tích hợp trong nhiều thiết bị thông minh như điện thoại, tivi, ô tô,… Chúng là sản phẩm ứng dụng của trí tuệ nhân tạo (AI), kết hợp với các mô hình và thuật toán của học máy (ML). Các trợ lý ảo được phát triển nhằm mục đích hỗ trợ thực hiện nhiều tác vụ và tối ưu hóa trải nghiệm người dùng. Vậy trợ lý ảo là gì, có những tính năng đột phá nào. Hãy cùng tìm hiểu trong bài viết dưới đây nhé!
Trợ lý ảo là gì?
Trợ lý ảo, còn được gọi là trợ lý AI hoặc trợ lý kỹ thuật số, là một chương trình ứng dụng có thể hiểu được các lệnh thoại bằng ngôn ngữ tự nhiên, hay bằng văn bản của con người và hỗ trợ người dùng thực hiện các tác vụ. Một số tác vụ có thể kể đến như: đọc tin nhắn, email, tra cứu số điện thoại, lên lịch, gọi điện và nhắc lịch hẹn.
Được phát triển dựa trên trí tuệ nhân tạo AI, trợ lý ảo đóng vai trò như một thư ký cá nhân cho người dùng. Chúng thường được tích hợp trong các thiết bị thông minh sử dụng hàng ngày, để người dùng có thể dễ dàng kết nối và ra lệnh cho trợ lý ảo mọi lúc mọi nơi. Các nhà nghiên cứu đang không ngừng phát triển để trợ lý ảo trở nên thông minh, linh hoạt hơn, có thể thấu hiểu người dùng và xử lý nhiều yêu cầu cùng lúc. Những trợ lý ảo nổi tiếng được cả thế giới biết đến hiện nay: Siri của Apple, Alexa của Amazon, Trợ lý Google,…
Phương thức tương tác của trợ lý ảo
Cùng với sự phát triển của Trí tuệ nhân tạo (AI) cũng như các mô hình học máy (ML), trợ lý ảo ngày càng có nhiều phương thức tương tác với người dùng. Các phương thức dần trở nên linh hoạt, gần gũi như những cuộc đối thoại hàng ngày.
Văn bản
Phương thức tương tác đầu tiên được sử dụng cho các trợ lý ảo là văn bản. Hầu như bất kỳ 1 trợ lý ảo nào hiện nay cũng hỗ trợ tương tác bằng văn bản. Người dùng chỉ cần đưa ra yêu cầu bằng cách gửi tin nhắn và trợ lý ảo sẽ phản hồi thông tin ngay lập tức dựa trên yêu cầu đó. Ví dụ điển hình của phương thức này là các hệ thống chatbot. Khi bạn tương tác với một số fanpage trên Facebook, bạn thường nhận được ngay câu trả lời mà không phải mất thời gian chờ đợi quá lâu thì có lẽ doanh nghiệp đó đang sử dụng chatbot.
Chatbot ngày càng trở nên phổ biến và cách xử lý yêu cầu cũng thông minh và gần gũi với người dùng hơn. Giờ đây, không cần phải gửi những yêu cầu theo mẫu như thời mới ra mắt, người dùng chabot hoàn toàn có thể hỏi-đáp bằng ngôn ngữ hội thoại tự nhiên, thoải mái nhất. Hiện nay, chatbot được áp dụng trí tuệ nhân tạo (AI) và các quy trình xử lý ngôn ngữ tự nhiên (NLP) tiên tiến, với khả năng xử lý hàng nghìn yêu cầu cùng lúc, với tốc độ xử lý nhanh, chính xác, đáp ứng được nhiều bài toán chăm sóc khách hàng của doanh nghiệp.
Xem thêm: AI chatbot là gì và những đột phá so với chatbot thông thường
Giọng nói
Ngoài văn bản, để có thể dễ dàng giao tiếp với người dùng hơn, trợ lý ảo ngày nay được phát triển tương tác với người dùng bằng giọng nói. Chúng thường được gọi là các trợ lý giọng nói. Các trợ lý giọng nói hoạt động theo nguyên tắc: Người dùng chỉ cần gọi chúng bằng các wake-up words (câu mệnh lệnh khởi động), sau đó tiến hành giao tiếp với chúng như những cuộc hội thoại thông thường. Trợ lý giọng nói không chỉ xử lý yêu cầu trên thiết bị thông minh, mà còn có thể trở thành một người bạn dễ dàng tâm sự cùng người dùng, trò chuyện và cung cấp thông tin bất cứ khi nào người dùng muốn.
Tuy nhiên, các trợ lý giọng nói nổi tiếng hiện nay từ các gã khổng lồ công nghệ như Apple Siri, Amazon Alexa, Google,… hầu hết chỉ đang hỗ trợ ngôn ngữ bằng tiếng Anh. Điều này khiến cho một số người dùng Việt Nam vẫn đang gặp khó khăn trong việc giao tiếp với các trợ lý giọng nói của mình.
Trong thời gian gần đây, Trợ lý giọng nói Tiếng Việt ViVi, phát triển bởi Viện Nghiên cứu Dữ liệu lớn Vingroup – VinBigdata, đã được giới thiệu với công chúng và dự kiến ứng dụng trong các dòng xe Vinfast.
Trải nghiệm ViVi: Tại đây
Hình ảnh
Trên thế giới đã xuất hiện một số trợ lý ảo có thể xử lý thông tin với hình ảnh do người dùng cung cấp. Tuy nhiên việc xử lý dữ liệu hình ảnh và phương thức giao tiếp bằng hình ảnh vẫn còn chưa phổ biến, nên trợ lý ảo hình ảnh đang chưa được chú trọng phát triển. Hy vọng đây sẽ là một trong những dự án đột phá của tương lai.
Các trợ lý ảo hàng đầu trong ngành như Apple Siri, Google Assistant hay Samsung Bixby hiện nay đều đang cố gắng hỗ trợ người dùng bằng nhiều phương pháp đa dạng khác nhau. Tuy nhiên, chủ yếu, thông minh và linh hoạt nhất vẫn là phương thức bằng văn bản hay giọng nói.
Các nền tảng hỗ trợ sử dụng trợ lý ảo
Trợ lý ảo hiện nay được hỗ trợ sử dụng trên rất nhiều thiết bị và nền tảng khác nhau để phục vụ nhu cầu đa dạng và thường xuyên của người dùng. Dưới đây là một số nền tảng phổ biến:
Hệ điều hành của các thiết bị điện tử thông minh
Được tích hợp ngay vào hệ điều hành của điện thoại, đồng hồ, máy tính, TV thông minh,… các trợ lý ảo không còn quá xa lạ với người dùng. Thuận tiện mang theo bất cứ đâu, xử lý nhiều tác vụ từ công việc đến đời sống, sự có mặt của trợ lý ảo khiến mọi việc dần trở nên dễ dàng hơn.
Tính năng của các thiết bị trong gia đình
Thời gian gần đây, các trợ lý ảo được tích hợp nhiều trong cả loa hay hệ thống thiết bị gia dụng, để cuộc sống người dùng trở nên thuận tiện hơn. Dễ dàng ra lệnh cho trợ lý ảo bật nhạc, chỉnh độ sáng, chỉnh quạt gió, hay tăng nhiệt độ,… khiến căn nhà trở nên thông minh và mang đến những trải nghiệm thoải mái, tiện nghi.
Tích hợp trong các dịch vụ nhắn tin trên một số nền tảng website, mạng xã hội
Các trợ lý ảo giao tiếp với người dùng bằng văn bản, thường được tích hợp theo cách này. Các doanh nghiệp, tổ chức sử dụng chúng như một nhân viên chăm sóc khách hàng, giải đáp thắc mắc của người dùng trong thời gian thực. Chúng có thể cung cấp thông tin doanh nghiệp và thu thập thông tin khách hàng, giúp các công đoạn gia tăng trải nghiệm người dùng được tối ưu hóa.
Các khả năng của trợ lý ảo
Khả năng xử lý yêu cầu
Dựa trên cơ sở dữ liệu khổng lồ, các thuật toán học máy (ML) và trí tuệ nhân tạo (AI) hiện đại, các trợ lý ảo có khả năng nhận nhiều yêu cầu cùng lúc và xử lý chúng trong thời gian thực. Các trợ lý ảo tiến hành phân tích lời thoại hoặc tin nhắn văn bản từ người dùng, sau đó chuyển hóa thành dữ liệu và truyền về máy chủ để xử lý trong thời gian vài mili giây. Chúng sử dụng tri thức được lập trình và đào tạo từ trước để thực thi mệnh lệnh hoặc trả lời câu hỏi phù hợp. Ngày nay, dựa vào công nghệ xử lý ngôn ngữ tự nhiên (Natural Language Processing – NLP), các trợ lý ảo còn có thể phân tích ngôn ngữ thoại đời sống, các từ ngữ vùng miền, để chọn lọc thông tin và đáp ứng yêu cầu chính xác, linh hoạt.
Khả năng nhận diện tiếng nói (Automatic Speech Recognition – ASR)
Với các trợ lý ảo sử dụng giọng nói, ngoài khả năng xử lý yêu cầu thì khả năng nhận diện tiếng nói cũng cho thấy một bước đột phá ấn tượng từ các nhà nghiên cứu. Trợ lý ảo lắng nghe giọng nói người dùng, ghi lại và chuyển thành dạng dữ liệu có thể hiểu và xử lý được. Sử dụng các thuật toán đặc trưng để xem xét các đặc tính của tín hiệu tiếng nói như tần số, năng lượng, trường độ,… mang đến tính chính xác cao. Các trợ lý ảo sử dụng giọng nói cũng được áp dụng công nghệ Chuyển văn bản thành giọng nói (Text to speech – TTS), để tiến hành hồi đáp và trò chuyện cùng người dùng.
Khả năng tìm kiếm và truy xuất thông tin
Chúng ta thường yêu cầu trợ lý ảo hỗ trợ một số tác vụ như: bật một bài nhạc, cập nhật thông tin mới, hay điều chỉnh âm lượng,… Những công việc này đòi hỏi khả năng xử lý lượng thông tin khổng lồ từ trợ lý ảo. Chúng phải truy cập nền tảng nghe nhạc số sau đó tra cứu và phát bài hát người dùng yêu cầu, hay truy cập các nền tảng tin tức để trích xuất tin nóng trong ngày, hoặc truy cập nhanh chóng vào hệ điều hành để điều chỉnh thông số,… Tất cả các tác vụ này được xử lý chỉ trong vài tích tắc.
Khả năng học hỏi người dùng
Một khả năng được đánh giá cao của các trợ lý AI trong thời gian gần đây. Chúng thu thập thông tin từ thói quen sử dụng và tìm kiếm dữ liệu, để đưa ra các gợi ý phù hợp với mong muốn của người dùng nhất. Thời gian người dùng sử dụng càng lâu, trợ lý ảo càng trở nên linh hoạt và phục vụ chính xác những gì người dùng ưa thích. Chẳng hạn như, thay vì phải nói “Bật bài nhạc Peaches của Justin Bieber”, người dùng có thể nói “Bật bài hát tôi yêu thích”, hay chỉ đơn giản là “Bật nhạc cho tôi”.
Khả năng tự động kết hợp các ứng dụng
Điểm mạnh mới của trợ lý ảo đang được các nhà nghiên cứu phát triển. Một minh chứng cụ thể cho khả năng này: Trợ lý ảo có thể vừa giúp người dùng ghi lại báo cáo cuộc họp, lưu lại lịch trình mới được nêu ra trong cuộc họp này, sau đó truy cập vào ứng dụng báo thức để bật nhắc nhở. Người dùng giờ đây không còn cần phải ghi chép hay ghi nhớ các lịch hẹn, vì trợ lý ảo đã đảm nhận chức năng này.
Ứng dụng của trợ lý ảo
Trợ lý ảo đối với cá nhân
Giao tiếp, trò chuyện với người dùng, cung cấp thông tin, giải đáp thắc mắc: Được phát triển dựa trên trí tuệ nhân tạo (AI) và các công nghệ xử lý ngôn ngữ tự nhiên (Natural Language Processing – NLP) tiên tiến, trợ lý ảo ngày nay có thể dễ dàng tìm hiểu và xử lý dữ liệu thông qua thông tin người dùng cung cấp. Với hệ thống cơ sở dữ liệu lớn và ngày càng được mở rộng, chúng ngày càng có vốn từ vựng phong phú, linh hoạt sử dụng đối thoại tự nhiên.
Trợ lý ảo có thể trả lời các câu hỏi của người dùng với các thông tin thường thức như: thời tiết, thời sự mới, cập nhật chính trị, y khoa,… Một số trợ lý ảo còn có thể thấu hiểu chân dung người dùng và đưa ra các câu thoại trò chuyện phù hợp trong các tình huống giao tiếp.
Rảnh tay thực hiện một số tác vụ trên các thiết bị thông minh: Đây là tính năng được ưa chuộng hàng đầu đối với các trợ lý ảo sử dụng giọng nói. Một cuộc khảo sát của Trung tâm Nghiên cứu Pew vào tháng 5 năm 2017 cho thấy gần một nửa số người trưởng thành ở Hoa Kỳ sử dụng trợ lý giọng nói trên điện thoại thông minh và các thiết bị khác của họ. Trợ lý giọng nói có thể hỗ trợ người dùng thực hiện cuộc gọi, gửi tin nhắn văn bản, tra cứu mọi thứ trực tuyến, cung cấp chỉ đường, mở ứng dụng, đặt lịch hẹn trên lịch có sẵn và khởi động hoặc hoàn thành nhiều tác vụ khác. Người dùng không cần chạm tay vào bất kỳ một thiết bị nào mà vẫn dễ dàng xử lý được yêu cầu nhanh chóng.
Ngày nay, trợ lý giọng nói ngày càng được tích hợp vào nhiều thiết bị và trở nên đa năng hơn. Ngoài hoạt động linh hoạt trên điện thoại thông minh, trợ lý giọng nói có thể điều khiển nhiều thiết bị trong đời sống hàng ngày: ô tô thông minh, loa thông minh, thiết bị gia đình (TV, điều hòa,…) với nhiều tính năng hữu ích: mở khóa ô tô và nhà cửa, bật đèn, điều chỉnh nhiệt độ, quạt gió, thay đổi kênh truyền hình, chỉnh âm lượng và hơn thế nữa.
Trợ lý ảo đối với Doanh nghiệp
Gia tăng trải nghiệm khách hàng: Việc sử dụng nhân lực để chăm sóc và giải đáp thông tin cho hàng trăm khách hàng truy cập fanpage mỗi ngày dễ gây ra sai sót và nhầm lẫn, đồng thời cũng khiến khách hàng mất nhiều thời gian chờ đợi để được hồi đáp. Những điều này giảm thiểu trải nghiệm khách hàng đáng kể, dễ gây hao hụt doanh thu và ảnh hưởng tiêu cực đến hình ảnh doanh nghiệp. Thay vào đó, sử dụng trợ lý kĩ thuật số, điển hình là chatbot, hồi đáp khách hàng nhanh chóng trong thời gian thực và đảm bảo lượng thông tin chính xác được lập trình sẵn, là một giải pháp tuyệt vời.
Thay đổi phương thức sản xuất: Trợ lý ảo là một phần của quy trình tự động hóa trong các nhà máy. Ví dụ về một phòng thí nghiệm nơi mọi người phải đeo găng tay dày và mặc đồ bó sát vì lý do an toàn và ô nhiễm. Việc họ gõ bất kỳ thứ gì hoặc nhấn nút để thực hiện điều gì đó là rất khó khăn, nhưng trợ lý giọng nói có thể thay đổi mọi thứ bằng cách tự động hóa các tác vụ.
Thay đổi phương thức quản lý và làm việc: Đối với các công ty nắm bắt công nghệ, nhiều nhân viên sử dụng loa thông minh cho các nhiệm vụ khác nhau trong các cuộc họp. Trợ lý giọng nói có thể tìm kiếm thông tin, ghi chú, thiết lập cuộc họp trên lịch và tạo danh sách việc cần làm và theo dõi,… Điều này giúp tiết kiệm thời gian và giúp mọi người tập trung vào cuộc họp. Ngoài ra, với một số trợ lý AI có quyền truy cập vào cơ sở dữ liệu của công ty, chúng cũng có thể biên dịch số liệu thống kê, tự động hóa các tác vụ và hỗ trợ một phần các báo cáo văn bản.
Một số trở ngại của trợ lý ảo
Lo ngại về quyền riêng tư
Quyền riêng tư là một mối quan tâm của rất nhiều người dùng, đặc biệt là liên quan đến các thiết bị thông minh được sử dụng hàng ngày. Sau khi được kích hoạt bằng các câu lệnh khởi động (wake-up words), trợ lý ảo sử dụng giọng nói sẽ bắt đầu ghi lại những âm thanh xung quanh. Những dữ liệu này được gửi đến máy chủ để xử lý thông tin và hình thành phản hồi. Vì vậy, người dùng thường lo ngại việc thông tin riêng tư của mình bị lưu lại hoặc theo dõi. Tuy nhiên, các nhà nghiên cứu gần đây đã cho ra mắt tính năng mới cho phép người dùng truy cập vào các bản ghi âm của trợ lý AI và lựa chọn giữ lại hay xóa chúng.
Độ chính xác
Các trợ lý ảo không phải lúc nào cũng hiểu những gì người dùng yêu cầu. Có những điều người dùng cần nhưng trợ lý ảo chưa được đào tạo. Vì vậy, chúng thường khó đưa ra câu trả lời chính xác, thậm chí đôi khi chúng không đưa ra phản hồi. Một phần nguyên nhân ảnh hưởng đến độ chính xác là do đặc trưng ngôn ngữ và âm sắc của người dùng. Họ đến từ nhiều nơi khác nhau, với vốn từ vựng và khả năng phát âm phong phú, bị ảnh hưởng bởi các yếu tố vùng miền, nên nhiều khi chưa đáp ứng được quy chuẩn mà trợ lý giọng nói có thể phân tích.
Khả năng bảo mật
Mặc dù các trợ lý ảo truyền thông tin về máy chủ bằng các kết nối được mã hóa, tuy nhiên vẫn tiềm ẩn khả năng bị hack, rò rỉ thông tin và ảnh hưởng tới vấn đề bảo mật. Vào đầu năm 2018, một số người dùng Amazon’s Echo báo cáo rằng nó sẽ đột nhiên phát ra tiếng cười ác độc mà không rõ lý do và mọi người nghĩ rằng ai đó đã xâm nhập vào loa thông minh của họ. Amazon đã điều tra vấn đề và sau đó thông báo rằng Echo đã nghe thấy những từ tương tự như “Alexa cười”, vì vậy nó bắt đầu cười.
Vì một số trợ lý giọng nói có thể nhận dạng và phản hồi với bất kỳ giọng nói nào gần đó nên người lạ có thể kiểm tra hoặc thay đổi một số thông tin trên thiết bị thông minh của chủ sở hữu. Hoặc nguy hiểm hơn, là các vấn đề về giả dạng giọng nói để điều khiển các thiết bị của người dùng.
Trợ lý ảo, với nhiều tính năng đột phá, được dự đoán sẽ trở thành người bạn đồng hành thông minh với con người trong tương lai. Một kỷ nguyên mới về các công nghệ trợ lý ảo đang được mở ra, với bất kỳ cá nhân hay doanh nghiệp nào cũng không nằm ngoài xu thế này. Cùng chờ đón các trợ lý ảo vượt trội ra đời trên thế giới và cả ở Việt Nam nhé!
Trợ lý ảo đang là giải pháp công nghệ mũi nhọn được VinBigdata tập trung phát triển, bởi những tính năng đột phá có khả năng ứng dụng cao. Thời gian gần đây, Trợ lý ảo Tiếng Việt ViVi đã được thử nghiệm trên xe Vinfast với khả năng nhận diện ngôn ngữ tiếng Việt chính xác khoảng 98% với nhóm từ phổ thông. Tỷ lệ lỗi khi nhận dạng giọng nói nhỏ hơn hoặc bằng 6% khi có kết nối mạng và mất kết nối mạng (ngoại tuyến) là 15%. ViVi hỗ trợ hơn 100 tính năng về thông tin, tiện ích, giải trí cũng như dịch vụ và điều khiển xe thông minh.Tìm hiểu thêm về trợ lý ảo của VinBigdata: Tại đây |
Trợ lý ảo sử dụng giọng nói (hay Voice Assistant – VA) đang dần trở nên quen thuộc và là người bạn đồng hành của nhiều người sử dụng điện thoại thông minh thời gian gần đây. Chỉ với một câu nói làm mệnh lệnh, trợ lý giọng nói có thể hỗ trợ chúng ta thực hiện các tác vụ mà chúng ta mong muốn. Phát triển dựa trên nền tảng trí tuệ nhân tạo (AI), trợ lý giọng nói như một trợ lý ảo cá nhân thông minh, giúp người dùng tiến hành một số hoạt động hàng ngày dễ dàng như cung cấp thông tin, trò chuyện, bật nhạc,…
Trợ lý ảo sử dụng giọng nói ra đời như thế nào?

Khởi điểm tại Hội chợ thế giới Seattle năm 1962, IBM đã trưng bày bộ máy độc đáo với tên gọi là Shoebox, mở ra kỷ nguyên tiến hóa cho trợ lý giọng nói. Đúng như tên gọi, Shoebox có kích thước của một chiếc hộp giày, nhưng lại có khả năng nhận biết khoảng 16 từ thông dụng, bao gồm các chữ số từ 0 đến 9. Shoebox cũng có thể thực hiện các chức năng toán học như cộng và trừ. Shoebox được phát triển bởi William C. Dersch trong Phòng thí nghiệm Bộ phận Phát triển Hệ thống Tiên tiến tại IBM năm 1961.
Tiếp theo đó, vào những năm 1970s của thế kỷ 20, các nhà nghiên cứu tại Đại học Carnegie Mellon ở Pittsburgh, Pennsylvania cùng với sự hỗ trợ của Bộ Quốc phòng Hoa Kỳ và Cơ quan Dự án Nghiên cứu Quốc phòng Tiên tiến (DARPA) – đã tạo ra Harpy. Harpy có sự phát triển đột phá, với khả năng thông hiểu khoảng 1.000 từ, gần bằng từ vựng của một đứa trẻ 3 tuổi.
Tháng 4 năm 1997, một phần mềm có khả năng tự đọc ra đời mang tên Dragon NataturalSpeaking. Tiền thân là phần mềm chỉnh sửa chính tả, Dragon NataturalSpeaking có thể hiểu khoảng 100 từ và biến nó thành nội dung có thể đọc được.
Cùng với sự phát triển của các công nghệ mới, và nhận được sự đầu tư mạnh mẽ, một kỷ nguyên trợ lý ảo thông minh tân tiến ra đời: Với sự ra mắt của Apple Siri năm 2011, sau đó là Google Now, Google Assistant, Amazon Alexa, Microsoft Cortana,…Và mới đây nhất là Trợ lý giọng nói tiếng Việt ViVi, được phát triển bởi Viện Nghiên cứu Dữ liệu lớn VinBigdata và được Tập đoàn Vingroup dự kiến ứng dụng trong các dòng xe Vinfast.
Công nghệ phát triển trợ lý ảo sử dụng giọng nói
Những công nghệ và kiến thức nền tảng nào được ứng dụng vào xây dựng và phát triển trợ lý giọng nói?
Trợ lý giọng nói dựa trên sự kết hợp của nhiều công nghệ trong lĩnh vực xử lý ngôn ngữ tự nhiên (Natural Language Processing – NLP) và trí tuệ nhân tạo (AI) như công nghệ nhận dạng tiếng nói (Automatic Speech Recognition – ASR), hiểu ngôn ngữ tư nhiên (Natural language Understanding – NLU), chuyển văn bản thành tiếng nói (Text to Speech – TTS). Các thuật toán cho phép trợ lý giọng nói nhận dạng tiếng nói, hiểu yêu cầu, đưa ra câu trả lời và hoàn thành nhiệm vụ theo lệnh của người dùng.
Dưới đây là các bước trong quy trình mà 1 trợ lý giọng nói hoạt động
Trợ lý giọng nói nghe và nhận lệnh từ người dùng
Sau khi nghe được câu gọi khởi động (Wake-up words), trợ lý giọng nói sẽ được kích hoạt để phản ứng. Nó tiếp nhận các yêu cầu của người dùng và bắt đầu tiến trình xử lý chúng.
Nhận dạng tiếng nói (ASR)
Sử dụng trí tuệ nhân tạo (AI) và học sâu (Deep Learning), ở giai đoạn này bắt đầu quá trình chuyển đổi sóng âm thanh thành dữ liệu mà máy có thể hiểu được. Các yếu tố được công nghệ xem xét ở giai đoạn này bao gồm các đặc tính của tín hiệu tiếng nói như tần số, năng lượng, trường độ v.v..
Hiểu ngôn ngữ (NLU)
Bởi sự đa dạng trong cách thức sử dụng ngôn ngữ của người dùng, từ mục đích, ngữ cảnh, giọng địa phương, tiếng lóng cho đến trọng âm và các yếu tố khác của phương thức hội thoại, trợ lý giọng nói nhiều khi sẽ gặp khó khăn trong việc phân biệt câu lệnh cần thực hiện. Xử lý ngôn ngữ tự nhiên là thao tác quan trọng để giúp trợ lý giọng nói hiểu được mệnh lệnh từ người dùng.
Truy xuất thông tin
Sau khi trợ lý giọng nói xử lý lệnh thông qua nhận dạng tiếng nói (ASR) và hiểu ngôn ngữ (NLU), bước tiếp theo là truy xuất thông tin. Phần mềm tiến hành truy cập các nguồn thông tin / dữ liệu khác nhau để xây dựng các câu trả lời và phản hồi cho yêu cầu nhận được.
Trả ra câu trả lời và thực thi
Cuối cùng người dùng sẽ nhận được phản hồi âm thanh và cả một số hỗ trợ tác vụ từ trợ lý giọng nói của mình.
Tất cả các thao tác này trợ lý giọng nói chỉ xử lý trong mili giây, vì vậy người dùng luôn nhận được những phản hồi ngay lập tức như một cuộc hội thoại tự nhiên.
Trợ lý giọng nói được dự đoán là xu thế của tương lai, khi một trợ lý ảo đa nhiệm được tích hợp trên điện thoại và máy tính ngày càng được con người ưa chuộng. Hãy cùng mong chờ sự ra đời của những trợ lý ảo vượt trội trên thế giới và ở Việt Nam nhé!
Giải pháp Trợ lý giọng nói là giải pháp công nghệ đang được Viên Nghiên cứu dữ liệu lớn Vingroup – VinBigdata tập trung phát triển. Được xây dựng dựa trên công nghệ Xử lý ngôn ngữ tự nhiên (NLP) tiên tiến nhất, sản phẩm mang đến một hệ sinh thái thông minh, có nhiều ưu thế vượt trội như nhận diện ngôn ngữ Tiếng Việt chính xác tới 98% với nhóm từ phổ thông, tỷ lệ lỗi khi nhận dạng giọng nói nhỏ hơn hoặc bằng 6% khi có kết nối mạng và mất kết nối mạng (ngoại tuyến) là 15%. Thêm vào đó, ViVi hỗ trợ hơn 100 tính năng về thông tin, tiện ích, giải trí cũng như dịch vụ và điều khiển xe thông minh, mang đến trải nghiệm tuyệt vời và khác biệt cho người dùng. Tìm hiểu thêm: Tại đây |
Tư liệu tham khảo: Analytics Vidhya