Đặt mua báo in| Mới - Đọc báo in phiên bản số| Thứ Tư, Ngày 24 tháng 04 năm 2024,
Nguyễn Thị Thu Trang, Sáng lập VBee: Text - To - Speech sẽ là xu hướng của cuộc sống
Thu Phương - 25/07/2018 14:28
 
Nghiên cứu và ứng dụng công nghệ chuyển văn bản tiếng Việt thành giọng nói (Text - To -Speech) là mục tiêu của TS. Nguyễn Thị Thu Trang, Sáng lập Công ty cổ phần Dịch vụ và Giải pháp dữ liệu VBee cùng đội ngũ cộng sự.

VBee và Text - To - Speech

Nguyễn Thị Thu Trang đã có một sự nghiệp nghiên cứu, giảng dạy với Text - To - Speech – giải pháp chuyển văn bản tiếng Việt thành giọng nói, với mong muốn hỗ trợ người khiếm thị có thể tiếp cận thông tin tốt hơn. Nhưng, mọi việc đã không dừng lại.

“Tôi là giảng viên của Trường đại học Bách Khoa Hà Nội. Năm 2015, tôi bảo vệ luận án tiến sỹ với giải pháp chuyển văn bản tiếng Việt thành giọng nói. Dựa trên nền tảng đó, tôi phát triển một số ứng dụng cộng đồng cho người khiếm thị. Nhưng, khi triển khai các ứng dụng, chúng tôi phát hiện rằng, công nghệ này còn có thể ứng dụng rộng rãi hơn, ở nhiều lĩnh vực trong tương lai. Tôi và các đồng nghiệp đã thử nghiệm cùng ứng dụng Vadi - "trợ lý ảo" lái xe với hai tính năng được tích hợp là bản đồ giao thông và báo nói. Ứng dụng này được cập nhật trên hệ điều hành Android hoặc iOS”, TS. Trang chia sẻ.

.
Nguyễn Thị Thu Trang, Sáng lập VBee

Text - To - Speech là công nghệ xử lý văn bản thành giọng nói đã được nghiên cứu khoảng vài chục năm trước, đặc biệt phát triển mạnh trong 10-15 năm gần đây. Công nghệ này đã phát triển gần như hoàn thiện ở nước ngoài, đặc biệt tại các nước sử dụng tiếng Anh. Khi ứng dụng vào cuộc sống, công nghệ này mang lại lợi ích lớn cho cộng đồng người khuyết tật, như người khiếm thị, những người mất khả năng đọc, mất khả năng nói hoặc diễn đạt.

Ngoài ra, Text - To - Speech còn mang lại nhiều giá trị thực tiễn, ứng dụng trong hệ thống tổng đài chăm sóc khách hàng, tổng đài nhắc nợ, hay các hệ thống phát thanh trong các lĩnh vực công cộng như giao thông, y tế...

Nhưng tại Việt Nam, Text - To - Speech đang đi những bước đi đầu tiên. “VBee đã ra đời nhằm đưa công nghệ này vào đời sống của người Việt. Vadi một ứng dụng trong lĩnh vực giao thông cũng ra đời dựa trên nền tảng này”, TS. Nguyễn Thị Thu Trang nói

Cùng với Trang, Hồ Minh Đức - người có hơn chục năm kinh nghiệm kinh doanh trong lĩnh vực công nghệ và TS. Nguyễn Thanh Hùng, Trưởng Bộ môn Công nghệ phần mềm (Trường đại học Bách Khoa Hà Nội) cũng ghi tên trong danh sách sáng lập của VBee.

Ra đời từ đầu năm 2018, hiện tại đội ngũ của VBee có gần 20 người. Ngoài ra, Công ty có nhiều cộng tác viên, đa số là sinh viên ưu tú của Trường đại học Bách khoa Hà Nội cùng nghiên cứu và làm việc.

Ứng dụng thực tiễn

Chia sẻ về Vadi, TS. Nguyễn Thị Thu Trang cho biết, người dùng sẽ nhận được thông báo về tai nạn, tắc đường hoặc lũ lụt tại thời gian thực, từ đó đưa ra các gợi ý để lái xe chuyển cung đường khác.

Ngoài ra, Vadi còn phục vụ nhu cầu giải trí do được tích hợp công nghệ đọc báo. Đơn cử, người dùng có thể yêu cầu Vadi đọc một bài báo về trận bóng World Cup đêm qua, hoặc yêu cầu tìm đường tới một địa điểm nào đó bằng giọng nói, không cần thao tác bằng tay.

"Chúng tôi là nhóm đầu tiên ở Việt Nam tích hợp tính năng bản đồ giao thông và báo đọc trong một ứng dụng", TS. Trang nói.

Sự khác biệt là điều mà đội ngũ VBee để tâm. Ví dụ, về giọng đọc, nhóm mất khá nhiều thời gian để tạo ra giọng có ngữ điệu thu hút và gần gũi nhất với người dùng, khác với ngôn ngữ máy đọc thông thường là đều đều, không tự nhiên mà Google hay Microsoft đang hỗ trợ cho tiếng Việt.

Ứng dụng hiện có gần 5.000 người dùng. Nhóm nghiên cứu đã hoàn thiện tính năng điều khiển bằng giọng nói cho Vadi, giúp thuận tiện trong sử dụng, đặc biệt khi đang lái xe. Tương lai, ngoài cung cấp bản đồ và báo nói, nhóm sẽ cung cấp thêm các dịch vụ như sách nói, truyện nói hoặc các hình thức giải trí khác cho lái xe.

Người đồng sáng lập VBee, TS. Nguyễn Thanh Hùng cũng cho hay, dư địa phát triển ứng dụng của công nghệ Text-To-Speech còn rất lớn, Vadi là một phần trong đó.

Ngoài ra, công nghệ này còn có thể ứng dụng trên nhiều lĩnh vực như, bộ phận chăm sóc khách hàng, tổng đài, đọc chuyện cho trẻ bằng giọng của bố mẹ hướng dẫn, bất động sản ứng dụng smart home (nhà thông minh)…

“Công ty đang hợp tác với một số đối tác để phát triển ứng dụng về tổng đài chăm sóc khách hàng và nhà thông minh. Khi bước vào nhà có thể bật tắt điện, nước bằng giọng nói, đưa ra thông báo, điều chỉnh thiết bị tivi… Tuy nhiên, chúng tôi xác định không phát triển theo số lượng mà sẽ hợp tác với những đối tượng ở các lĩnh vực khác nhau”, TS. Hùng chia sẻ.

Nói về dự dịnh phát triển trong thời gian tới, người đồng sáng lập VBee cho biết, Công ty sẽ đáp ứng nhiều cho các bên có như cầu sử dụng dịch vụ ứng dụng công nghệ chuyển văn bản bằng giọng nói. Đồng thời, VBee vẫn tiếp tục và hoàn thiện ứng dụng Vadi.

Trò chuyện với TS. Nguyễn Thị Thu Trang:

Chị đến với Text - To - Speech như thế nào?

Năm 2010, tôi bắt đầu nghiên cứu về giải pháp này. Năm 2012, tôi sang Pháp làm nghiên cứu sinh, đến năm 2015 bảo vệ xong luận án tiến sỹ về giải pháp Text - To - Speech cho tiếng Việt. Khi về nước, tôi bắt đầu nghiên cứu để ứng dụng công nghệ này trong đời sống.

Ba người cùng sáng lập và triển khai ứng dụng công nghệ, có khó khăn gì không?

Một mình tôi không thể làm được. Chúng tôi đều là những người đã có ít nhiều kinh nghiệm thực tiễn, thống nhất quan điểm: mỗi người phụ trách một mảng để cùng phát triển thì sẽ đem lại kết quả tốt nhất.

Lâu nay, luôn có khoảng cách giữa công nghệ và ứng dụng thực tiễn?

Tất nhiên sẽ có nhiều khó khăn, bởi nghiên cứu chỉ là trên môi trường giả định, còn môi trường thực tế đòi hỏi phải cân đối rất nhiều yếu tố. Nhưng chúng tôi bị hấp dẫn bởi bài toán cân đối được các đòi hỏi thực tiễn để đưa công nghệ vào thực tiễn.

Lê Thanh Hoài, sáng lập, CEO SuperShip: Không nên tiết kiệm giấc mơ của mình
Lê Thanh Hoài, CEO Công ty TNHH Dịch vụ vận chuyển Dấu chân Việt (SuperShip) đã thuyết phục được các nhà đầu tư bằng mong muốn được làm việc,...
Bình luận bài viết này
Xem thêm trên Báo Đầu Tư