Mã số N1059: Giải pháp chuyển đổi giọng nói thành văn bản Memobot

Giải thưởng 2023 19/07/2023

Thích · 4

- Chia sẻ:

Ứng dụng có khả năng tối ưu nhận dạng vùng miền với khả năng hoạt động hiệu quả trong môi trường nhiễu, khoảng cách xa và hiển thị thời gian thực, đạt độ chính xác 95%.

Memobot là một giải pháp trí tuệ nhân tạo (AI) đột phá trong lĩnh vực chuyển đổi giọng nói thành văn bản. Được phát triển bởi Công ty TNHH Hệ thống Trí thông minh Nhân tạo Việt Nam (VAIS), Memobot đã giúp tối ưu hóa quy trình ghi chép và xử lý thông tin bằng cách tự động chuyển đổi nội dung từ giọng nói thành văn bản nhanh chóng và hiệu quả.

Với nguồn dữ liệu gần 7000 từ vựng tiếng Việt, Memobot là phương án hiệu quả giúp cá nhân và doanh nghiệp tiết kiệm thời gian, công sức, tối ưu năng suất, thúc đẩy tiến độ công việc, giải quyết được vấn đề xả băng ghi âm, dễ dàng lưu trữ, phân loại các loại tập tin, dữ liệu. Ứng dụng có khả năng tối ưu nhận dạng vùng miền với khả năng hoạt động hiệu quả trong môi trường nhiễu, khoảng cách xa và hiển thị thời gian thực, đạt độ chính xác lên tới 95%. Một giờ ghi âm có thể xử lý thành văn bản trong 6 phút.

Đặc điểm nổi bật của Memobot:

Hiệu suất và tốc độ: Memobot có khả năng xử lý giọng nói với hiệu suất cao và tốc độ nhanh chóng. Việc chuyển đổi từ giọng nói thành văn bản chỉ mất vài giây, giúp tiết kiệm thời gian và năng suất làm việc.

Độ chính xác cao: Memobot sử dụng các thuật toán trí tuệ nhân tạo tiên tiến để đảm bảo độ chính xác cao trong việc chuyển đổi giọng nói thành văn bản. Hệ thống tự động nhận diện các yếu tố ngữ cảnh và ngữ pháp, giúp tạo ra văn bản chính xác và dễ hiểu.

Hỗ trợ giọng nói đa vùng miền: Ứng dụng Memobot có thể nhận diện và chuyển giọng nói miền Bắc thành văn bản chính xác đến 99%, miền Trung 85%-90% và miền Nam 90%

Tích hợp dễ dàng: Memobot tích hợp dễ dàng vào nhiều ứng dụng và hệ thống quản lý dữ liệu. Người dùng có thể sử dụng Memobot trực tiếp qua ứng dụng trên điện thoại di động hoặc tích hợp vào hệ thống quản lý thông tin của tổ chức.

An toàn và bảo mật: Memobot đảm bảo tính an toàn và bảo mật của dữ liệu. Các thông tin chuyển đổi từ giọng nói thành văn bản được mã hóa và lưu trữ một cách an toàn, đảm bảo không có sự xâm nhập trái phép vào dữ liệu.

Memobot hỗ trợ tự động tạo phụ đề và ngắt đoạn từng lời của nhiều người khác nhau trong thời gian thực, giúp tiết kiệm tối đa thời gian xử lý băng ghi âm, trong khi xả băng ghi âm truyền thống phải nghe và viết lại thủ công, tự ngắt phân đoạn thời gian và phân biệt từng người nói. Văn bản đầu ra được chuẩn hóa viết tắt, số, ngày tháng, từ nước ngoài, email và tự động viết hoa và chèn dấu chấm câu. Bên cạnh đó, Memobot cũng hỗ trợ đăng tải và xuất văn bản chuyển đổi ra các loại tệp có định dạng khác nhau, xử lý toàn bộ các công đoạn trên trong thời gian thực, chỉnh sửa nội dung văn bản trực tiếp kèm theo phân đoạn thời gian được thể hiện sẵn, từ nào sai thì chỉ cần gõ lại từ đó chứ không cần gõ lại toàn bộ nội dung.

Ứng dụng của Memobot:

Ghi chép tự động: Memobot giúp tự động chuyển đổi các cuộc họp, bài thuyết trình, và thông tin từ giọng nói thành văn bản. Điều này giúp tăng cường năng suất và chính xác trong quá trình ghi chép và lưu trữ thông tin.

Hỗ trợ học tập và nghiên cứu: Memobot hỗ trợ trong việc chuyển đổi các bài giảng, bài thuyết trình, hoặc bài viết từ giọng nói thành văn bản, giúp sinh viên và nhà nghiên cứu tiện lợi trong việc nắm bắt và tìm hiểu kiến thức.

Trợ lý ảo và ứng dụng AI: Memobot có thể tích hợp vào các trợ lý ảo hoặc ứng dụng AI khác, giúp tăng cường tính tương tác và hỗ trợ người dùng trong nhiều lĩnh vực khác nhau.

Memobot cũng có thể hỗ trợ chuyển đổi nội dung từ tập tin âm thanh hoặc video thành văn bản, giúp dễ dàng tra cứu và phân tích thông tin. Với ứng dụng này, người dùng có thể chỉnh sửa nội dung văn bản trực tiếp kèm theo phân đoạn thời gian được thể hiện sẵn, chỉ cần gõ lại từ mà Memobot nhận diện sai, không cần gõ lại toàn bộ nội dung. Ngoài ra người dùng có thể sửa trực tiếp vào văn bản nếu thấy phần dịch của Memobot chưa được chính xác hay muốn bổ sung nội dung mới khi phần thu âm trước đó chưa đề cập đến nội dung đó.

Để đánh dấu phần ghi âm, người dùng tô đen phần chữ trong văn bản, Memobot sẽ đồng bộ phần tô đen giống với phần ghi âm, khi đó chỉ cần nhấp vào phần chữ tô đen thì phần thu âm giọng nói sẽ tự động phát đến đoạn tương ứng với dòng chữ đó.

Sau khi kết thúc quá trình chuyển đổi file ghi âm, Memobot hỗ trợ tải bản ghi qua nhiều định dạng khác nhau từ tệp word (doc), tệp âm thanh (mp3), tệp văn bản (txt), tệp phụ đề (srt)… và chia sẻ trực tiếp bản ghi thông qua những ứng dụng khác nhau như Instagram, Facebook, Zalo, Gmail, Drive, Twitter….

Khi sử dụng Memobot, người dùng có thể ghi âm mọi lúc, mọi nơi bằng smartphone, kể cả việc ghi âm cuộc họp trên Zoom, Microsoft Teams và Google Meet . Mọi thông tin file ghi âm và văn bản đều được lưu trữ trên phần mềm. Sau đó, người dùng dễ dàng nắm bắt và chia sẻ cho người khác, do đó các cá nhân và doanh nghiệp khác cũng có thể tiếp nhận thông tin từ dữ liệu đã được lưu trữ lại. Nhờ vậy, doanh nghiệp, cá nhân giải quyết được vấn đề xả băng ghi âm, dễ dàng lưu trữ, phân loại các loại tập tin, dữ liệu. Hơn thế, giải pháp chuyển đổi giọng nói thành văn bản Memobot có thể được triển khai ngay, thích nghi nhiều ngôn ngữ lập trình và nhiều loại thiết bị (máy tính, điện thoại di động, micro) trong điều kiện ngoại tuyến, sử dụng dịch vụ cloud và máy chủ riêng để đảm bảo bảo mật thông tin trong đơn vị, doanh nghiệp.

Với hiệu suất, độ chính xác cao và tích hợp dễ dàng, Memobot đã và đang góp phần cải thiện năng suất và hiệu quả làm việc trong nhiều lĩnh vực và giúp các tổ chức và cá nhân tiết kiệm thời gian và công sức trong quá trình xử lý thông tin. Trong vài năm gần đây, Memobot đã đoạt giải Nhất hạng mục Nhận dạng giọng nói tại cuộc thi Xử lý ngôn ngữ và giọng nói tiếng Việt 2019. Tại cuộc thi Startup Wheel 2022, ứng dụng Memobot là sản phẩm duy nhất nhận 2 giải thưởng quan trọng là giải Nhì và giải thưởng Dự án sáng tạo nhất.

Thông tin

Tên đơn vị: Công ty TNHH Hệ thống Trí thông minh Nhân tạo Việt Nam (VAIS)

Đơn vị đồng hành

Đơn vị bảo trợ truyền thông

Thích · 4