Chuyển âm thanh thành văn bản chính xác luôn là một vấn đề khó khăn. Cách đây khoảng 10 năm, bạn sẽ phải trả khoảng 200 USD để mua các ứng dụng hỗ trợ chuyển âm thanh thành văn bản, và vẫn cần phải chỉnh sửa nhiều để có kết quả chính xác.
Tuy nhiên, với sự phát triển của công nghệ, mọi thứ giờ đã trở nên đơn giản hơn. Ngoài ChatGPT, OpenAI còn phát triển một mô hình AI mã nguồn mở có tên là Whisper, hỗ trợ nhận dạng âm thanh và chuyển thành văn bản với độ chính xác cao. Nhưng để có thể tận dụng tối đa mô hình này, bạn cần phải là kỹ thuật viên hoặc nhà phát triển phần mềm.
Mới đây, một nhà phát triển đã đưa mô hình AI của OpenAI vào ứng dụng MacWhisper, cho phép người dùng thông thường (không rành về công nghệ) cũng có thể tận dụng công nghệ AI để chuyển âm thanh thành văn bản.
MacWhisper 11.12