Cách chuyển đổi âm thanh sang văn bản: Bộ chuyển đổi miễn phí và giá rẻ tốt nhất

Lần cuối cùng tôi phỏng vấn khách mời Chris Pirillo của chúng tôi, tôi cần một ứng dụng có thể chuyển đổi tệp âm thanh bài phát biểu của anh ấy thành tài liệu văn bản. Thành thật mà nói, tôi muốn tiết kiệm thời gian của mình và không cảm thấy nhàm chán khi gõ từng từ anh ấy nói. Vì vậy, tôi đã lướt Internet kỹ lưỡng và tìm thấy một số ứng dụng tốt có thể chuyển đổi các tệp âm thanh (MP3, WMA hoặc M4A) sang tài liệu văn bản một cách tự động. Bây giờ tôi rất vui khi chia sẻ chúng với bạn.

1. CƠ SỞ GIỌNG NÓI

UPD: Voicebase là giải pháp chuyển giọng nói thành văn bản tốt nhất trong nhiều năm. Thật không may, kể từ năm 2019, đây không còn là âm thanh miễn phí cho văn bản chuyển tải nữa. Nó hiện cung cấp API cho phiên âm âm thanh và phân tích giọng nói với một khoản phí. Vì vậy, tốt hơn bạn nên bỏ qua phần Voicebase và thử các công cụ bên dưới.

VoiceBase là dịch vụ phiên âm tin nhắn văn bản trực tuyến dành cho các công ty và cá nhân. Mặc dù điều này chủ yếu tập trung vào khách hàng doanh nghiệp, nhưng người dùng bình thường như bạn và tôi có thể chuyển đổi bản ghi âm giọng nói sang tệp văn bản miễn phí trên VoiceBase. Kể từ tháng 1 năm 2016, mỗi người dùng mới được cấp một tài khoản miễn phí với tín dụng trị giá 60 đô la và lên đến 50 giờ bộ nhớ âm thanh. Chi phí khoảng 0,01 đô la để ghi lại bài phát biểu 10 giây. VoiceBase sử dụng công nghệ nhận dạng giọng nói thông minh, vì vậy chất lượng của máy ghi âm của nó cao.

Rõ ràng, chất lượng văn bản cuối cùng phụ thuộc vào nhạc nền gốc và giọng của người nói. VoiceBase hiểu cách phát âm tiếng Anh Mỹ một cách liền mạch. Nếu người nói rõ ràng, thì văn bản gần như viết tay. Nếu người phỏng vấn nói ngọng hoặc nói ngọng thì bạn sẽ phải sửa lại bảng điểm hoặc thuê người xem lại văn bản. May mắn thay, bạn có thể đặt hàng bản ghi âm người trực tiếp từ tài khoản VoiceBase của mình. Ngoài ra, bạn có thể chuyển video thành văn bản!

Công cụ chuyển đổi âm thanh sang văn bản này hiểu được tiếng Anh, tiếng Hà Lan, tiếng Pháp, tiếng Đức, tiếng Ý, tiếng Tây Ban Nha (bao gồm cả phiên bản Mỹ Latinh). Trên thực tế, VoiceBase đáng chú ý là chuyển đổi giọng nói sang văn bản nhanh chóng và dễ dàng. Giao diện trang web rõ ràng và bạn thực hiện từng bước một cách suôn sẻ:

  1. Truy cập www.voicebase.com và nhấp vào nút Tải lên tệp màu xanh lục ở giữa màn hình.
  2. Tạo tài khoản VoiceBase miễn phí. Cung cấp tên, địa chỉ email của bạn và nhấp vào nút “Đăng ký”. Bạn phải xác minh tài khoản của mình qua email để truy cập VoiceBase.
  3. Nhấp vào nút Tải xuống màu xanh lục ở góc trên bên phải.
  4. Thêm tệp âm thanh hoặc video ở định dạng được hỗ trợ. Nếu cần, hãy kết hợp các phần video hoặc âm thanh với nhau. Đặt tên cho tệp, thêm mô tả, chọn phiên âm máy và kiểu chia sẻ tệp (riêng tư hoặc công khai).
    Mẹo: sử dụng Freemake’s Audio Converter để tạo tệp âm thanh được hỗ trợ cho VoiceBase.
  5. Tệp của bạn sẽ được xử lý và bạn sẽ được thông báo qua email khi tệp đã sẵn sàng. Sau đó có thể tìm thấy tệp trong tab “Nội dung của tôi”. Ví dụ: tôi đã thêm một cuộc phỏng vấn âm thanh M4A dài 10 phút và mất khoảng 15 phút để chuyển đổi thành tệp văn bản.
  6. Khi tệp văn bản hoàn tất, hãy chuyển đến tab Nội dung của tôi trong tài khoản VoiceBase của bạn và nhấp vào tên tệp của bạn. Phiên bản văn bản của tệp âm thanh
    cach-chuyen-doi-am-thanh-sang-van-ban

    Text version of audio file

  7. Kiểm tra hộp máy Transcript ngay bên dưới tệp âm thanh.
  8. Sao chép bản ghi và lưu dưới dạng tài liệu văn bản.

Tóm tắt: VoiceBase là một công cụ chuyển đổi âm thanh sang văn bản trực tuyến nhanh chóng. Không cần phải nói, nó phù hợp với tất cả mọi người, cho dù bạn cần giọng nói tự động hay con người để ghi lại quá trình chuyển đổi.

2. TRUYỆN RỒNG

Bạn chắc chắn có thể thử một công cụ chuyển đổi giọng nói sang văn bản khác: Dragon Dictation. Chúng tôi đã dành một bài báo đặc biệt cho anh ấy. Nói một cách ngắn gọn, Dragon Dictation hoàn toàn khác với VoiceBase. Nó tuyên bố là một công cụ nhận dạng giọng nói phổ biến cho Windows, Mac, iOS, Android và các nền tảng khác. Lưu ý rằng phiên bản dành cho máy tính để bàn được trả phí (75-150 đô la cho người dùng gia đình, 300 đô la cho doanh nghiệp), trong khi ứng dụng di động miễn phí cho Hoa Kỳ và Canada.

Giống như Siri của Apple, Dragon Dictation có thể hiểu những gì bạn nói với nó. Tuy nhiên, trọng tâm chính của ứng dụng là ghi nhớ các bài phát biểu của bạn dưới dạng một đoạn văn bản. Dễ dàng tạo các tài liệu có độ dài bất kỳ và chỉnh sửa, định dạng và chia sẻ chúng trực tiếp từ thiết bị di động của bạn. Dragon có thể xử lý các từ vựng chuyên ngành trong ngành và nó đi kèm với các tính năng tuyệt vời như khả năng phiên âm văn bản từ tệp âm thanh mà bạn tải xuống.

Để thực hiện việc này, hãy làm theo các bước:

  1. Mở phần mềm. Từ DragonBar, chọn Công cụ, Âm thanh đã chép và Bản ghi đã chép.
    tải chính tả rồng

    cach-chuyen-doi-am-thanh-sang-van-ban-02

    DRAGON DICTATION

  2. Nhấn vào Chọn loa và chọn người sở hữu giọng nói trong bản ghi âm – Tôi hoặc người khác.
  3. Trong trường Đầu vào âm thanh, hãy nhập tên tệp của bản ghi và đường dẫn của thư mục chứa tệp đó hoặc nhấp vào Duyệt qua để điều hướng đến tệp đó.
  4. Trong trường Tệp đầu ra, hãy nhập tên tệp cho đầu ra tệp được phiên âm và nhập đường dẫn của thư mục mà bạn muốn lưu nó.
  5. Bỏ chọn nâng cao Tự động thêm dấu phẩy và dấu chấm nếu bạn không muốn Dragon thêm dấu chấm câu này vào bản phiên âm, vì độ chính xác có thể giảm khi tùy chọn này được chọn.
  6. Sau đó làm theo trình hướng dẫn phiên âm, nó sẽ nhắc bạn chọn những gì bạn muốn làm tiếp theo. Chọn các tùy chọn cần thiết và nhấp vào Hoàn tất.

Tóm tắt: Dragon Dictaion không chỉ là một công cụ chuyển đổi âm thanh sang văn bản đơn giản. Bạn chỉ nên đầu tư vào nó nếu bạn chắc chắn sử dụng các tùy chọn đọc chính tả một cách thường xuyên. Để sử dụng bình thường, bạn nên thử phần mềm miễn phí được liệt kê dưới đây.

3. SONICS. Ai

Sonix.ai là một ứng dụng theo dõi âm thanh trực tuyến. Bản dùng thử miễn phí bao gồm 30 phút chuyển đổi âm thanh sang văn bản miễn phí. Tôi nghĩ rằng điều này là đủ để sử dụng thông thường. Các nhà phát triển cung cấp quyền truy cập đầy đủ vào tất cả các chức năng mà không cần thẻ tín dụng. Điều duy nhất bạn cần là đăng ký, bạn có thể thực hiện việc này từ tài khoản Google của mình chỉ bằng một cú nhấp chuột. Tài khoản trả phí không đắt (từ $ 11,25 mỗi tháng).

Để chuyển đổi tệp giọng nói sang tài liệu Word, hãy làm theo các bước:

  1. Kéo và thả tệp âm thanh (hoặc video!) Vào cửa sổ trình duyệt từ máy tính của bạn hoặc chọn tệp cần thiết từ Dropbox hoặc Google Drive.
    sonix
  2. Trong khi tải tệp xuống, hãy chọn ngôn ngữ được nói. Nhấp vào nút lớn màu xanh bên dưới.
  3. Trả lời một số câu hỏi về chất lượng của tệp âm thanh (tiếng ồn xung quanh, v.v.). Nhấn Tiếp tục theo dõi.
  4. Chờ một chút trong khi văn bản của tệp đang được chuẩn bị. Sau đó, bạn có thể xem và chỉnh sửa văn bản.
  5. Tải tệp Word xuống máy tính của bạn, chia sẻ trực tuyến hoặc lưu vào Google Drive.

Tóm tắt: Sonix.ai là tuyệt vời cho các bản ghi âm thanh hiếm. Nó mang lại chất lượng văn bản tốt và không bị choáng ngợp bởi chức năng. Chắc chắn phải có cho người dùng kén chọn.

4. viết

Inqscribe là phần mềm phiên âm cho Windows, Mac OS. Bạn có thể sử dụng miễn phí mà không cần giấy phép (với các tính năng hạn chế) hoặc mở khóa tất cả các tính năng ngay lập tức bằng cách mua giấy phép trả phí (99 đô la) hoặc yêu cầu dùng thử 14 ngày.

Bên cạnh các tập tin âm thanh, bạn cũng có thể giải mã các tập tin video dài bao gồm các bộ phim có thời lượng đầy đủ, không giới hạn thời gian ở tất cả các phiên bản. Tuy nhiên, với miễn phí, bạn sẽ không thể lưu và tải xuống tệp văn bản kết quả. Tuy nhiên, bạn có thể sao chép văn bản vào khay nhớ tạm.

Inscribe

Công cụ này hoạt động theo cùng một cách như tất cả các cách trên. Bạn cần thêm tệp phương tiện, chọn ngôn ngữ và bắt đầu âm thanh để chuyển đổi văn bản. Bảng điểm InqScribe chứa các mã thời gian nhúng cho phép truy cập tức thì vào thời gian tùy ý trong tệp phương tiện.

InqScribe cũng có môi trường chỉnh sửa linh hoạt, thời gian nhanh và hỗ trợ Windows Media, các phím tắt có thể tùy chỉnh để điều khiển phát lại phương tiện và chèn văn bản trùng lặp, và một loạt các tùy chọn nhập và xuất có sẵn trong phiên bản trả phí.

Tóm tắt: InqScribe giống như một con dao Thụy Sĩ để ghi chú thích và phụ đề. Bạn nên thử phiên bản đánh giá nếu bạn cần phiên âm chính xác một video dài với tính năng xuất phương tiện khác.

Share: