Cách chuyển đổi tài liệu đã quét sang Word - Android Hạnh phúc

Nếu bạn cần số hóa một cuốn sách ở định dạng văn bản, bạn có thể có một số câu hỏi. Nó có thể được thực hiện? Làm thế nào về chất lượng, nó là tốt? Không chỉ có thể thực hiện được mà còn có một số cách để chuyển đổi một tài liệu đã quét sang Word. Hãy xem nào:

  • Bằng cách quét tài liệu ở định dạng PDF và chỉnh sửa nó sau đó với Adobe Acrobat XI Pro để lưu nó ở định dạng Word. Phiên bản Pro của Acrobat được trả phí, nhưng bạn có thể mua giấy phép dùng thử miễn phí 30 ngày.
  • Từ trang web OnlineOCR.net . Ứng dụng web này cho phép bạn chuyển đổi tài liệu ở định dạng PDF, JPG, TIFF và GIF sang Word, Excel và văn bản. Trong phiên bản miễn phí, chúng tôi có thể chuyển đổi tối đa 15 trang mỗi giờ và tài liệu không quá một trang.
  • Bằng cách quét tài liệu ở định dạng (OCR) và lưu nó dưới dạng văn bản. Sau đó, chúng ta có thể mở Word và chỉnh sửa hoặc lưu nó ở định dạng .doc.
  • Sử dụng một số chương trình nhận dạng ký tự quang học :
    •  VueScan (có sẵn cho Windows, Mac OS X và Linux)
    • Kooka  (dành cho Linux)
    • Office Lens (dành cho AndroidiOS )
    • CamScanner (dành cho AndroidiOS )

Cách hiệu quả nhất mà chúng tôi có thể nói là thông qua Adobe Acrobat Pro, nhưng chỉ khi bản quét rất, rất sạch và có chất lượng cao. Các ứng dụng nhận dạng ký tự quang học đã đi được một chặng đường dài, nhưng chúng vẫn còn một số sơ hở với những thứ như in đậm hoặc nghiêng, và phiên âm của một số từ tùy thuộc vào loại phông chữ của tài liệu gốc có thể bị sai.

Hãy thử quét và chuyển tài liệu này sang Word để xem điều gì sẽ xảy ra

Từ chính máy quét

Một số máy quét bao gồm tính năng Nhận dạng Quang học (OCR) trong chương trình quét của riêng chúng. Để quét tài liệu thành văn bản, bạn chỉ cần đặt định dạng số hóa và nhìn vào một định dạng đề cập đến OCR hoặc tương tự (nó phụ thuộc vào thương hiệu / kiểu máy của máy quét).

Chuyển từ PDF sang Word với Adobe Acrobat XI Pro

Sau khi Adobe Acrobat XI Pro được tải xuống và cài đặt ( bạn có phiên bản dùng thử 30 ngày miễn phí TẠI ĐÂY ), hãy đi tới “ Công cụ -> Nhận dạng văn bản -> Trong tệp này ”.

Trong cửa sổ " Nhận dạng văn bản " , nhấp vào " Chỉnh sửa " và chọn ngôn ngữ văn bản, kiểu đầu ra và độ phân giải.

Cuối cùng quay lại " Công cụ -> Chỉnh sửa nội dung -> Chỉnh sửa văn bản và hình ảnh " và sửa đổi văn bản nếu bạn cần sửa bất kỳ từ nào. Để hoàn tất, hãy nhấp vào " File -> Save As " và lưu nó ở định dạng Word.

OnlineOCR

OnlineOCR là một ứng dụng web để chuyển hình ảnh hoặc pdf sang Word và nó rất dễ sử dụng. Tôi sẽ giải thích cách nó hoạt động: Nhập //www.onlineocr.net/ và nhấp vào " Chọn tệp ". Chọn tài liệu đã quét, sau đó chọn ngôn ngữ và định dạng đầu ra từ 2 menu thả xuống mà bạn có ở giữa màn hình.

Để hoàn tất, hãy nhấp vào " Chuyển đổi ". Ngay bên dưới nó sẽ xuất hiện một bản xem trước văn bản thuần túy mà bạn có thể chỉnh sửa nếu cần sửa bất kỳ từ nào. Cuối cùng, nhấp vào " Tải xuống tệp đầu ra " và bạn có thể tải tệp xuống ở định dạng Word. Đây là một ví dụ về một tệp PDF được chuyển đổi sang Word với OnlineOCR:

  • Bản PDF gốc:

  • Tài liệu đã chuyển đổi:

Nếu ứng dụng web này không làm bạn hài lòng, bạn có thể thử các lựa chọn thay thế tương tự khác như FreeOCR hoặc Free-Online-OCR .

Chương trình Nhận dạng Ký tự Quang học (OCR)

Nếu bạn không muốn sửa đổi tài liệu của mình trực tuyến và bạn cần một ứng dụng dành cho máy tính để bàn, bạn có thể sử dụng các ứng dụng như VueScan (cũng có sẵn cho Mac và Linux ngoài Windows phổ biến).

Một khả năng khác là sử dụng thiết bị Android hoặc iOS của bạn để quét tài liệu và chuyển đổi nó thành văn bản trực tiếp. Có những ứng dụng như Office Lens (dành cho AndroidiOS ) hoặc CamScanner (dành cho AndroidiOS ) thực hiện toàn bộ quy trình từ cùng một ứng dụng. Trong những trường hợp này, bạn nên làm sạch hình ảnh trước khi chuyển nó thành văn bản. Nếu bạn muốn biết thêm về phương pháp này, hãy xem BÀI ĐĂNG NÀY .

Theo tôi, kỹ thuật nhận dạng ký tự quang học, mặc dù nó đã được cải thiện rất nhiều trong những năm gần đây, nhưng vẫn còn cách xa nhiều năm ánh sáng để trở thành một kỹ thuật hoàn hảo. Nhiều chi tiết, nhiều từ được anh “dịch” sai chữ cái, ký hiệu làm ngổn ngang văn bản. Anh ta vẫn thiếu trí thông minh thừa đó khiến anh ta thấy rằng " t &! $ Olog1a " không thể là bản dịch hợp lệ của bất kỳ từ nào trong văn bản. Tôi vẫn không thấy khả năng đọc hiểu, mà là sự nhận dạng trực quan đơn giản của các chữ cái riêng lẻ tạo thành từ mà không tích hợp chúng với phần còn lại của văn bản. Tuy nhiên, tôi tin rằng thời điểm mà chúng ta sẽ tạo nên bước nhảy vọt cuối cùng đang đến gần hơn mỗi ngày.

Bạn đã cài đặt Telegram chưa? Nhận bài đăng hay nhất mỗi ngày trên kênh của chúng tôi . Hoặc nếu bạn thích, hãy tìm hiểu mọi thứ từ trang Facebook của chúng tôi .