Cách trích xuất văn bản từ hình ảnh

[ad_1]

Chụp hoặc nhấp vào hình ảnh là cách dễ nhất để chụp lại văn bản từ tài liệu giấy trên điện thoại hoặc máy tính một cách thuận tiện.

Hãy tưởng tượng bạn có một loạt ghi chú viết tay cần sắp xếp cho một dự án, hoặc một loạt biên lai mà bạn muốn số hóa để theo dõi chi phí tốt hơn.

Mặc dù lưu trữ văn bản dưới dạng hình ảnh rất tiện lợi, nhưng bạn không thể dễ dàng sửa đổi, sao chép hoặc chỉnh sửa văn bản trong hình ảnh. Bạn thường sẽ trích xuất văn bản từ hình ảnh để có phiên bản kỹ thuật số mà sau đó bạn có thể dễ dàng chỉnh sửa trên máy tính hoặc thiết bị di động của mình.

Sao chép hoặc trích xuất văn bản từ hình ảnh là một quá trình khá dễ dàng ngày nay, với các công cụ thậm chí có thể nhận dạng chữ viết tay, dữ liệu dạng bảng phức tạp và hộp kiểm. Các công cụ như vậy tận dụng các thuật toán học máy và các kỹ thuật thị giác máy tính để đọc/chụp văn bản từ hình ảnh.

Trong bài viết này, bạn sẽ học cách dễ dàng trích xuất văn bản từ tệp hình ảnh chỉ trong vài giây.

Hãy cùng xem 4 phương pháp nhanh chóng để chuyển đổi hình ảnh thành văn bản có thể chỉnh sửa bằng Adobe, Microsoft Phrase, Google Drive và Nanonets.

Bằng cách chuyển đổi hình ảnh thành tệp PDF trước, trong một số trường hợp, bạn có thể sao chép văn bản từ tệp đó khá dễ dàng.

Chọn trình chuyển đổi hình ảnh sang PDF phù hợp từ Adobe Acrobat trực tuyến – ví dụ trình chuyển đổi JPG sang PDF (các loại tệp hình ảnh được hỗ trợ bao gồm JPG, PNG, BMP, v.v.).
Nhấp vào “Chọn tệp” để tải hình ảnh lên hoặc kéo và thả vào trình chuyển đổi.
Nhấp vào mở tệp PDF đã tải xuống.

Bây giờ bạn có thể sao chép văn bản từ PDF.

💡

Trong một số trường hợp, PDF đã chuyển đổi có thể trở nên phẳng và bạn có thể không thể sao chép văn bản dễ dàng! Bạn có thể phải sử dụng trình chuyển đổi PDF sang văn bản để trích xuất văn bản trong trường hợp đó.

Chuyển đổi hình ảnh thành văn bản trên Microsoft Phrase

Việc chuyển đổi hình ảnh thành văn bản trong Microsoft Phrase cũng bao gồm một bước trung gian là chuyển đổi tệp sang định dạng PDF.

Thêm hoặc thả hình ảnh vào tài liệu Phrase.
Nhấp vào Tệp >> Lưu dưới dạng >> và chọn tùy chọn PDF – thao tác này sẽ lưu tệp dưới dạng PDF.
Bây giờ, hãy nhấp vào Tệp >> Mở >> và chọn tệp PDF mà bạn vừa lưu ở bước trước để mở tệp đó trong tệp Phrase mới.

Microsoft Phrase sẽ tự động phát hiện văn bản trong tệp PDF và hiển thị dưới dạng văn bản có thể chỉnh sửa trên tài liệu Phrase mới được tạo ở bước 3.

💡

Mặc dù phương pháp này hiệu quả, nhưng định dạng văn bản có thể bị thay đổi – đặc biệt nếu hình ảnh ban đầu của bạn chứa dữ liệu bảng phức tạp hoặc hộp kiểm chẳng hạn.

Google Drive cho phép bạn mở bất kỳ tệp hình ảnh (hoặc PDF) nào trên Google Doc, do đó hiển thị văn bản theo định dạng Doc có thể chỉnh sửa.

Tải hình ảnh của bạn lên Google Drive.
Nhấp chuột phải vào tệp >> Mở bằng >> Google Docs.

Có thể mất một thời gian nhưng cuối cùng bạn sẽ nhận được Google Doc có cả tệp hình ảnh gốc và văn bản đã trích xuất ở định dạng có thể chỉnh sửa.

💡

Giống như phương pháp trước, định dạng văn bản có thể bị mất khi chuyển đổi hình ảnh sang Google Doc theo cách này – đặc biệt nếu hình ảnh ban đầu của bạn chứa các cột hoặc bảng chẳng hạn.

Phần mềm OCRchẳng hạn như Mạng nanosử dụng nâng cao Nhận dạng ký tự quang học khả năng trích xuất văn bản từ hình ảnh/ảnh chụp và tài liệu.

Điều này vượt xa OCR cơ bản là một phần của các phương pháp được đề cập ở trên. Nó có thể trích xuất văn bản từ tài liệu và hình ảnh khá chính xác – ngay cả những văn bản có định dạng dữ liệu phức tạp. Phần mềm OCR như vậy không chỉ có thể duy trì định dạng gốc của văn bản trong hình ảnh mà còn trích xuất chỉ dữ liệu có cấu trúc mà bạn cần.

Sau đây là cách bạn có thể chuyển đổi hình ảnh thành văn bản bằng cách sử dụng Mạng nano:

Tải lên hoặc tự động thu thập hình ảnh từ e mail, dịch vụ lưu trữ đám mây, phiếu hỗ trợ và hầu hết mọi nguồn dữ liệu.
Trích xuất văn bản hoặc dữ liệu chính xác với công nghệ AI tiên tiến Trình trích xuất OCR không dựa vào các mẫu được xác định trước.
Xuất dữ liệu có cấu trúc sạch dưới dạng XLS, CSV hoặc XML, v.v. hoặc đẩy dữ liệu trực tiếp vào CRM, WMS hoặc cơ sở dữ liệu của bạn.

Tại sao phải chuyển đổi hình ảnh thành văn bản?

Trích xuất văn bản từ hình ảnh là một yêu cầu khá phổ biến – cho cả trường hợp sử dụng cá nhân và kinh doanh. Sau đây là một số lý do tại sao việc chuyển đổi tài liệu hình ảnh thành văn bản có thể có lợi:

Dữ liệu văn bản ở định dạng kỹ thuật số thuận tiện hơn cho việc lưu trữ, chỉnh sửa, sắp xếp, tìm kiếm hoặc thậm chí sao chép.
Sao chép văn bản từ hình ảnh là giải pháp thay thế hiệu quả hơn nhiều so với việc nhập dữ liệu thủ công – đặc biệt là khi xử lý hình ảnh có nhiều bảng văn bản phức tạp hoặc dữ liệu viết tay.

Ngoài ra, khi sử dụng phần mềm (như OCR) để trích xuất hình ảnh thành văn bản, bạn có thể xử lý nhiều hình ảnh cùng lúc hoặc theo từng đợt, do đó tiết kiệm được nhiều thời gian và công sức.

Sau đây là một số điều cần lưu ý khi lựa chọn phương pháp trích xuất hình ảnh thành văn bản phù hợp nhất với bạn và giảm thiểu mọi khả năng phải chỉnh sửa lại:

Hình ảnh hoặc tranh ảnh cần phải rõ ràng với văn bản dễ đọc – hình ảnh mờ hoặc tối với phông chữ văn bản nhỏ không chuẩn có thể ảnh hưởng đến độ chính xác
Cố gắng duy trì hướng chuẩn cho hình ảnh – hình ảnh bị lệch có thể ảnh hưởng đến độ chính xác của việc trích xuất văn bản
Kích thước tệp hình ảnh không được quá lớn hoặc quá nhỏ – ví dụ: Google Drive lý tưởng nhất là khuyến nghị tệp hình ảnh nhỏ hơn 2MB
Nếu việc duy trì định dạng văn bản gốc từ hình ảnh là quan trọng, hãy chọn phương pháp phù hợp với bạn – không phải mọi phương pháp chuyển đổi hình ảnh sang văn bản đều có thể đảm bảo điều này!
Luôn xem lại văn bản đã trích xuất – hoặc ít nhất là một mẫu – để đảm bảo độ chính xác. Mặc dù việc trích xuất văn bản đơn giản khá dễ dàng, nhưng lỗi có thể xảy ra với hình ảnh của các tài liệu phức tạp hơn (hóa đơn, sao kê ngân hàng, hợp đồng, v.v.).

[ad_2]

Source link

Google cuối cùng cũng hành động để hạn chế deepfake không có sự đồng thuận

Hệ thống AI mới của Google DeepMind hiện có thể giải quyết các bài toán phức tạp

Một công cụ mới dành cho chủ sở hữu bản quyền có thể hiển thị liệu tác phẩm của họ có nằm trong dữ liệu đào tạo AI hay không

Sự khác biệt giữa ANN, CNN và RNN

Quy trình mua hàng để thanh toán & cách tối ưu hóa chu trình P2P

AI và Nguồn nhân lực: Chuyển đổi Tương lai của Quản lý Lực lượng lao động

Giá InVideo, Ưu điểm Nhược điểm, Tính năng, Các lựa chọn thay thế

Đi sâu vào AutoGen và Multi-Agent Frameworks | của Matthew Gunton | Tháng 6, 2024

Most Popular

Sự khác biệt giữa ANN, CNN và RNN

Quy trình mua hàng để thanh toán & cách tối ưu hóa chu trình P2P

AI và Nguồn nhân lực: Chuyển đổi Tương lai của Quản lý Lực lượng lao động

Our Picks

Google cuối cùng cũng hành động để hạn chế deepfake không có sự đồng thuận

Nghiên cứu đồng hành của Cognizant & Oxford Economics với Báo cáo “Công việc mới, Thế giới mới” cho thấy sự lạc quan thận trọng trong các doanh nghiệp áp dụng AI

Làm thế nào để truy cập mô hình GitHub trong vài bước?

Cách trích xuất văn bản từ hình ảnh

Chuyển đổi hình ảnh thành văn bản trên Microsoft Phrase

Tại sao phải chuyển đổi hình ảnh thành văn bản?

Related Posts