Searchable-PDF là gì?

PDF có thể tìm kiếm (Searchable PDF) là tệp PDF có chứa văn bản có thể tìm kiếm và sao chép bằng các công cụ như Ctrl + F. Loại này được tạo ra từ các tài liệu gốc đã có văn bản (như Word, Excel) hoặc từ tài liệu quét (dạng hình ảnh) thông qua công nghệ nhận dạng ký tự quang học (OCR) để tạo thêm một lớp văn bản ẩn bên dưới lớp hình ảnh.

Searchable PDF 

Đây là định dạng PDF tiêu chuẩn nhưng có thêm một lớp văn bản ẩn nằm bên dưới hoặc bên trên hình ảnh quét.

  • Cách tạo: Thông qua quy trình nhận dạng ký tự quang học (OCR) trên các tệp PDF dạng ảnh (từ tài liệu quét).
  • Đặc điểm: Gồm hai lớp trùng khớp: lớp trên là hình ảnh gốc, lớp dưới là văn bản đã được nhận dạng. Lớp văn bản này vô hình nhưng cho phép tìm kiếm và sao chép nội dung.
  • Ứng dụng: Giúp tìm kiếm nội dung trong các tài liệu được quét mà không có văn bản gốc.

Image Only PDF

Đây là một file PDF chỉ chứa hình ảnh quét gốc của bạn được đóng gói dưới định dạng PDF.

Hạn chế:

  • Bạn không thể tìm kiếm hoặc sao chép bất kỳ văn bản nào. Tài liệu của bạn về cơ bản là một cuốn sách ảnh kỹ thuật số.
  • Nếu hình ảnh ban đầu có chất lượng rất cao (ví dụ: TIFF không nén), file PDF cuối cùng có thể có kích thước lớn.

Các công cụ hỗ trợ

https://www.pdf2go.com/vi/create-searchable-pdf

ABBYY FineReader

 

 

Nhận xét

Bài đăng phổ biến từ blog này

Kinh nghiệm tạo biểu đồ Use Case

PHÉP TOÁN XOR

Phần mềm hỗ trợ vẽ bản đồ tư duy trên máy tính

Power Designer 12.5