Thêm game tại WuGames.ioTài trợKhám phá kho game trình duyệt miễn phí — chơi ngay, không tải, không đăng ký.Chơi ngay

So sánh PDF

So sánh hai tệp PDF online với diff văn bản từng trang. Phát hiện từ ngữ, điều khoản, metadata thay đổi giữa các phiên bản, miễn phí ngay trong trình duyệt.

Về công cụ so sánh PDF

Công cụ này so sánh hai file PDF và hiển thị sự khác biệt của chúng. Nó so sánh thuộc tính file, metadata, số trang và kích thước file. Tất cả quá trình xử lý diễn ra trên trình duyệt của bạn để đảm bảo riêng tư hoàn toàn.

Công cụ so sánh những gì?

Công cụ so sánh tên file, kích thước file, số trang, phiên bản PDF và metadata (tiêu đề, tác giả, v.v.).

Có thể so sánh nội dung không?

Công cụ này so sánh thuộc tính cấp file và metadata. Để so sánh nội dung chi tiết, bạn cần các công cụ diff chuyên biệt.

Giới hạn kích thước file là gì?

Mỗi file PDF phải dưới 50MB.

Dữ liệu của tôi có an toàn không?

Có! Tất cả quá trình so sánh diễn ra trong trình duyệt của bạn. File không bao giờ được tải lên bất kỳ máy chủ nào.

Công cụ này có phát hiện thay đổi văn bản giữa hai phiên bản PDF không?

Có. Công cụ nay đã so sánh văn bản trích xuất theo từng trang: nó lấy lớp văn bản của mỗi PDF, tách thành các dòng theo trang, rồi chạy diff cấp dòng để bạn thấy chính xác dòng nào được thêm (+) hay xóa (-) trên mỗi trang, kèm tổng số trang thay đổi và số dòng thêm/xóa. Đây là diff văn bản (nội dung), không phải diff hình ảnh hay OCR: nó so sánh từ ngữ chứ không phải điểm ảnh hay bố cục, đúng thứ bạn cần khi rà soát hợp đồng, tài liệu kỹ thuật và báo cáo.

So sánh PDF — So sánh hai tệp PDF online với diff văn bản từng trang. Phát hiện từ ngữ, điều khoản, metadata thay đổi giữa các phiên b
So sánh PDF

Công cụ có hoạt động với PDF quét hoặc chỉ có ảnh không?

Chỉ khi có lớp văn bản thật, chọn được. Tài liệu quét chỉ là ảnh của trang thì không có văn bản trích xuất được, nên diff sẽ báo 'không có lớp văn bản'. Nếu bản quét đã qua OCR, kết quả tùy chất lượng OCR: lỗi nhận dạng có thể hiện thành dòng thêm/xóa giả. Để so sánh đáng tin cậy, hãy dùng PDF xuất từ Word, LaTeX, Chrome hay tương tự, vốn giữ lớp văn bản thật.

So sánh văn bản có bị ảnh hưởng bởi phông chữ, bố cục hay định dạng không?

Không. Diff làm việc trên văn bản trích xuất, không trên vị trí, nên thay đổi phông chữ, lề, dàn lại dòng và phần lớn thay đổi bố cục không tạo khác biệt giả miễn là cùng từ ngữ giữ nguyên thứ tự đọc. Hai PDF nhìn rất khác nhau nhưng nội dung chữ giống hệt sẽ diff là không đổi; ngược lại, một từ bị sửa sẽ được đánh dấu dù bố cục không động tới. Việc sắp xếp lại mạnh các cột hay bảng có thể đổi thứ tự đọc và hiện thành các dòng bị dời chỗ.

Vì sao dung lượng khác nhau dù tài liệu trông giống hệt?

Dung lượng PDF phụ thuộc: mức nén ảnh (JPEG vs Flate), font nhúng (subset hay đầy đủ), object stream bật, linearization (tối ưu web), mã hóa, đánh dấu chỉnh sửa, theo dõi thay đổi. Hai PDF nhìn y hệt có thể chênh 5 lần dung lượng theo các cài đặt này.

Những trường metadata nào được so sánh giữa hai tệp?

Title, Author, Subject, Keywords, Creator (app tạo nội dung), Producer (thư viện ghi PDF), CreationDate, ModDate và phiên bản PDF (1.4, 1.7, 2.0). Khác biệt Producer thường cho biết thư viện nào sinh ra mỗi PDF (LaTeX, Word, Chrome, Acrobat).

Giới hạn 50MB mỗi tệp có cứng không?

Là giới hạn mềm theo bộ nhớ trình duyệt để tránh crash tab. PDF.js nạp toàn bộ tệp vào RAM. Laptop hiện đại xử lý tới 200MB; điện thoại khó với trên 30MB. Với PDF cực lớn, tách bằng pdftk hoặc dùng phần mềm desktop như PDF24 Creator hay qpdf.