Thêm game tại WuGames.ioTài trợKhám phá kho game trình duyệt miễn phí — chơi ngay, không tải, không đăng ký.Chơi ngay

Nén PDF

Nén PDF online với kiểm soát chất lượng và tùy chọn xóa metadata để bảo vệ riêng tư. Công cụ giảm dung lượng PDF chạy ngay trên trình duyệt.

Upload
Kéo thả file PDF vào đây
hoặc nhấp để duyệt
Chọn file PDF để nén

Về công cụ nén PDF

Công cụ này nén file PDF để giảm dung lượng. Bạn có thể chọn từ các mức độ nén khác nhau để cân bằng giữa kích thước file và chất lượng. Tất cả quá trình xử lý diễn ra trên trình duyệt của bạn để đảm bảo riêng tư hoàn toàn. Xem thêm Gộp PDFBảo Vệ PDF.

Cách tốt nhất để thu nhỏ PDF mà không mất chất lượng là gì?

Bước đơn lẻ tác động cao nhất là nén lại hình ảnh nhúng, vì với hầu hết PDF chúng chiếm phần lớn số byte. Chọn cài đặt Chất Lượng Cao để giữ chất lượng nhìn thấy gần bản gốc trong khi vẫn cắt kích thước 30–60% trên nội dung ảnh; chọn Trung Bình cho đọc trên màn hình (tốt cho đính kèm email ở 150 DPI); chọn Thấp chỉ khi khả năng đọc văn bản nhỏ không quan trọng. Công cụ cũng subset phông nhúng, loại bỏ đối tượng trùng lặp và xóa lịch sử chỉnh sửa do ứng dụng tác giả để lại — tất cả lợi ích không mất chất lượng thường thêm 5–15% tiết kiệm. Với PDF chỉ văn bản hoặc nặng vector, lợi ích khiêm tốn vì không có hình để thu nhỏ; trong những trường hợp đó hãy chạy Tuyến Tính Hóa PDF, công cụ này khử trùng lặp luồng đối tượng mà không tái mã hóa bất cứ thứ gì nhìn thấy.

PDF thực tế có thể nhỏ đến mức nào và điều gì đặt mức sàn?

Mức sàn được đặt bởi nội dung thông tin của file: mỗi subset phông nhúng tốn khoảng 30–100 KB tùy phạm vi glyph, mỗi trang thêm vài trăm byte phụ phí cấu trúc, và mỗi hình bị giới hạn bởi entropy cảm thụ ở DPI mục tiêu. Báo cáo 10 trang chỉ văn bản có thể nén dưới 50 KB; tờ rơi 10 trang có ảnh hiếm khi giảm dưới 500 KB mà không có artefact xấu; tài liệu quét 100 trang ở 300 DPI bị giới hạn bởi hiệu quả JBIG2 cho đơn sắc (khoảng 5–10 KB mỗi trang) hoặc JPEG 2000 cho màu (50–200 KB mỗi trang). Nếu file của bạn đã chủ yếu là hình nén, hãy chờ lợi ích phần trăm một chữ số ở lượt thứ hai; nếu nó được xuất từ Word với PNG độ phân giải đầy đủ, hãy chờ giảm 80%+.

Công cụ có hỗ trợ JBIG2 cho tài liệu quét và JPEG 2000 cho hình ảnh màu không?

Động cơ dựa trên trình duyệt dùng JPEG (DCT) cho hình màu và xám và Deflate/Flate cho văn bản và line art — cùng thuật toán được chỉ định trong ISO 32000 phần 7 và hỗ trợ bởi mọi trình đọc PDF từ 1.4. JBIG2 (hiệu quả cho văn bản quét đơn sắc, phổ biến trong lưu trữ PDF/A) và JPEG 2000 (mã hóa wavelet có hoặc không mất chất lượng cho ảnh) là một phần của PDF 1.5+ nhưng yêu cầu bộ mã hóa nhị phân gốc chưa có sẵn trong WebAssembly thuần. Với sách quét đen trắng nơi JBIG2 thường đánh bại Deflate 3–5×, hãy đưa file qua Ghostscript hoặc mutool offline với `mutool clean -giffs` để có các định dạng đó. Chúng tôi đang theo dõi bản port WASM của OpenJPEG và JBIG2enc cho bản phát hành trình duyệt tương lai.

Việc nén có làm hỏng lớp văn bản có thể tìm kiếm trong PDF đã OCR không?

Không — lớp văn bản vô hình do OCR thêm được lưu dưới dạng toán tử hiển thị văn bản Tj/TJ trong luồng nội dung, mã hóa thành chuỗi UTF-16 nén Flate. Nén PDF tái mã hóa hình và loại bỏ đối tượng dư thừa nhưng để toán tử văn bản yên. Sau khi nén, tìm kiếm Ctrl+F, sao chép-dán và truy cập bằng trình đọc màn hình tiếp tục hoạt động đúng như trước. Các subset phông liên kết với văn bản vô hình được giữ (nếu không vị trí văn bản sẽ dịch chuyển), dù glyph không bao giờ được vẽ. Nếu bạn thấy tìm kiếm bị hỏng sau khi nén, thường có nghĩa văn bản OCR được lưu dưới dạng lớp phủ raster thay vì lớp văn bản đúng nghĩa — hãy chạy lại OCR PDF trên đầu ra đã nén để sửa.

Nén PDF — Nén PDF online với kiểm soát chất lượng và tùy chọn xóa metadata để bảo vệ riêng tư. Công cụ giảm dung lượng PDF chạy ng
Nén PDF

Đầu ra đã nén có còn đáp ứng chuẩn lưu trữ PDF/A hay chuẩn in PDF/X không?

Nén PDF nhắm tới giảm kích thước, không phải tuân thủ chuẩn. Một số yếu tố chuẩn yêu cầu có thể sống sót (phông nhúng, cây cấu trúc) trong khi cái khác có thể bị bóc (khối siêu dữ liệu XMP đánh dấu tùy chọn, cờ nhận dạng PDF/A, ý định đầu ra ICC mà PDF/X yêu cầu). Sau khi nén, hãy đưa đầu ra qua veraPDF cho PDF/A hoặc kiểm tra Callas cho PDF/X; nếu thất bại, chuyển đổi lại với trình chuyển chuẩn tường minh như Ghostscript với `-dPDFA=2 -sProcessColorModel=DeviceRGB -dPDFACompatibilityPolicy=1`. Quy trình lưu trữ sạch nhất là: nén trước để giảm kích thước, rồi chuyển đổi một lần ở cuối để chốt cờ tuân thủ, OutputIntent và DocumentID mà hệ thống bảo tồn lâu dài dùng để khử trùng lặp.

Tại sao nén cùng một file hai lần không tiếp tục thu nhỏ nó?

Sau một lượt, hình ảnh đã được mã hóa ở mức chất lượng đã chọn và luồng Flate đã bị xì gần giới hạn entropy. Lượt thứ hai không thể hợp lệ thu nhỏ thêm dữ liệu mà không hạ chất lượng thị giác — và hầu hết trình nén sẽ không hạ nó vì thanh trượt chất lượng được đặt theo lượt, không tích lũy. Bạn có thể thấy tiết kiệm thêm nhỏ 1–2% từ việc loại bỏ đối tượng mới mồ côi, hoặc không tiết kiệm gì nếu công cụ là idempotent. Nếu thực sự cần thu nhỏ hơn, hãy hạ cài đặt chất lượng cho lượt hai (Trung Bình → Thấp) hoặc giảm mẫu DPI hình một cách tường minh. Tái mã hóa JPEG lặp lại làm chúng xuống cấp thấy rõ — mỗi thế hệ đưa vào ringing và dải màu — nên hãy ưu tiên một lượt mạnh duy nhất hơn nhiều lượt nhẹ.

Tôi có nên tuyến tính hóa PDF đã nén để xem web nhanh không?

Có nếu bạn phục vụ file qua HTTP và trình xem hỗ trợ yêu cầu byte-range — điều mà mọi trình duyệt hiện đại đều làm. Tuyến tính hóa, định nghĩa trong ISO 32000-2 mục 7.5.4, sắp xếp lại đối tượng để nội dung trang đầu nằm phía trước file, cho phép trình xem render trang một trong khi phần còn lại được stream về. Với sách giáo khoa 50 MB trên kết nối 5 Mbps, điều đó biến chờ 80 giây thành chờ 1 giây trước khi người dùng thấy gì đó. Nén PDF không tuyến tính hóa mặc định vì nó thêm 1–2% vào kích thước file; hãy đưa đầu ra qua công cụ Tuyến Tính Hóa PDF như bước cuối. Với file phục vụ từ kho lạnh hoặc tải đầy đủ trước khi xem (ví dụ đính kèm email), hãy bỏ qua tuyến tính hóa và giữ bố cục phi tuyến nhỏ hơn.

Công cụ xử lý hồ sơ màu ICC và CMYK trong hình ảnh đã nén ra sao?

Hồ sơ ICC nhúng (dùng cho quy trình quản lý màu trong in và PDF ảnh cao cấp) được bảo toàn qua quá trình nén — chúng nằm trong từ điển tài nguyên, không phải luồng hình, nên sống sót qua tái mã hóa không đổi. Hình CMYK được giữ trong CMYK (tái mã hóa với JPEG-CMYK nếu nguồn là JPEG CMYK), điều này quan trọng vì chuyển CMYK sang RGB và ngược lại là chuyến khứ hồi mất chất lượng làm dịch chuyển đen và xanh lục bão hòa. Nếu bạn cần chuyển sang sRGB để hiển thị web, hãy làm tường minh với công cụ quản lý màu trước khi nén, không phải như hiệu ứng phụ. PDF/X-4 yêu cầu hồ sơ ICC ý định đầu ra vẫn hiện diện và không sửa đổi, nên với file sẵn sàng in hãy xác minh bằng preflight của Adobe Acrobat hoặc hồ sơ callas sau khi nén để xác nhận từ điển OutputIntent đã sống sót.