Thêm game tại WuGames.ioTài trợKhám phá kho game trình duyệt miễn phí — chơi ngay, không tải, không đăng ký.Chơi ngay

PDF sang ảnh

Chuyển PDF sang ảnh trực tuyến. Xuất mỗi trang PDF thành JPG hoặc PNG. Công cụ chuyển PDF sang ảnh miễn phí với kiểm soát chất lượng. Nhanh, an toàn, chạy trên trình duyệt.

Upload
Kéo thả file PDF vào đây
hoặc nhấp để duyệt
Chọn file PDF để chuyển sang ảnh

Về công cụ chuyển PDF sang ảnh

Công cụ này chuyển các trang PDF thành file ảnh (JPG hoặc PNG). Mỗi trang được xuất thành một file ảnh riêng biệt. Bạn có thể tùy chỉnh định dạng, chất lượng và độ phân giải. Tất cả quá trình xử lý diễn ra trên trình duyệt của bạn để đảm bảo riêng tư hoàn toàn. Xem thêm PDF sang TextGộp PDF.

Chuyển PDF sang ảnh có giữ được độ rõ văn bản ở kích thước màn hình thông thường không?

Có — ở DPI mặc định 150, văn bản rasterized rõ nét trên màn hình tiêu chuẩn, và 300 DPI sắc hơn chất lượng tạp chí in. Bên trong công cụ, PDF.js render mỗi trang lên canvas HTML, rồi xuất dưới dạng PNG hoặc JPEG. PNG không mất chất lượng và lý tưởng cho tài liệu có văn bản và line art (việc render giữ hoàn hảo từng pixel kể cả khi phóng to); JPEG nhỏ hơn cho các trang chủ yếu là ảnh. Đánh đổi là một khi bạn chuyển sang ảnh, văn bản không còn chọn được, tìm kiếm được hay tiếp cận được bằng trình đọc màn hình — thông tin đó từng sống trong lớp văn bản PDF, không phải trong pixel. Nếu cần ảnh có thể tìm kiếm, hãy giữ một bản sao PDF và đưa bất kỳ ảnh nào bạn chỉnh sau đó qua công cụ OCR để dựng lại lớp văn bản.

Tôi nên chọn DPI nào cho màn hình, in ấn và OCR?

Cho đọc trên màn hình và hiển thị web, 96–150 DPI là dư — điều đó khớp mật độ pixel của hầu hết laptop và điện thoại, và tạo file nhỏ. Cho in văn phòng trên giấy Letter hoặc A4, chọn 300 DPI; đó là độ phân giải mà mắt người ngừng phân biệt các chấm riêng lẻ ở khoảng cách đọc bình thường. Cho in chất lượng cao (tạp chí, sách, ảnh) dùng 600 DPI. Cho việc đưa đầu ra vào OCR, 300 DPI là điểm ngọt mọi engine OCR lớn khuyến nghị (Tesseract, Google Vision, Adobe) vì thấp hơn thì làm thiếu chi tiết glyph cho bộ nhận diện và cao hơn chỉ làm chậm mà không cải thiện độ chính xác. Bộ chọn DPI của công cụ áp dụng đồng nhất cho mọi trang.

Tôi có thể trích các trang cụ thể thay vì chuyển đổi cả PDF không?

Có — nhập một khoảng trang như `1-5,8,12-15` vào trường Trang trước khi nhấn Chuyển Đổi. Mỗi trang được liệt kê trở thành một file ảnh, và tất cả được đóng gói vào một ZIP để tải. Dùng cái này để rút một biểu đồ ra khỏi báo cáo dài, hoặc chuyển chỉ trang bìa sách thành một thumbnail. Đánh số trang theo thứ tự riêng của PDF, thường là thứ tự thị giác mà trình đọc hiển thị nhưng có thể khác với tài liệu có chỉ số trang sắp xếp lại. Nếu để trống trường, mọi trang được chuyển đổi. Để trích trang mà giữ chúng dưới dạng PDF (không phải ảnh), hãy dùng công cụ Trích Trang PDF hoặc Tách PDF — chúng không mất chất lượng.

Sự khác biệt giữa đầu ra PNG và JPEG cho việc chuyển đổi PDF là gì?

PNG dùng nén DEFLATE không mất chất lượng và hỗ trợ trong suốt alpha, làm cho nó lý tưởng cho tài liệu có văn bản sắc nét, line art, ảnh chụp màn hình và biểu đồ — mỗi pixel y hệt cái được render. Kích thước file có thể lớn cho nội dung ảnh vì PNG không thể khai thác dư thừa cảm thụ. JPEG dùng nén dựa trên DCT mất chất lượng khai thác cách thị giác con người dung thứ lỗi tần số cao nhỏ; nó tạo file nhỏ hơn 5–10× cho ảnh nhưng đưa vào artefact dạng khối quanh cạnh văn bản sắc nét, đặc biệt ở mức chất lượng thấp. Quy tắc ngón tay cái: chọn PNG cho tài liệu văn phòng, hợp đồng và trang chiếu; chọn JPEG chỉ khi trang chủ yếu là ảnh. Nhiều người dùng bắt đầu với PNG và chỉ chuyển sang JPEG nếu kích thước là vấn đề.

PDF sang ảnh — Chuyển PDF sang ảnh trực tuyến. Xuất mỗi trang PDF thành JPG hoặc PNG. Công cụ chuyển PDF sang ảnh miễn phí với kiểm soá
PDF sang ảnh

Việc chuyển đổi có bảo toàn hồ sơ màu ICC nhúng không?

Công cụ render mỗi trang dùng PDF.js, vốn tôn trọng hồ sơ ICC nhúng trong khi rasterize — màu xuất hiện trên canvas giống cách Adobe Reader hiển thị. Tuy nhiên, PNG hoặc JPEG đầu ra được viết trong không gian màu sRGB theo mặc định, vì đó là hồ sơ duy nhất mà mọi trình duyệt, dịch vụ web và hệ điều hành diễn giải đáng tin cậy cùng cách. Nếu PDF nguồn dùng CMYK với hồ sơ ICC đặc thù cho in (ví dụ FOGRA51 cho offset châu Âu), màu sẽ được chuyển sang sRGB để hiển thị — tương tự cảm thụ nhưng không chính xác. Cho quy trình quan trọng về màu (in thử bản nghệ thuật), đừng dùng rasterizer dựa trên trình duyệt; dùng Adobe Acrobat hoặc Ghostscript với `-sDEVICE=tiff32nc -sOutputICCProfile=USWebCoatedSWOP.icc` để giữ độ trung thực màu CMYK.

Làm sao xử lý PDF rất lớn mà không làm sập tab trình duyệt?

Mỗi trang rasterized sống trong bộ nhớ trình duyệt dưới dạng pixel RGBA trước khi được mã hóa; một trang Letter ở 300 DPI là 2550×3300 pixel × 4 byte = ~34 MB dữ liệu pixel thô. Một tài liệu 100 trang ở 300 DPI do đó cần khoảng 3.4 GB bộ nhớ đỉnh, vượt cái hầu hết tab trình duyệt cho phép. Công cụ xử lý trang tuần tự và giải phóng mỗi canvas sau khi mã hóa, giữ sử dụng đỉnh ở khoảng một trang một lúc cộng ZIP đang lớn dần. Nếu vẫn sập, hãy hạ DPI xuống 150 (cắt bộ nhớ 4×), chuyển đổi theo lô bằng trường khoảng trang, hoặc chuyển sang JPEG mã hóa nhanh hơn và giải phóng bộ nhớ sớm hơn. Cho lưu trữ 1000+ trang, dùng công cụ máy tính bàn như pdftoppm hoặc `mutool draw -o page-%d.png`.

Tôi có thể có đầu ra vector SVG thay vì PNG hoặc JPEG raster không?

Đầu ra vector SVG đang trong lộ trình nhưng chưa được hỗ trợ trong công cụ này. Thách thức là luồng nội dung PDF bao gồm các tính năng (mẫu shading nâng cao, ICC nhúng, ảnh có mặt nạ, chế độ pha trộn) mà SVG 1.1 không thể đại diện trung thực; PDF.js có một backend SVG thử nghiệm, nhưng đầu ra thường khác hơi tinh tế so với render canvas cho các trang phức tạp. Nếu bạn cụ thể cần đầu ra bảo toàn vector, đường tốt nhất hôm nay là giữ PDF ở định dạng PDF (nó đã là container vector) và xem với trình đọc PDF; hoặc dùng nhập PDF của Inkscape (dùng Poppler bên dưới) chuyển trang theo trang sang SVG với độ trung thực hợp lý cho trang đơn giản. Chúng tôi sẽ bật chế độ SVG khi thư viện cơ sở chín muồi.

Ảnh đã chuyển đổi có bao gồm lớp văn bản OCR cho khả năng tiếp cận không?

Không — việc rasterize bỏ hoàn toàn lớp văn bản. Văn bản OCR vô hình của PDF sống trong luồng nội dung dưới dạng toán tử Tj/TJ với dữ liệu định vị; một khi bạn render sang PNG hoặc JPEG, chỉ pixel nhìn thấy sống sót. Điều này phá hỏng tìm kiếm Ctrl+F, truy cập bằng trình đọc màn hình và sao chép-dán. Nếu bạn cần trang định dạng ảnh giữ lại văn bản tìm kiếm được, quy trình là hai bước: trước tiên chuyển bằng PDF sang Ảnh để có PNG, rồi đưa các PNG đó qua công cụ OCR như Tesseract hoặc Google Vision để tạo file văn bản sidecar hoặc file HOCR với hộp bao quanh. Để nhúng lại vào PDF, OCR PDF trên file gốc là đường sạch hơn — nó giữ nội dung vector và thêm lớp văn bản tại chỗ.