Gộp File
Ghép lại các phần chia 001/002 thành một file, kết hợp các phần nhị phân theo thứ tự và xác minh checksum. Gộp ngay trên trình duyệt, không tải lên.
Về công cụ gộp File
Gộp file — còn gọi là nối file — thêm các byte của một file vào cuối file khác theo thứ tự xác định, tạo ra một file đầu ra duy nhất. Đây chính xác là điều lệnh Unix 'cat file1 file2 file3 > merged' đã làm từ năm 1971, và nó vẫn là cách chính tắc để tái lắp ráp các bản tải xuống đã chia (phổ biến cho các file rất lớn được chuyển qua kết nối chậm hoặc bị gián đoạn), kết hợp các đoạn video/log được đánh số, tái tạo các ảnh CD đã chia từ các phần .001/.002, và nối các luồng nhị phân được chia chunk có chủ ý cho giới hạn tier lưu trữ. Công cụ này chạy việc nối hoàn toàn trong trình duyệt của bạn bằng Blob và File API — file được đọc từ đĩa, ghép trong bộ nhớ và cung cấp dưới dạng một bản tải xuống duy nhất mà không bao giờ vượt qua mạng. Hoạt động trên mọi loại file (nhị phân hoặc văn bản), với thứ tự tùy chỉnh qua nút lên/xuống, và tích hợp sẵn xác minh SHA-256 để bạn xác nhận file đã ghép lại khớp với checksum do nhà cung cấp công bố. Xem thêm Đổi tên hàng loạt và Nén File ZIP.
Làm sao tái lắp ráp file được chia bởi 7-Zip, WinRAR hoặc HJSplit?
Các công cụ chia khác nhau dùng quy ước đặt tên khác nhau và bạn phải tái lắp ráp bằng CÙNG công cụ: 7-Zip chia thành .001/.002/.003 — mở .001 trong 7-Zip và nó tự tìm phần còn lại; WinRAR chia thành part1.rar/part2.rar — mở part1.rar; HJSplit tạo .001/.002 nhưng định dạng chỉ là chia byte thô, nên bạn có thể nối chúng bằng công cụ này. Để kiểm tra liệu lưu trữ nhiều phần có phải chia byte thô (tương thích với công cụ này) hay chia có cấu trúc (yêu cầu công cụ gốc), kiểm tra vài byte đầu tiên của .001: nếu chúng khớp với tiêu đề lưu trữ đã biết (PK cho ZIP, Rar! cho RAR, 7z cho 7-Zip), công cụ có cấu trúc được yêu cầu. Các clip 4 GB chia chunk từ máy quay phổ biến (MP4 đặt tên C0001.MP4, C0002.MP4) KHÔNG tương thích — chúng là các MP4 hợp lệ độc lập, không phải chia thô.
Thứ tự gộp có quan trọng không và làm sao để đúng?
Có, thứ tự rất quan trọng: việc gộp nối các byte theo trình tự chính xác hiển thị trong danh sách, nên sắp xếp lại tạo đầu ra khác. Với chia được đánh số (file.001, file.002, ...) sắp xếp theo bảng chữ cái — hầu hết các trình chọn file sắp xếp như vậy mặc định, nhưng luôn xác minh. Với chunk được tải xuống từ trình quản lý tải xuống, theo lược đồ đánh số mà trình quản lý dùng (thường là hậu tố _001, _002 hoặc phần mở rộng .partN). Với log văn bản được nối để phân tích (vd: access.log.1, access.log.2 từ logrotate), đảo ngược đánh số rõ ràng: logrotate đặt tên .1 là THỨ HAI gần đây nhất và .0 / không hậu tố là MỚI NHẤT, nên để đọc theo thứ tự thời gian bạn có thể cần .5 trước, rồi .4, rồi .3, v.v. Khi nghi ngờ, gộp và kiểm tra kích thước file khớp với tổng đầu vào.
Khác biệt giữa gộp file và tạo lưu trữ ZIP/TAR là gì?
Gộp tạo ra một luồng byte duy nhất — thêm các byte của file B sau các byte của file A — mà không có metadata về ranh giới. Đầu ra chỉ hợp lệ nếu đầu vào ban đầu được chia từ một file liên tục (nơi ranh giới là offset byte tùy ý, không phải đầu cuối file). Một lưu trữ ZIP hoặc TAR, ngược lại, bao gồm metadata về mỗi file chứa (tên, kích thước, timestamp, quyền) để các file gốc có thể được trích xuất lại dưới dạng các thực thể riêng biệt. Gộp khi bạn muốn tái tạo file gốc từ chia byte thô; dùng ZIP/TAR khi bạn muốn gói các file riêng để lưu trữ hoặc truyền. Quy tắc cơ bản: cat rồi split round-trip (cat a b > c; split c thành a b tái tạo gốc); zip rồi unzip cũng round-trip với metadata đầy đủ; nhưng gộp các file không liên quan tùy ý thành một tạo ra rác trong hầu hết định dạng file.
Tại sao file đã gộp không mở được mặc dù việc gộp hoàn tất?
Bốn nguyên nhân theo tần suất: (1) Sai thứ tự — các byte không ở nơi định dạng file mong đợi. Xác minh lại thứ tự. (2) Thiếu phần — nếu trình quản lý tải xuống thất bại âm thầm trên phần 5 trong 10, file đã gộp của bạn thiếu các byte đó và định dạng trở nên không hợp lệ. Kiểm tra số file khớp với mong đợi. (3) Phần bị hỏng — ngay cả một phần bị hỏng (vài bit bị lật trong quá trình tải xuống) thường làm vô hiệu hóa checksum hoặc chữ ký. So sánh hash SHA-256 nếu nguồn cung cấp. (4) Phần không khớp — vô tình bao gồm file từ tập chia khác tạo ra đầu ra có tổng kích thước đúng nhưng không giải mã được. Luôn gộp file từ cùng tập nguồn/timestamp.

File lớn nhất tôi có thể tạo bằng cách gộp là gì?
Giới hạn thực tế là bộ nhớ trình duyệt vì toàn bộ đầu ra được lắp ráp trong một Blob duy nhất trước khi tải xuống. Trình duyệt desktop (Chrome, Firefox, Edge) xử lý đáng tin cậy đầu ra 1-2 GB và đôi khi có thể đẩy đến 4 GB trên máy có 16+ GB RAM. Safari nghiêm ngặt hơn. Trình duyệt mobile giới hạn gần 500 MB. Cho gộp lớn hơn (tái lắp ráp video 5+ GB, dump cơ sở dữ liệu), dùng lệnh nối gốc của OS: trên Linux/macOS 'cat file1 file2 file3 > output' truyền mà không tải vào bộ nhớ; trên Windows 'copy /b file1+file2+file3 output' làm điều tương tự. Người dùng PowerShell có thể dùng Get-Content -Raw đường ống đến Set-Content.
Tôi có thể thêm dấu ngăn cách giữa các file văn bản đã gộp không?
Công cụ này thực hiện nối nhị phân thô mà không chèn bất kỳ dấu ngăn cách nào. Để chèn dấu ngăn cách giữa các file văn bản, ba cách: (1) Sau khi gộp, mở kết quả trong trình soạn thảo văn bản và chèn tiêu đề hoặc dòng trống thủ công tại ranh giới file — dễ nhất cho vài file; (2) Dùng lệnh Unix 'awk "FNR==1 && NR>1 {print \"\\n=== " FILENAME " ==="} {print}" file1.txt file2.txt > merged.txt' để thêm dấu hiệu tên file; (3) Cho quy trình tự động trong Node.js: const merged = files.map(f => '=== ' + f.name + ' ===\n' + f.content).join('\n\n'); Cho file CSV cụ thể, dấu ngăn cách nguy hiểm — chúng phá vỡ cấu trúc cột. Dùng công cụ gộp CSV chuyên dụng loại bỏ tiêu đề trùng lặp và căn chỉnh cột thay thế.
Công cụ này so với Unix cat hoặc Windows copy /b như thế nào?
Tương đương về chức năng cho thao tác gộp — cả ba tạo ra cùng đầu ra byte-by-byte. Khác biệt: (1) Tốc độ — lệnh gốc của OS truyền từ đĩa-sang-đĩa mà không tải toàn bộ nội dung vào RAM, nên chúng xử lý các merge nhiều GB sẽ làm sập trình duyệt; (2) Tiện lợi — công cụ trình duyệt này cung cấp UI kéo thả trực quan và thứ tự với nút lên/xuống, trong khi lệnh CLI yêu cầu thứ tự thủ công trong dòng lệnh (trở nên đau đớn với nhiều file); (3) Quyền riêng tư — cả hai cách tiếp cận đều giữ cục bộ; không gì được tải lên; (4) Đa nền tảng — công cụ này hoạt động giống hệt trên Windows, Mac, Linux, Chromebook, iOS, Android mà không cần cài gì.
Làm sao xác minh checksum của file đã gộp với SHA-256 do nhà cung cấp công bố?
Sau khi gộp xong, công cụ này tự động tính SHA-256 của đầu ra đã ghép lại và hiển thị trong ô Kiểm Tra Tính Toàn Vẹn — không cần bước băm riêng hay chuyển sang công cụ khác. Để xác nhận việc tái lắp ráp chính xác từng byte, dán checksum do nhà cung cấp cấp (từ trang tải xuống, file .sha256 đi kèm, hoặc bản kê khai ký phát hành) vào ô 'Mã Băm SHA-256 Mong Đợi'. Công cụ chuẩn hóa cả hai giá trị (không phân biệt hoa thường, bỏ qua khoảng trắng và dấu hai chấm) và hiển thị huy hiệu KHỚP nếu chúng giống hệt hoặc KHÔNG KHỚP nếu khác nhau. KHÔNG KHỚP nghĩa là việc tái lắp ráp sai — hầu như luôn do một phần sai thứ tự, một phần bị thiếu hoặc bị cắt cụt, hoặc tải xuống bị hỏng — và không nên tin cậy file đã gộp. Đây chính là bước xác minh mà FAQ chẩn đoán lỗi đề cập: một file mở được nhưng bị hỏng âm thầm sẽ trượt checksum. Nếu nguồn chỉ công bố MD5 hoặc CRC32, chúng yếu hơn và không được tính ở đây; hãy ưu tiên SHA-256 khi có. Mọi thứ chạy cục bộ qua crypto.subtle.digest gốc của trình duyệt, nên các byte không bao giờ rời khỏi thiết bị của bạn.
