Chia & Lấy mẫu CSV
Chia file CSV hoặc TSV theo số dòng hay kích thước để vừa giới hạn 1.048.576 dòng của Excel. Giữ tiêu đề, lấy mẫu, 100% cục bộ, miễn phí.
Giới thiệu Chia & Lấy mẫu CSV
Chia & Lấy mẫu CSV là công cụ mạnh mẽ để xử lý file CSV lớn. Chia nhỏ tập dữ liệu khổng lồ thành các phần nhỏ hơn theo số dòng hoặc kích thước file, hoặc trích xuất mẫu thống kê bằng phương pháp ngẫu nhiên hoặc có hệ thống—tất cả xử lý cục bộ trên trình duyệt để đảm bảo quyền riêng tư dữ liệu hoàn toàn.
Chia CSV được dùng để làm gì?
Chia CSV chia nhỏ file CSV lớn thành các phần nhỏ hơn, dễ quản lý. Điều này hữu ích khi bạn cần xử lý file vượt quá giới hạn kích thước của ứng dụng khác, nhập dữ liệu theo lô, hoặc chia sẻ tập con của tập dữ liệu lớn với đồng nghiệp.
Sự khác biệt giữa lấy mẫu ngẫu nhiên và có hệ thống?
Lấy mẫu ngẫu nhiên trích xuất các dòng ngẫu nhiên từ toàn bộ file, mỗi dòng có cơ hội được chọn ngang nhau—lý tưởng cho phân tích thống kê. Lấy mẫu có hệ thống lấy mỗi dòng thứ N (VD: mỗi dòng thứ 10), nhanh hơn và duy trì mẫu theo thời gian nhưng có thể gây thiên vị nếu dữ liệu có mẫu định kỳ.
Tiêu đề có được giữ lại khi chia không?
Có. Khi bạn bật 'Dòng đầu là tiêu đề', dòng tiêu đề sẽ tự động được bao gồm ở đầu mỗi phần đầu ra, đảm bảo mỗi file chia là CSV hợp lệ, độc lập với tên cột.
Dữ liệu của tôi có an toàn không?
Hoàn toàn an toàn. Mọi xử lý diễn ra cục bộ trên trình duyệt của bạn: file CSV không bao giờ được tải lên bất kỳ máy chủ nào. Điều này đảm bảo quyền riêng tư hoàn toàn cho dữ liệu nhạy cảm như danh sách khách hàng, hồ sơ tài chính, hoặc tập dữ liệu độc quyền.

Làm sao chia CSV để vừa giới hạn 1.048.576 dòng của Excel?
Chọn chế độ 'Theo dòng' và nhấn 'Đặt giới hạn Excel', thao tác này điền 1.048.575 dòng dữ liệu để mỗi phần cùng dòng tiêu đề đạt đúng giới hạn 1.048.576 dòng của Excel. Một huy hiệu đạt/không đạt xác nhận mỗi file sẽ nhập vào Excel hoặc Google Sheets mà không bị cắt bớt hay mất dòng âm thầm.
Có cần tải lên không, hay công cụ hoạt động ngoại tuyến?
Không cần tải lên. Công cụ chạy hoàn toàn trong trình duyệt bằng JavaScript, nên file được đọc trực tiếp từ thiết bị và không bao giờ được truyền đi. Sau khi trang đã tải xong, công cụ hoạt động ngoại tuyến, lý tưởng cho dữ liệu bảo mật.
Có hỗ trợ TSV và các ký tự phân cách khác không?
Có. Ngoài dấu phẩy, bạn có thể chọn dấu chấm phẩy, tab (cho file TSV) hoặc dấu gạch đứng, hoặc để công cụ tự động nhận diện. Ký tự phân cách đã chọn được giữ nguyên trong mọi file đầu ra.
Tôi có thể chia file theo kích thước chính xác không?
Chế độ 'Theo kích thước' chia file để xấp xỉ kích thước mục tiêu của bạn tính bằng megabyte. Do cấu trúc CSV (dòng không thể chia giữa chừng), kích thước file thực tế có thể khác nhau một chút nhưng sẽ gần với mục tiêu bạn chỉ định.
Điều gì xảy ra với file rất lớn?
File được phân tích và xử lý cục bộ trong trình duyệt, nên giới hạn thực tế phụ thuộc vào bộ nhớ khả dụng của thiết bị chứ không phải máy chủ. File rất lớn nhiều gigabyte nên được chia trên máy tính để bàn có nhiều RAM; với tập dữ liệu khổng lồ, hãy chia theo số dòng sao cho mỗi phần nằm thoải mái trong giới hạn của máy bạn.
