Thêm game tại WuGames.ioTài trợKhám phá kho game trình duyệt miễn phí — chơi ngay, không tải, không đăng ký.Chơi ngay

So sánh văn bản

So sánh hai đoạn văn bản và tìm sự khác biệt giữa chúng. Công cụ so sánh văn bản làm nổi bật các nội dung được thêm vào, xóa bỏ và thay đổi theo từng dòng, từng từ hoặc từng ký tự. Hoàn hảo để so sánh code, tài liệu hoặc bất kỳ nội dung văn bản nào.

So sánh văn bản - Tìm thay đổi giữa hai đoạn văn bản

Công cụ so sánh văn bản (diff tool) này giúp bạn so sánh hai đoạn văn bản và xác định những gì đã thay đổi giữa chúng. Nó làm nổi bật nội dung được thêm vào bằng màu xanh lá, nội dung bị xóa bằng màu đỏ và hiển thị nội dung không thay đổi. Bạn có thể so sánh văn bản theo dòng, theo từ hoặc theo ký tự với nhiều tùy chọn để tùy chỉnh cách so sánh.

Công cụ so sánh văn bản là gì?

Công cụ so sánh văn bản, còn được gọi là diff tool hoặc text comparison tool, là một chương trình so sánh hai đoạn văn bản và làm nổi bật sự khác biệt giữa chúng. Nó hiển thị:

- Thêm vào: Nội dung có trong văn bản đã sửa nhưng không có trong bản gốc (hiển thị màu xanh lá)
- Xóa bỏ: Nội dung có trong văn bản gốc nhưng không có trong bản đã sửa (hiển thị màu đỏ)
- Không đổi: Nội dung giống nhau trong cả hai văn bản

Công cụ này thường được các lập trình viên sử dụng để so sánh các phiên bản code, bởi các nhà văn để theo dõi thay đổi tài liệu, và bởi bất kỳ ai cần xác định những gì đã thay đổi giữa hai phiên bản của văn bản.

Các chế độ so sánh khác nhau là gì?

Công cụ so sánh văn bản này cung cấp ba chế độ so sánh:

1. So sánh theo dòng: So sánh toàn bộ các dòng văn bản. Tốt nhất cho tài liệu, file code và văn bản có cấu trúc mà mỗi dòng có ý nghĩa riêng.

2. So sánh theo từ: So sánh từng từ riêng lẻ trong khi vẫn giữ nguyên khoảng trắng và ngắt dòng. Lý tưởng để theo dõi thay đổi trong câu và đoạn văn.

3. So sánh theo ký tự: So sánh từng ký tự đơn lẻ. Chế độ so sánh chi tiết nhất, hữu ích để tìm lỗi đánh máy nhỏ hoặc thay đổi một ký tự.

Chọn chế độ phù hợp nhất với nhu cầu của bạn dựa trên loại nội dung bạn đang so sánh.

'Bỏ qua chữ hoa thường' và 'Bỏ qua khoảng trắng' nghĩa là gì?

Các tùy chọn này giúp bạn tập trung vào những khác biệt có ý nghĩa:

- Bỏ qua chữ hoa thường: Coi chữ hoa và chữ thường là giống nhau. Ví dụ, 'Xin chào' và 'xin chào' sẽ được coi là giống nhau. Hữu ích khi việc viết hoa không quan trọng đối với việc so sánh của bạn.

- Bỏ qua khoảng trắng: Coi nhiều khoảng trắng, tab và ngắt dòng như một khoảng trắng duy nhất. Hữu ích khi thay đổi định dạng không quan trọng và bạn chỉ muốn xem thay đổi nội dung.

Các tùy chọn này hữu ích khi so sánh code, tài liệu hoặc văn bản mà sự khác biệt về định dạng không quan trọng.

Làm thế nào để đọc kết quả so sánh?

Kết quả so sánh sử dụng mã màu để hiển thị sự khác biệt:

- Nền màu xanh lá: Nội dung được thêm vào (có trong văn bản đã sửa nhưng không có trong bản gốc)
- Nền màu đỏ: Nội dung bị xóa (có trong văn bản gốc nhưng không có trong bản đã sửa)
- Không làm nổi bật: Nội dung không đổi (giống nhau trong cả hai văn bản)

Trong chế độ theo dòng:
- Các dòng bắt đầu bằng '+ ' là thêm vào
- Các dòng bắt đầu bằng '- ' là xóa bỏ
- Các dòng bắt đầu bằng ' ' (hai khoảng trắng) là không đổi

Thống kê ở phía trên hiển thị tổng số mục được thêm vào, xóa bỏ và không đổi.

Các trường hợp sử dụng phổ biến của công cụ so sánh văn bản là gì?

Công cụ so sánh văn bản hữu ích cho nhiều mục đích:

- So sánh code: So sánh các phiên bản khác nhau của mã nguồn để xem những gì đã thay đổi
- Xem xét tài liệu: Theo dõi thay đổi giữa các bản nháp hoặc bản sửa đổi của tài liệu
- Gỡ lỗi: Tìm sự khác biệt giữa đầu ra mong đợi và đầu ra thực tế
- Xác minh nội dung: Đảm bảo hai văn bản khớp nhau hoặc tìm sự không khớp
- So sánh bản dịch: So sánh văn bản gốc với bản dịch
- Xác thực dữ liệu: Kiểm tra xem các bản xuất hoặc sao chép dữ liệu có giống hệt nhau không
- Tài liệu pháp lý: Xác minh thay đổi hợp đồng giữa các phiên bản

Lập trình viên, nhà văn, biên tập viên, phiên dịch và nhiều chuyên gia khác sử dụng công cụ so sánh văn bản hàng ngày.

So sánh văn bản — So sánh hai đoạn văn bản và tìm sự khác biệt giữa chúng. Công cụ so sánh văn bản làm nổi bật các nội dung được thêm vào,
So sánh văn bản

Độ chính xác của công cụ so sánh văn bản này như thế nào?

Công cụ này sử dụng thuật toán Longest Common Subsequence (LCS - Dãy con chung dài nhất), đây là phương pháp tiêu chuẩn và đáng tin cậy để tính toán sự khác biệt giữa các văn bản. Nó xác định chính xác:

- Tất cả các nội dung được thêm vào và xóa bỏ giữa hai văn bản
- Tập hợp thay đổi tối thiểu cần thiết để chuyển đổi một văn bản thành văn bản khác
- Khớp nội dung chính xác ngay cả khi các dòng hoặc từ được sắp xếp lại

Thuật toán này giống với thuật toán được sử dụng bởi các hệ thống quản lý phiên bản chuyên nghiệp như Git và SVN, đảm bảo kết quả so sánh chất lượng cao mà các nhà phát triển và nhà văn tin tưởng.

Phần trăm độ tương đồng được tính như thế nào?

Phần trăm độ tương đồng chính là con số duy nhất trả lời 'hai văn bản khác nhau bao nhiêu?' mà các chuyên gia cần, được suy ra từ chính phép so sánh LCS mà công cụ đã tính. Nó dùng công thức Dice / SequenceMatcher.ratio() tiêu chuẩn:

độ tương đồng = 2 * (số đơn vị khớp) / (tổng số đơn vị ở cả hai văn bản) * 100

Trong đó 'đơn vị khớp' là các dòng, từ hoặc ký tự không đổi, và 'tổng' đếm mọi đơn vị khớp, thêm vào và xóa bỏ ở cả hai phía. Hai văn bản giống hệt nhau đạt 100%, hai văn bản hoàn toàn khác nhau đạt 0%. Phiên dịch viên dùng nó để kiểm tra mức khớp của bộ nhớ dịch (TM), người kiểm tra chất lượng và đạo văn dùng làm điểm trùng lặp nhanh, còn người rà soát pháp lý dùng để đánh giá hợp đồng đã thay đổi bao nhiêu. Các token chỉ chứa khoảng trắng bị loại khỏi phép đếm ở chế độ theo từ để khoảng trắng không bao giờ làm sai lệch điểm số.

Văn bản của tôi có riêng tư không, và công cụ này khác gì so với diff của Git?

Quyền riêng tư: mọi phép so sánh chạy hoàn toàn trong trình duyệt của bạn bằng JavaScript phía client. Văn bản của bạn không bao giờ được tải lên, lưu trữ hay gửi đến bất kỳ máy chủ nào, nên công cụ an toàn cho hợp đồng pháp lý bí mật, mã nguồn chưa phát hành và tài liệu doanh nghiệp nhạy cảm.

So với diff của Git: Git so sánh các phiên bản tệp được theo dõi bên trong một kho lưu trữ và hoạt động theo dòng. Công cụ này so sánh hai văn bản bất kỳ mà bạn dán vào, không cần kho lưu trữ hay quản lý phiên bản, đồng thời bổ sung chế độ theo từ và theo ký tự cùng điểm độ tương đồng. Hãy dùng chế độ ký tự hoặc từ khi bạn là phiên dịch viên hay người kiểm tra chất lượng so sánh văn xuôi, và dùng chế độ dòng khi rà soát code hoặc tệp có cấu trúc như một diff truyền thống.

'Bỏ qua khoảng trắng' hoạt động khác nhau ra sao giữa chế độ theo từ và theo dòng?

Đây là điểm gây nhầm lẫn phổ biến nhất, nên cần làm rõ:

- Chế độ theo dòng: 'Bỏ qua khoảng trắng' gộp các chuỗi khoảng trắng, tab và ngắt dòng trong mỗi dòng thành một khoảng trắng duy nhất và cắt bỏ hai đầu trước khi so sánh, nên các dòng chỉ khác nhau do thụt lề hay khoảng trắng cuối được coi là không đổi.

- Chế độ theo từ: văn bản được tách theo khoảng trắng, và các token chỉ chứa khoảng trắng giữa các từ không bao giờ được tính là thêm vào, xóa bỏ hay là một phần của điểm độ tương đồng. Khi bật 'Bỏ qua khoảng trắng', bản thân các từ cũng được chuẩn hóa để bỏ qua sai khác về khoảng cách bên trong một token. Kết quả là việc định dạng lại (ngắt dòng hay thụt lề lại) không tạo ra thay đổi giả, và chỉ những khác biệt nội dung thực sự mới được báo cáo.

Tính năng chính

  • Ba chế độ so sánh: theo dòng, theo từ và theo ký tự
  • Kết quả so sánh có mã màu với sự phân biệt trực quan rõ ràng giữa thêm vào và xóa bỏ
  • Tùy chọn so sánh không phân biệt chữ hoa thường khi việc viết hoa không quan trọng
  • Tùy chọn chuẩn hóa khoảng trắng để bỏ qua sự khác biệt về định dạng
  • Thống kê thời gian thực hiển thị số lượng mục được thêm vào, xóa bỏ và không đổi
  • Phần trăm độ tương đồng cho biết nhanh hai văn bản khác nhau bao nhiêu
  • Hỗ trợ văn bản lớn với thuật toán LCS hiệu quả
  • Hỗ trợ sao chép, tải xuống và tải lên file để nhập xuất văn bản dễ dàng
  • Hỗ trợ chế độ tối để xem thoải mái trong mọi điều kiện ánh sáng
  • Không giới hạn kích thước file - so sánh văn bản với độ dài bất kỳ
  • Tập trung vào quyền riêng tư: Tất cả việc so sánh diễn ra trên trình duyệt của bạn, không có dữ liệu nào được gửi đến máy chủ