Trình Sửa Ngữ Pháp AI & Diễn Đạt Lại
Công cụ sửa ngữ pháp AI chạy trên thiết bị. Mô hình T5 sửa ngữ pháp ngay trong trình duyệt, hiển thị diff từng từ và xuất báo cáo JSON/TXT. Riêng tư, ngoại tuyến.
Giới Thiệu Trình Sửa Ngữ Pháp AI
Trình Sửa Ngữ Pháp AI này sửa ngữ pháp hoàn toàn trên thiết bị của bạn. Nó tải mô hình Xenova/t5-base-grammar-correction bằng Transformers.js và chạy bên trong một Web Worker, dùng WebGPU khi có sẵn hoặc WebAssembly nếu không. Văn bản của bạn không bao giờ được tải lên máy chủ nào: không có lệnh gọi API, không ghi log, không đo lường dữ liệu đầu vào.
Công cụ hiển thị bản diff từng từ giữa văn bản gốc và bản đã sửa, chỉ số tỷ lệ thay đổi, cùng thời gian suy luận của mỗi lượt và backend đang hoạt động. Bạn có thể sao chép văn bản đã sửa hoặc tải báo cáo có cấu trúc dạng JSON hay văn bản thuần. Xem thêm Tóm Tắt Văn Bản AI và Trình Dịch AI, đều dùng cùng nền tảng chạy trong trình duyệt.
Văn bản của tôi có bị tải lên máy chủ khi dùng công cụ này không?
Không. Công cụ chạy hoàn toàn trong trình duyệt của bạn bằng Transformers.js và WebAssembly (hoặc WebGPU). Mô hình được tải một lần từ CDN của Hugging Face và lưu vào bộ nhớ đệm cục bộ, sau đó toàn bộ việc sửa diễn ra trên CPU hoặc GPU mà văn bản không hề rời khỏi thiết bị. Không có lệnh gọi API, không ghi log, không đo lường. Điều này quan trọng với hợp đồng pháp lý, hồ sơ y tế, ghi chú nội bộ và bài luận của học sinh. Bạn có thể tự kiểm chứng bằng cách mở DevTools, theo dõi tab Network và xác nhận không có yêu cầu nào chứa văn bản của bạn được gửi đi sau khi mô hình tải xong.
Công cụ dùng mô hình nào bên dưới?
Nó dùng Xenova/t5-base-grammar-correction, một mô hình T5-base mã hóa-giải mã (khoảng 220 triệu tham số) được tinh chỉnh cho việc sửa lỗi ngữ pháp và phục vụ qua Transformers.js. Trên WebAssembly nó chạy ở mức lượng tử hóa q8 (8 bit) để giảm dung lượng tải và bộ nhớ; trên WebGPU nó chạy ở fp32. Mỗi đầu vào được thêm tiền tố "grammar: " mà mô hình mong đợi. Văn bản dài được chia theo câu để mỗi lượt nằm trong cửa sổ 512 token.
Độ chính xác ra sao và có giới hạn gì?
Mô hình sửa đáng tin cậy các lỗi phổ biến: hòa hợp chủ ngữ-động từ, mạo từ, giới từ, thì của động từ, từ lặp và dấu câu cơ bản. Nó tập trung vào tiếng Anh và được huấn luyện trên dữ liệu sửa ngữ pháp tiếng Anh, nên kết quả với ngôn ngữ khác không đáng tin. Là mô hình cỡ base, nó có thể bỏ sót các vấn đề văn phong tinh tế, cách diễn đạt thành ngữ và thuật ngữ chuyên ngành, và đôi khi diễn đạt lại thay vì chỉ sửa tối thiểu. Hãy xem kết quả như một lượt rà nhanh đầu tiên và soát lại trước khi xuất bản tài liệu quan trọng. Đây là kỳ vọng chung, không phải điểm chuẩn được bảo đảm.

Diff từng từ và Tỷ Lệ Thay Đổi là gì?
Sau khi sửa, công cụ căn chỉnh văn bản gốc và bản đã sửa theo từng token bằng thuật toán diff dựa trên chuỗi con chung dài nhất. Các từ bị xóa hiển thị gạch ngang màu đỏ, các từ thêm hoặc thay đổi hiển thị màu xanh lá, để bạn thấy chính xác mô hình đã chỉnh gì. Tỷ Lệ Thay Đổi là số token thay đổi chia cho số từ trong văn bản gốc, tính theo phần trăm. Tỷ lệ thấp nghĩa là chỉ chỉnh sửa nhẹ; tỷ lệ cao nghĩa là đã viết lại nhiều hơn và nên xem kỹ.
Tôi có thể dùng GPU để suy luận nhanh hơn không?
Có. Transformers.js phát hiện hỗ trợ WebGPU (Chrome 113+, Edge và các trình duyệt Chromium khác) và dùng tự động; nếu không thì quay về WebAssembly. Backend đang hoạt động hiển thị dưới dạng huy hiệu cạnh ô nhập (WebGPU hoặc WASM), và mỗi lượt báo cáo thời gian suy luận bằng mili giây. WebGPU thường nhanh hơn WASM vài lần trên cùng phần cứng, nhất là với đoạn văn dài. Không cần cấu hình: công cụ tự chọn backend nhanh nhất có sẵn.
Độ dài tối đa là bao nhiêu và có hoạt động ngoại tuyến không?
Không có giới hạn ký tự cứng, nhưng mô hình có cửa sổ 512 token, nên công cụ chia văn bản dài thành các đoạn cỡ câu và sửa từng đoạn; tài liệu rất dài chỉ đơn giản là cần nhiều lượt hơn. Sau khi mô hình tải xong lần đầu, các tệp của nó được lưu trong bộ nhớ đệm trình duyệt, nên bạn có thể ngắt kết nối internet, tải lại trang và tiếp tục sửa ngoại tuyến chừng nào bộ nhớ đệm còn. Điều này hữu ích trên máy bay, mạng bảo mật hoặc nơi kết nối chập chờn.
Tôi có thể xuất các bản sửa cho quy trình làm việc không?
Có. Sau khi sửa, bạn có thể sao chép văn bản đã sửa hoặc tải báo cáo dạng JSON hay văn bản thuần. Báo cáo JSON chứa tên mô hình, backend đang hoạt động, thời gian suy luận, văn bản gốc và bản đã sửa, cùng danh sách có cấu trúc các token được thêm và xóa, để biên tập viên và người duyệt kiểm tra chính xác điều gì đã thay đổi và đưa vào quy trình theo dõi thay đổi. Báo cáo văn bản thuần là bản tóm tắt dễ đọc của cùng thông tin đó.
