Trình Dịch AI

Trình dịch AI miễn phí chạy NLLB-200 distilled 600M ngay trên thiết bị, trong trình duyệt. 15+ ngôn ngữ, WebGPU. Không tải lên, không API key, riêng tư.

Có góp ý? Báo lỗi, đề xuất tính năng, hoặc chia sẻ suy nghĩ — chúng tôi đọc tất cả

Giới Thiệu Trình Dịch AI

Trình Dịch AI là công cụ dịch máy thần kinh chạy hoàn toàn trên trình duyệt của bạn, sử dụng mô hình NLLB-200 distilled 600M của Meta thông qua thư viện Transformers.js và WebGPU. Khác với Google Translate, DeepL hay ChatGPT, không một ký tự văn bản nào rời khỏi thiết bị: trọng số mô hình được tải về một lần từ CDN công cộng, sau đó toàn bộ quá trình dịch diễn ra cục bộ trên CPU hoặc GPU của bạn. Điều này có nghĩa là luật sư, bác sĩ, nhà báo và lập trình viên có thể dịch các bản thảo bảo mật, chú thích mã nguồn, NDA và tài liệu nội bộ mà không cần gửi cho bên thứ ba. Công cụ hỗ trợ 15 ngôn ngữ phổ biến nhất trong tổng số 200 ngôn ngữ của NLLB-200, bao gồm tiếng Anh, tiếng Việt, Tây Ban Nha, Bồ Đào Nha, Pháp, Đức, Ý, Nga, Trung Giản thể, Nhật, Hàn, Ả Rập, Hindi, Thái và Indonesia. Lần dịch đầu tiên sẽ kích hoạt tải xuống khoảng 600 MB trọng số đã được lượng tử hóa, sau đó trình duyệt sẽ lưu cache vĩnh viễn; những lần dịch tiếp theo gần như miễn phí về băng thông và hoàn tất dưới hai giây cho một đoạn văn trên laptop hiện đại. Văn bản dài được chia theo ranh giới câu để vừa với cửa sổ ngữ cảnh 1024 token của mô hình, rồi ghép lại. Công cụ phù hợp cho đoạn văn ngắn đến vừa (dưới 5.000 ký tự); với tài liệu dài cỡ sách, hãy chia thành các đợt hoặc chạy nhiều tab. Xem thêm Kiểm Tra Ngữ Pháp and Diễn Đạt Lại AI và Tóm Tắt Văn Bản AI.

Công cụ này dùng mô hình dịch nào và chất lượng ra sao?

Chúng tôi sử dụng NLLB-200 distilled 600M, mô hình mã nguồn mở của Meta (No-Language-Left-Behind) được huấn luyện trên 200 ngôn ngữ bao gồm hàng chục ngôn ngữ ít tài nguyên. Trên benchmark FLORES-200, NLLB-200 distilled 600M đạt điểm BLEU gần ngang với các hệ thống thương mại lớn hơn nhiều ở các cặp ngôn ngữ phổ biến (Anh/Tây Ban Nha, Anh/Pháp, Anh/Trung) và vượt trội đáng kể các mô hình mã nguồn mở cũ ở các cặp ít tài nguyên như Anh/Việt, Anh/Khmer, Anh/Yoruba. Phiên bản distilled là mô hình học sinh nhỏ hơn được huấn luyện trên đầu ra của mô hình thầy 54B tham số; chất lượng rất gần với thầy ở hầu hết cặp ngôn ngữ trong khi đủ nhỏ để chạy cục bộ. Với văn bản kỹ thuật dày đặc, thành ngữ hoặc văn học đòi hỏi phong cách cao, bạn có thể vẫn ưa thích DeepL hoặc một LLM tinh chỉnh, nhưng cho email hàng ngày, trang web, văn bản pháp lý mẫu và chú thích mã nguồn thì NLLB-200 là quá đủ và đặc biệt riêng tư.

Tại sao lần dịch đầu tiên lại lâu như vậy?

Lần đầu tiên bạn nhấn Dịch, trình duyệt phải tải xuống trọng số NLLB-200 (khoảng 600 MB dạng lượng tử hóa) từ CDN công cộng và biên dịch chúng thành đồ thị WebGPU hoặc WebAssembly. Hãy đợi từ 30 giây đến vài phút tùy kết nối. Sau khi đã cache, trọng số nằm trong bộ lưu trữ trình duyệt (IndexedDB / Cache API) và tải dưới một giây trong các lần truy cập sau, nên mọi bản dịch tiếp theo hoàn tất trong 1-3 giây cho một đoạn văn. Nếu bạn xóa dữ liệu trình duyệt, mô hình sẽ phải tải lại. Để kiểm tra, mở DevTools, chuyển sang Application > Cache Storage; bạn sẽ thấy các mục thuộc huggingface.co hoặc jsdelivr sau lần chạy đầu.

Văn bản của tôi có thật sự riêng tư không? Nó đi đâu?

Đúng vậy. Văn bản của bạn được xử lý hoàn toàn bên trong tab trình duyệt bằng JavaScript và WebGPU. Không có API dịch phía máy chủ và không có yêu cầu mạng nào chứa văn bản đầu vào của bạn. Bạn có thể tự kiểm chứng bằng cách mở tab Network trong DevTools trước khi nhấn Dịch: bạn sẽ thấy trọng số mô hình được tải về từ CDN, nhưng không bao giờ thấy văn bản đầu vào bị gửi đi đâu. Điều này khiến công cụ lý tưởng cho dịch pháp lý hoặc y tế bảo mật, bản thảo nội bộ doanh nghiệp, tài liệu nguồn báo chí, NDA và bất kỳ nội dung nào không thể gửi cho Google hay OpenAI. Trọng số mô hình bản thân là mã nguồn mở do Meta công bố năm 2022; không có hành vi gửi dữ liệu về nhà nào được nhúng trong đó.

Vì sao WebGPU nhanh hơn WASM và làm sao kích hoạt?

WebGPU là API trình duyệt hiện đại cho phép JavaScript chạy tính toán trực tiếp trên card đồ họa; với một transformer 600 triệu tham số như NLLB-200, nó thường nhanh hơn backend WebAssembly (CPU) từ 5 đến 20 lần. Công cụ tự động phát hiện hỗ trợ WebGPU và sử dụng khi có; phù hiệu xanh 'WebGPU' xuất hiện ở đầu trang nếu vậy. WebGPU được bật sẵn trong Chrome 113+, Edge 113+, các bản Opera/Brave gần đây; trên Firefox cần bật cờ (about:config -> dom.webgpu.enabled); Safari hỗ trợ trong Technology Preview và các bản ổn định gần đây. Trên WebGPU, một đoạn văn dịch trong khoảng 1-2 giây trên iGPU laptop; trên WASM thuần thì mất 8-15 giây. Nếu thấy phù hiệu vàng 'WASM', trình duyệt của bạn không bộc lộ GPU adapter cho WebGPU và công cụ tự động lùi về CPU.

Trình Dịch AI — Trình dịch AI miễn phí chạy NLLB-200 distilled 600M ngay trên thiết bị, trong trình duyệt. 15+ ngôn ngữ, WebGPU. Không t — **Trình Dịch AI**

Hỗ trợ những ngôn ngữ và cặp ngôn ngữ nào?

Mô hình NLLB-200 đầy đủ hỗ trợ 200 ngôn ngữ và mọi hướng giữa chúng; để giao diện đơn giản chúng tôi mở 15 ngôn ngữ được yêu cầu nhiều nhất trong bản này: Anh, Việt, Tây Ban Nha, Bồ Đào Nha (Brazil và châu Âu dùng chung tokenizer), Pháp, Đức, Ý, Nga, Trung Giản thể, Nhật, Hàn, Ả Rập, Hindi, Thái và Indonesia. Bạn có thể dịch theo mọi hướng giữa hai trong số đó, tức là 15 x 14 = 210 cặp đều có sẵn mà không cần tải thêm sau khi mô hình đã được cache. Chúng tôi truyền mã ngôn ngữ NLLB (eng_Latn, vie_Latn, zho_Hans, ...) cho mô hình ở bên trong; nếu bạn cần một cặp chưa được mở trong dropdown (Swahili, Tagalog, Bengali, ...), hãy báo cho chúng tôi và sẽ được bổ sung trong bản dựng sau.

Giới hạn ký tự là bao nhiêu và tài liệu dài được xử lý ra sao?

Giao diện chấp nhận tối đa 5.000 ký tự mỗi lần nhấn Dịch, tương ứng khoảng 700-1000 từ tiếng Anh. Bên trong, công cụ chia đầu vào theo ranh giới câu (dấu chấm, dấu hỏi, dấu chấm CJK đầy đủ) thành các đoạn khoảng 500 ký tự, đưa từng đoạn qua mô hình với cửa sổ ngữ cảnh 1024 token, rồi ghép đầu ra lại. Một câu đơn dài hơn ~1.000 ký tự (hoặc văn bản CJK có rất ít dấu phân cách) sẽ được chia cứng theo độ dài để không bị bỏ qua trong âm thầm, và công cụ sẽ hiển thị thông báo khi điều đó xảy ra. Với tài liệu cỡ sách chúng tôi khuyên chạy theo từng đợt vài trang một lần và sao chép kết quả vào tệp tổng hợp. Chúng tôi chọn 5.000 ký tự làm giới hạn mỗi lần vì thời gian tỉ lệ tuyến tính với độ dài và lần chạy quá dài làm tăng đáng kể nguy cơ tab bị làm mới hoặc thiếu bộ nhớ trên phần cứng yếu.

Tôi có nên tin các bản dịch này cho công việc pháp lý hay y tế không?

Hãy coi mỗi kết quả là ước lượng của máy, không phải bản dịch có công chứng. NLLB-200 distilled 600M rất tốt để nắm ý chính, soạn bản nháp và phân loại nhanh, nhưng các mô hình thần kinh có thể dịch sai con số, tên riêng, liều lượng, từ phủ định và phạm vi mệnh đề theo cách nghe trôi chảy nhưng làm thay đổi ý nghĩa. Với bất cứ điều gì có tính ràng buộc pháp lý hay lâm sàng, một dịch giả có chuyên môn phải hiệu đính (post-edit) và xác nhận, và một chuyên gia trong lĩnh vực nên rà soát thuật ngữ. Lợi thế ở đây là quy trình làm việc, không phải thẩm quyền: vì việc dịch chạy hoàn toàn trên thiết bị, không tải lên, không API key, bạn có thể soạn hợp đồng mật, ghi chú bệnh án hay NDA ngay tại chỗ rồi chuyển cho người rà soát, thay vì dán văn bản nhạy cảm vào dịch vụ đám mây. Hãy dùng tính năng xuất JSON để trao cho người rà soát một bản ghi có thể kiểm tra, khớp theo từng đoạn, đúng những gì mô hình tạo ra.

Tôi có thể xuất hoặc xử lý hàng loạt bản dịch cho quy trình CAT hay QA không?

Có. Sau mỗi lần dịch, nút Sao chép dạng JSON và Tải JSON tạo ra một bản ghi máy đọc được, dựng từ chính các cặp đoạn mà mô hình thực sự tạo ra: {source_lang, target_lang, model: 'nllb-200-distilled-600M', device: 'webgpu' hoặc 'wasm', segments: [{src, tgt}], elapsed_ms, char_count, word_counts}. Các đoạn nguồn/đích đã khớp có thể đưa thẳng vào bộ nhớ dịch (TM) hay công cụ CAT, công cụ hiệu đính và script QA, còn các trường thiết bị/mô hình/thời gian cho kỹ sư bản địa hóa một dấu vết có thể kiểm tra về việc engine nào tạo ra kết quả nào. Bản xuất được tạo cục bộ trong trình duyệt nên giữ nguyên cam kết riêng tư trên thiết bị như chính bản dịch: không có gì được tải lên. Để xử lý tài liệu lớn theo lô, hãy dịch vài trang mỗi lần và nối các mảng segments JSON đã xuất lại với nhau.

Xem thêm

CôNG Cụ AI33

WUTOOLS