Trình Dịch AI

Trình dịch AI miễn phí chạy mô hình NLLB-200 trực tiếp trên trình duyệt. Dịch 15+ ngôn ngữ với WebGPU. Không tải lên, không API key, riêng tư tuyệt đối.

AI Sử dụng NLLB-200 (Meta). Lần đầu tải mô hình (~600 MB); những lần sau gần như tức thời. Riêng tư 100%.
Đang phát hiện phần cứng...
clearXóapasteDán
Tối đa 5000 ký tự mỗi lần dịch0 / 5000

Giới Thiệu Trình Dịch AI

Trình Dịch AI là công cụ dịch máy thần kinh chạy hoàn toàn trên trình duyệt của bạn, sử dụng mô hình NLLB-200 distilled 600M của Meta thông qua thư viện Transformers.js và WebGPU. Khác với Google Translate, DeepL hay ChatGPT, không một ký tự văn bản nào rời khỏi thiết bị: trọng số mô hình được tải về một lần từ CDN công cộng, sau đó toàn bộ quá trình dịch diễn ra cục bộ trên CPU hoặc GPU của bạn. Điều này có nghĩa là luật sư, bác sĩ, nhà báo và lập trình viên có thể dịch các bản thảo bảo mật, chú thích mã nguồn, NDA và tài liệu nội bộ mà không cần gửi cho bên thứ ba. Công cụ hỗ trợ 15 ngôn ngữ phổ biến nhất trong tổng số 200 ngôn ngữ của NLLB-200, bao gồm tiếng Anh, tiếng Việt, Tây Ban Nha, Bồ Đào Nha, Pháp, Đức, Ý, Nga, Trung Giản thể, Nhật, Hàn, Ả Rập, Hindi, Thái và Indonesia. Lần dịch đầu tiên sẽ kích hoạt tải xuống khoảng 600 MB trọng số đã được lượng tử hóa, sau đó trình duyệt sẽ lưu cache vĩnh viễn; những lần dịch tiếp theo gần như miễn phí về băng thông và hoàn tất dưới hai giây cho một đoạn văn trên laptop hiện đại. Văn bản dài được chia theo ranh giới câu để vừa với cửa sổ ngữ cảnh 1024 token của mô hình, rồi ghép lại. Công cụ phù hợp cho đoạn văn ngắn đến vừa (dưới 5.000 ký tự); với tài liệu dài cỡ sách, hãy chia thành các đợt hoặc chạy nhiều tab.

Công cụ này dùng mô hình dịch nào và chất lượng ra sao?

Chúng tôi sử dụng NLLB-200 distilled 600M, mô hình mã nguồn mở của Meta (No-Language-Left-Behind) được huấn luyện trên 200 ngôn ngữ bao gồm hàng chục ngôn ngữ ít tài nguyên. Trên benchmark FLORES-200, NLLB-200 distilled 600M đạt điểm BLEU gần ngang với các hệ thống thương mại lớn hơn nhiều ở các cặp ngôn ngữ phổ biến (Anh/Tây Ban Nha, Anh/Pháp, Anh/Trung) và vượt trội đáng kể các mô hình mã nguồn mở cũ ở các cặp ít tài nguyên như Anh/Việt, Anh/Khmer, Anh/Yoruba. Phiên bản distilled là mô hình học sinh nhỏ hơn được huấn luyện trên đầu ra của mô hình thầy 54B tham số; chất lượng rất gần với thầy ở hầu hết cặp ngôn ngữ trong khi đủ nhỏ để chạy cục bộ. Với văn bản kỹ thuật dày đặc, thành ngữ hoặc văn học đòi hỏi phong cách cao, bạn có thể vẫn ưa thích DeepL hoặc một LLM tinh chỉnh, nhưng cho email hàng ngày, trang web, văn bản pháp lý mẫu và chú thích mã nguồn thì NLLB-200 là quá đủ và đặc biệt riêng tư.

Tại sao lần dịch đầu tiên lại lâu như vậy?

Lần đầu tiên bạn nhấn Dịch, trình duyệt phải tải xuống trọng số NLLB-200 (khoảng 600 MB dạng lượng tử hóa) từ CDN công cộng và biên dịch chúng thành đồ thị WebGPU hoặc WebAssembly. Hãy đợi từ 30 giây đến vài phút tùy kết nối. Sau khi đã cache, trọng số nằm trong bộ lưu trữ trình duyệt (IndexedDB / Cache API) và tải dưới một giây trong các lần truy cập sau, nên mọi bản dịch tiếp theo hoàn tất trong 1-3 giây cho một đoạn văn. Nếu bạn xóa dữ liệu trình duyệt, mô hình sẽ phải tải lại. Để kiểm tra, mở DevTools, chuyển sang Application > Cache Storage; bạn sẽ thấy các mục thuộc huggingface.co hoặc jsdelivr sau lần chạy đầu.

Văn bản của tôi có thật sự riêng tư không? Nó đi đâu?

Đúng vậy. Văn bản của bạn được xử lý hoàn toàn bên trong tab trình duyệt bằng JavaScript và WebGPU. Không có API dịch phía máy chủ và không có yêu cầu mạng nào chứa văn bản đầu vào của bạn. Bạn có thể tự kiểm chứng bằng cách mở tab Network trong DevTools trước khi nhấn Dịch: bạn sẽ thấy trọng số mô hình được tải về từ CDN, nhưng không bao giờ thấy văn bản đầu vào bị gửi đi đâu. Điều này khiến công cụ lý tưởng cho dịch pháp lý hoặc y tế bảo mật, bản thảo nội bộ doanh nghiệp, tài liệu nguồn báo chí, NDA và bất kỳ nội dung nào không thể gửi cho Google hay OpenAI. Trọng số mô hình bản thân là mã nguồn mở do Meta công bố năm 2022; không có hành vi gửi dữ liệu về nhà nào được nhúng trong đó.

Trình Dịch AI — Trình dịch AI miễn phí chạy mô hình NLLB-200 trực tiếp trên trình duyệt. Dịch 15+ ngôn ngữ với WebGPU. Không tải lên, kh
Trình Dịch AI

Vì sao WebGPU nhanh hơn WASM và làm sao kích hoạt?

WebGPU là API trình duyệt hiện đại cho phép JavaScript chạy tính toán trực tiếp trên card đồ họa; với một transformer 600 triệu tham số như NLLB-200, nó thường nhanh hơn backend WebAssembly (CPU) từ 5 đến 20 lần. Công cụ tự động phát hiện hỗ trợ WebGPU và sử dụng khi có; phù hiệu xanh 'WebGPU' xuất hiện ở đầu trang nếu vậy. WebGPU được bật sẵn trong Chrome 113+, Edge 113+, các bản Opera/Brave gần đây; trên Firefox cần bật cờ (about:config -> dom.webgpu.enabled); Safari hỗ trợ trong Technology Preview và các bản ổn định gần đây. Trên WebGPU, một đoạn văn dịch trong khoảng 1-2 giây trên iGPU laptop; trên WASM thuần thì mất 8-15 giây. Nếu thấy phù hiệu vàng 'WASM', trình duyệt của bạn không bộc lộ GPU adapter cho WebGPU và công cụ tự động lùi về CPU.

Hỗ trợ những ngôn ngữ và cặp ngôn ngữ nào?

Mô hình NLLB-200 đầy đủ hỗ trợ 200 ngôn ngữ và mọi hướng giữa chúng; để giao diện đơn giản chúng tôi mở 15 ngôn ngữ được yêu cầu nhiều nhất trong bản này: Anh, Việt, Tây Ban Nha, Bồ Đào Nha (Brazil và châu Âu dùng chung tokenizer), Pháp, Đức, Ý, Nga, Trung Giản thể, Nhật, Hàn, Ả Rập, Hindi, Thái và Indonesia. Bạn có thể dịch theo mọi hướng giữa hai trong số đó, tức là 15 x 14 = 210 cặp đều có sẵn mà không cần tải thêm sau khi mô hình đã được cache. Chúng tôi truyền mã ngôn ngữ NLLB (eng_Latn, vie_Latn, zho_Hans, ...) cho mô hình ở bên trong; nếu bạn cần một cặp chưa được mở trong dropdown (Swahili, Tagalog, Bengali, ...), hãy báo cho chúng tôi và sẽ được bổ sung trong bản dựng sau.

Giới hạn ký tự là bao nhiêu và tài liệu dài được xử lý ra sao?

Giao diện chấp nhận tối đa 5.000 ký tự mỗi lần nhấn Dịch, tương ứng khoảng 700-1000 từ tiếng Anh. Bên trong, công cụ chia đầu vào theo ranh giới câu (dấu chấm, dấu hỏi, dấu chấm CJK đầy đủ) thành các đoạn khoảng 500 ký tự, đưa từng đoạn qua mô hình với cửa sổ ngữ cảnh 1024 token, rồi ghép đầu ra lại. Điều đó có nghĩa câu rất dài (trên ~500 ký tự) có thể bị cắt và bạn nên chia thủ công; với tài liệu cỡ sách chúng tôi khuyên chạy theo từng đợt vài trang một lần và sao chép kết quả vào tệp tổng hợp. Chúng tôi chọn 5.000 ký tự làm giới hạn mỗi lần vì thời gian tỉ lệ tuyến tính với độ dài và lần chạy quá dài làm tăng đáng kể nguy cơ tab bị làm mới hoặc thiếu bộ nhớ trên phần cứng yếu.