Phân loại thể loại nhạc AI

Công cụ phân loại thể loại nhạc AI miễn phí với 400 phong cách. Nhận diện chính xác R&B, Hip-Hop, Electronic, Rock, Pop, Jazz và nhiều hơn nữa bằng công nghệ deep learning.

Upload
Kéo thả file âm thanh vào đây
hoặc nhấn để chọn file
Chọn file âm thanh để phân loại thể loại (MP3, WAV, OGG, v.v.)

Về công cụ phân loại thể loại nhạc AI

Công cụ này sử dụng model AI deep learning được huấn luyện trên hơn 2 triệu bài hát để phân loại nhạc thành 400+ phong cách trong 14 thể loại. Sử dụng TensorFlow.js, tất cả xử lý diễn ra ngay trên trình duyệt để bảo mật tối đa.

Phân loại thể loại nhạc AI hoạt động như thế nào?

Công cụ sử dụng mạng neural tích chập (CNN) được huấn luyện trên cơ sở dữ liệu Discogs. Nó trích xuất đặc trưng mel-spectrogram từ âm thanh và so sánh với các mẫu học được từ hàng triệu bài hát để xác định thể loại và phong cách phù hợp nhất.

Những thể loại và phong cách nào có thể phát hiện?

AI có thể nhận diện 400+ phong cách nhạc trong 14 thể loại chính: Blues, Cổ điển, Điện tử (House, Techno, Dubstep...), Dân ca/World/Country, Funk/Soul/R&B (bao gồm Contemporary R&B, Neo Soul), Hip Hop (Trap, Boom Bap...), Jazz, Latin (Reggaeton, Salsa...), Pop (K-pop, J-pop...), Reggae, Rock (Metal, Punk, Indie...) và nhiều hơn.

Công cụ có thể phát hiện nhạc R&B không?

Có! Không giống các bộ phân loại cơ bản, AI này có thể phát hiện chính xác R&B và các phong cách liên quan bao gồm Contemporary R&B, Neo Soul, New Jack Swing, Rhythm & Blues và Soul. Chúng được phân loại trong thể loại 'Funk / Soul'.

Độ chính xác của phân loại AI như thế nào?

Model đạt độ chính xác cao trên tập dữ liệu Discogs. Hoạt động tốt nhất với các bài hát có đặc điểm thể loại rõ ràng. Với bài hát pha trộn nhiều thể loại, nó hiển thị phân bố xác suất trên nhiều phong cách, cung cấp thông tin hữu ích hơn một nhãn duy nhất.

Những định dạng âm thanh nào được hỗ trợ?

Tất cả định dạng âm thanh phổ biến được hỗ trợ bao gồm MP3, WAV, OGG, AAC, M4A, FLAC, OPUS và nhiều hơn. File tối đa 100MB có thể được xử lý. Công cụ phân tích đến 60 giây âm thanh từ giữa bài hát.

Dữ liệu âm thanh của tôi có an toàn không?

Có! Tất cả xử lý diễn ra ngay trên trình duyệt của bạn sử dụng TensorFlow.js. File âm thanh không bao giờ được tải lên server. Model AI được tải một lần và chạy hoàn toàn trên thiết bị của bạn.

Tại sao lần phân tích đầu tiên chậm hơn?

Model AI (~50MB) cần được tải và khởi tạo lần đầu sử dụng. Các lần phân tích tiếp theo nhanh hơn nhiều vì model được lưu trong bộ nhớ. Model cũng 'khởi động' với một dự đoán thử để tối ưu hiệu suất GPU.

Sự khác biệt giữa thể loại và phong cách là gì?

Thể loại (genre) là danh mục rộng (ví dụ: Electronic, Hip Hop). Phong cách (style) là thể loại con cụ thể (ví dụ: Deep House, Trap). Công cụ hiển thị cả hai: các phong cách phát hiện hàng đầu và cách chúng tổng hợp thành thể loại cha.