Omnivoice – multijęzyczny model pozwalający na klonowanie głosów z krótkich próbek audio i generowanie nimi tekstu na lokalnym sprzęcie. Wyszedł kilka dni temu, i narobił nie małą rewolucję. Jest na tyle mały, że teoretycznie da się go uruchomić na telefonie z lepszym procem i układem graficznym.
Pierwszym materiałem, którym go nakarmiłem jest fragment śpiewu wycięty z rosyjskiej piosenki militarnej (wiem, kreatywnie XD).
Space, w którym można go testować online:
https://huggingface.co/spaces/k2-fsa/OmniVoice
Zachęcam do przetestowania :).
Skomentuj djsenter Anuluj pisanie odpowiedzi