Wkrótce nie będziemy w stanie rozróżnić głosu człowieka od sztucznej inteligencji

Kategorie: 

Źródło: pixabay.com

W 2016 roku laboratorium badawcze Alpha AI wykorzystało sztuczną inteligencję do opracowania syntetycznego systemu mowy o nazwie WaveNet. System opiera się na pracy sztucznej sieci neuronowej, która jest w stanie generować próbki mowy do złudzenia przypominające ludzki głos. Nie zapominajmy, że system ten stale ewoluuje.

 

Google opublikowało kilka dni temu artykuł, w którym informuje, że ich system mowy WaveNet współpracuje teraz z dodatkowym programem o nazwie Tacotron 2. Dzięki temu sztuczna inteligencja jest w stanie odczytywać tekst w niezwykle realistyczny sposób w czasie rzeczywistym.

 

Na podstawie przeprowadzonych badań ustalono, że sztuczna inteligencja Google osiąga teraz MOS (ang. Mean Opinion Score), czyli subiektywny współczynnik jakości dźwięku, na poziomie 4,53, gdy 4,58 odpowiada profesjonalnemu nagraniu mowy człowieka. Innymi słowy, trudno usłyszeć jakąkolwiek różnicę. 

Google poszło o krok dalej – umieszczając w sieci nagrania ludzkiej mowy oraz sztucznej mowy wygenerowanej przez komputer. Możemy więc samodzielnie zweryfikować postępy technologii. Nie oznacza to jednak, że nowy system sztucznej inteligencji jest doskonały. Póki co program został przeszkolony na podstawie nagrań głosu konkretnej kobiety. Do mówienia jakimkolwiek innym głosem, WaveNet potrzebowałoby kolejnej „inspiracji”. Mimo wszystko nie wydaje się to być dużym wyzwaniem dla Google, które z pewnością ma już wiele propozycji zawodów do wykonywania przez swoją technologię. 

Ocena: 

Średnio: 4 (1 vote)



Skomentuj