Una revisión de Reconocimiento automático de voz
voz a texto en línea
Whisper es un maniquí basado en Transformer con una estructura de codificador-decodificador, entrenado tanto en datos exclusivamente en inglés como en datos multilingües. Los modelos en inglés se centraron en el reconocimiento del deje, mien