Microsoft sta rilasciando (già disponibile in preview per le target release) la nuova funzionalità per le trascrizioni in Microsoft Word.
Alla funzionalità di dettatura, già rilasciata tempo fa sia su Word Online che sull’app di Microsoft Word, so aggiunge a possibilità di trascrivere l’audio in test scritto, partendo dall’upload di una file audio (fino a 200 MB, in formato .wav, .mp4, .mp3) o catturando una sorgente audio in diretta.
Per ora la funzionalità è rilasciata per il riconoscimento della sola lingua inglese.

Una volta elaborata l’operazione “speech to text“, compare un pannello sulla destra, dove è possibile riascoltare l’audio, verificando la qualità della trascrizione (eventualmente correggendola), e procedendo all’inserimento del testo (per frasi o in blocco) all’interno del documento.
Interessante anche la funzionalità che è in grado di riconoscere i diversi speaker coinvolti nella conversazione.

Sono curioso di vedere quale sarà la qualità dello strumento anche quando sarà supportata la lingua italiana.
Mi immagino già gli studenti universitari alle prese con la trascrizione delle lezioni nei propri appunti (se si usa ancora fare così…)… o in generale la possibilità di trascrivere interviste o riunioni. A prima vista, mi sembra una gran figata! 🙂
Il servizio sfrutta anche i servizi di AI di Azure, ed al momento pare ci saranno limiti sul numero delle trascrizioni per mese (su questo non mi è ancora chiaro il dettaglio, si parla di 5 ore/mese e di 300 trascrizioni utente/mese) che ciascun utente potrà richiedere al proprio Word.

Molto interessante.