Stai cercando il miglior software gratuito di sintesi vocale di Windows? La raccomandazione più ripetuta a pagamento è Dragon Naturally Speaking (DNS). Ma alcuni potrebbero beffarsi di pagare soldi per il software. Fortunatamente, ci sono molti ottimi programmi gratuiti come Google Docs Voice Typing (GDVT) e Windows Speech Recognition (WSR).
Informazioni di base su Dragon NaturallySpeaking 13 Informazioni di base su Dragon NaturallySpeaking 13 Acquista ora su Amazon $ 29, 84
Potresti chiederti come questi due prodotti si confrontino con il DNS e se il DNS soddisfi o meno le tue esigenze. Per questo articolo, ho identificato tre tipi di utenti: quelli che hanno bisogno della trascrizione vocale per scrivere romanzi, quelli che hanno bisogno della trascrizione accademica e quelli che scrivono documenti aziendali, come i promemoria. A tal fine, ho testato tre programmi di trascrizione vocale (DNS, GDVT e WSR).
Impostazione trascrizione vocale
Prima di entrare nel test, esaminiamo prima la configurazione hardware e software consigliata.
Requisiti hardware e software
La digitazione vocale di Google Docs richiede il browser Chrome e un microfono. E ha anche bisogno di una connessione internet persistente (che non è menzionata nei requisiti). In caso contrario, questo è probabilmente il metodo più semplice per iniziare con la trascrizione del discorso.
DNS richiede un processore realizzato nel 2001 o successivo, Windows 7 o successivo e circa 4 GB di spazio di archiviazione gratuito. Il suo requisito più severo è di 2 GB di RAM. Ecco un elenco completo dei requisiti hardware del DNS.
Riconoscimento vocale Windows Attiva riconoscimento vocale e controllo vocale mediante l'impostazione del riconoscimento vocale in Windows Attiva riconoscimento vocale e controllo vocale mediante l'impostazione del riconoscimento vocale in Windows Il riconoscimento vocale rimane più potente di Cortana. Spinge il parlato in testo e controllo vocale. Questo articolo ti mostrerà cosa può fare il riconoscimento vocale, come configurarlo, addestrarlo e usarlo. Leggi di più, noto anche come Speech Platform Runtime (download WSR), non costa nulla e richiede solo un sistema operativo Windows 7 o successivo.
Considerazioni sul microfono
Uso un microfono dinamico (miglior microfono per podcasting Il miglior microfono per podcast per il tuo denaro nel 2017 Il miglior microfono per podcast per il tuo denaro nel 2017 I microfoni sono importanti quando si effettua un podcast. I costi iniziali sono piuttosto bassi: software di registrazione, desktop o laptop e, naturalmente, un microfono, quindi qual è il miglior microfono per podcast? Ulteriori informazioni) e un processore Intel Core i7 relativamente veloce. Se si desidera un microfono di alta qualità, non è necessario. Anche così, i risultati miglioreranno con una migliore qualità del suono e un rumore di sottofondo ridotto.
Il microfono più economico che consiglio per registrazioni di alta qualità è Audio-Technica ATR-2100. Tuttavia, la differenza di accuratezza tra il microfono da $ 5 e il dispositivo da $ 200 è piuttosto ridotta.
Audio-Technica ATR2100-USB Cardioide Dynamic USB / XLR Microfono Audio-Technica ATR2100-USB Cardioid Dynamic USB / XLR Microfono Acquista ora su Amazon $ 74, 10
D'altra parte, i requisiti minimi per Microsoft Speech sono praticamente tutti i computer remoti moderni (la maggior parte dei computer realizzati negli ultimi dieci anni) e un microfono. Se possiedi un laptop o un tablet realizzato negli ultimi cinque anni, dovrebbe avere quello che ti serve per impostazione predefinita.
Configurazione dei programmi di trascrizione vocale
Ecco come utilizzare Google Voice Typing:
Ecco come iniziare con Windows Speech Recognition:
E, infine, ecco come iniziare con Dragon Naturally Speaking:
Metodologia di prova
Voglio trovare il miglior discorso gratuito basato su Windows per l'applicazione di testo. Poiché diversi consumatori potrebbero aver bisogno di un prodotto diverso, ho ideato un semplice test. Ho letto tre diversi passaggi di testi senza copyright: uno tratto da Charles Darwin sulla tendenza delle specie alle varietà di forme . Uno di Call of Cthulu di HP Lovecraft. L'ultimo saluta dal discorso sullo stato dell'Unione del 2017 di Jerry Brown. La mia metodologia non è affatto perfetta, ma dà un'idea delle precisioni di ciascuna suite di riconoscimento vocale.
Esempio di scrittura di finzione (da Call of Cthulu di HP Lovecraft)
"La cosa più misericordiosa del mondo, penso, è l'incapacità della mente umana di correlare tutti i suoi contenuti. Viviamo su una placida isola di ignoranza in mezzo a mari neri dell'infinito, e non è stato pensato che dovremmo viaggiare lontano. Le scienze, ognuna tesa nella sua stessa direzione, ci hanno finora danneggiato poco; ma un giorno il mettere insieme la conoscenza dissociata aprirà così terrificanti visioni della realtà e della nostra terrificante posizione in essa, che saremo impazziti dalla rivelazione o fuggiremo dalla luce mortale nella pace e nella sicurezza di una nuova era oscura “.
Esempio di scrittura aziendale (discorso sullo stato dell'Unione di Jerry Brown 2017)
"In un'occasione come questa è consuetudine definire un programma specifico per l'anno a venire. Sei volte prima da questo podio, l'ho fatto, e in alcuni dettagli. E, rileggendo quelle proposte esposte in precedenti discorsi sullo Stato, mi sono meravigliato di vedere quanto abbiamo realizzato insieme. "
Esempio di scrittura accademica (Charles Darwin sulla tendenza delle specie a formare varietà )
"Ora quando una varietà di un tale animale si verifica, avendo aumentato il potere o la capacità in qualsiasi organo o senso, tale aumento è totalmente inutile, non è mai chiamato in azione, e può persino esistere senza che l'animale ne diventi consapevole. Nell'animale selvatico, al contrario, tutte le sue facoltà e il suo potere sono portati in piena azione per le necessità dell'esistenza, qualsiasi aumento diventa immediatamente disponibile, è rafforzato dall'esercizio e deve anche modificare leggermente il cibo, le abitudini e l'intero economia della razza. "
3 suite di trascrizione vocale testate
È sorprendente il riconoscimento vocale gratuito Le migliori app per la creazione di elenchi per comandi vocali Le migliori app per la creazione di elenchi per comandi vocali Molti strumenti di produttività gratuiti supportano la voce in testo per gli elenchi. Ti mostreremo le migliori app per la creazione di elenchi con riconoscimento vocale e comandi da provare. Leggi altri test eseguiti contro il software a pagamento. Ma alla fine della giornata, l'app più accurata è Dragon Naturally Speaking. Tuttavia, sia Google Voice Typing che Windows Speech Recognition non costano nulla e offrono una precisione superiore al 90%. Ma ognuno ha i suoi punti di forza e di debolezza e potresti preferire uno all'altro.
HP Lovecraft (test di scrittura di fiction)
Lovecraft amava scrivere in una prosa lunga, ininterrotta, intensamente genetica. Mentre tutte e tre le suite fanno un ottimo lavoro di trascrizione accurata del testo vocalizzato di Lovecraft, il DNS viene fuori dai suoi concorrenti . Include sia la maiuscola che la punteggiatura (che è completamente folle).
DNS: DNS ha eliminato solo una singola parola dal testo. Complessivamente, ha ottenuto 107 errori su 108 parole. Ha inchiodato anche diverse frasi lunghe e senza interruzione.
WSR: Windows ha fatto un ottimo lavoro - ma non eccezionale - di trascrizione di Lovecraft. Ha ottenuto circa 97 di circa 108 parole corrette. Sebbene ciò non sia sufficiente sia per GDVT che per DNS, è comunque valido per un programma di sintesi vocale gratuito che non richiede l'accesso online.
GDVT: Non sono sicuro di cosa sia successo perché Google ha inchiodato la trascrizione per gli altri estratti. GDVT ha ottenuto solo 103 punti su 108, lasciando cadere due parole e ne ha trascritte tre. Ha anche scritto una sola volta "punto e virgola" invece di inserire la punteggiatura corretta. Ha anche capitalizzato alcune parole, trasformandole in nomi propri (ma non li penalizzo poiché è la precisione e non la maiuscola che conta).
Sono abbastanza sicuro che se rileggo il documento una seconda volta, non avrebbe alcun errore.
Charles Darwin (test di scrittura scientifica o accademica)
Darwin scrive, come Lovecraft, frasi lunghe caricate con informazioni parentali. Tuttavia, il suo uso del linguaggio è molto chiaro e non usa quasi alcun gergo, che differisce dalla scrittura scientifica quasi incomprensibile di oggi.
DNS: il testo di Darwin esce quasi perfetto in Dragon Naturally Speaking. DNS ha scritto male solo una parola ("in") e in caso contrario ha completamente inchiodato il test con 87 parole proprio su 88.
WSR: Microsoft ha fatto un ottimo lavoro, facendo corrispondere 82 parole su 88. Ha fatto alcuni errori relativamente bizzarri, però, come ortografare "senso" come "centesimi".
GDVT: Google ha fatto un ottimo lavoro con l'estratto di Darwin. GDVT ha emesso solo due parole, su 88. Nel complesso, per un'applicazione gratuita, non è possibile trovare un'alternativa più accurata.
Jerry Brown Stato dello Stato Indirizzo 2016 (Business Writing Test)
Il discorso di Brown non usa molte frasi complicate o vocaboli (a parte la parola "rostro"). Nel complesso, la maggior parte dei servizi di trascrizione è stata eseguita in modo sorprendente. Più o meno, se hai bisogno di un servizio che gestisca frasi semplici e un vocabolario limitato, ognuno di questi funziona alla grande.
DNS: DNS ha inchiodato lo stato dello stato dell'indirizzo di Brown. Mentre lasciava cadere un periodo, in caso contrario, riceveva ogni parola perfettamente. Nota, tuttavia, che i discorsi politici spesso non hanno quel tipo di linguaggio complesso che potresti vedere nella finzione o nel mondo accademico. Un memo o un discorso è diretto e al punto. Questo è qualcosa che un client di riconoscimento vocale non dovrebbe avere problemi nella gestione.
WSR: Windows Speech Recognition ha fatto un ottimo lavoro - sebbene non bello come DNS o Google - nel trascrivere il discorso di Brown. Ha segnato 55 su 58 parole. Riconobbe persino la parola "rostro", che non sapevo nemmeno fosse una parola, né sapevo come pronunciarlo. Apparentemente, o ho capito bene o la tecnologia di riconoscimento vocale può anche prendere errori di pronuncia.
GDVT: il software di trascrizione di Google ha completamente inchiodato la trascrizione, con una precisione del 100%. È persino riuscito a capitalizzare correttamente "State of the State", senza bisogno di input da parte dell'utente. Ha usato stranamente il numero, piuttosto che l'ortografia, per la parola "sei". Che ha provocato un errore stilistico.
I servizi di trascrizione gratuiti sono degni di utilizzo?
C'è una differenza tra Dragon Naturally Speaking, Google Voice Typing e Microsoft Speech Recognition di Windows. Dragon è più preciso dei suoi concorrenti. Tuttavia, il miglior programma gratuito in termini di precisione è - con un margine ristretto - Google Voice Typing. Sebbene sia i servizi di trascrizione di Microsoft sia quelli di Google si confrontino in modo meno che favorevole con il DNS, non costano $ 30.
Contrariamente ai due servizi gratuiti l'uno contro l'altro, Google offre una migliore precisione di riconoscimento vocale, punteggiatura e astensione, richiede una connessione Internet. Google cattura anche molto che tu non intendi, come la punteggiatura e le maiuscole.
Tuttavia, se si desidera un programma di trascrizione gratuito che non sia necessario utilizzare una connessione Internet, Windows Speech Recognition è compatibile con Windows Può fare QUESTO? 15 caratteristiche sorprendenti che non avevi idea di Windows può fare questo? 15 Caratteristiche sorprendenti di cui non avevi la minima idea su Windows può fare molto più di quanto tu possa pensare. Anche se sei un utente veterano di Windows, scommetto che scoprirai una funzionalità nella nostra lista che non hai mai saputo esistesse. Leggi di più . Non è affatto male e offre il 90% di ciò che Dragon Naturally Speaking offre. Fai un tentativo se non l'hai già fatto.
Qual è il tuo servizio di trascrizione preferito? Per favore fateci sapere nei commenti!