Video

Trascrivere il testo da audio o video con MacWhisper

Tiziano Fogliata

Se stai cercando un software per trascrivere audio e video sul tuo Mac, sei nel posto giusto. In questo articolo, ti voglio parlare di MacWhisper, un’app che sfrutta il sistema di riconoscimento vocale di OpenAI e garantisce trascrizioni di alta qualità, mantenendo i tuoi file sicuri sul tuo computer. Scoprirai le principali funzionalità, i vantaggi rispetto ad altri servizi, i requisiti di sistema e i costi associati. Continua a leggere per scoprire perché MacWhisper potrebbe essere la soluzione perfetta per le tue esigenze di trascrizione.

MacWhisper è un’app per Mac, disponibile anche in versione gratuita, che rende semplicissimo trarre vantaggio da Whisper, il sistema di riconoscimento automatico del parlato di OpenAI, la stessa azienda che ha creato ChatGPT.

Utilizzo MacWhisper da alcuni mesi e sono molto soddisfatto dai risultati di trascrizione offerti da questa app.

MacWhisper è un’interfaccia che semplifica l’uso di Whisper di OpenAI per creare trascrizioni e sottotitoli da file audio o video.

Uno dei principali vantaggi offerti da MacWhisper, oltre alla buona qualità dei testi trascritti, è che il contenuto dei file audio e video rimane sul proprio computer. Il lavoro di trascrizione è effettuato in locale, non su qualche server remoto.

MacWhisper scarica i modelli di OpenAI direttamente sul tuo computer. Questa funzionalità ti consente di utilizzare i modelli per le trascrizioni in modo completamente offline, senza la necessità di una connessione internet attiva. Grazie a MacWhisper, hai la libertà di eseguire tutte le operazioni di trascrizione direttamente sulla tua macchina, garantendo così una maggiore sicurezza e privacy dei tuoi dati sensibili. Non dovrai più preoccuparti di eventuali interruzioni di rete o di condividere i tuoi file con terze parti.

È possibile scegliere tra diversi modelli OpenAI da utilizzare per l’elaborazione delle trascrizioni. Modelli di dimensioni ridotte offrono una maggiore velocità di elaborazione, ma minor precisione nelle trascrizioni. Modelli di dimensioni maggiori offrono invece maggior accuratezza nella trascrizione, ma tempi di elaborazione un po’ più lunghi.
Personalmente utilizzo sempre il modello Large, dato che trovo i tempi di elaborazione accettabili e preferisco avere una trascrizione più precisa. Il modello Large è disponibile solo con la versione a pagamento di MacWhisper.

Modelli di Whisper OpenAI

Generare una trascrizione da un file audio o video

Per generare una trascrizione, puoi importare un file video (m4a, mp4, mov) o audio (mp3, wav, aiff) dal tuo computer. Puoi anche fornire l’URL del file o di un video su YouTube. In alternativa, puoi registrare l’audio con un microfono e inviarlo direttamente a MacWhisper.

Le trascrizioni generate possono poi essere esportate in diversi formati: Testo semplice, HTML, PDF, Microsoft Word Docx, CSV…
Inoltre, possono essere esportati anche i sottotitoli nei formati SRT e VTT.

Esportare una trascrizione generata da MacWhisper
Un esempio di trascrizione che puoi esportare con MacWhisper

È inoltre possibile effettuare operazioni di ricerca e sostituzione all’interno del testo trascritto. Nelle impostazioni del programma puoi anche definire delle regole di sostituzione globali, in modo che una determinata parola venga sempre sostituita da un’altra.

Con MacWhisper è possibile sia importare file audio e video da trascrivere, sia registrare l’audio direttamente da un microfono. Inoltre, acquistando la versione Pro, è possibile usare l’audio di sistema come sorgente per le trascrizioni. Questo consente, ad esempio, di trascrivere il testo di una call su Zoom.

La versione a pagamento di MacWhisper costa solo € 25 e non richiede alcun abbonamento. Questo rende questa app molto più conveniente rispetto alla maggior parte dei servizi online di trascrizione.

Sono supportate numerose lingue: Inglese, Cinese, Tedesco, Spagnolo, Russo, Coreano, Francese, Giapponese, Portoghese, Turco, Polacco, Catalano, Olandese, Arabo, Svedese, Italiano, Indonesiano, Hindi, Finlandese, Vietnamita, Ebraico, Ucraino, Greco, Malese, Ceco, Rumeno, Danese, Ungherese, Tamil, Norvegese, Thai, Urdu, Croato, Bulgaro, Lituano, Latino, Maori, Malayalam, Gallese, Slovacco, Telugu, Persiano, Lettone, Bengalese, Serbo, Azero, Sloveno, Kannada, Estone, Macedone, Bretone, Basco, Islandese, Armeno, Nepalese, Mongolo, Bosniaco, Kazako, Albanese, Swahili, Galiziano, Marathi, Punjabi, Singalese, Khmer, Shona, Yoruba, Somalo, Afrikaans, Occitano, Georgiano, Bielorusso, Tagiko, Sindhi, Gujarati, Amarico, Yiddish, Lao, Usbeco, Feroese, Creolo Haitiano, Pashto, Turkmeno, Nynorsk, Maltese, Sanscrito, Lussemburghese, Birmano, Tibetano, Tagalog, Malgascio, Assamese, Tataro, Hawaiano, Lingala, Hausa, Baschiro, Giavanese, Sundanese.

Con la versione a pagamento di MacWhisper è anche possibile utilizzare la propria chiave API di DeepL per effettuare la traduzione del testo trascritto.

Un consiglio: per sfruttare al meglio MacWhisper, è bene avere un Mac con almeno 8GB di RAM e processore Apple Silicon (M1 o M2). Su Mac più vecchi con processore Intel, la trascrizione potrebbe essere lenta.

È possibile scaricare la versione gratuita di MacWhisper, oppure acquistare la versione Pro, sullo store dell’autore (Jordi Bruin) presente su Gumroad.

Altri articoli che ti suggerisco…

Nessun articolo correlato

Lascia un commento