Το MacWhisper είναι το δωρεάν λογισμικό μεταγραφής που περίμενα

Αναζητάτε λογισμικό Mac για τη μεταγραφή αρχείων ήχου σε αρχεία γραπτού κειμένου; Υπάρχουν πολλά εργαλεία επί πληρωμή, όπως το Otter.ai και το Trint, που μπορεί να κοστίζουν πραγματικά χρήματα όταν αρχίσετε να τα χρησιμοποιείτε υπερβολικά. Αλλά MacWhisper είναι η δωρεάν λύση που περίμενε το διαδίκτυο. Ή, τουλάχιστον, αυτό που περίμενα.

Το OpenAI κυκλοφόρησε ένα απίστευτα ισχυρό δωρεάν πρόγραμμα τον Σεπτέμβριο του 2022 που επέτρεπε σε άτομα με γνώσεις τεχνολογίας να μετατρέψουν τα αρχεία ήχου και βίντεο τους σε απίστευτα ακριβείς μεταγραφές. Το πρόβλημα ήταν ότι δεν ήταν πολύ προσιτό στον μέσο χρήστη, καθώς έπρεπε να εξοικειωθείτε με τη χρήση εντολών στην εφαρμογή Terminal.

Αλλά με το MacWhisper, το οποίο εντόπισε για πρώτη φορά 9to5Mac, κάποιος ανέπτυξε επιτέλους ένα GUI ή γραφική διεπαφή χρήστη, που βασίζεται στο Whisper του OpenAI και αφήνει όλα τα μπερδεμένα τεχνολογικά πράγματα κάτω από την κουκούλα, επιτρέποντάς σας απλώς να σύρετε και να αποθέσετε το αρχείο ήχου σας και να λάβετε μια μεταγραφή πολύ γρήγορα. Και το MacWhisper είναι εξαιρετικά ακριβές επειδή το Whisper του OpenAI έχει εκπαιδευτεί 680,000 ώρες δεδομένων ήχου στον Ιστό.

Ένα από τα ωραία πράγματα του MacWhisper είναι ότι δεν ανεβάζετε το αρχείο ήχου ή βίντεο που θέλετε να μεταγραφεί στο Διαδίκτυο. Αυτό είναι σημαντικό για τους δημοσιογράφους που μπορεί να εργάζονται σε μια ευαίσθητη ιστορία ή για οποιονδήποτε είναι γενικά επιφυλακτικός να ανεβάσει τα προσωπικά του αρχεία στο cloud. Το αρχείο παραμένει στην επιφάνεια εργασίας σας, πράγμα που σημαίνει ότι δεν υπάρχει πιθανότητα κάποιος να υποκλέψει τον ήχο σας.

Και πάλι, το MacWhisper είναι απλώς μια νέα διεπαφή χρήστη για ένα δωρεάν πρόγραμμα που εισήχθη από το OpenAI στα τέλη του περασμένου έτους, αλλά πραγματικά πρόκειται να κάνει τη μεταγραφή ήχου εύκολη για σχεδόν οποιονδήποτε. Επειδή χρησιμοποιώ το Whisper και το βρήκα τρομερά χρήσιμο από τότε που κυκλοφόρησε. Και ακόμη και εγώ θα χρησιμοποιώ τώρα το MacWhsiper, γιατί είναι βέβαιο ότι θα επιταχύνει τη ροή εργασίας μου.

Ως ένα μόνο παράδειγμα, μετά την είδηση ​​της κατάρρευσης της εταιρείας κρυπτογράφησης FTX, χρησιμοποίησα το Whisper για να μεταγράψω δεκάδες ώρες παλιών συνεντεύξεων στο YouTube με τον ιδρυτή της εταιρείας Sam Bankman-Fried. Από εκεί, μπόρεσα να ψάξω τις μεταγραφές και να βρω περίεργες και ενδιαφέρουσες ιδέες για να γράψω άρθρα, όπως όταν η SBF είπε τον Ιούνιο του 2021 ότι το blockchain θα είχε διορθώσει την Enron. Η σύγκριση της SBF με την Enron ήταν μια περίεργη σύμπτωση, δεδομένων όλων όσων γνωρίζουμε τώρα για το πώς κατέρρευσε το FTX. Αλλά ποτέ δεν θα έβρισκα εκείνη τη στιγμή σε μια παλιά σκοτεινή συνέντευξη χωρίς να έχω δεκάδες μεταγραφές που θα μπορούσα να ψάξω. Και αυτή η διαδικασία, αν και πιο εύκολη από το να ακούς ώρες και ώρες κασέτες, ήταν ακόμα βαρετή και όχι πολύ αυτοματοποιημένη.

Μετά την εγκατάσταση του Whisper στον υπολογιστή μου, πληκτρολογούσα "whisper audiofilename.mp3 —model tiny.en" στην εφαρμογή Terminal του Mac κάθε φορά που ήθελα να μεταγράψω ένα αρχείο. Με το WhisperMac, μπορώ απλώς να σύρω και να αποθέσω το αρχείο ήχου μου και κάνει τα μαγικά του χωρίς καμία επιπλέον πληκτρολόγηση.

Δοκίμασα το MacWhisper με ένα επεισόδιο του NBC Nightly News που κατέβασα από το YouTube. Και εκτός από μερικά λάθη, όπως η ερμηνεία της λέξης "windchills" ως "windhills" και η ακρόαση του Lester Holt ως "Lester Hold", η μεταγραφή ήταν πολύ ακριβής. Το MacWhisper είναι δωρεάν, αλλά υπάρχει ένα επί πληρωμή επίπεδο λογισμικού που θα μπορούσε να είναι ελαφρώς πιο ακριβές επειδή χρησιμοποιεί τα πιο εντατικά μοντέλα εκπαίδευσης του OpenAI, αλλά η δωρεάν έκδοση θα λειτουργήσει πολύ καλά για τους περισσότερους ανθρώπους.

Το MacWhisper σάς επιτρέπει να εξάγετε τη μεταγραμμένη λέξη σε μερικές διαφορετικές μορφές, συμπεριλαμβανομένου απλού κειμένου, CSV ή ακόμα και μορφή αρχείου υπότιτλων όπως SRT και VTT.

Και το MacWhisper δεν είναι μόνο για αγγλικά. Μπορείτε να μεταγράψετε τον ήχο σε 100 διαφορετικές γλώσσες, κάτι που είναι απίστευτα βολικό. Το μόνο χαρακτηριστικό που δεν έχει το MacWhisper, το οποίο μου άρεσε να παίζω στο Whisper στην εφαρμογή Terminal, είναι η μετάφραση γλώσσας. Έχω μεταφράσει viral βίντεο στα ρωσικά και τα κινέζικα και άτομα που μιλούν τις γλώσσες στο Twitter μου είπαν ότι οι μεταφράσεις είναι ακριβής.

Το άλλο χαρακτηριστικό που δεν έχει το MacWhisper, αν και δεν είναι επίσης διαθέσιμο από το Whisper του OpenAI, είναι η δυνατότητα διαφοροποίησης των ηχείων. Για παράδειγμα, εάν μεταγράφετε μια συνέντευξη με δύο ομιλητές, δεν υπάρχουν σαφείς ενδείξεις που να δείχνουν πότε ένας ομιλητής σταμάτησε και ένας άλλος ξεκίνησε. Αλλά υποψιάζομαι ότι κάποιος θα δημιουργήσει αυτή την ικανότητα τελικά. Οι υπηρεσίες επί πληρωμή όπως το Tint το κάνουν αυτόματα και θα ήταν υπέροχο να το έχετε δωρεάν τελικά, αλλά παίρνετε αυτό που πληρώνετε.

Υπάρχει επίσης μια δυνατότητα με το MacWhisper όπου μπορείτε να μετατρέψετε την ομιλία από το μικρόφωνο του υπολογιστή σας σε κείμενο, κάτι που θα μπορούσε να είναι χρήσιμο εάν θέλετε να μεταγράψετε κάτι εν κινήσει.

Πέρασα μήνες αναρωτιέμαι πότε κάποιος θα αναπτύξει επιτέλους ένα GUI για το Whisper, καθώς μερικοί άνθρωποι το έδωσαν μια ευκαιρία, αλλά δεν δημιούργησαν κάτι πολύ φιλικό προς το χρήστη. Αλλά το MacWhisper, το οποίο αναπτύχθηκε από τον Jordi Bruin, είναι το λογισμικό που περίμενα. Ο Bruin έχει επίσης αναπτύξει λογισμικό όπως MacGPT, το οποίο επιτρέπει στους χρήστες να έχουν πρόσβαση στο ChatGPT από τη γραμμή μενού τους.

Μπορείτε να κατεβάσετε το MacWhisper δωρεάν, με εγγραφή μέσω email, στον ιστότοπο του Bruin.

Πηγή: https://www.forbes.com/sites/mattnovak/2023/02/04/macwhisper-is-the-free-transcription-software-ive-been-waiting-for/