Η νέα τεχνητή νοημοσύνη του ήχου αυτοκινήτου μπορεί να βελτιωθεί περισσότερο από απλά μελωδίες

Το Χόλιγουντ έχει διαχρονικά απεικονίσει την Τεχνητή Νοημοσύνη (AI) ως το λειτουργικό στρώμα των δυστοπικών ρομπότ που αντικαθιστούν ανυποψίαστους ανθρώπους και δημιουργούν την κλιμακούμενη, κεντρική σύγκρουση. Σε μια αναφορά στην καλύτερη περίπτωση, θα μπορούσατε να φανταστείτε μια νεαρή Hailey Joel Osment να παίζει τον David, το συνειδητοποιημένο, τεχνητό παιδί στον κόσμο του Spielberg με τα πολικά καπέλα, τις αποψυγμένες και πλημμυρισμένες παράκτιες πόλεις (ακούγεται οικείο;) AI: Τεχνητή Νοημοσύνη ο οποίος (προειδοποίηση spoiler) σκοτώνει μόνο τον εαυτό του. Ή ίσως θυμάστε τη φωνή του Robin Williams ως Bicentennial Man ο οποίος, για άλλη μια φορά, είναι ένα ρομπότ με επίγνωση του εαυτού του που προσπαθεί να ευδοκιμήσει και (για άλλη μια φορά σε συναγερμό spoiler), καταλήγει να είναι το μοναδικό του θύμα. Και, φυσικά, υπάρχει η σχεδόν κλισέ αναφορά Terminator και τον μετα-αποκαλυπτικό κόσμο του με μηχανές που προσπαθούν να καταστρέψουν ανθρώπους και, καλά, (όχι και τόσο-προειδοποίηση spoiler) πολλά θύματα για μερικές δεκαετίες. Σε κανένα από αυτά τα σενάρια, ωστόσο, οι άνθρωποι δεν συνυπάρχουν με μια βελτιωμένη ζωή, πόσο μάλλον με ενισχυμένη ψυχαγωγία και ασφάλεια.

Αυτή, όμως, είναι η νέα πραγματικότητα. Οι αλγόριθμοι τεχνητής νοημοσύνης μπορούν να συμπεριληφθούν σε ηχητικά σχέδια και να βελτιώνονται συνεχώς μέσω ενημερώσεων over-the-air για τη βελτίωση της οδηγικής εμπειρίας. Και σε ευθεία αντίθεση με αυτά τα παραδείγματα του Χόλιγουντ, μια τέτοια τεχνητή νοημοσύνη μπορεί πραγματικά να βελτιώσει την πιθανότητα επιβίωσης του ανθρώπου.

Μόνο για Ευχαρίστηση

Μέχρι πρόσφατα, όλη η διεπαφή χρήστη (UI) συμπεριλαμβανομένης της ανάπτυξης ήχου απαιτούσε πολύπλοκο προγραμματισμό από ειδικούς κωδικοποιητές για τους τυπικούς τριάντα έξι (36) μήνες ενός προγράμματος οχήματος. Το στυλ λαμαρίνας και τα ηλεκτρονικά κιβώτια καθορίζονται, προέρχονται και αναπτύσσονται παράλληλα μόνο για τη βαθμονόμηση μεμονωμένων στοιχείων αργά στην ανάπτυξη. Επώνυμοι ήχοι. Ακουστικές υπογραφές. Όλες οι ξεχωριστές πρωτοβουλίες μέσα στον ίδιο, αναιμικό σχεδιασμό συστήματος που έχει κοστίζει δισεκατομμύρια στους κατασκευαστές.

Αλλά η Τεχνητή Νοημοσύνη επέτρεψε έναν πολύ πιο ευέλικτο και αποτελεσματικό τρόπο προσέγγισης του σχεδιασμού της ακουστικής εμπειρίας. «Αυτό που βλέπουμε είναι η σύγκλιση των τάσεων», δηλώνει ο Josh Morris, Διευθυντής Μηχανικής Μηχανικής Μάθησης της DSP Concept. "Ο ήχος γίνεται πιο κυρίαρχο χαρακτηριστικό στην αυτοκινητοβιομηχανία, αλλά ταυτόχρονα βλέπετε τους σύγχρονους επεξεργαστές να γίνονται ισχυρότεροι με περισσότερη μνήμη και δυνατότητες."

Επίσης, χρησιμοποιώντας μια πλατφόρμα ανάπτυξης εστιασμένη στα συστήματα, η Τεχνητή Νοημοσύνη και αυτοί οι ισχυρότεροι επεξεργαστές παρέχουν στους οδηγούς και τους επιβάτες ένα νέο επίπεδο προσαρμοστικής απόκρισης σε πραγματικό χρόνο. . «Αντί της ιστορικής ανάγκης να γράφονται ομάδες κώδικα για κάθε πιθανό σενάριο, η τεχνητή νοημοσύνη καθοδηγεί την ανταπόκριση του συστήματος με βάση τη γνώση των περιβαλλοντικών συνθηκών και γεγονότων, δηλώνει ο Steve Ernst, Επικεφαλής Ανάπτυξης Επιχειρήσεων Αυτοκινήτου της DSP Concept.

Ο πολύ προφανής τρόπος χρήσης ενός τέτοιου συστήματος εκμάθησης είναι η «απομάκρυνση» του θορύβου του οχήματος, έτσι ώστε ο κορυφαίος ήχος να μπορεί να προσαρμοστεί και να βελτιωθεί παρά την αλλαγή με χειμερινά ελαστικά ή άλλες τέτοιες αλλαγές περιβάλλοντος. Αλλά Η LG Electronics έχει αναπτύξει αλγόριθμους που τρέχουν στο Audio Weaver του DSP Concept πλατφόρμα που επιτρέπει φωνητικές βελτιώσεις του διαλόγου της ταινίας κατά τη διάρκεια της ψυχαγωγίας στο πίσω κάθισμα για να τον τονίσουν έναντι των εκρήξεων στην ταινία, επιτρέποντας έτσι στον επιβάτη να ακούει καλύτερα το κρίσιμο περιεχόμενο

Μια άλλη μη προφανής πτυχή θα ήταν ο τρόπος με τον οποίο ενορχηστρώνονται οι επώνυμοι ήχοι εν μέσω άλλων θορύβων. Αυτό το συγκεκριμένο όχημα απαιτεί την κλιμακούμενη ακολουθία εκκίνησης για αναπαραγωγή ενώ άλλοι ήχοι όπως το ραδιόφωνο και τα κουδούνια απενεργοποιούνται αυτόματα; Κάθε εμπειρία μπορεί να προσαρμοστεί.

Πιο πιθανό να ευδοκιμήσει

Καθώς ο κόσμος αγωνίζεται τόσο σε ηλεκτρικά οχήματα όσο και σε αυτόνομη οδήγηση, η συχνότητα και οι ανάγκες των ηχητικών προειδοποιήσεων πιθανότατα θα αλλάξουν δραστικά. Για παράδειγμα, ο μηχανικός ασφαλείας ενός αυτόνομου ταξί δεν μπορεί να υποθέσει ότι οι επιβάτες βρίσκονται οπουδήποτε κοντά σε μια οπτική οθόνη όταν απαιτείται έγκαιρη ειδοποίηση. Και πόσο ηχητική είναι αυτή η ειδοποίηση για το σχεδόν 25 εκατομμύρια Αμερικανοί με αναπηρία για ποιον τα αυτόνομα οχήματα θα πρέπει να ανοίξουν νέες δυνατότητες κινητικότητας; «Ο ήχος τώρα δεν είναι μόνο για να ακούς το αγαπημένο σου τραγούδι», δηλώνει ο Ernst. «Με την αυτόνομη οδήγηση, υπάρχουν όλα τα είδη ειδοποιήσεων που απαιτούνται για να κρατήσουν τον οδηγό αφοσιωμένο ή για να ειδοποιήσουν τον μη εμπλεκόμενο οδηγό για πράγματα που συμβαίνουν γύρω του».

«Και αυτό που το κάνει πιο δύσκολο», λέει ο Adam Levenson, επικεφαλής μάρκετινγκ της DSP Concepts, «είναι όλα τα πράγματα που χειρίζονται ταυτόχρονα μέσα στο αυτοκίνητο: τηλεφωνία, καθηλωτικός ή χωρικός ήχος, θόρυβος κινητήρα, θόρυβος από το δρόμο, συστήματα ακουστικής ειδοποίησης οχημάτων, φωνητικά συστήματα κ.λπ. Μας αρέσει να λέμε ότι το πιο περίπλοκο προϊόν ήχου είναι το αυτοκίνητο».

Για παράδειγμα, φανταστείτε το σενάριο όπου ένας οδηγός έχει ενεργοποιήσει τη λειτουργία αυτόνομης οδήγησης στον αυτοκινητόδρομο, έχει ανεβάσει τους ήχους του και αγνοεί ευχάριστα ένα όχημα έκτακτης ανάγκης που πλησιάζει. Με ποια ακρίβεια (και απόσταση) ανίχνευσης σειρήνας με χρήση του μικροφώνου(ων) του οχήματος ειδοποιεί το αυτοκίνητο τον σχεδόν αποσπασμένο οδηγό του; Πώς πρέπει να παρουσιάζεται αυτή η ειδοποίηση για να ξεπεραστεί ο θόρυβος του περιβάλλοντος, να δοθεί επαρκής προσοχή αλλά να μην τρομάξει άσκοπα τον οδηγό; Όλα αυτά μπορούν να συντονιστούν μέσω προ-ανεπτυγμένων μοντέλων, εκ των προτέρων εκπαίδευσης με διαφορετικές σειρήνες και επακόλουθο συντονισμό βάσει cloud. «Εδώ είναι που η συνολική ενορχήστρωση γίνεται πολύ σημαντική», εξηγεί ο Morris. «Μπορούμε να πάρουμε την έξοδο του μοντέλου [ανίχνευσης AI] και να το κατευθύνουμε σε διαφορετικά σημεία του αυτοκινήτου. Ίσως χαμηλώσετε τον ήχο, να ενεργοποιήσετε κάποιο ηχητικό προειδοποιητικό σήμα και να αναβοσβήσετε κάτι στο ταμπλό για να προσέξει ο οδηγός."

Το ίδιο ισχύει και για τις εξωτερικές ειδοποιήσεις. Για παράδειγμα, το αθόρυβο ηλεκτρικό όχημα μπορεί να έχει ρυθμισμένους συναγερμούς για τους πεζούς. Έτσι, νέες βαθμονομήσεις μπορούν να δημιουργηθούν εκτός σύνδεσης και να μεταφορτωθούν σε οχήματα ως ενημερώσεις λογισμικού με βάση την ενεργοποιημένη καινοτομία.

Καινοτομία παντού. Και η Τεχνητή Νοημοσύνη τροφοδοτεί την ουτοπική εμπειρία αντί να δημιουργεί τον δυστοπικό κόσμο του Χόλιγουντ.

Πρόβλεψη του συγγραφέα

Εδώ είναι η πρόβλεψή μου για την εβδομάδα (και είναι μόλις Τρίτη, παιδιά): η επόμενη εξέλιξη του ήχου θα περιλαμβάνει έναν πλήρη, στιγμιαίο βρόχο ανατροφοδότησης, συμπεριλαμβανομένης της λεπτής, σε πραγματικό χρόνο απόλαυσης των χρηστών. Ναι, μεγάλο μέρος της τρέχουσας σχεδίασης πιθανότατα βελτιώνει την εμπειρία, αλλά μια συνεχής βαθμονόμηση του User-Centred Design (UCD) μπορεί να βελτιωθεί επιπλέον με βάση τις εκφράσεις, τη γλώσσα του σώματος και τα σχόλια των επιβατών, ρυθμίζοντας έτσι την ικανοποίηση σε πραγματικό χρόνο. Όλα τα εργαλεία είναι όλα εκεί: κάμερα, AI, επεξεργαστές και μια προσαρμοστική πλατφόρμα.

Ναι, το έχουμε ξανακούσει προσαρμοστικός ατμοσφαιρικός φωτισμός και απομακρυσμένη ανίχνευση πλήξης, άγχους κ.λπ. για τη βελτίωση της ασφάλειας, αλλά τίποτα που να βελτιώνει τη συνδυασμένη εμπειρία που βασίζεται σε αλγόριθμους εκμάθησης σε πραγματικό χρόνο όλων των αισθητήρων που απευθύνονται στο χρήστη.

Ίσως προεκτείνω πάρα πολύ. Αλλά όπως και ο χαρακτήρας του Robin Williams, έχω διανύσει δύο αιώνες… έτσι ίσως είμαι επίσης ευαίσθητος στο τι μπορεί να θέλουν οι άνθρωποι.

Πηγή: https://www.forbes.com/sites/stevetengler/2022/09/13/the-new-artificial-intelligence-of-car-audio-might-improve-more-than-just-tunes/