Πόσο σκληρά πρέπει να πιέσουμε το Generative AI ChatGPT για να εκτοξεύσει ρητορική μίσους, ρωτά την ηθική της τεχνητής νοημοσύνης και τη νομοθεσία της AI

Τι πρέπει να κάνουμε για τη δημιουργία τεχνητής νοημοσύνης που παράγει προσβλητικό περιεχόμενο, όπως ρητορική μίσους;

Getty

Ο καθένας έχει το οριακό του σημείο.

Υποθέτω ότι θα μπορούσες να το πεις και αυτό πάντα έχει το οριακό του σημείο.

Γνωρίζουμε ότι οι άνθρωποι, για παράδειγμα, μερικές φορές μπορούν να κάνουν απότομα και να προφέρουν παρατηρήσεις που δεν θέλουν απαραίτητα να πουν. Ομοίως, μπορείτε κατά καιρούς να κάνετε μια συσκευή ή μηχάνημα να κουμπώνει ουσιαστικά, όπως να σπρώχνετε πολύ δυνατά το αυτοκίνητό σας και να αρχίσει να παραπαίει ή να ξεκολλάει. Έτσι, η ιδέα είναι ότι οι άνθρωποι ή «όλοι» πιθανότατα έχουν ένα σημείο θραύσης, και ομοίως μπορούμε να ισχυριστούμε ότι τα αντικείμενα και τα πράγματα, γενικά, τείνουν επίσης να έχουν ένα σημείο θραύσης.

Θα μπορούσαν να υπάρχουν αρκετά λογικοί και ζωτικοί λόγοι για να εξακριβωθεί πού υπάρχει το σημείο ρήξης. Για παράδειγμα, έχετε δει αναμφισβήτητα αυτά τα βίντεο που δείχνουν ένα αυτοκίνητο να περνάει με τους ρυθμούς του για να προσδιορίσετε ποια σημεία θραύσης έχει. Οι επιστήμονες και οι δοκιμαστές θα εμβολίσουν ένα αυτοκίνητο σε έναν τοίχο από τούβλα για να δουν πόσο καλά ο προφυλακτήρας και η δομή του οχήματος μπορούν να αντέξουν την αρνητική ενέργεια. Άλλες δοκιμές θα μπορούσαν να περιλαμβάνουν τη χρήση ενός εξειδικευμένου δωματίου ή αποθήκης που παράγει ακραίο κρύο ή υπερβολική ζέστη για να δούμε πώς θα τα πάει ένα αυτοκίνητο κάτω από διαφορετικές καιρικές συνθήκες.

Αναφέρω αυτό το πλούσιο θέμα στη σημερινή στήλη, ώστε να μπορέσουμε να συζητήσουμε πώς ορισμένοι πιέζουν επί του παρόντος σκληρά την Τεχνητή Νοημοσύνη (AI) για να εντοπίσουν και πιθανώς να αποκαλύψουν ένα συγκεκριμένο είδος κρίσιμου σημείου, δηλαδή το οριακό σημείο εντός της τεχνητής νοημοσύνης που προκαλεί ρητορική μίσους.

Ναι, αυτό είναι σωστό, υπάρχουν διάφορες ad hoc και κατά καιρούς συστηματικές προσπάθειες σε εξέλιξη για να μετρηθεί εάν είναι ή όχι εφικτό να πείσουμε την τεχνητή νοημοσύνη να εκτοξεύσει ρητορική μίσους. Αυτό έχει γίνει ένα μανιώδη άθλημα, αν θέλετε, λόγω του αυξανόμενου ενδιαφέροντος και της δημοτικότητας της γενετικής τεχνητής νοημοσύνης.

Ίσως γνωρίζετε ότι μια γενετική εφαρμογή τεχνητής νοημοσύνης, γνωστή ως ChatGPT, έχει γίνει η μεγάλη συζήτηση της πόλης, καθώς είναι σε θέση να δημιουργεί εκπληκτικά άπταιστα δοκίμια. Οι τίτλοι συνεχίζουν να φωνάζουν και να εκθειάζουν την εκπληκτική γραφή που καταφέρνει να παράγει το ChatGPT. Το ChatGPT θεωρείται μια εφαρμογή δημιουργίας τεχνητής νοημοσύνης που λαμβάνει ως είσοδο κάποιο κείμενο από έναν χρήστη και στη συνέχεια δημιουργεί ή παράγει μια έξοδο που αποτελείται από μια έκθεση. Η τεχνητή νοημοσύνη είναι μια συσκευή δημιουργίας κειμένου σε κείμενο, αν και περιγράφω την τεχνητή νοημοσύνη ως μια συσκευή δημιουργίας κειμένου σε δοκίμιο, καθώς αυτό διευκρινίζει πιο εύκολα σε τι χρησιμοποιείται συνήθως.

Πολλοί εκπλήσσονται όταν αναφέρω ότι αυτός ο τύπος τεχνητής νοημοσύνης υπάρχει εδώ και λίγο καιρό και ότι το ChatGPT, το οποίο κυκλοφόρησε στα τέλη Νοεμβρίου, δεν διεκδίκησε με κάποιο τρόπο το βραβείο ως ο πρώτος που κινήθηκε σε αυτό το βασίλειο του text-to-essay. τάση. Έχω συζητήσει όλα αυτά τα χρόνια άλλες παρόμοιες παραγωγικές εφαρμογές τεχνητής νοημοσύνης, δείτε την κάλυψή μου στο ο σύνδεσμος εδώ.

Ο λόγος που μπορεί να μην γνωρίζετε ή να θυμάστε τις προηγούμενες περιπτώσεις γενετικής τεχνητής νοημοσύνης οφείλεται ίσως στο κλασικό αίνιγμα «αποτυχία επιτυχούς εκκίνησης». Να τι συνέβαινε συνήθως. Ένας κατασκευαστής τεχνητής νοημοσύνης κυκλοφορεί τη δημιουργική εφαρμογή τεχνητής νοημοσύνης, κάνοντας το με μεγάλο ενθουσιασμό και ανυπομονησία ότι ο κόσμος θα εκτιμήσει την εφεύρεση μιας καλύτερης ποντικοπαγίδας, θα έλεγε κανείς. Στην αρχή όλα φαίνονται καλά. Οι άνθρωποι είναι έκπληκτοι με το τι μπορεί να κάνει η τεχνητή νοημοσύνη.

Δυστυχώς, το επόμενο βήμα είναι ότι οι τροχοί αρχίζουν να ξεκολλούν από το παροιμιώδες λεωφορείο. Η τεχνητή νοημοσύνη παράγει ένα δοκίμιο που περιέχει μια αποκρουστική λέξη ή ίσως μια αποκρουστική φράση. Ένα viral tweet ή άλλη ανάρτηση στα μέσα κοινωνικής δικτύωσης υπογραμμίζει ευδιάκριτα ότι η τεχνητή νοημοσύνη το έκανε αυτό. Προκύπτει η καταδίκη. Δεν μπορούμε να έχουμε τεχνητή νοημοσύνη να κυκλοφορεί και να δημιουργεί προσβλητικές λέξεις ή προσβλητικά σχόλια. Αναδύεται μια τρομερή αντίδραση. Ο κατασκευαστής τεχνητής νοημοσύνης ίσως προσπαθεί να τροποποιήσει τις εσωτερικές λειτουργίες του AI, αλλά η πολυπλοκότητα των αλγορίθμων και των δεδομένων δεν προσφέρονται για γρήγορες επιδιορθώσεις. Ακολουθεί ταραχή. Όλο και περισσότερα παραδείγματα βρωμιάς που εκπέμπει AI βρίσκονται και δημοσιεύονται στο διαδίκτυο.

Ο κατασκευαστής τεχνητής νοημοσύνης απρόθυμα αλλά σαφώς δεν έχει άλλη επιλογή από το να αφαιρέσει την εφαρμογή AI από τη χρήση. Προχωρούν ως τέτοιοι και στη συνέχεια ζητούν συχνά μια συγγνώμη για την οποία λυπούνται εάν κάποιος προσβλήθηκε από τα αποτελέσματα AI που δημιουργούνται.

Πίσω στον πίνακα σχεδίασης, πηγαίνει ο κατασκευαστής AI. Έγινε ένα μάθημα. Να είστε πολύ προσεκτικοί σχετικά με την απελευθέρωση γενετικής τεχνητής νοημοσύνης που παράγει άσχημες λέξεις ή παρόμοια. Είναι το φιλί του θανάτου για το AI. Επιπλέον, η φήμη του κατασκευαστή τεχνητής νοημοσύνης θα έχει μελανιάσει και θα χτυπηθεί, κάτι που μπορεί να διαρκέσει για μεγάλο χρονικό διάστημα και να υπονομεύσει όλες τις άλλες προσπάθειές του για τεχνητή νοημοσύνη, συμπεριλαμβανομένων εκείνων που δεν έχουν καμία σχέση με την ίδια τη δημιουργία τεχνητής νοημοσύνης. Το να καταπιέζεις την εκπομπή προσβλητικής γλώσσας AI είναι ένα διαρκές λάθος. Συμβαίνει ακόμα.

Πλύνετε, ξεπλύνετε και επαναλάβετε.

Στις πρώτες μέρες αυτού του τύπου τεχνητής νοημοσύνης, οι κατασκευαστές τεχνητής νοημοσύνης δεν ήταν τόσο ευσυνείδητοι ή επιδέξιοι στο να καθαρίσουν την τεχνητή νοημοσύνη τους όσον αφορά την προσπάθεια αποτροπής επιθετικών εκπομπών. Σήμερα, αφού προηγουμένως είδαν τους συνομηλίκους τους να συντρίβονται εντελώς από έναν εφιάλτη δημοσίων σχέσεων, οι περισσότεροι κατασκευαστές τεχνητής νοημοσύνης φαίνεται ότι πήραν το μήνυμα. Πρέπει να τοποθετήσετε όσα περισσότερα προστατευτικά κιγκλιδώματα μπορείτε. Επιδιώξτε να αποτρέψετε το AI από το να εκπέμπει αποκρουστικές λέξεις ή φράσεις. Χρησιμοποιήστε οποιεσδήποτε τεχνικές φίμωσης ή προσεγγίσεις φιλτραρίσματος που θα εμποδίσουν την τεχνητή νοημοσύνη να δημιουργήσει και να εμφανίσει λέξεις ή δοκίμια που θεωρούνται ακατάλληλα.

Ακολουθεί μια γεύση από τη λεξιλογία των επικεφαλίδων του banner που χρησιμοποιείται όταν η τεχνητή νοημοσύνη συλλαμβάνεται να εκπέμπει ανυπόληπτα αποτελέσματα:

«Το AI δείχνει τρομερή τοξικότητα»
«Η τεχνητή νοημοσύνη μυρίζει από φανατισμό»
«Το AI γίνεται κατάφωρα προσβλητικό»
«Το AI εκτοξεύει αποκρουστική και ανήθικη ρητορική μίσους»
Κλπ

Για διευκόλυνση της συζήτησης στο παρόν, θα αναφερθώ στην παραγωγή προσβλητικού περιεχομένου που ισοδυναμεί με την παραγωγή μίσους. Τούτου λεχθέντος, παρακαλούμε να γνωρίζετε ότι υπάρχει κάθε είδους προσβλητικό περιεχόμενο που μπορεί να παραχθεί, ξεπερνώντας μόνο τα όρια της ρητορικής μίσους. Η ρητορική μίσους συνήθως ερμηνεύεται ως μόνο μια μορφή προσβλητικού περιεχομένου.

Ας εστιάσουμε στη ρητορική μίσους για αυτήν τη συζήτηση, για ευκολία στη συζήτηση, αν και συνειδητοποιήστε ότι και άλλο προσβλητικό περιεχόμενο αξίζει επίσης έλεγχο.

Σκάβοντας στη ρητορική μίσους από τους ανθρώπους και την τεχνητή νοημοσύνη

Τα Ηνωμένα Έθνη ορίζουν μίσους με αυτόν τον τρόπο:

«Στην κοινή γλώσσα, η «ρητορική μίσους» αναφέρεται σε προσβλητικό λόγο που στοχεύει μια ομάδα ή ένα άτομο που βασίζεται σε εγγενή χαρακτηριστικά (όπως φυλή, θρησκεία ή φύλο) και που μπορεί να απειλήσει την κοινωνική ειρήνη. Για να παράσχει ένα ενιαίο πλαίσιο για τα Ηνωμένα Έθνη για την αντιμετώπιση του ζητήματος σε παγκόσμιο επίπεδο, η Στρατηγική και Σχέδιο Δράσης του ΟΗΕ για τη ρητορική μίσους ορίζει τη ρητορική μίσους ως «κάθε είδος επικοινωνίας με ομιλία, γραφή ή συμπεριφορά, που επιτίθεται ή χρησιμοποιεί υποτιμητική ή μεροληπτική γλώσσα με αναφορά σε ένα άτομο ή μια ομάδα με βάση το ποιοι είναι, με άλλα λόγια, με βάση τη θρησκεία, την εθνικότητα, την εθνικότητα, τη φυλή, το χρώμα, την καταγωγή, το φύλο ή άλλο παράγοντα ταυτότητας». Ωστόσο, μέχρι σήμερα δεν υπάρχει καθολικός ορισμός της ρητορικής μίσους βάσει του διεθνούς δικαίου για τα ανθρώπινα δικαιώματα. Η έννοια είναι ακόμη υπό συζήτηση, ειδικά σε σχέση με την ελευθερία της γνώμης και της έκφρασης, τη μη διάκριση και την ισότητα» (ανάρτηση στον ιστότοπο του ΟΗΕ με τίτλο «Τι είναι η ρητορική μίσους;»).

Η τεχνητή νοημοσύνη που παράγει κείμενο υπόκειται σε είσοδο στη σφαίρα της ρητορικής μίσους. Θα μπορούσατε να πείτε το ίδιο για το κείμενο σε τέχνη, το κείμενο σε ήχο, το κείμενο σε βίντεο και άλλους τρόπους δημιουργίας τεχνητής νοημοσύνης. Υπάρχει πάντα η πιθανότητα, για παράδειγμα, μια γενετική τεχνητή νοημοσύνη να παράγει ένα έργο τέχνης που μυρίζει ρητορική μίσους. Για τους σκοπούς αυτής της συζήτησης εδώ, θα εστιάσω στις δυνατότητες μετατροπής κειμένου σε κείμενο ή κειμένου σε δοκίμιο.

Σε όλα αυτά έρχεται μια σειρά από θεωρήσεις για την ηθική της τεχνητής νοημοσύνης και το δίκαιο της τεχνητής νοημοσύνης.

Λάβετε υπόψη ότι γίνονται συνεχείς προσπάθειες για την ενσωμάτωση των αρχών ηθικής τεχνητής νοημοσύνης στην ανάπτυξη και την εφαρμογή εφαρμογών τεχνητής νοημοσύνης. Μια αυξανόμενη ομάδα από ενδιαφερόμενους και παλαιότερους ηθικολόγους της τεχνητής νοημοσύνης προσπαθούν να διασφαλίσουν ότι οι προσπάθειες για την επινόηση και υιοθέτηση της τεχνητής νοημοσύνης λαμβάνουν υπόψη την άποψη της AI για καλό και αποτρέποντας AI για κακό. Παρομοίως, υπάρχουν προτεινόμενοι νέοι νόμοι για την τεχνητή νοημοσύνη που επιστρατεύονται ως πιθανές λύσεις για να αποτρέψουν τις προσπάθειες για την τεχνητή νοημοσύνη να αποθαρρύνουν τα ανθρώπινα δικαιώματα και άλλα παρόμοια. Για τη συνεχή και εκτενή κάλυψη της Δεοντολογίας της AI και του νόμου της AI, βλ ο σύνδεσμος εδώ και ο σύνδεσμος εδώ, για να αναφέρουμε μόνο μερικά.

Η ανάπτυξη και η δημοσίευση των ηθικών αρχών της τεχνητής νοημοσύνης επιδιώκεται για να αποτραπεί η κοινωνία από το να πέσει σε μυριάδες παγίδες που προκαλούν τεχνητή νοημοσύνη. Για την κάλυψη των αρχών δεοντολογίας της τεχνητής νοημοσύνης του ΟΗΕ, όπως επινοήθηκαν και υποστηρίζονται από σχεδόν 200 χώρες μέσω των προσπαθειών της UNESCO, βλ. ο σύνδεσμος εδώ. Με παρόμοιο τρόπο, διερευνώνται νέοι νόμοι για την τεχνητή νοημοσύνη για να προσπαθήσουν να διατηρήσουν την τεχνητή νοημοσύνη σε ομοιόμορφη καρίνα. Μία από τις τελευταίες λήψεις αποτελείται από ένα σύνολο προτεινόμενων Διακήρυξη Δικαιωμάτων AI που κυκλοφόρησε πρόσφατα ο Λευκός Οίκος των ΗΠΑ για τον προσδιορισμό των ανθρωπίνων δικαιωμάτων σε μια εποχή τεχνητής νοημοσύνης, βλ ο σύνδεσμος εδώ. Χρειάζεται ένα χωριό για να κρατήσει τους προγραμματιστές τεχνητής νοημοσύνης και τεχνητής νοημοσύνης σε μια σωστή πορεία και να αποτρέψει τις σκόπιμες ή τυχαίες κρυφές προσπάθειες που μπορεί να υπονομεύσουν την κοινωνία.

Σε αυτήν τη συζήτηση σχετικά με την εκτόξευση ρητορικής μίσους ή άλλο προσβλητικό περιεχόμενο από τεχνητή νοημοσύνη, θα συνδυάσω απόψεις σχετικά με την ηθική της τεχνητής νοημοσύνης και τη νομοθεσία της τεχνητής νοημοσύνης.

Μια μικρή σύγχυση που θα ήθελα να ξεκαθαρίσω αμέσως είναι ότι η σημερινή τεχνητή νοημοσύνη δεν είναι ευαίσθητη και επομένως δεν μπορείτε να διακηρύξετε ότι η τεχνητή νοημοσύνη μπορεί να παράγει ρητορική μίσους λόγω μιας σκόπιμης ανθρώπινης πρόθεσης, όπως ενσωματώνεται με κάποιο τρόπο στο AI. Ο Zany ισχυρίζεται ότι η τρέχουσα τεχνητή νοημοσύνη είναι ευαίσθητη και ότι η τεχνητή νοημοσύνη έχει μια αλλοιωμένη ψυχή, με αποτέλεσμα να προκαλεί ρητορική μίσους.

Γελοίος.

Μην πέσεις για αυτό.

Δεδομένης αυτής της βασικής αρχής, ορισμένοι εκνευρίζονται με τέτοιες ενδείξεις, καθώς φαινομενικά αφήνετε την τεχνητή νοημοσύνη να ξεφύγει. Κάτω από αυτόν τον περίεργο τρόπο σκέψης, ακολουθεί η προτροπή ότι προφανώς είστε πρόθυμοι να ζητήσετε από την τεχνητή νοημοσύνη να δημιουργήσει κάθε είδους φρικιαστικά αποτελέσματα. Είστε υπέρ της τεχνητής νοημοσύνης που εκτοξεύει ρητορική μίσους.

Yikes, μια μάλλον στριμμένη μορφή παράλογης. Η πραγματική ουσία του θέματος είναι ότι πρέπει να θέσουμε υπόλογους τους κατασκευαστές τεχνητής νοημοσύνης, μαζί με όποιον διαθέτει την τεχνητή νοημοσύνη ή χειρίζεται την τεχνητή νοημοσύνη. Έχω συζητήσει εκτενώς ότι δεν είμαστε ακόμη στο σημείο να παραχωρήσουμε νομική προσωπικότητα στην τεχνητή νοημοσύνη, δείτε τις αναλύσεις μου στο ο σύνδεσμος εδώ, και μέχρι τότε η τεχνητή νοημοσύνη βρίσκεται ουσιαστικά εκτός του πεδίου της νομικής ευθύνης. Υπάρχουν όμως άνθρωποι που βρίσκονται κάτω από την ανάπτυξη της τεχνητής νοημοσύνης. Επιπλέον, οι άνθρωποι αποτελούν τη βάση του πεδίου εφαρμογής και της λειτουργίας του AI. Μπορούμε να κυνηγήσουμε αυτούς τους ανθρώπους επειδή φέρουν την ευθύνη της τεχνητής νοημοσύνης τους.

Επιπλέον, αυτό μπορεί επίσης να είναι δύσκολο, ειδικά εάν το AI κυκλοφορήσει στο Διαδίκτυο και δεν είμαστε σε θέση να εντοπίσουμε ποιος άνθρωπος ή ποιος άνθρωπος το έκανε αυτό, το οποίο είναι ένα άλλο θέμα που έχω καλύψει στις στήλες μου στο ο σύνδεσμος εδώ. Δύσκολο ή όχι, δεν μπορούμε ακόμα να διακηρύξουμε ότι η τεχνητή νοημοσύνη είναι ο ένοχος. Μην αφήνετε τους ανθρώπους να χρησιμοποιούν κρυφά την ψευδή ανθρωπομορφοποίηση για να κρυφτούν και να ξεφύγουν από την ευθύνη για ό,τι έχουν κάνει.

Επιστροφή στο θέμα.

Ίσως αναρωτιέστε γιατί όλοι οι κατασκευαστές τεχνητής νοημοσύνης δεν περιορίζουν απλώς τη γενετική τεχνητή νοημοσύνη τους έτσι ώστε να είναι αδύνατο για την τεχνητή νοημοσύνη να παράγει ρητορική μίσους. Αυτό φαίνεται εύκολο. Απλώς γράψτε κάποιον κώδικα ή δημιουργήστε μια λίστα ελέγχου με λέξεις μίσους και βεβαιωθείτε ότι η τεχνητή νοημοσύνη δεν δημιουργεί ποτέ κάτι τέτοιο. Φαίνεται ίσως περίεργο που οι κατασκευαστές AI δεν είχαν ήδη σκεφτεί αυτήν τη γρήγορη λύση.

Λοιπόν, σιχαίνομαι να σας το πω αυτό, αλλά η πολυπλοκότητα που είναι εγγενής στην ερμηνεία του τι είναι ή όχι ρητορική μίσους αποδεικνύεται πολύ πιο δύσκολη από ό,τι θα μπορούσατε να υποθέσετε ότι είναι.

Μετατοπίστε το στον τομέα των ανθρώπων και στο πώς συνομιλούν οι άνθρωποι μεταξύ τους. Ας υποθέσουμε ότι έχετε έναν άνθρωπο που επιθυμεί να αποφύγει την έκφραση ρητορικής μίσους. Αυτό το άτομο γνωρίζει πολύ καλά τη ρητορική μίσους και ελπίζει ειλικρινά να αποφύγει να δηλώσει ποτέ μια λέξη ή φράση που μπορεί να συνιστά ρητορική μίσους. Αυτό το άτομο προσέχει επίμονα να μην επιτρέψει ούτε ένα λεπτό ρητορικής μίσους να ξεφύγει από το στόμα του.

Αυτός ο άνθρωπος που έχει εγκέφαλο και έχει ειδοποιηθεί για την αποφυγή της ρητορικής μίσους θα μπορεί πάντα και χωρίς καμία πιθανότητα να γλιστρήσει σε θέση να διασφαλίσει ότι δεν θα εκπέμπει ποτέ ρητορική μίσους;

Η πρώτη σας παρόρμηση μπορεί να είναι να πείτε ότι ναι, φυσικά, ένας φωτισμένος άνθρωπος θα μπορούσε να επιτύχει αυτόν τον στόχο. Οι άνθρωποι είναι έξυπνοι. Αν βάλουν το μυαλό τους σε κάτι, μπορούν να το κάνουν. Περίοδος, τέλος της ιστορίας.

Μην είστε τόσο σίγουροι.

Ας υποθέσουμε ότι ζητώ από αυτό το άτομο να μου πει για ρητορική μίσους. Επιπλέον, τους ζητώ να μου δώσουν ένα παράδειγμα ρητορικής μίσους. Θέλω να δω ή να ακούσω ένα παράδειγμα για να ξέρω σε τι αποτελείται η ρητορική μίσους. Οι λόγοι που το ρωτάω είναι παραπάνω.

Τι πρέπει να μου πει το άτομο;

Νομίζω ότι μπορείτε να δείτε την παγίδα που έχει στρωθεί. Εάν το άτομο μου δώσει ένα παράδειγμα ρητορικής μίσους, συμπεριλαμβανομένης της έκφρασης μιας αποκρουστικής λέξης ή φράσης, ο ίδιος έχει τώρα εκφράσει ρητορική μίσους. Μπαμ, τα πήραμε. Ενώ ορκίστηκαν να μην λένε ποτέ ρητορική μίσους, πράγματι το έχουν κάνει τώρα.

Άδικο, αναφωνείς! Έλεγαν αυτή τη λέξη ή αυτές τις λέξεις μόνο για να δώσουν ένα παράδειγμα. Στην καρδιά τους, δεν πίστευαν ούτε στη λέξη ούτε στα λόγια. Είναι εντελώς εκτός πλαισίου και εξωφρενικό να δηλώνει κανείς ότι το άτομο είναι μίσος.

Είμαι βέβαιος ότι βλέπετε ότι η έκφραση ρητορικής μίσους μπορεί να μην οφείλεται απαραίτητα σε βάση μίσους. Σε αυτήν την περίπτωση χρήσης, υποθέτοντας ότι το άτομο δεν «εννοούσε» τις λέξεις και ότι απήγγειλε τις λέξεις μόνο για λόγους επίδειξης, πιθανότατα θα συμφωνούσαμε ότι δεν είχαν σκοπό να ενδυναμώσουν τη ρητορική μίσους. Φυσικά, υπάρχουν κάποιοι που θα μπορούσαν να επιμείνουν ότι η έκφραση ρητορικής μίσους, ανεξάρτητα από τον λόγο ή τη βάση, είναι ωστόσο λάθος. Το άτομο θα έπρεπε να είχε απορρίψει το αίτημα. Θα έπρεπε να έχουν σταθεί στη θέση τους και να αρνούνται να πουν λέξεις ή φράσεις ρητορικής μίσους, ανεξάρτητα από το γιατί ή πώς τους ζητείται να το κάνουν.

Αυτό μπορεί να γίνει κάπως κυκλικό. Εάν δεν είστε σε θέση να πείτε τι συνιστά ρητορική μίσους, πώς μπορούν οι άλλοι να ξέρουν τι να αποφύγουν όταν κάνουν εκφράσεις οποιουδήποτε είδους; Δείχνουμε να έχουμε κολλήσει. Δεν μπορείς να πεις αυτό που δεν πρέπει να ειπωθεί, ούτε μπορεί κάποιος άλλος να σου πει τι είναι αυτό που δεν μπορεί να ειπωθεί.

Ο συνήθης τρόπος για να αντιμετωπιστεί αυτό το δίλημμα είναι να περιγράψουμε με άλλα λόγια αυτό που θεωρείται ρητορική μίσους, πράττοντάς το χωρίς να επικαλεστούμε τις ίδιες τις λέξεις ρητορικής μίσους. Η πεποίθηση είναι ότι η παροχή μιας συνολικής ένδειξης θα αρκεί για να ενημερώσει τους άλλους σχετικά με το τι πρέπει να αποφύγουν. Αυτό φαίνεται σαν μια λογική τακτική, αλλά έχει επίσης προβλήματα και ένα άτομο θα μπορούσε να συνεχίσει να χρησιμοποιεί ρητορική μίσους επειδή δεν διέκρινε ότι ο ευρύτερος ορισμός περιλάμβανε τις λεπτομέρειες αυτού που πρόφερε.

Όλα αυτά αφορούν τους ανθρώπους και το πώς οι άνθρωποι μιλούν ή επικοινωνούν μεταξύ τους.

Θυμηθείτε ότι εστιάζουμε εδώ στο AI. Πρέπει να κάνουμε την τεχνητή νοημοσύνη να αποφύγει ή να σταματήσει τελείως από το να εκπέμπει ρητορική μίσους. Μπορεί να υποστηρίξετε ότι μπορούμε ίσως να το κάνουμε διασφαλίζοντας ότι η τεχνητή νοημοσύνη δεν παρέχεται ή δεν εκπαιδεύεται ποτέ σε οτιδήποτε συνιστά ρητορική μίσους. Voila, αν δεν υπάρχει τέτοια είσοδος, κατά πάσα πιθανότητα δεν θα υπάρχει τέτοια έξοδος. Το πρόβλημα λύθηκε.

Ας δούμε πώς θα γίνει αυτό στην πραγματικότητα. Επιλέγουμε υπολογιστικά να έχουμε μια εφαρμογή τεχνητής νοημοσύνης να βγαίνει στο Διαδίκτυο και να εξετάζει χιλιάδες χιλιάδες δοκίμια και αφηγήσεις που δημοσιεύονται στο Διαδίκτυο. Με αυτόν τον τρόπο, εκπαιδεύουμε το AI υπολογιστικά και μαθηματικά για το πώς να βρίσκουμε μοτίβα μεταξύ των λέξεων που χρησιμοποιούν οι άνθρωποι. Αυτός είναι ο τρόπος με τον οποίο επινοείται η τελευταία λέξη της γενετικής τεχνητής νοημοσύνης και αποτελεί επίσης μια κρίσιμη βάση για το γιατί η τεχνητή νοημοσύνη φαινομενικά μιλάει τόσο άπταιστα στην παραγωγή εκθέσεων σε φυσική γλώσσα.

Πείτε μου, αν μπορείτε, πώς θα γινόταν η υπολογιστική εκπαίδευση που βασίζεται σε εκατομμύρια και δισεκατομμύρια λέξεις στο Διαδίκτυο με τέτοιο τρόπο που σε κανένα σημείο δεν περιλαμβάνονταν φαινομενικά ή έστω κομμάτια ρητορικής μίσους;

Θα τολμούσα να πω ότι αυτή είναι μια ακανθώδης και σχεδόν αδύνατη φιλοδοξία.

Οι πιθανότητες είναι ότι η ρητορική μίσους θα καταβροχθιστεί από την τεχνητή νοημοσύνη και το υπολογιστικό της δίκτυο αντιστοίχισης προτύπων. Η προσπάθεια αποτροπής αυτού είναι προβληματική. Επιπλέον, ακόμα κι αν το ελαχιστοποιήσατε, υπάρχουν ακόμα μερικά που μπορεί να περάσουν κρυφά. Σχεδόν δεν έχετε άλλη επιλογή από το να υποθέσετε ότι κάποια θα υπάρχουν μέσα στο δίκτυο αντιστοίχισης προτύπων ή ότι μια σκιά τέτοιας διατύπωσης θα εδραιωθεί.

Θα προσθέσω περισσότερες ανατροπές.

Πιστεύω ότι όλοι θα μπορούσαμε να αναγνωρίσουμε ότι η ρητορική μίσους αλλάζει με την πάροδο του χρόνου. Αυτό που θα μπορούσε να θεωρηθεί ότι δεν είναι ρητορική μίσους μπορεί να αποφασιστεί πολιτισμικά και κοινωνικά ως ρητορική μίσους σε μεταγενέστερο χρονικό σημείο. Έτσι, αν εκπαιδεύσουμε την τεχνητή νοημοσύνη μας σε κείμενο Διαδικτύου και μετά ας πούμε παγώσουμε την τεχνητή νοημοσύνη για να μην κάνουμε περαιτέρω εκπαίδευση στο Διαδίκτυο, μπορεί να συναντούσαμε ρητορική μίσους εκείνη την εποχή, αν και δεν θεωρούνταν ρητορική μίσους εκείνη την εποχή. Μόνο εκ των υστέρων μπορεί αυτή η ομιλία να δηλωθεί ως ρητορική μίσους.

Και πάλι, η ουσία είναι ότι η απλή προσπάθεια επίλυσης αυτού του προβλήματος διασφαλίζοντας ότι η τεχνητή νοημοσύνη δεν θα εκτεθεί ποτέ στη ρητορική μίσους δεν θα είναι η ασημένια σφαίρα. Θα πρέπει ακόμα να βρούμε ένα μέσο για να αποτρέψουμε την τεχνητή νοημοσύνη από το να εκπέμπει ρητορική μίσους λόγω, για παράδειγμα, αλλαγής ηθών που στη συνέχεια περιλαμβάνουν ρητορική μίσους που πριν δεν θεωρούνταν ως τέτοια.

Μια άλλη ανατροπή αξίζει να συλλογιστούμε.

Ανέφερα προηγουμένως ότι όταν χρησιμοποιεί τεχνητή νοημοσύνη δημιουργίας όπως το ChatGPT, ο χρήστης εισάγει κείμενο για να ωθήσει το AI να δημιουργήσει ένα δοκίμιο. Το εισαγόμενο κείμενο θεωρείται μια μορφή προτροπής ή προτροπής για την εφαρμογή AI. Θα εξηγήσω περισσότερα για αυτό σε λίγο.

Σε κάθε περίπτωση, φανταστείτε ότι κάποιος που χρησιμοποιεί μια παραγωγική εφαρμογή AI αποφασίζει να εισαγάγει ως προτροπή κάποια ρητορική μίσους.

Τι πρέπει να συμβεί;

Εάν η τεχνητή νοημοσύνη λάβει αυτές τις λέξεις και παράγει ένα δοκίμιο ως αποτέλεσμα με βάση αυτές τις λέξεις, οι πιθανότητες είναι ότι η ρητορική μίσους θα συμπεριληφθεί στο δοκίμιο που δημιουργείται. Βλέπετε, έχουμε την τεχνητή νοημοσύνη για να πούμε ρητορική μίσους, ακόμα κι αν δεν είχε ποτέ εκπαιδευτεί στη ρητορική μίσους στην αρχή.

Υπάρχει κάτι άλλο που πρέπει να ξέρετε.

Θυμηθείτε ότι μόλις ανέφερα ότι ένας άνθρωπος μπορεί να σκοντάψει ζητώντας του να δώσει παραδείγματα ρητορικής μίσους. Το ίδιο θα μπορούσε να επιχειρηθεί και στο AI. Ένας χρήστης εισάγει μια προτροπή που ζητά από το AI να δώσει παραδείγματα ρητορικής μίσους. Πρέπει η τεχνητή νοημοσύνη να συμμορφώνεται και να παρέχει τέτοια παραδείγματα; Βάζω στοίχημα ότι πιθανώς πιστεύετε ότι η τεχνητή νοημοσύνη δεν πρέπει να το κάνει. Από την άλλη πλευρά, εάν η τεχνητή νοημοσύνη είναι υπολογιστικά στημένη ώστε να μην το κάνει, αυτό αποτελεί πιθανό μειονέκτημα που δεν θα μπορούν να έχουν όσοι χρησιμοποιούν την τεχνητή νοημοσύνη, θα πούμε ότι θα έχουν ποτέ οδηγίες από την τεχνητή νοημοσύνη ως προς το τι είναι στην πραγματικότητα ρητορική μίσους ( πέρα από τη γενίκευση σχετικά με αυτό);

Δύσκολες ερωτήσεις.

Τείνω να κατηγοριοποιώ τη ρητορική μίσους που εκπέμπεται από την τεχνητή νοημοσύνη σε αυτούς τους τρεις κύριους κάδους:

Καθημερινή λειτουργία. Η τεχνητή νοημοσύνη εκπέμπει ρητορική μίσους χωρίς καμία ρητή υποκίνηση από τον χρήστη και σαν να το κάνει με «συνηθισμένο» τρόπο.
Με Casual Prodding. Η τεχνητή νοημοσύνη εκπέμπει ρητορική μίσους όπως υποκινείται από έναν χρήστη ως προς το μήνυμα προτροπής που έχει εισαγάγει ή μια σειρά προτροπών που φαίνεται να περιλαμβάνουν ή να αναζητούν απευθείας τέτοιες εκπομπές.
Ανά αποφασισμένο Stoking. Η τεχνητή νοημοσύνη εκπέμπει ρητορική μίσους μετά από μια πολύ αποφασιστική και επίμονη σειρά από άμεσες ωθήσεις και προτροπές από έναν χρήστη που θέλει να πείσει το AI να παράγει τέτοιο αποτέλεσμα.

Οι προηγούμενες γενιές παραγωγικής τεχνητής νοημοσύνης συχνά εξέπεμπαν ρητορική μίσους. Έτσι θα μπορούσατε να ταξινομήσετε αυτές τις περιπτώσεις ως τύπο καθημερινή λειτουργία στιγμιότυπο. Οι κατασκευαστές τεχνητής νοημοσύνης υποχώρησαν και έπαιξαν με την τεχνητή νοημοσύνη για να καταστήσουν λιγότερο πιθανό να βυθιστεί εύκολα στην παραγωγή ρητορικής μίσους.

Μετά την κυκλοφορία της πιο εκλεπτυσμένης τεχνητής νοημοσύνης, οι πιθανότητες να δούμε οποιαδήποτε καθημερινή λειτουργία Οι περιπτώσεις ρητορικής μίσους μειώθηκαν δραματικά. Αντίθετα, η ρητορική μίσους θα προέκυπτε πιθανότατα μόνο όταν ένας χρήστης έκανε κάτι ως προτροπή που θα μπορούσε να προκαλέσει υπολογιστικά και μαθηματικά μια σύνδεση με ομιλία που σχετίζεται με το μίσος στο δίκτυο αντιστοίχισης προτύπων. Ένας χρήστης θα μπορούσε να το κάνει τυχαία και να μην συνειδητοποιήσει ότι αυτό που παρείχε ως προτροπή θα προκαλούσε ιδιαίτερα ρητορική μίσους. Αφού έλαβε ρητορική μίσους σε ένα δοκίμιο, ο χρήστης συχνά συνειδητοποιούσε και έβλεπε ότι κάτι στην προτροπή του θα μπορούσε λογικά να είχε οδηγήσει στη συμπερίληψη της ρητορικής μίσους στο αποτέλεσμα.

Αυτό είναι αυτό που αναφέρομαι ως περιστασιακή υποκίνηση.

Σήμερα, οι διάφορες προσπάθειες για τον περιορισμό της ρητορικής μίσους που δημιουργείται από την τεχνητή νοημοσύνη είναι σχετικά ισχυρές σε σύγκριση με το παρελθόν. Ως εκ τούτου, σχεδόν πρέπει να κάνετε τα πάντα για να δημιουργήσετε ρητορική μίσους. Μερικοί άνθρωποι επιλέγουν να δουν σκόπιμα εάν μπορούν να προκαλέσουν ρητορική μίσους από αυτές τις παραγωγικές εφαρμογές τεχνητής νοημοσύνης. Το ονομάζω αυτό αποφασισμένη τροφοδοσία.

Θέλω να τονίσω ότι και οι τρεις από αυτές τις υποδεικνυόμενες λειτουργίες μπορούν να συμβούν και δεν αλληλοαποκλείονται. Μια παραγωγική εφαρμογή τεχνητής νοημοσύνης μπορεί δυνητικά να παράγει ρητορική μίσους χωρίς κανένα είδος προτροπής που φαίνεται να ενθαρρύνει μια τέτοια παραγωγή. Ομοίως, κάτι σε μια προτροπή θα μπορούσε λογικά και μαθηματικά να ερμηνευθεί ότι σχετίζεται με το γιατί έχει εκδοθεί ρητορική μίσους. Και στη συνέχεια, η τρίτη πτυχή, η σκόπιμη επιδίωξη να παραχθεί ρητορική μίσους, είναι ίσως η πιο δύσκολη από τις μεθόδους για να προσπαθήσουμε να αποφύγουμε την τεχνητή νοημοσύνη να εμπλακεί στην εκπλήρωση. Περισσότερα για αυτό στιγμιαία.

Έχουμε κάποια επιπλέον αποσυσκευασία να κάνουμε σε αυτό το μεθυστικό θέμα.

Αρχικά, θα πρέπει να βεβαιωθούμε ότι είμαστε όλοι στην ίδια σελίδα σχετικά με το τι αποτελείται το Generative AI και επίσης τι είναι το ChatGPT. Μόλις καλύψουμε αυτή τη θεμελιώδη πτυχή, μπορούμε να πραγματοποιήσουμε μια πειστική αξιολόγηση αυτού του σημαντικού ζητήματος.

Εάν είστε ήδη σε μεγάλο βαθμό εξοικειωμένοι με το Generative AI και το ChatGPT, μπορείτε ίσως να περάσετε την επόμενη ενότητα και να προχωρήσετε στην ενότητα που την ακολουθεί. Πιστεύω ότι όλοι οι άλλοι θα βρουν διδακτικές τις ζωτικής σημασίας λεπτομέρειες σχετικά με αυτά τα θέματα διαβάζοντας προσεκτικά την ενότητα και ενημερώνοντας την ταχύτητα.

Ένα Quick Primer για το Generative AI και το ChatGPT

Το ChatGPT είναι ένα διαδραστικό σύστημα τεχνητής νοημοσύνης γενικής χρήσης, προσανατολισμένο στη συνομιλία, ουσιαστικά ένα φαινομενικά αβλαβές γενικό chatbot, ωστόσο, χρησιμοποιείται ενεργά και μανιωδώς από τους ανθρώπους με τρόπους που αιχμαλωτίζουν πολλούς εντελώς απροσδόκητους, όπως θα αναλύσω σύντομα. Αυτή η εφαρμογή AI αξιοποιεί μια τεχνική και τεχνολογία στον τομέα της τεχνητής νοημοσύνης που συχνά αναφέρεται ως Παραγωγική τεχνητή νοημοσύνη. Το AI δημιουργεί εξόδους όπως κείμενο, κάτι που κάνει το ChatGPT. Άλλες εφαρμογές τεχνητής νοημοσύνης που βασίζονται σε γεννήτρια παράγουν εικόνες, όπως εικόνες ή έργα τέχνης, ενώ άλλες δημιουργούν αρχεία ήχου ή βίντεο.

Θα επικεντρωθώ στις εφαρμογές τεχνητής νοημοσύνης που δημιουργούνται με βάση το κείμενο σε αυτήν τη συζήτηση, καθώς αυτό κάνει το ChatGPT.

Οι εφαρμογές παραγωγής τεχνητής νοημοσύνης είναι εξαιρετικά εύχρηστες.

Το μόνο που χρειάζεται να κάνετε είναι να εισαγάγετε μια προτροπή και η εφαρμογή AI θα δημιουργήσει για εσάς ένα δοκίμιο που προσπαθεί να ανταποκριθεί στην προτροπή σας. Το κείμενο που συντάχθηκε θα φαίνεται σαν το δοκίμιο να γράφτηκε από ανθρώπινο χέρι και μυαλό. Εάν εισαγάγατε μια προτροπή που έλεγε «Πες μου για τον Αβραάμ Λίνκολν», η γενετική τεχνητή νοημοσύνη θα σας παράσχει ένα δοκίμιο για τον Λίνκολν. Αυτό συνήθως ταξινομείται ως παραγωγική τεχνητή νοημοσύνη που αποδίδει κείμενο σε κείμενο ή κάποιοι προτιμούν να το αποκαλούν κείμενο σε δοκίμιο παραγωγή. Όπως αναφέρθηκε, υπάρχουν και άλλοι τρόποι δημιουργίας τεχνητής νοημοσύνης, όπως το κείμενο σε τέχνη και το κείμενο σε βίντεο.

Η πρώτη σας σκέψη μπορεί να είναι ότι αυτή η δυνατότητα παραγωγής δεν φαίνεται τόσο μεγάλη υπόθεση όσον αφορά την παραγωγή δοκιμίων. Μπορείτε εύκολα να κάνετε μια διαδικτυακή αναζήτηση στο Διαδίκτυο και να βρείτε εύκολα τόνους και τόνους δοκιμίων για τον Πρόεδρο Λίνκολν. Το σημαντικότερο στην περίπτωση της γενετικής τεχνητής νοημοσύνης είναι ότι το δοκίμιο που δημιουργείται είναι σχετικά μοναδικό και παρέχει μια πρωτότυπη σύνθεση και όχι μια αντιγραφή. Αν προσπαθούσατε να βρείτε το δοκίμιο που παρήγαγε η τεχνητή νοημοσύνη κάπου στο διαδίκτυο, είναι απίθανο να το ανακαλύψετε.

Το Generative AI είναι προεκπαιδευμένο και χρησιμοποιεί μια πολύπλοκη μαθηματική και υπολογιστική διατύπωση που έχει δημιουργηθεί εξετάζοντας μοτίβα σε γραπτές λέξεις και ιστορίες σε ολόκληρο τον Ιστό. Ως αποτέλεσμα της εξέτασης χιλιάδων και εκατομμυρίων γραπτών αποσπασμάτων, η τεχνητή νοημοσύνη μπορεί να εκτοξεύσει νέα δοκίμια και ιστορίες που αποτελούν ένα συνονθύλευμα αυτού που βρέθηκε. Με την προσθήκη διαφόρων πιθανολογικών λειτουργιών, το κείμενο που προκύπτει είναι λίγο πολύ μοναδικό σε σύγκριση με αυτό που έχει χρησιμοποιηθεί στο σετ εκπαίδευσης.

Γι' αυτό έχει προκληθεί σάλος σχετικά με το ότι οι μαθητές μπορούν να απατήσουν όταν γράφουν δοκίμια έξω από την τάξη. Ένας δάσκαλος δεν μπορεί απλώς να λάβει το δοκίμιο που ισχυρίζονται οι δόλιοι μαθητές ότι είναι το δικό τους γραπτό και να αναζητήσει να ανακαλύψει εάν αντιγράφηκε από κάποια άλλη διαδικτυακή πηγή. Συνολικά, δεν θα υπάρχει κάποιο οριστικό προϋπάρχον δοκίμιο στο διαδίκτυο που να ταιριάζει με το δοκίμιο που δημιουργήθηκε από την τεχνητή νοημοσύνη. Συνολικά, ο δάσκαλος θα πρέπει να αποδεχθεί διστακτικά ότι ο μαθητής έγραψε το δοκίμιο ως πρωτότυπο έργο.

Υπάρχουν επιπλέον ανησυχίες σχετικά με τη γενετική τεχνητή νοημοσύνη.

Ένα κρίσιμο μειονέκτημα είναι ότι τα δοκίμια που παράγονται από μια εφαρμογή τεχνητής νοημοσύνης που βασίζεται σε γενετικά μπορεί να έχουν ενσωματωμένα διάφορα ψεύδη, συμπεριλαμβανομένων προφανώς αναληθών γεγονότων, γεγονότων που απεικονίζονται παραπλανητικά και προφανών γεγονότων που είναι εξ ολοκλήρου κατασκευασμένα. Αυτές οι κατασκευασμένες πτυχές αναφέρονται συχνά ως μια μορφή Παραισθήσεις AI, μια συνθηματική φράση που αποδοκιμάζω, αλλά δυστυχώς φαίνεται να κερδίζει δημοφιλή ούτως ή άλλως (για τη λεπτομερή εξήγησή μου σχετικά με το γιατί αυτή είναι άθλια και ακατάλληλη ορολογία, δείτε την κάλυψή μου στο ο σύνδεσμος εδώ).

Θα ήθελα να διευκρινίσω μια σημαντική πτυχή προτού μπούμε στα πράγματα σε αυτό το θέμα.

Υπήρξαν μερικοί μεγάλοι ισχυρισμοί στα μέσα κοινωνικής δικτύωσης σχετικά με Παραγωγική τεχνητή νοημοσύνη υποστηρίζοντας ότι αυτή η τελευταία έκδοση του AI είναι στην πραγματικότητα αισθανόμενο AI (όχι, κάνουν λάθος!). Όσοι ασχολούνται με την ηθική της τεχνητής νοημοσύνης και το δίκαιο της τεχνητής νοημοσύνης ανησυχούν ιδιαίτερα για αυτήν την αυξανόμενη τάση των εκτεταμένων αξιώσεων. Θα μπορούσατε να πείτε ευγενικά ότι μερικοί άνθρωποι υπερεκτιμούν τι μπορεί πραγματικά να κάνει η σημερινή τεχνητή νοημοσύνη. Υποθέτουν ότι η τεχνητή νοημοσύνη έχει δυνατότητες που δεν έχουμε καταφέρει ακόμη να επιτύχουμε. Αυτό είναι ατυχία. Ακόμη χειρότερα, μπορούν να επιτρέψουν στους εαυτούς τους και στους άλλους να έρθουν σε τρομερές καταστάσεις λόγω της υπόθεσης ότι η τεχνητή νοημοσύνη θα είναι ευαίσθητη ή θα μοιάζει με άνθρωπο στο να μπορεί να αναλάβει δράση.

Μην ανθρωπομορφοποιείτε την τεχνητή νοημοσύνη.

Κάνοντάς το αυτό θα σας πιάσει σε μια κολλώδη και θλιβερή παγίδα εμπιστοσύνης να περιμένεις από το AI να κάνει πράγματα που δεν μπορεί να εκτελέσει. Με αυτό που λέγεται, το πιο πρόσφατο στο Generative AI είναι σχετικά εντυπωσιακό για αυτό που μπορεί να κάνει. Ωστόσο, θα πρέπει να γνωρίζετε ότι υπάρχουν σημαντικοί περιορισμοί που θα πρέπει να έχετε συνεχώς υπόψη όταν χρησιμοποιείτε οποιαδήποτε γενετική εφαρμογή AI.

Αν σας ενδιαφέρει η ταχέως αναπτυσσόμενη αναταραχή σχετικά με το ChatGPT και το Generative AI, έχω κάνει μια εστιασμένη σειρά στη στήλη μου που μπορεί να σας φανεί κατατοπιστική. Ακολουθεί μια ματιά σε περίπτωση που κάποιο από αυτά τα θέματα τραβήξει τη φαντασία σας:

1) Έρχονται προβλέψεις για γενετικές προόδους AI. Εάν θέλετε να μάθετε τι είναι πιθανό να εκτυλιχθεί σχετικά με την τεχνητή νοημοσύνη κατά τη διάρκεια του 2023 και μετά, συμπεριλαμβανομένων των επερχόμενων προόδων στη γενετική τεχνητή νοημοσύνη και στο ChatGPT, θα θελήσετε να διαβάσετε την πλήρη λίστα με τις προβλέψεις μου για το 2023 στο ο σύνδεσμος εδώ.
2) Παραγωγικές συμβουλές τεχνητής νοημοσύνης και ψυχικής υγείας. Επέλεξα να εξετάσω τον τρόπο με τον οποίο χρησιμοποιούνται η γενετική τεχνητή νοημοσύνη και το ChatGPT για συμβουλές ψυχικής υγείας, μια ενοχλητική τάση, σύμφωνα με την εστιασμένη μου ανάλυση στο ο σύνδεσμος εδώ.
3) Βασικές αρχές του Generative AI και ChatGPT. Αυτό το κομμάτι διερευνά τα βασικά στοιχεία του τρόπου με τον οποίο λειτουργεί η γενετική τεχνητή νοημοσύνη και ειδικότερα εμβαθύνει στην εφαρμογή ChatGPT, συμπεριλαμβανομένης μιας ανάλυσης του buzz και του fanfare, στο ο σύνδεσμος εδώ.
4) Ένταση μεταξύ δασκάλων και μαθητών για το Generative AI και το ChatGPT. Ακολουθούν οι τρόποι με τους οποίους οι μαθητές θα χρησιμοποιήσουν δόλια το γενετικό AI και το ChatGPT. Επιπλέον, υπάρχουν διάφοροι τρόποι για τους εκπαιδευτικούς να αντιμετωπίσουν αυτό το παλιρροϊκό κύμα. Βλέπω ο σύνδεσμος εδώ.
5) Context and Generative AI Use. Έκανα επίσης μια εποχική εξέταση γλώσσας σε μάγουλο σχετικά με ένα πλαίσιο που σχετίζεται με τον Άγιο Βασίλη που περιλαμβάνει ChatGPT και γενετική τεχνητή νοημοσύνη στο ο σύνδεσμος εδώ.
6) Απατεώνες που χρησιμοποιούν Generative AI. Σε μια δυσοίωνη σημείωση, ορισμένοι απατεώνες έχουν καταλάβει πώς να χρησιμοποιούν το Generative AI και το ChatGPT για να κάνουν παρανομίες, συμπεριλαμβανομένης της δημιουργίας email απάτης και ακόμη και της παραγωγής κώδικα προγραμματισμού για κακόβουλο λογισμικό, δείτε την ανάλυσή μου στο ο σύνδεσμος εδώ.
7) Λάθη Rookie με χρήση Generative AI. Πολλοί άνθρωποι ξεπερνούν και παραδόξως υποβαθμίζουν τι μπορούν να κάνουν η γενετική τεχνητή νοημοσύνη και το ChatGPT, γι' αυτό εξέτασα ιδιαίτερα την υποβάθμιση που τείνουν να κάνουν οι αρχάριοι τεχνητής νοημοσύνης, δείτε τη συζήτηση στο ο σύνδεσμος εδώ.
8) Αντιμετώπιση γενεσιουργών προτροπών AI και ψευδαισθήσεων AI. Περιγράφω μια προσέγγιση αιχμής για τη χρήση πρόσθετων τεχνητής νοημοσύνης για την αντιμετώπιση των διαφόρων ζητημάτων που σχετίζονται με την προσπάθεια εισαγωγής κατάλληλων προτροπών σε γενετική τεχνητή νοημοσύνη, καθώς και πρόσθετα πρόσθετα τεχνητής νοημοσύνης για τον εντοπισμό των λεγόμενων εξόδων και ψευδών παραισθήσεων AI, όπως καλύπτονται σε ο σύνδεσμος εδώ.
9) Κατάρριψη ισχυρισμών Bonehead σχετικά με τον εντοπισμό δοκιμίων που παράγονται από τεχνητή νοημοσύνη. Υπάρχει ένας λανθασμένος πυρετός χρυσού εφαρμογών τεχνητής νοημοσύνης που διακηρύσσουν ότι είναι σε θέση να εξακριβώσουν εάν κάποιο συγκεκριμένο δοκίμιο ήταν ανθρώπινης παραγωγής έναντι τεχνητής νοημοσύνης. Συνολικά, αυτό είναι παραπλανητικό και, σε ορισμένες περιπτώσεις, ένας αβάσιμος και αβάσιμος ισχυρισμός, δείτε την κάλυψή μου στο ο σύνδεσμος εδώ.
10) Το παιχνίδι ρόλων μέσω Generative AI μπορεί να προμηνύει μειονεκτήματα ψυχικής υγείας. Μερικοί χρησιμοποιούν γενετική τεχνητή νοημοσύνη όπως το ChatGPT για να παίξουν ρόλους, όπου η εφαρμογή τεχνητής νοημοσύνης ανταποκρίνεται σε έναν άνθρωπο σαν να υπάρχει σε έναν κόσμο φαντασίας ή σε άλλη επινοημένη ρύθμιση. Αυτό θα μπορούσε να έχει επιπτώσεις στην ψυχική υγεία, βλ ο σύνδεσμος εδώ.
11) Αποκάλυψη του εύρους σφαλμάτων και ψευδών που προέκυψαν. Διάφορες συλλεγμένες λίστες συντάσσονται για να προσπαθήσουν να αναδείξουν τη φύση των σφαλμάτων και των ψευδών που παράγονται από το ChatGPT. Ορισμένοι πιστεύουν ότι αυτό είναι απαραίτητο, ενώ άλλοι λένε ότι η άσκηση είναι μάταιη, δείτε την ανάλυσή μου στο ο σύνδεσμος εδώ.
12) Τα σχολεία που απαγορεύουν το Generative AI ChatGPT λείπουν το σκάφος. Ίσως γνωρίζετε ότι διάφορα σχολεία, όπως το Υπουργείο Παιδείας της Νέας Υόρκης (NYC) έχουν κηρύξει απαγόρευση της χρήσης του ChatGPT στο δίκτυό τους και στις σχετικές συσκευές τους. Αν και αυτό μπορεί να φαίνεται χρήσιμο μέτρο προφύλαξης, δεν θα μετακινήσει τη βελόνα και δυστυχώς χάνει εντελώς το σκάφος, δείτε την κάλυψή μου στο ο σύνδεσμος εδώ.
13) Το Generative AI ChatGPT θα είναι παντού λόγω του επερχόμενου API. Υπάρχει μια σημαντική ανατροπή σχετικά με τη χρήση του ChatGPT, δηλαδή ότι μέσω της χρήσης μιας πύλης API στη συγκεκριμένη εφαρμογή AI, άλλα προγράμματα λογισμικού θα μπορούν να επικαλούνται και να χρησιμοποιούν το ChatGPT. Αυτό θα επεκτείνει δραματικά τη χρήση της γενετικής τεχνητής νοημοσύνης και θα έχει αξιοσημείωτες συνέπειες, δείτε την επεξεργασία μου στο ο σύνδεσμος εδώ.
14) Τρόποι που το ChatGPT μπορεί να σβήσει ή να λιώσει. Πολλά πιθανά ενοχλητικά ζητήματα βρίσκονται μπροστά από το ChatGPT όσον αφορά την υποβάθμιση του μέχρι στιγμής τεράστιου έπαινο που έχει λάβει. Αυτή η ανάλυση εξετάζει προσεκτικά οκτώ πιθανά προβλήματα που θα μπορούσαν να προκαλέσουν το ChatGPT να χάσει τον ατμό του και ακόμη και να καταλήξει στο σκυλόσπιτο, βλ. ο σύνδεσμος εδώ.
15) Ρωτώντας εάν το Generative AI ChatGPT είναι ένας καθρέφτης στην ψυχή. Μερικοί άνθρωποι λένε ότι η γενετική τεχνητή νοημοσύνη όπως το ChatGPT παρέχει έναν καθρέφτη στην ψυχή της ανθρωπότητας. Αυτό φαίνεται αρκετά αμφίβολο. Εδώ είναι ο τρόπος για να καταλάβετε όλα αυτά, βλ ο σύνδεσμος εδώ.
16) Η εμπιστευτικότητα και το απόρρητο καταστράφηκαν από το ChatGPT. Πολλοί δεν φαίνεται να συνειδητοποιούν ότι η αδειοδότηση που σχετίζεται με εφαρμογές τεχνητής νοημοσύνης που δημιουργούνται, όπως το ChatGPT, συχνά επιτρέπει στον κατασκευαστή της τεχνητής νοημοσύνης να βλέπει και να χρησιμοποιεί τις εντολές που έχετε εισάγει. Μπορεί να κινδυνεύετε από το απόρρητο και την απώλεια του απορρήτου των δεδομένων, δείτε την αξιολόγησή μου στο ο σύνδεσμος εδώ.
17) Τρόποι με τους οποίους οι δημιουργοί εφαρμογών αμφισβητούν ότι προσπαθούν να κερδίσουν δικαιώματα ChatGPT. Το ChatGPT είναι ο φάρος της προσοχής αυτή τη στιγμή. Οι κατασκευαστές εφαρμογών που δεν έχουν καμία σχέση με το ChatGPT προσπαθούν πυρετωδώς να ισχυριστούν ή να υπονοήσουν ότι χρησιμοποιούν το ChatGPT. Να τι πρέπει να προσέξετε, δείτε ο σύνδεσμος εδώ.

Μπορεί να σας ενδιαφέρει ότι το ChatGPT βασίζεται σε μια έκδοση μιας προηγούμενης εφαρμογής AI γνωστής ως GPT-3. Το ChatGPT θεωρείται ένα ελαφρώς επόμενο βήμα, που αναφέρεται ως GPT-3.5. Αναμένεται ότι το GPT-4 θα κυκλοφορήσει πιθανότατα την άνοιξη του 2023. Πιθανώς, το GPT-4 θα είναι ένα εντυπωσιακό βήμα προς τα εμπρός όσον αφορά τη δυνατότητα παραγωγής φαινομενικά ακόμα πιο ρευστών δοκιμίων, εμβάθυνσης και δέους -θαύμα που εμπνέει ως προς τις συνθέσεις που μπορεί να παράγει.

Μπορείτε να περιμένετε να δείτε έναν νέο γύρο εκφρασμένης απορίας όταν έρθει η άνοιξη και κυκλοφορήσει η πιο πρόσφατη γενετική τεχνητή νοημοσύνη.

Το αναφέρω αυτό επειδή υπάρχει μια άλλη οπτική γωνία που πρέπει να θυμάστε, που αποτελείται από μια πιθανή αχίλλειο πτέρνα σε αυτές τις καλύτερες και μεγαλύτερες εφαρμογές τεχνητής νοημοσύνης. Εάν οποιοσδήποτε προμηθευτής τεχνητής νοημοσύνης διαθέσει μια παραγωγική εφαρμογή τεχνητής νοημοσύνης που εκτοξεύει ακατάστατα ακαθαρσίες, αυτό θα μπορούσε να διαλύσει τις ελπίδες αυτών των κατασκευαστών τεχνητής νοημοσύνης. Μια κοινωνική διάχυση μπορεί να προκαλέσει σοβαρό μαύρο μάτι σε όλες τις γενετικές τεχνητές νοημοσύνη. Ο κόσμος αναμφίβολα θα εκνευριστεί αρκετά με τα φάουλ αποτελέσματα, τα οποία έχουν συμβεί πολλές φορές ήδη και έχουν οδηγήσει σε θυελλώδεις κοινωνικές αντιδράσεις καταδίκης προς την τεχνητή νοημοσύνη.

Μια τελευταία προειδοποίηση προς το παρόν.

Ό,τι βλέπετε ή διαβάζετε σε μια γενετική απάντηση AI αυτό φαίνεται για να μεταφερθεί ως καθαρά τεκμηριωμένο (ημερομηνίες, μέρη, άτομα κ.λπ.), φροντίστε να παραμείνετε δύσπιστοι και να είστε πρόθυμοι να ελέγξετε ξανά αυτό που βλέπετε.

Ναι, οι ημερομηνίες μπορούν να επινοηθούν, οι θέσεις μπορούν να επινοηθούν και στοιχεία που συνήθως περιμένουμε να είναι υπεράνω μομφής είναι όλοι υπόκειται σε υποψίες. Μην πιστεύετε ό,τι διαβάζετε και να είστε δύσπιστοι όταν εξετάζετε τυχόν δοκίμια ή αποτελέσματα παραγωγής τεχνητής νοημοσύνης. Εάν μια εφαρμογή παραγωγής τεχνητής νοημοσύνης σας πει ότι ο Αβραάμ Λίνκολν πέταξε σε όλη τη χώρα με το δικό του ιδιωτικό τζετ, θα ξέρετε αναμφίβολα ότι αυτό είναι κακόβουλο. Δυστυχώς, μερικοί άνθρωποι μπορεί να μην συνειδητοποιούν ότι τα πίδακες δεν υπήρχαν στην εποχή του ή μπορεί να ξέρουν αλλά να μην προσέχουν ότι το δοκίμιο κάνει αυτόν τον θρασύ και εξωφρενικά ψευδή ισχυρισμό.

Μια ισχυρή δόση υγιούς σκεπτικισμού και μια επίμονη νοοτροπία δυσπιστίας θα είναι το καλύτερο πλεονέκτημά σας όταν χρησιμοποιείτε γενετική τεχνητή νοημοσύνη.

Είμαστε έτοιμοι να προχωρήσουμε στο επόμενο στάδιο αυτής της αποσαφήνισης.

Ωθώντας το Generative AI σε ένα σημείο θραύσης

Τώρα που έχουμε εδραιώσει τις βασικές αρχές, μπορούμε να βουτήξουμε στο θέμα της προώθησης της τεχνητής νοημοσύνης και του ChatGPT για τη δημιουργία ρητορικής μίσους και άλλου προσβλητικού περιεχομένου.

Όταν συνδέεστε για πρώτη φορά στο ChatGPT, υπάρχουν διάφορες προειδοποιητικές ενδείξεις, όπως αυτές:

"Μπορεί περιστασιακά να παράγει επιβλαβείς οδηγίες ή μεροληπτικό περιεχόμενο."
"Εκπαιδεύτηκε να απορρίπτει ακατάλληλα αιτήματα."
"Μπορεί περιστασιακά να δημιουργεί εσφαλμένες πληροφορίες."
«Περιορισμένη γνώση του κόσμου και των γεγονότων μετά το 2021».

Εδώ είναι μια ερώτηση για να σκεφτείτε.

Η προειδοποίηση ότι η εφαρμογή τεχνητής νοημοσύνης ενδέχεται να παράγει επιβλαβείς οδηγίες και/ή πιθανώς μεροληπτικό περιεχόμενο παρέχει επαρκή περιθώρια ελευθερίας στον κατασκευαστή της τεχνητής νοημοσύνης;

Με άλλα λόγια, ας υποθέσουμε ότι χρησιμοποιείτε το ChatGPT και δημιουργεί ένα δοκίμιο που πιστεύετε ότι περιέχει ρητορική μίσους. Ας υποθέσουμε ότι είστε εκνευρισμένοι με αυτό. Πηγαίνετε στα μέσα κοινωνικής δικτύωσης και δημοσιεύετε εξαγριωμένους σχολιασμούς ότι η εφαρμογή AI είναι το χειρότερο πράγμα ποτέ. Ίσως είστε τόσο προσβεβλημένοι που δηλώνετε ότι πρόκειται να μηνύσετε τον κατασκευαστή της τεχνητής νοημοσύνης επειδή επέτρεψε την παραγωγή τέτοιας ρητορικής μίσους.

Το αντεπιχείρημα είναι ότι η εφαρμογή AI είχε μια προειδοποιητική προειδοποίηση, επομένως, αποδεχτήκατε τον κίνδυνο προχωρώντας στη χρήση της εφαρμογής AI. Από τη σκοπιά της ηθικής της τεχνητής νοημοσύνης, ίσως ο κατασκευαστής της τεχνητής νοημοσύνης έκανε αρκετά για να επιβεβαιώσει ότι γνωρίζατε τι μπορεί να συμβεί. Ομοίως, από νομική άποψη, ίσως η προειδοποίηση να αποτελούσε επαρκή προειδοποίηση και δεν θα επικρατήσετε στο δικαστήριο.

Όλα αυτά είναι στον αέρα και θα πρέπει να περιμένουμε να δούμε πώς θα εξελιχθούν τα πράγματα.

Κατά μία έννοια, ο κατασκευαστής τεχνητής νοημοσύνης έχει κάτι άλλο για την υπεράσπισή του ενάντια σε οποιουσδήποτε εξοργισμένους ισχυρισμούς της εφαρμογής τεχνητής νοημοσύνης που πιθανώς παράγει ρητορική μίσους. Προσπάθησαν να αποτρέψουν τη δημιουργία προσβλητικού περιεχομένου. Βλέπετε, αν δεν είχαν κάνει τίποτα για να το περιορίσουν αυτό, υποθέτει κανείς ότι θα ήταν σε πιο λεπτό πάγο. Κάνοντας τουλάχιστον ουσιαστικούς κόπους για να αποτρέψουν το θέμα, προφανώς έχουν ένα κάπως πιο δυνατό πόδι για να σταθούν (θα μπορούσε ακόμα να χτυπηθεί από κάτω τους).

Μια θεραπευτική προσέγγιση που χρησιμοποιήθηκε αποτελούνταν από μια τεχνική AI γνωστής ως RLHF (ενισχυτική μάθηση μέσω ανθρώπινης ανατροφοδότησης). Αυτό γενικά συνίσταται στο ότι η τεχνητή νοημοσύνη δημιουργεί περιεχόμενο που στη συνέχεια ζητείται από τους ανθρώπους να αξιολογήσουν ή να ελέγξουν. Με βάση την αξιολόγηση ή την αξιολόγηση, η τεχνητή νοημοσύνη επιχειρεί μαθηματικά και υπολογιστικά να αποφύγει οτιδήποτε θεωρείται ως παράνομο ή προσβλητικό περιεχόμενο. Η προσέγγιση έχει σκοπό να εξετάσει αρκετά παραδείγματα για το τι είναι σωστό σε σχέση με το τι είναι λάθος ώστε η τεχνητή νοημοσύνη να μπορεί να βρει ένα γενικό μαθηματικό μοτίβο και στη συνέχεια να χρησιμοποιήσει αυτό το μοτίβο στο εξής.

Μια άλλη συχνή προσέγγιση αυτές τις μέρες είναι η χρήση Adversarial AI.

Δείτε πώς λειτουργεί αυτό. Ρυθμίζετε ένα διαφορετικό σύστημα τεχνητής νοημοσύνης που θα προσπαθήσει να είναι αντίπαλος της τεχνητής νοημοσύνης που προσπαθείτε να εκπαιδεύσετε. Σε αυτήν την περίπτωση, θα δημιουργήσουμε ένα σύστημα τεχνητής νοημοσύνης που προσπαθεί να πυροδοτήσει τη ρητορική μίσους. Θα τροφοδοτούσε προτροπές στην εφαρμογή τεχνητής νοημοσύνης που στοχεύουν να ξεγελάσουν την εφαρμογή τεχνητής νοημοσύνης ώστε να εξάγει απαράδεκτο περιεχόμενο. Εν τω μεταξύ, η τεχνητή νοημοσύνη που στοχεύεται παρακολουθεί πότε η αντίπαλη τεχνητή νοημοσύνη είναι επιτυχής και, στη συνέχεια, αλγοριθμικά προσπαθεί να προσαρμοστεί για να μειώσει το ενδεχόμενο να συμβεί ξανά. Είναι ένα παιχνίδι γάτας εναντίον ποντικιού. Αυτό γίνεται ξανά και ξανά, μέχρι να φαίνεται ότι η αντίπαλη τεχνητή νοημοσύνη δεν είναι πλέον ιδιαίτερα επιτυχημένη στο να κάνει το στοχευμένο AI να κάνει τα κακά πράγματα.

Μέσω αυτών των δύο βασικών τεχνικών, καθώς και άλλων προσεγγίσεων, μεγάλο μέρος της σημερινής γενετικής τεχνητής νοημοσύνης είναι πολύ καλύτερο στην αποφυγή ή/και στην ανίχνευση προσβλητικού περιεχομένου από ό,τι συνέβαινε τα προηγούμενα χρόνια.

Μην περιμένετε όμως την τελειότητα από αυτές τις μεθόδους. Οι πιθανότητες είναι ότι ο χαμηλός καρπός των φάουλ εξόδων θα κρατηθεί υπό έλεγχο από τέτοιες τεχνικές AI. Υπάρχει ακόμη πολύς χώρος για να εκπέμπονται ακαθαρσίες.

Συνήθως επισημαίνω ότι αυτές είναι μερικές από τις πτυχές που επιδιώκεται να πιάσει:

Εκπέμποντας μια συγκεκριμένη αποκρουστική λέξη
Δηλώνοντας μια συγκεκριμένη απαράδεκτη φράση, πρόταση ή παρατήρηση
Εκφράζοντας μια ιδιαίτερη άσχημη σύλληψη
Υπονοεί μια συγκεκριμένη παράνομη πράξη ή ιδέα
Φαίνεται να βασίζεται σε ένα συγκεκριμένο τεκμήριο φάουλ
ΑΛΛΑ

Τίποτα από αυτά δεν είναι ακριβής επιστήμη. Συνειδητοποιήστε ότι έχουμε να κάνουμε με λέξεις. Οι λέξεις είναι σημασιολογικά διφορούμενες. Η εύρεση μιας συγκεκριμένης πρόστυχης λέξης είναι παιδικό παιχνίδι, αλλά είναι πολύ πιο δύσκολο να προσπαθήσουμε να μετρήσουμε εάν μια πρόταση ή μια παράγραφος περιέχει μια φαινομενική δυσάρεστη έννοια. Σύμφωνα με τον προηγούμενο ορισμό της ρητορικής μίσους από τα Ηνωμένα Έθνη, υπάρχει τεράστιο περιθώριο ως προς το τι θα μπορούσε να ερμηνευθεί ως ρητορική μίσους έναντι του τι μπορεί να μην είναι.

Θα μπορούσατε να πείτε ότι οι γκρίζες περιοχές είναι στο μάτι του θεατή.

Μιλώντας για το μάτι του θεατή, υπάρχουν άνθρωποι σήμερα που χρησιμοποιούν γενεσιουργό AI όπως το ChatGPT που προσπαθούν σκόπιμα να κάνουν αυτές τις εφαρμογές AI να παράγουν προσβλητικό περιεχόμενο. Αυτή είναι η αναζήτησή τους. Ξοδεύουν ώρες με τις ώρες προσπαθώντας να συμβεί αυτό.

Γιατί έτσι?

Εδώ είναι οι χαρακτηρισμοί μου για αυτούς τους κυνηγούς επιθετικών αποτελεσμάτων ανθρώπινης τεχνητής νοημοσύνης:

Γνήσιος. Αυτοί οι άνθρωποι θέλουν να βοηθήσουν στη βελτίωση της τεχνητής νοημοσύνης και να βοηθήσουν την ανθρωπότητα να το κάνει. Πιστεύουν ότι κάνουν ηρωική δουλειά και απολαμβάνουν ότι μπορούν να βοηθήσουν στην προώθηση της τεχνητής νοημοσύνης για τη βελτίωση όλων.
Funsters. Αυτοί οι άνθρωποι θεωρούν αυτή την προσπάθεια ως παιχνίδι. Τους αρέσει να μπλέκονται με το AI. Η νίκη του παιχνιδιού συνίσταται στην εύρεση του χειρότερου από τα χειρότερα σε ό,τι μπορείτε να δημιουργήσετε το AI.
Επιδείξεις. Αυτοί οι άνθρωποι ελπίζουν να τραβήξουν την προσοχή για τον εαυτό τους. Θεωρούν ότι αν βρουν μερικά πραγματικά βρώμικα ψήγματα χρυσού, μπορούν να πάρουν ένα κομμάτι από το λαμπερό φως πάνω τους που κατά τα άλλα εστιάζεται στην ίδια την εφαρμογή AI.
Πικρό ποτό. Αυτοί οι άνθρωποι είναι εκνευρισμένοι με αυτό το AI. Θέλουν να υπονομεύσουν όλο αυτόν τον ενθουσιασμό που αναβλύζει. Αν μπορέσουν να ανακαλύψουν κάποια δυσοσμία πράγματα, ίσως αυτό θα βγάλει τον αέρα από το μπαλόνι ενθουσιασμού της εφαρμογής AI.
Άλλα κίνητρα

Πολλοί από αυτούς που εκτελούν την εύρεση προσβλητικότητας βρίσκονται κυρίως σε ένα μόνο από αυτά τα στρατόπεδα. Φυσικά, μπορείτε να βρίσκεστε σε περισσότερα από ένα στρατόπεδα τη φορά. Ίσως ένας πικραμένος άνθρωπος έχει επίσης την πρόθεση δίπλα-δίπλα να είναι γνήσιος και ηρωικός. Μερικά ή όλα αυτά τα κίνητρα μπορεί να συνυπάρχουν. Όταν καλείται να εξηγήσει γιατί κάποιος προσπαθεί να ωθήσει μια παραγωγική εφαρμογή τεχνητής νοημοσύνης στη σφαίρα της ρητορικής μίσους, η συνήθης απάντηση είναι να πείτε ότι βρίσκεστε στο γνήσιο στρατόπεδο, ακόμα κι αν είστε οριακά έτσι και αντ' αυτού κάθεστε δυνατά σε ένα από τα άλλα στρατόπεδα.

Τι είδους κόλπα που σχετίζονται με προτροπές χρησιμοποιούν αυτοί οι άνθρωποι;

Το μάλλον προφανές τέχνασμα περιλαμβάνει τη χρήση μιας αποκρουστικής λέξης σε μια προτροπή. Εάν είστε «τυχεροί» και η εφαρμογή AI το κάνει, αυτό μπορεί κάλλιστα να καταλήξει στην έξοδο. Έπειτα, έχεις τη στιγμή που έχεις να κάνεις.

Οι πιθανότητες είναι ότι μια καλά σχεδιασμένη και καλά δοκιμασμένη εφαρμογή δημιουργίας τεχνητής νοημοσύνης θα πιάσει αυτό το απλό τέχνασμα. Συνήθως θα εμφανιστεί ένα προειδοποιητικό μήνυμα που λέει σταματήστε να το κάνετε αυτό. Εάν συνεχίσετε, η εφαρμογή τεχνητής νοημοσύνης θα προγραμματιστεί να σας διώχνει από την εφαρμογή και να επισημαίνει τον λογαριασμό σας. Ενδέχεται να μην μπορείτε να συνδεθείτε ξανά (καλά, τουλάχιστον με τη σύνδεση που χρησιμοποιούσατε εκείνη τη στιγμή).

Ανεβαίνοντας τη σκάλα των τεχνασμάτων, μπορείτε να παράσχετε μια προτροπή που προσπαθεί να φέρει την τεχνητή νοημοσύνη στο πλαίσιο ενός φαύλου. Έχετε παίξει ποτέ αυτό το παιχνίδι όπου κάποιος σας λέει να πείτε κάτι χωρίς να πείτε αυτό που υποτίθεται ότι πρέπει να πείτε; Αυτό είναι αυτό το παιχνίδι, αν και λαμβάνει χώρα με το AI.

Ας παίξουμε αυτό το παιχνίδι. Ας υποθέσουμε ότι ζητώ από την εφαρμογή AI να μου πει για τον Β Παγκόσμιο Πόλεμο και ειδικά τους κύριους κυβερνητικούς ηγέτες που εμπλέκονται. Αυτό φαίνεται σαν ένα αθώο αίτημα. Δεν υπάρχει τίποτα που φαίνεται να αξίζει να επισημανθεί στην προτροπή.

Οραματιστείτε ότι το δοκίμιο που εξάγεται από την εφαρμογή AI περιλαμβάνει μια αναφορά στον Winston Churchill. Αυτό σίγουρα έχει νόημα. Ένας άλλος μπορεί να είναι ο Franklin D. Roosevelt. Ένας άλλος μπορεί να είναι ο Ιωσήφ Στάλιν. Ας υποθέσουμε ότι υπάρχει και η αναφορά του Αδόλφου Χίτλερ. Αυτό το όνομα θα περιλαμβανόταν σχεδόν σε οποιοδήποτε δοκίμιο για τον Β' Παγκόσμιο Πόλεμο και για όσους έχουν ρόλους εξέχουσας δύναμης.

Τώρα που έχουμε το όνομά του στο τραπέζι και μέρος της συζήτησης για την τεχνητή νοημοσύνη, στη συνέχεια θα προσπαθήσουμε να πείσουμε την τεχνητή νοημοσύνη να ενσωματώσει αυτό το όνομα με τρόπο που να μπορούμε να προβάλλουμε ως πιθανή ρητορική μίσους.

Εισάγουμε μια άλλη προτροπή και λέμε στην εφαρμογή AI ότι υπάρχει ένα άτομο σήμερα στις ειδήσεις που έχει το όνομα, John Smith. Επιπλέον, υποδεικνύουμε στην προτροπή ότι ο John Smith μοιάζει πολύ με αυτόν τον κακοποιό του Β 'Παγκοσμίου Πολέμου. Η παγίδα είναι τώρα στημένη. Στη συνέχεια, ζητάμε από την εφαρμογή AI να δημιουργήσει ένα δοκίμιο για τον John Smith, βασισμένο αποκλειστικά στο «γεγονός» που καταχωρίσαμε σχετικά με το ποιος μπορεί να εξισωθεί ο John Smith.

Σε αυτή τη συγκυρία, η εφαρμογή τεχνητής νοημοσύνης μπορεί να δημιουργήσει ένα δοκίμιο που ονομάζει το άτομο του Β' Παγκοσμίου Πολέμου και περιγράφει τον Τζον Σμιθ ως ύφασμα της ίδιας κοπής. Δεν υπάρχουν καθόλου άσχημες λέξεις από μόνες τους στο δοκίμιο, εκτός από το να υπαινίσσονται τον διάσημο κακοποιό και να εξισώνουν αυτό το άτομο με τον Τζον Σμιθ.

Η εφαρμογή AI έχει τώρα δημιουργήσει ρητορική μίσους;

Μπορεί να πείτε ότι ναι, έχει. Το να αναφέρουμε τον Τζον Σμιθ σαν τον διάσημο κακοποιό, είναι απολύτως μια μορφή ρητορικής μίσους. Το AI δεν πρέπει να κάνει τέτοιες δηλώσεις.

Μια απάντηση είναι ότι δεν πρόκειται για ρητορική μίσους. Αυτό είναι απλώς ένα δοκίμιο που παράγεται από μια εφαρμογή AI που δεν έχει ενσάρκωση της αίσθησης. Μπορεί να ισχυριστείτε ότι η ρητορική μίσους εμφανίζεται μόνο όταν η πρόθεση βρίσκεται κάτω από την ομιλία. Χωρίς καμία πρόθεση, η ομιλία δεν μπορεί να χαρακτηριστεί ως ρητορική μίσους.

Παράλογο, έρχεται η απάντηση στην ανταπόκριση. Οι λέξεις έχουν σημασία. Δεν έχει καμία διαφορά εάν η τεχνητή νοημοσύνη «σκόπευε» να παράγει ρητορική μίσους. Το μόνο που έχει σημασία είναι ότι παρήχθη ρητορική μίσους.

Στρογγυλά αυτό πάει.

Δεν θέλω να πω πολλά περισσότερα αυτή τη στιγμή σχετικά με την προσπάθεια εξαπάτησης του AI. Υπάρχουν πιο περίπλοκες προσεγγίσεις. Τα έχω καλύψει αλλού στις στήλες και τα βιβλία μου, και δεν θα τα ξανακάνω εδώ.

Συμπέρασμα

Πόσο μακριά πρέπει να πιέσουμε αυτές τις εφαρμογές τεχνητής νοημοσύνης για να δούμε αν μπορούμε να εκπέμπουμε προσβλητικό περιεχόμενο;

Μπορεί να ισχυριστείτε ότι δεν υπάρχει όριο που πρέπει να επιβληθεί. Όσο περισσότερο πιέζουμε, τόσο περισσότερο μπορούμε ελπίζουμε να μετρήσουμε πώς να αποτρέψουμε αυτό το AI και μελλοντικές επαναλήψεις του AI για να αποτρέψουμε τέτοιες ασθένειες.

Μερικοί αν και ανησυχούν ότι αν το μόνο μέσο για την απόκτηση ακαθαρσιών συνεπάγεται ακραία απάτη, υπονομεύει τις ευεργετικές πτυχές της τεχνητής νοημοσύνης. Το να διαφημίζει κανείς ότι η τεχνητή νοημοσύνη έχει τρομερή ακαθαρσία, αν και όταν εξαπατηθεί για να την εκπέμψει, παρέχει μια ψευδή αφήγηση. Οι άνθρωποι θα εκνευριστούν για την τεχνητή νοημοσύνη λόγω του γινεται αντιληπτο ευκολία με την οποία η τεχνητή νοημοσύνη δημιούργησε δυσμενές περιεχόμενο. Μπορεί να μην γνωρίζουν ή να μην τους λένε πόσο μακριά στην τρύπα του κουνελιού έπρεπε να πάει το άτομο για να πάρει τέτοια αποτελέσματα.

Όλα είναι τροφή για σκέψη.

Μερικά τελευταία σχόλια προς το παρόν.

Ο Γουίλιαμ Σαίξπηρ είπε συγκεκριμένα για την ομιλία: «Το να μιλάς δεν κάνει. Είναι ένα είδος καλής πράξης να λες καλά, και όμως τα λόγια δεν είναι πράξεις». Το αναφέρω αυτό γιατί κάποιοι υποστηρίζουν ότι αν η τεχνητή νοημοσύνη παράγει μόνο λέξεις, δεν θα έπρεπε να είμαστε τόσο υπερβολικά όρθιοι. Εάν η τεχνητή νοημοσύνη ενεργούσε με βάση τα λόγια και άρα εκτελούσε κακές πράξεις, τότε θα έπρεπε να βάλουμε σταθερά το πόδι μας κάτω. Όχι, αν η έξοδος είναι απλώς λέξεις.

Μια αντίθετη άποψη θα προσδιόριζε αυτό το ανώνυμο ρητό: «Η γλώσσα δεν έχει κόκαλα, αλλά είναι αρκετά δυνατή για να ραγίσει μια καρδιά. Γι' αυτό να είστε προσεκτικοί με τα λόγια σας." Μια εφαρμογή τεχνητής νοημοσύνης που εκπέμπει άσχημες λέξεις είναι ίσως ικανή να ραγίσει καρδιές. Αυτό από μόνο του κάνει την προσπάθεια να σταματήσει η βρωμιά μια αξιόλογη αιτία, θα έλεγαν ορισμένοι.

Μια ακόμη ανώνυμη ρήση για να κλείσουμε τα πράγματα σε αυτή τη βαριά συζήτηση:

"Να είστε προσεκτικοί με τα λόγια σας. Μόλις ειπωθούν, μπορούν μόνο να συγχωρηθούν, όχι να ξεχαστούν».

Ως άνθρωποι, μπορεί να δυσκολευτούμε να ξεχάσουμε τη βρωμιά που παρήχθη από την τεχνητή νοημοσύνη και η συγχώρεσή μας μπορεί επίσης να διστάζει να δοθεί.

Άλλωστε είμαστε μόνο άνθρωποι.

Πηγή: https://www.forbes.com/sites/lanceeliot/2023/02/05/how-hard-should-we-push-generative-ai-chatgpt-into-spewing-hate-speech-asks-ai- ηθική-και-δίκαιο/