Το ChatGPT V4 ξεπερνά τη γραμμή, τα SAT και μπορεί να αναγνωρίσει εκμεταλλεύσεις σε συμβόλαια ETH

Το GPT-4, η πιο πρόσφατη έκδοση του chatbot Τεχνητής Νοημοσύνης (AI), ChatGPT, μπορεί να περάσει δοκιμασίες γυμνασίου και εξετάσεις νομικής σχολής με βαθμολογίες στο 90ο εκατοστημόριο και έχει νέες δυνατότητες επεξεργασίας που δεν ήταν δυνατές με την προηγούμενη έκδοση.

Τα στοιχεία από τις βαθμολογίες των δοκιμών του GPT-4 κοινοποιήθηκαν στις 14 Μαρτίου από τον δημιουργό του OpenAI, αποκαλύπτοντας ότι μπορεί επίσης να μετατρέπει εισόδους εικόνας, ήχου και βίντεο σε κείμενο, καθώς και να χειρίζεται «πολύ πιο λεπτές οδηγίες» πιο δημιουργικά και αξιόπιστα.

«Περνάει σε μια προσομοιωμένη εξέταση bar με βαθμολογία γύρω από το 10% των κορυφαίων υποψηφίων», πρόσθεσε το OpenAI. «Αντίθετα, η βαθμολογία του GPT-3.5 ήταν περίπου στο χαμηλότερο 10%.

Τα στοιχεία δείχνουν ότι το GPT-4 πέτυχε βαθμολογία 163 στο 88ο εκατοστημόριο στις εξετάσεις LSAT — οι φοιτητές του κολεγίου πρέπει να περάσουν στις Ηνωμένες Πολιτείες για να γίνουν δεκτοί στη νομική σχολή.

Αποτελέσματα εξετάσεων των GPT-4 και GPT-3.5 σε μια σειρά πρόσφατων εξετάσεων στις ΗΠΑ. Πηγή: OpenAI

Η βαθμολογία του GPT4 θα το έθετε σε καλή θέση για να γίνει δεκτό σε μια κορυφαία νομική σχολή 20 και είναι μόνο λίγες μονάδες λιγότερο από τις αναφερόμενες βαθμολογίες που απαιτούνται για την αποδοχή σε σχολές κύρους όπως το Χάρβαρντ, το Στάνφορντ, το Πρίνστον ή το Γέιλ.

Η προηγούμενη έκδοση του ChatGPT σημείωσε μόνο 149 στο LSAT βάζοντας το στο χαμηλότερο 40%.

Το GPT-4 σημείωσε επίσης βαθμολογία 298 στα 400 στην Ενιαία Εξέταση Δικηγόρων — μια δοκιμασία που πραγματοποιήθηκε από πρόσφατα πτυχιούχους φοιτητές νομικής που τους επιτρέπει να ασκήσουν το επάγγελμα του δικηγόρου σε οποιαδήποτε δικαιοδοσία των ΗΠΑ.

Οι βαθμολογίες UBE έπρεπε να γίνουν δεκτές για δικηγορία σε κάθε δικαιοδοσία των ΗΠΑ. Πηγή: Πανελλήνιο Συνέδριο Εξεταστών Δικηγόρων

Η παλιά έκδοση του ChatGPT δυσκολεύτηκε σε αυτό το τεστ, τερματίζοντας στο κάτω 10% με βαθμολογία 213 στα 400.

Όσον αφορά τις εξετάσεις SAT Evidence-Based Reading & Writing και SAT Math από μαθητές γυμνασίου των ΗΠΑ για τη μέτρηση της ετοιμότητάς τους στο κολέγιο, το GPT-4 βαθμολογήθηκε στο 93ο και 89ο εκατοστημόριο αντίστοιχα.

Το GPT-4 διέπρεψε και στις «σκληρές» επιστήμες, σημειώνοντας πολύ πάνω από το μέσο όρο βαθμολογίες εκατοστιαίου επιπέδου στην AP Βιολογία (85-100%), τη Χημεία (71-88%) και τη Φυσική 2 (66-84%).

Αποτελέσματα εξετάσεων των GPT-4 και GPT-3.5 σε μια σειρά από πρόσφατες Εξετάσεις στις ΗΠΑ. Πηγή: OpenAI.

Ωστόσο, η βαθμολογία του AP Calculus ήταν αρκετά μέτρια, κατατάσσοντας στο 43ο έως το 59ο εκατοστημόριο.

Ένας άλλος τομέας στον οποίο έλειπε το GPT-4 ήταν στις εξετάσεις Αγγλικής Λογοτεχνίας, με βαθμολογίες στο 8ο έως το 44ο εκατοστημόριο σε δύο ξεχωριστά τεστ.

Η OpenAI είπε ότι οι GPT-4 και GPT-3.5 πήραν αυτές τις δοκιμές από τις πρακτικές εξετάσεις 2022-2023 και ότι «καμία ειδική εκπαίδευση» δεν λήφθηκε από τα εργαλεία επεξεργασίας γλώσσας:

«Δεν κάναμε συγκεκριμένη εκπαίδευση για αυτές τις εξετάσεις. Μια μειοψηφία των προβλημάτων στις εξετάσεις φάνηκε από το μοντέλο κατά τη διάρκεια της εκπαίδευσης, αλλά πιστεύουμε ότι τα αποτελέσματα είναι αντιπροσωπευτικά».

Τα αποτελέσματα προκάλεσαν φόβο και στην κοινότητα του Twitter.

Συγγενεύων: Πώς θα επηρεάσει το ChatGPT τον χώρο Web3; Η βιομηχανία απαντά

Ο Nick Almond, ο ιδρυτής του FactoryDAO είπε τους 14,300 οπαδούς του στο Twitter στις 14 Μαρτίου ότι το GPT4 πρόκειται να «τρομάξει τους ανθρώπους» και θα «καταρρεύσει» το παγκόσμιο εκπαιδευτικό σύστημα.

Ο πρώην διευθυντής του Coinbase, Conor Grogan, είπε ότι εισήγαγε ένα ζωντανό έξυπνο συμβόλαιο Ethereum στο GPT-4 και αμέσως επεσήμανε πολλά «τρωτά σημεία ασφαλείας» και περιέγραψε πώς μπορεί να γίνει εκμετάλλευση του κώδικα:

Προηγούμενοι έλεγχοι έξυπνων συμβολαίων στο ChatGPT διαπίστωσαν ότι η πρώτη του έκδοση ήταν επίσης ικανή να εντοπίσει σφάλματα κώδικα σε λογικό βαθμό επίσης.

Ο Rowan Cheung, ο ιδρυτής του ενημερωτικού δελτίου τεχνητής νοημοσύνης "The Rundown" μοιράστηκε ένα βίντεο του GPT που μεταγράφει έναν ψεύτικο ιστότοπο που σχεδιάστηκε με το χέρι σε ένα κομμάτι χαρτί σε κώδικα.