Οι ερευνητές αξιολογούν την απόδοση του ChatGPT στη σύνοψη ιατρικών περιλήψεων

Σε μια πρόσφατη μελέτη που δημοσιεύτηκε στο The Annals of Family Medicine, οι ερευνητές αξιολόγησαν την αποτελεσματικότητα του Chat Generative Pretrained Transformer (ChatGPT) στη σύνοψη ιατρικών περιλήψεων για να βοηθήσουν τους γιατρούς. Η μελέτη είχε στόχο να καθορίσει την ποιότητα, την ακρίβεια και την προκατάληψη στις περιλήψεις που δημιουργούνται από το ChatGPT, παρέχοντας πληροφορίες για τις δυνατότητές του ως εργαλείου για την αφομοίωση τεράστιων ποσοτήτων ιατρικής βιβλιογραφίας εν μέσω χρονικών περιορισμών που αντιμετωπίζουν οι επαγγελματίες υγείας.

Υψηλές βαθμολογίες για την ποιότητα και την ακρίβεια

Η μελέτη χρησιμοποίησε το ChatGPT για να συμπυκνώσει 140 ιατρικές περιλήψεις από 14 διαφορετικά περιοδικά, μειώνοντας το περιεχόμενο κατά μέσο όρο κατά 70%. Παρά ορισμένες ανακρίβειες και παραισθήσεις που εντοπίστηκαν σε ένα μικρό κλάσμα των περιλήψεων, οι γιατροί βαθμολόγησαν τις περιλήψεις ιδιαίτερα ως προς την ποιότητα και την ακρίβεια. Τα ευρήματα υποδεικνύουν ότι το ChatGPT έχει τη δυνατότητα να βοηθήσει τους γιατρούς στην αποτελεσματική ανασκόπηση της ιατρικής βιβλιογραφίας, προσφέροντας συνοπτικές και ακριβείς περιλήψεις εν μέσω του συντριπτικού όγκου πληροφοριών.

Οι ερευνητές επέλεξαν 10 άρθρα από καθένα από τα 14 περιοδικά που καλύπτουν διάφορα ιατρικά θέματα και δομές. Ανέθεσαν στο ChatGPT να συνοψίσει αυτά τα άρθρα και αξιολόγησαν τις περιλήψεις που δημιουργήθηκαν ως προς την ποιότητα, την ακρίβεια, την προκατάληψη και τη συνάφεια σε δέκα ιατρικούς τομείς. Η μελέτη διαπίστωσε ότι το ChatGPT συμπύκνωσε με επιτυχία τις ιατρικές περιλήψεις κατά μέσο όρο κατά 70%, συγκεντρώνοντας υψηλές βαθμολογίες από τους ιατρούς αναθεωρητές για την ποιότητα και την ακρίβεια.

Επιπτώσεις στην υγειονομική περίθαλψη

Παρά τις υψηλές βαθμολογίες, η μελέτη εντόπισε σοβαρές ανακρίβειες και παραισθήσεις σε μικρό αριθμό περιλήψεων. Αυτά τα σφάλματα κυμαίνονταν από παραλείψεις κρίσιμων δεδομένων έως παρερμηνείες των σχεδίων μελέτης, που θα μπορούσαν ενδεχομένως να αλλάξουν την ερμηνεία των ερευνητικών ευρημάτων. Ωστόσο, η απόδοση του ChatGPT στη σύνοψη ιατρικών περιλήψεων κρίθηκε αξιόπιστη, με ελάχιστη προκατάληψη.

Ενώ το ChatGPT έδειξε ισχυρή ευθυγράμμιση με τις ανθρώπινες αξιολογήσεις σε επίπεδο περιοδικών, η απόδοσή του στον εντοπισμό της συνάφειας μεμονωμένων άρθρων με συγκεκριμένες ιατρικές ειδικότητες ήταν λιγότερο εντυπωσιακή. Αυτή η ασυμφωνία υπογράμμισε έναν περιορισμό στην ικανότητα του ChatGPT να προσδιορίζει με ακρίβεια τη συνάφεια μεμονωμένων άρθρων στο ευρύτερο πλαίσιο των ιατρικών ειδικοτήτων.

Η μελέτη παρέχει πολύτιμες γνώσεις σχετικά με τις δυνατότητες του AI, ιδιαίτερα του ChatGPT, να βοηθά τους γιατρούς να αναθεωρούν αποτελεσματικά την ιατρική βιβλιογραφία. Ενώ το ChatGPT δείχνει πολλά υποσχόμενο στη σύνοψη ιατρικών περιλήψεων με υψηλή ποιότητα και ακρίβεια, απαιτείται περαιτέρω έρευνα για την αντιμετώπιση των περιορισμών και τη βελτίωση της απόδοσής του σε συγκεκριμένα ιατρικά πλαίσια.

Η μελλοντική έρευνα θα μπορούσε να επικεντρωθεί στη βελτίωση της ικανότητας του ChatGPT να αναγνωρίζει τη συνάφεια μεμονωμένων άρθρων με συγκεκριμένες ιατρικές ειδικότητες. Επιπλέον, οι προσπάθειες για τον μετριασμό των ανακριβειών και των παραισθήσεων στις περιλήψεις που δημιουργούνται θα μπορούσαν να ενισχύσουν περαιτέρω τη χρησιμότητα των εργαλείων τεχνητής νοημοσύνης σε περιβάλλοντα υγειονομικής περίθαλψης.

Πηγή: https://www.cryptopolitan.com/chatgpt-in-summarizing-medical-abstracts/