Intelligenza Artificiale (@Shutterstock)
Tutti ormai possono constatare l’incredibile impatto che sta avendo l’Intelligenza Artificiale sulle nostre vite, ma alcuni test eseguiti sui più popolari chatbot sono pronti a smentire la credenza per cui l’IA ragioni in modo logico e che abbia ormai reso obsolete le capacità di ragionamento umano.
La comunità scientifica sta, ovviamente, continuando ad eseguire test e sperimentazioni nell’ambito dell’Intelligenza Artificiale. L’obbiettivo è cercare di capire fino in fondo le potenzialità di questa particolare tecnologia. Nello specifico qui parliamo di un progetto di ricerca realizzato dai ricercatori dell’University College di Londra Olivia Macmillan-Scott e l’italiano Mirco Musolesi, dell’Università di Bologna. I due esperti hanno sottoposto alcuni degli strumenti di IA più popolari a test cognitivi che hanno rivelato che questi riportino la stessa percentuale di errore degli esseri umani. Questo, però, per motivi diversi.
Lo studio, che è in via di pubblicazione, è stato utile a comprendere che benché abbia capacità computazionali straordinarie, l’algoritmo fallisce classici test logici usati in psicologia cognitiva. “Il nostro lavoro partiva dalla volontà di capire se i modelli linguistici usati oggi dimostrassero una capacità di ragionamento logico e, nel caso, di trovare un metodo per misurarla”, ha spiegato all’ANSA Macmillan-Scott.
In seguito a 12 test differenti è risultato chiaro che i chatbot non conducano un pensiero razionale. Non solo sbagliavano operazioni di associazione semplici, ma di fronte allo stesso quesito davano risposte diverse. Il ricercatore dell’Università di Bologna si è spiegato questo tipo di risultati con il fatto che i passaggi logici effettuati dalle IA singolarmente hanno un senso, ma lo perdono completamente quando li analizzi nel complesso. Pertanto si è portati a credere che abbiano una limitata comprensione del contesto e lo derivino da schemi di probabilità.
Il chatbot più performante in assoluto comunque è stato Gpt4 che ha superato il 90% dei test. Comunque “Nel complesso sono risultati che, a parte ChatGpt 4 che è più evoluto degli altri e che probabilmente è anche capace di utilizzare tool paralleli, non stupiscono chi lavora nel settore”, ha concluso Macmillan-Scott.
Potrebbe interessarti anche
Blue Prince sta destando scalpore tra la massa, con alcuni che gli assegnano già il…
Marvel Studios ha finalmente rilasciato il trailer ufficiale di I Fantastici Quattro: Gli Inizi, nuovo…
Ubisoft ha annunciato con orgoglio che Assassin's Creed Origins e Odyssey hanno superato il traguardo…
A pochi giorni dal lancio ufficiale di Clair Obscur: Expedition 33, Sandfall Interactive ha pubblicato…
Alla Star Wars Celebration di Tokyo, Lucasfilm e Disney hanno finalmente mostrato il primo assaggio…
Il 15 aprile 2025 è uscito su Disney+ l’ultimo episodio della nuova serie Marvel Daredevil:…