Intelligenza Artificiale (@Shutterstock)
Tutti ormai possono constatare l’incredibile impatto che sta avendo l’Intelligenza Artificiale sulle nostre vite, ma alcuni test eseguiti sui più popolari chatbot sono pronti a smentire la credenza per cui l’IA ragioni in modo logico e che abbia ormai reso obsolete le capacità di ragionamento umano.
La comunità scientifica sta, ovviamente, continuando ad eseguire test e sperimentazioni nell’ambito dell’Intelligenza Artificiale. L’obbiettivo è cercare di capire fino in fondo le potenzialità di questa particolare tecnologia. Nello specifico qui parliamo di un progetto di ricerca realizzato dai ricercatori dell’University College di Londra Olivia Macmillan-Scott e l’italiano Mirco Musolesi, dell’Università di Bologna. I due esperti hanno sottoposto alcuni degli strumenti di IA più popolari a test cognitivi che hanno rivelato che questi riportino la stessa percentuale di errore degli esseri umani. Questo, però, per motivi diversi.
Lo studio, che è in via di pubblicazione, è stato utile a comprendere che benché abbia capacità computazionali straordinarie, l’algoritmo fallisce classici test logici usati in psicologia cognitiva. “Il nostro lavoro partiva dalla volontà di capire se i modelli linguistici usati oggi dimostrassero una capacità di ragionamento logico e, nel caso, di trovare un metodo per misurarla”, ha spiegato all’ANSA Macmillan-Scott.
In seguito a 12 test differenti è risultato chiaro che i chatbot non conducano un pensiero razionale. Non solo sbagliavano operazioni di associazione semplici, ma di fronte allo stesso quesito davano risposte diverse. Il ricercatore dell’Università di Bologna si è spiegato questo tipo di risultati con il fatto che i passaggi logici effettuati dalle IA singolarmente hanno un senso, ma lo perdono completamente quando li analizzi nel complesso. Pertanto si è portati a credere che abbiano una limitata comprensione del contesto e lo derivino da schemi di probabilità.
Il chatbot più performante in assoluto comunque è stato Gpt4 che ha superato il 90% dei test. Comunque “Nel complesso sono risultati che, a parte ChatGpt 4 che è più evoluto degli altri e che probabilmente è anche capace di utilizzare tool paralleli, non stupiscono chi lavora nel settore”, ha concluso Macmillan-Scott.
Potrebbe interessarti anche
Dopo tanti anni ci troviamo finalmente al day one di Hollow Knight: Silksong, l'attesissimo metroidvania…
A breve uscirà il remake di Final Fantasy Tactics The Ivalice Chronicles, richiesto a gran…
La noia, spesso considerata un semplice stato passeggero, può in realtà trasformarsi in un potente…
Take-Two è stata ad un passo dall'acquisizione di Perfect Dark, e quindi dall'evitare la sua…
Il lancio di Helldivers 2 su Xbox ha registrato un numero di vendite ben superiore…
La sera di mercoledì 3 settembre, a Viterbo, il Trasporto della Macchina di Santa Rosa…