OpenAI e il caso FrontierMath: valutazione del modello o3 falsata?
Il coinvolgimento non dichiarato di OpenAI, l'azienda responsabile di ChatGPT, nella creazione del dataset FrontierMath ha sollevato dubbi sull'affidabilità dei punteggi ottenuti dal modello di intelligenza artificiale o3, concepito per eccellere nel ragionamento matematico e logico
What's Your Reaction?