OpenAI e il caso FrontierMath: valutazione del modello o3 falsata?

2025-01-20 12:20:00 - www.hwupgrade.it

Si parla di:
Frontiermath

o3 ha ottenuto una valutazione di 25% in FrontierMath, mentre i precedenti modelli IA non sono andati oltre il 2%, il che evidenzia la precisione e le prestazioni nettamente al di sopra della norma di questo modello.
Per affrontare il problema, Epoch AI ha annunciato l'introduzione di un dataset completamente nuovo, che non è stato condiviso con OpenAI e che sarà utilizzato per una valutazione indipendente delle performance del modello o3.

Stories
Chi siamo
Come Funziona
Privacy
Contattaci

Openai Caso Frontiermath Valutazione Modello O3 Falsata

OpenAI e il caso FrontierMath: valutazione del modello o3 falsata?