AI Benchmark: come misurare i progressi degli LLM se conoscono le regole del gioco?
Sono più intelligente di un LLM. È una frase introduttiva pericolosa e parecchio autoreferenziale, ma per oggi ho scelto di fidarmi dell’esito del puzzle giornaliero di ARC-AGI. Devo fornire del contesto perché possiate fidarvi di ciò che ho scritto, ma prima di farlo il mio consiglio è di testarlo voi stessi, dopodiché tornate qui. Sono […]
AI Benchmark: come misurare i progressi degli LLM se conoscono le regole del gioco? Leggi tutto »