Nome dell'autore: Giuseppe Russo

AI Benchmark: come misurare i progressi degli LLM se conoscono le regole del gioco?

Sono più intelligente di un LLM. È una frase introduttiva pericolosa e parecchio autoreferenziale, ma per oggi ho scelto di fidarmi dell’esito del puzzle giornaliero di ARC-AGI. Devo fornire del contesto perché possiate fidarvi di ciò che ho scritto, ma prima di farlo il mio consiglio è di testarlo voi stessi, dopodiché tornate qui. Sono […]

AI Benchmark: come misurare i progressi degli LLM se conoscono le regole del gioco? Leggi tutto »

Le conseguenze – effettive e mancate – del terremoto DeepSeek

Necessario disclaimer: non ho resistito alla tentazione di porre al chatbot di DeepSeek domande la cui risposta sapevo sarebbe stata censurata. Avevo letto in un articolo del Wall Street Journal che le aziende che producono modelli di AI generativa devono dimostrare al governo cinese il rifiuto da parte dei propri chatbot di rispondere ad un numero

Le conseguenze – effettive e mancate – del terremoto DeepSeek Leggi tutto »