Anthropic ha annunciato un aggiornamento dei suoi modelli di intelligenza artificiale Claude, introducendo una nuova funzionalità sperimentale: la capacità di utilizzare i computer. Il modello Claude 3.5 Sonnet è ora in grado di accedere al sistema dell’utente, guardare lo schermo, spostare il cursore, digitare testo e cliccare sui pulsanti. Questa innovazione rappresenta un passo avanti significativo verso l’automazione e l’interazione tra intelligenza artificiale e sistemi operativi progettati per l’uso umano.
Nonostante la natura sperimentale e la possibilità di errori, il modello Claude 3.5 Sonnet ha ottenuto risultati promettenti nel benchmark OSWorld, che valuta la capacità dei modelli di IA di utilizzare i computer come farebbe un essere umano. Ha ottenuto un punteggio del 14,9% nella categoria delle schermate e del 22,0% in altre attività che richiedono più passaggi. Sebbene questi risultati siano ancora lontani dalla media umana del 72,36%, rappresentano un notevole progresso per l’intelligenza artificiale.
Oltre alla nuova funzionalità, Anthropic ha anche aggiornato i suoi modelli Claude 3.5 Sonnet e Hauiku, rendendoli ancora più efficaci in varie attività. L’azienda ha fornito valutazioni comparative rispetto ai modelli precedenti e ai design all’avanguardia di OpenAI e Google, dimostrando i miglioramenti apportati.