Anche noi italiani adesso possiamo mettere a confronto le risposte dateci dai principali chatbot AI attualmente in circolazione: indigo.ai ha infatti appena messo a disposizione di tutti Chatbot Arena Italia, la prima piattaforma di comparazione LLM (acronimo di Large Language Model, ovvero quei sistemi di intelligenza artificiale che sembrano comprendere ciò che chiediamo perché ci rispondono apparentemente come esseri senzienti) per la lingua italiana.
Magari ricordate quando l’anno scorso vi abbiamo segnalato il sorpasso di Claude 3 nei confronti di GPT nei test alla cieca. Per questo genere di comparazioni (come fu per altro in quell’occasione) il più delle volte si usa Chatbot Arena, una piattaforma nata nel 2023 (oggi il punto di riferimento a livello mondiale per testing e comparazione degli LLM) e che permette appunto di confrontare le risposte date dai chatbot più diffusi quando viene rivolta loro la stessa domanda.
Ecco, questi confronti adesso possiamo farli anche noi e nella nostra lingua utilizzando Chatbot Arena Italia. L’idea di base è quella di utilizzare questa nuova piattaforma per stilare una classifica dei migliori LLM specificamente per la lingua italiana: per ogni risultato ottenuto è infatti possibile dare un voto e così determinare quale dei due chatbot ha dato la risposta migliore, oppure indicare quando ci si trova di fronte a un caso di pareggio o quando entrambi i modelli confrontati hanno dato una risposta sbagliata.

Come funziona Chatbot Arena Italia
Oltre a spulciare la classifica (Leaderboard) aggiornata in tempo reale, chiunque può accedere alla nuova piattaforma e mettere alla prova svariati modelli di chatbot digitando i prompt in italiano.
La versione attuale offre tre modalità di iterazione.
Con Arena (battaglie) è possibile confrontare due LLM in maniera anonima. Si digita la domanda, si schiaccia invio e si confrontano poi le risposte senza sapere da quali chatbot provengono. È forse la modalità più democratica di tutte in quanto nella maggior parte dei casi risulta difficile capire da quale AI viene generata la risposta e di conseguenza il voto dell’utente non può essere influenzato dai suoi pregiudizi verso un LLM in particolare.
In alternativa si può selezionare il pannello Arena (fianco a fianco) e interrogare due AI con lo stesso prompt selezionandole manualmente. Nel momento in cui scriviamo si può scegliere tra:
- Claude-3.5-sonnet
- Claude-3.5-haiku
- Claude-3-haiku
- Claude-3-sonnet
- Claude-3-opus
- Gemini-1.5-flash
- Gemini-1.5-pro
- Gemini-2.0-flash
- Gemini-2.0-pro
- GPT-4o
- GPT-4o-mini
- o1
- o1-mini
- o3-mini
- GPT-4-turbo
- GPT-3.5-turbo
- Gemma2-9B
- Mixtral-8x22B-Instruct-v0.1
- Mixtral-8x7B
- Deepseek-V3
- Llama-3.1-8B
- Llama-3.2-3B
- LLaMAntino3
- Minerva-7B-instruct
- Maestrale-chat-v0.4
- Modello-Italia-9B
- Llama-3.3-70B
- Qwen2.5-72B-Instruct-Turbo
- Deepseek-R1
- Mistral Small 3
- Phi 4
- Velvet-14B
Come ultima opzione c’è la Chat diretta che, semplicemente, permette di selezionare uno dei chatbot sopracitati e avviare una conversazione e fare le proprie valutazioni.

Come accedere a Chatbot Arena Italia
Se volete provarci, vi basta cliccare qui per accedere alla piattaforma Chatbot Arena Italia.
Come abbiamo già detto è completamente gratuita e interessante anche per il fatto che permette di provare versioni normalmente a pagamento come ChatGPT o1 (che richiede un abbonamento mensile di 20 $), oltre che accedere facilmente ai chatbot italiani Minerva e Modello Italia nonché alla cinese DeepSeek che il garante per la privacy aveva bloccato nel nostro paese a partire dal 30 Gennaio.
Sull’intelligenza artificiale
Trovate tante altre notizie legate al mondo dell’intelligenza artificiale raccolte all’interno di questa sezione del nostro sito. Per approfondimenti sulle applicazioni e sulle implicazioni dell’AI potete invece fare rifermento a quest’area di Macitynet.