Il gruppo di ricerca Sapienza NLP della Sapienza Università di Roma ha presentato ChatMinerva, una nuova evoluzione del modello LLM Minerva. Si tratta di un assistente AI multimodale in grado di effettuare diverse operazioni.

Un assistente IA tuttofare

ChatMinerva è progettato per comprendere testi, immagini e documenti, accedere al web in tempo reale e può anche dialogare in italiano, garantendo prestazioni migliori, sia in termini di affidabilità che di sicurezza, rispetto al modello precedente. Il progetto è interamente sviluppato in Italia e offre un approccio aperto, trasparente e controllabile.

Come sottolineato anche in apertura, ChatMinerva è un vero e proprio assistente multimodale. Tra le novità troviamo la comprensione multimodale, con la capacità di comprendere input visuali e testuali oltre che effettuare l'OCR dei testi scansionati. C'è anche la possibilità di dialogare con l'assistente utilizzando la voce.

Da segnalare anche la capacità di accesso al web in tempo reale, con anche la possibilità di effettuare ricerche tramite il motore DuckDuckGo. Migliora anche la gestione dei documenti lunghi, con la possibilità di sfruttare una finestra contestuale fino a 32.000 token. È stato specificato, inoltre, che il modello integra un componente dedicato per il controllo e la validazione degli input e delle risposte.