Aspetti principali
- Come spiega TechCrunch, sviluppato dal team Qwen di Alibaba, QwQ-32B-Preview include 32,5 miliardi di parametri e può gestire prompt fino a circa 32.000 parole.
- Secondo i test effettuati da Alibaba, QwQ-32B-Preview supera i modelli di OpenAI o1 nei test AIME e MATH. AIME utilizza altri modelli di intelligenza artificiale per valutare le prestazioni di un modello, mentre MATH è una raccolta di problemi di matematica basati su testo.
- QwQ-32B-Preview è in grado di risolvere puzzle logici e rispondere a quesiti matematici complessi, grazie alle sue capacità di “ragionamento”.
Punti critici
Come si legge sulla piattaforma di sviluppo Hugging Face, QwQ-32B-Preview non è privo di difetti. Il modello potrebbe cambiare lingua inaspettatamente compromettendo la chiarezza delle risposte; Inoltre, potrebbe entrare in schemi di ragionamento circolari, generando risposte prolisse senza arrivare a una conclusione definitiva. Per quanto riguarda la sicurezza, sono necessarie misure più avanzate per garantire un utilizzo affidabile e sicuro; gli utenti dovrebbero adottare cautela durante il suo impiego. Infine, sebbene il modello brilli in ambiti come matematica e programmazione, necessita di miglioramenti in altre aree, come il ragionamento basato sul senso comune e la comprensione di sfumature linguistiche.
I limiti “politici”
Per altri contenuti iscriviti alla newsletter di Forbes.it CLICCANDO QUI .
Forbes.it è anche su WhatsApp: puoi iscriverti al canale CLICCANDO QUI .