DeepL-Kutylowski
Tech

La storia di DeepL, l’unicorno tedesco delle traduzioni che sfida Google Translate e ChatGpt

Questo articolo è apparso su Forbes.com

L’imprenditore Jaroslaw Kutylowski parla correttamente tedesco, polacco e inglese. Con DeepL, lo strumento di traduzione Ai della sua startup, può leggere e scrivere in oltre 30 lingue.

Fondata nel 2017, DeepL ha sviluppato un software di traduzione che, a suo dire, è molto più accurato dei prodotti rivali offerti da Google e altri, grazie a una potente intelligenza artificiale che lavora con persone madrelingua.

In quante lingue traduce DeepL

L’architettura proprietaria della rete neurale di DeepL – una tecnica di apprendimento automatico che aiuta un computer ad apprendere le informazioni nello stesso modo di un cervello umano – è stata addestrata su un vasto database di testi bilingui (tradotti) e monolingua (non tradotti) disponibili pubblicamente in 31 lingue diverse, tra cui cinese, russo, spagnolo e italiano.

Si tratta solo di alcune delle 130 lingue che è possibile tradurre con Google. Ma le traduzioni di DeepL sono calibrate tenendo conto delle sfumature di significato da redattori umani e madrelingua. La startup impiega 20 redattori interni e più di mille traduttori umani a contratto in tutto il mondo per valutare la qualità delle traduzioni prodotte dal modello e regolarne l’accuratezza.

“Abbiamo bisogno di molti dati di alta qualità tradotti dall’uomo solo per imparare le peculiarità di una lingua e tradurre testi formali e informali”, ha dichiarato Kutylowski.

Quanto vale DeepL

DeepL vanta più di 10 milioni di utenti attivi mensili, 500mila dei quali pagano tra i 9 e i 59 dollari al mese. Tra questi ci sono nonni che usano DeepL per parlare ai nipoti nella loro lingua madre e partner che lottano con una barriera linguistica.

La maggior parte del business di DeepL, però, è dovuto alle sue 20mila aziende clienti – Mercedes Benz, Fujitsu e la società ferroviaria tedesca Deutsche Bahn, per citarne alcuni – che utilizzano il software per tradurre qualsiasi cosa: dai siti web ai contratti legali e agli accordi con i clienti, fino alle e-mail, ai testi di marketing e alle diapositive PowerPoint.

Secondo Pitchbook, nel gennaio 2023 la startup con sede a Colonia (Germania) ha raccolto circa 100 milioni di dollari di finanziamenti da società di venture capital globali, tra cui Institutional Venture Partners (Ivp), Atomico e Bessemer Venture Partners, con una valutazione di 1 miliardo di dollari. Tuttavia, Kutylowski non ha dichiarato il finanziamento totale che la sua azienda ha raccolto fino a oggi.

L’accuratezza della traduzione

DeepL è stato scaricato finora su 25 milioni di dispositivi: una miseria rispetto a quelle di Google Transiate, che superano il miliardo. Ma chi lo ha usato ne loda l’accuratezza. Nina Gafni, traduttrice professionista con sede a Washington, Dc, che in precedenza ha lavorato per il Federal Bureau of Investigations come linguista e traduttrice, usa DeepL per tradurre francese, tedesco e italiano in inglese.

Secondo l’autrice, se i sistemi di apprendimento automatico non sono mai del tutto perfetti nelle loro traduzioni, quelle di DeepL sono più precise e ricche di sfumature culturali rispetto alla maggior parte delle altre. “A volte le traduzioni automatiche possono essere troppo letterali e questo è un grosso problema”, ha detto Gafni. “Se mi trovo in una situazione difficile, sento di poter contare molto più su DeepL che su Google Translate”.

Come viene addestrato DeepL

Ciò è dovuto probabilmente alla calibrazione umana apportata alla massa di sottotitoli di film, traduzioni di libri, brevetti e conversazioni di forum utilizzati per addestrare DeepL.

Akiko Taguchi, una madrelingua giapponese che lavora per DeepL, ha raccontato a Forbes che passa la maggior parte del suo tempo ad assicurarsi che le traduzioni siano corrette nel loro contesto e che suonino come qualcosa che un essere umano potrebbe dire. “Ho dato alla macchina il mio feedback quando confondeva le formalità usate nella scrittura giapponese”, ha detto Taguchi. “Da allora è migliorata in modo significativo”.

DeepL, nato da uno strumento di traduzione del motore di ricerca Linguee, permette agli utenti di tradurre documenti come Pdf, Word e PowerPoint mantenendo intatta la formattazione. Suggerisce traduzioni alternative e modifiche tonali, oltre a consentire di creare un dizionario personalizzato per specificare come devono essere tradotte determinate parole.

Un passo avanti

Dottore di ricerca in informatica, Kutylowski ha sviluppato la tecnologia di apprendimento automatico alla base di DeepL nel 2016, nello stesso periodo in cui i ricercatori di Google stavano lavorando a Transformers, la svolta tecnologica basata sulle traduzioni che alimenta ChatGpt.

Al momento DeepL non utilizza né Transformers, né modelli linguistici di grandi dimensioni per la traduzione, ha dichiarato Kutylowski, rifiutandosi di specificare l’esatta architettura di DeepL. “Sapevamo che le reti neurali avrebbero dominato questo campo molto presto”, ha detto Kutylowski. “Eravamo convinti che tutto ciò che veniva usato prima per tradurre, come i metodi statistici, non avrebbe avuto alcuna applicazione in futuro”.

Secondo Karthik Ramakrishnan, partner di Ivp, che ha guidato il round di investimento di 100 milioni di dollari della serie B di DeepL a gennaio, questa previsione si sta rivelando corretta. Il mercato globale dei servizi di traduzione ammonta a 27,9 miliardi di dollari e non è ancora stato sfruttato a dovere. “La stragrande maggioranza delle traduzioni è ancora molto manuale, con un flusso di lavoro obsoleto”, ha detto Ramakrishnan. “Le persone assumono fornitori esterni di servizi linguistici che impiegano giorni, o addirittura settimane, per tradurre i contenuti”.

I concorrenti di DeepL

Con i suoi riconoscimenti e la sua valutazione di 1 miliardo di dollari, DeepL è in una buona posizione per sfruttare il mercato a cui Ramakrishnan ha puntato. Lo stesso, però, vale per altri. Anche se il suo strumento di traduzione può non essere preciso come quello di DeepL, Google Translate supporta 130 lingue ed è sostenuto da un colosso che investe da decenni nell’intelligenza artificiale.

Un altro grande concorrente tecnologico è Microsoft Translator, che supporta più di 100 lingue e dialetti e ha grandi clienti aziendali, come il gruppo Volkswagen. Nel frattempo, ChatGpt – il bot che ha probabilmente fatto conoscere l’Ia alle masse – è attualmente in grado di tradurre in 50 lingue (ma presenta una serie di problemi di traduzione, come la traduzione errata del gergo colloquiale).La situazione migliorerà solo grazie alla continua evoluzione dei grandi modelli linguistici (large language models, llm)  della società madre, OpenAi, leader del mercato dell’intelligenza artificiale.

DeepL non ha un proprio llm. Non ancora, almeno. Kutylowski ha dichiarato a Forbes che intende costruirne uno internamente e combinarlo con il suo attuale modello di traduzione più piccolo per ottenere risultati migliori. Per questo l’azienda sta aumentando le sue risorse di calcolo per l’addestramento dei modelli di Ia, utilizzando il centro dati di Nvidia dedicato a questa tecnologia, in Svezia. “L’Ia generativa è un’opportunità enorme. Ci permetterà di costruire funzioni in cima alla traduzione, in cui il traduttore diventerà più interattivo o dialogherà di più con l’utente”.

© RIPRODUZIONE RISERVATA

Per altri contenuti iscriviti alla newsletter di Forbes.it CLICCANDO QUI .

Forbes.it è anche su WhatsApp: puoi iscriverti al canale CLICCANDO QUI .