B y: Fiorenza Mileto
Negli ultimi anni la traduzione automatica si sta diffondendo nel mercato della traduzione con la promessa di ridurre tempi e costi, senza ridurre in alcun modo gli standard qualitativi del prodotto finale. È davvero possibile? Col tempo, grazie anche al contributo di competenze altamente specializzate e a una più stretta collaborazione tra linguisti e ingegneri.
Contrariamente a quanto potrebbe fare pensare il concetto di traduzione automatica (machine translation, MT), infatti, non si tratta di un’attività automatizzata che richiede un intervento minimo da parte del traduttore, tutt’altro!
Prima di tutto, è importante comprendere che si tratta di un’attività completamente nuova, che non va confusa né con la traduzione, né tantomeno con la revisione, e che come tale richiede una preparazione e una formazione ad hoc: paradossalmente, per poter utilizzare al meglio la traduzione automatica bisogna essere molto specializzati nell’argomento che si sta traducendo, bisogna disporre di buone competenze tecnologiche che consentano di “collaborare” con la macchina per ottimizzare il lavoro di entrambi e, soprattutto, sono necessarie ottima conoscenza della lingua italiana e solidissime basi di grammatica italiana. Nei progetti di traduzione svolti con programmi di MT, al post-editor sono richieste non solo competenze classiche di traduzione, ma anche competenze di linguista puro: la conoscenza approfondita delle strutture grammaticali è fondamentale per riuscire a “editare” il prodotto della MT senza essere indotti in errori banali e agire in modo tale da consentire alla macchina di “imparare”. Inoltre, per poter suggerire al linguista che si occupa dell’ottimizzazione e della personalizzazione della MT le correzioni migliori da apportare, bisogna essere molto precisi e competenti.
È importante tenere presente che la traduzione automatica può essere eseguita a diversi livelli:
• gisting: una traduzione approssimativa generata tramite le funzioni di base della MT senza alcun intervento umano, utilizzata generalmente per le e-mail e per la messaggistica istantanea, per avere un’idea generale del contenuto;
• FAUT (Fully Automated Useful Translation): una traduzione generata da motori di MT personalizzati grazie all’intervento di linguisti, ma la traduzione viene utilizzata direttamente senza ulteriore rielaborazione;
• post-editing: una traduzione che richiede l’intervento di linguisti sia durante la personalizzazione dei motori di MT con cui viene generata sia durante la fase di post-editing per garantire una traduzione di elevata qualità.
Pertanto la traduzione automatica non è soltanto quella a cui si può accedere utilizzando i vari programmi disponibili gratuitamente sulla rete o la realizzazione di singole traduzioni che si possono eseguire una tantum su argomenti non particolarmente specialistici e su cui non si lavora con continuità, ma può anche essere applicata a progetti che prevedo un ciclo di vita lungo e complesso in cui si utilizzano programmi che prevedono un workflow più articolato e un numero di attività collaterali (ad esempio, aggiornamento dei dizionari, ottimizzazione degli algoritmi linguistici, training del sistema) superiori rispetto alla traduzione assistita.
Un progetto di traduzione realizzato con traduzione automatica prevede diverse fasi:
• valutazione iniziale: è necessario verificare che il materiale del cliente sia adatto ad essere elaborato con la machine translation in base a determinati criteri quali: volumi (devono essere sufficientemente elevati per giustificare l’investimento iniziale necessario); disponibilità dei dati (se il cliente non dispone di materiale bilingue e non ha mai tradotto il suo materiale prima, potrebbe non essere idoneo per questo metodo); tipo di contenuto (la MT è indicata per documentazione tecnica e guide; testi molto creativi, legali o di tipo marketing non sono idicati); formattazione e formati dei file; terminologia (deve essere coerente, anche nel testo di partenza, altrimenti sia la traduzione automatica rule based che quella statistica potrebbero avere grossi problemi e richiedere un maggior impegno nella fase di post-editing o di adeguamento del dizionario); stile e sintassi (il testo di partenza deve essere scritto bene, senza errori di grammatica, errori ortografici o di punteggiatura); tempistica.
• SMT o RBMT: una volta analizzato il materiale, bisogna scegliere il sistema di MT migliore: statistical machine translation (SMT) o rule-based machine translation (RBMT).
- Nel caso della SMT, il motore si basa su un ampio corpus di termini che derivano da varie fonti attendibili dal quale si produce un output di base che poi viene personalizzato utilizzando un corpus specifico e i requisiti del cliente: questo si chiama training del motore e viene effettuato per ogni singola lingua, poiché per ottenere risultati ottimali il corpus deve essere bilingue e piuttosto consistente (in genere si utilizzano le memorie di traduzione del cliente). Dal momento che non vengono utilizzati dati di tipo sintattico o lessicale, migliore è il corpus, migliore sarà la qualità dell’output. Per questo motivo è fondamentale il ruolo del linguista responsabile della pulizia della memoria e della personalizzazione del motore: è necessario garantire dati che siano coerenti da un punto di vista terminologico e stilistico. Dopo la fase iniziale eseguita da un linguista, il training continuerà ad essere eseguito periodicamente in fasi successive sfruttando il materiale prodotto nella fase di post-editing, solo quando si sarà raggiunta una quantità sufficiente di dati per alimentare il sistema statistico (milioni di parole, quindi non dopo ogni singolo progetto di traduzione di dimensioni ridotte).
- Nel caso della RBMT, il sistema si basa su una serie di regole grammaticali per ogni lingua in combinazione con un core dictionary di base che contiene informazioni grammaticali dettagliate sui termini source e target. Il testo viene analizzato in base a queste regole. In questo caso, l’aggiunta di termini e regole grammaticali per personalizzare il sistema si definisce codifica. In questo sistema, è fondamentale la manutenzione del dizionario e il feedback linguistico che il post-editor fornisce sui singoli termini restituiti dalla MT.
La traduzione automatica è progredita moltissimo negli ultimi 4 o 5 anni, è stata integrata con la traduzione assistita, associa la corrispondenza di tipo statistico agli algoritmi linguistici e si prepara a cambiare il modo di ‘vendere’ e di ‘fare’ traduzione, sia per gli LSP che per i singoli vendor.
Il mercato ha già affrontato l’esperienza dell’introduzione dei CAT tool, che sembrava dovessero annientare la figura del traduttore classico per sostituirla con quella di “linguista-ombra traduci-stringhe”. In realtà non è stato così: dopo le prime difficoltà legate principalmente alle competenze tecnologiche necessarie, ai costi (in termini di tempo e denaro) e alla remunerazione, è stato proprio il feedback dei protagonisti del mercato (i traduttori stessi) a indirizzare i produttori di software nella creazione dei programmi, tanto è vero che oggi la maggior parte delle software house crea gruppi di beta tester volontari che fanno da filtro e consulenti per lo sviluppo e l’ottimizzazione dei programmi.
La consapevolezza e la preparazione dei traduttori ha svolto un ruolo fondamentale in questo processo di evoluzione: l’introduzione dell’insegnamento della traduzione assistita nei curricula universitari ha accelerato e migliorato il processo. Le memorie di traduzione (opportunamente ripulite, filtrate e preparate per scopi didattici, soprattutto abbinate a progetti di traduzione che assecondano il progressivo apprendimento e approfondimento della materia da parte degli studenti) si sono dimostrate un patrimonio prezioso per aiutare gli studenti ad acquisire non solo terminologia, ma anche a curare lo stile, il registro e soprattutto la coerenza, principalmente nel campo della localizzazione. Un aspetto fondamentale è stato insegnare una nuova metodologia di lavoro agli studenti, un approccio diverso alla traduzione, una visione del lavoro come un progetto in cui il CAT tool non è un semplice editor, ma piuttosto la base su cui ruota la programmazione di tutte le attività legate alla creazione del prodotto finale. La didattica a progetto che con il collega Luigi Muzii abbiamo introdotto nei corsi di traduzione assistita e localizzazione circa sei anni fa, potrebbe rivelarsi vincente anche per la traduzione automatica.
Gli studenti di traduzione in genere hanno solo una formazione di base sull’uso del computer e di Internet, ma non dispongono di nozioni di linguistica computazionale, statistica, programmazione. In genere ci si aspetta da loro esattamente le competenze definite dall’EMT, ovvero che abbiano un’eccellente conoscenza della propria madrelingua e della lingua dalla quale traducono, che sappiano fare ricerche linguistiche, che abbiano nozioni di terminologia e che abbiamo acquisito i concetti di stile, registro, coesione e coerenza del testo. Nei corsi curricolari di traduzione automatica (ad esempio, al Language Technologies Institute della Carnegie Mellon University o alla University of Orleans) si tende a fornire: nozioni di base dei sistemi di traduzione automatica, i problemi ad essi legati e i vari approcci alla traduzione (ad esempio, SMT, Example-based, diretta, Transfer Systems, interlingua, ruled-based e probabilistica); informazioni tecniche sullo sviluppo di questi sistemi. Una volta acquisite queste nozioni, si procede all’analisi dei principali problemi derivanti dall’uso di tali strumenti e alle possibili strategie di risoluzione, non senza prima aver eseguito un’analisi sulla produttività.
Per quanto riguarda l’approccio traduttivo, invece, sono principalmente due:
• l’analisi contrastiva bilingue (e spesso si usa anche la traduzione automatica come esercizio per imparare a rilevare in revisione i principali errori grammaticali e di traduzione)
• l’analisi monolingua di un cosiddetto “testo di partenza” prodotto dalla macchina che viene modificato in base a dei materiali collaterali disponibili per la traduzione, quali memorie, termbase e guide di stile.
Fino a poco tempo fa la tendenza principale era “riscrivere” completamente il testo di arrivo, dal momento che la traduzione automatica non era altro che una accozzaglia di parole tradotte, talvolta corrette, talvolta totalmente senza senso e senza struttura; ma in seguito agli ulteriori sviluppi tecnologici degli strumenti di traduzione automatica, adesso l’approccio traduttivo tende più verso la creazione di un testo che sia corretto da un punto di vista grammaticale e terminologico, ma il cui stile si può definire “accettabile e comprensibile”. Da qui nasce il concetto di publishable quality, il nuovo standard qualitativo che si sta imponendo insieme ai nuovi sistemi di traduzione automatica e alla necessità di “fare il training” della macchina, affinché possa migliorare le proprie performance. In base a questa nuova tendenza, si tenta di ottenere un testo che rispecchi l’inglese, che sia grammaticalmente e formalmente corretto, che rispetti le indicazioni e le istruzioni dei clienti, in cui lo stile e la forma siano accettabili ma non necessariamente eccelsi.
Il nuovo approccio all’insegnamento deve impartire non solo informazioni di carattere teorico come nozioni di base di linguistica computazionale, linguistica dei corpora e terminologia, ma deve anche tenere presente lo stretto legame che si crea tra il post-editor e la macchina, un legame che definirei reciproco, nel quale ognuno impara a parlare la lingua dell’altro. Il post-editor deve adattare il proprio stile agli algoritmi e alla struttura grammaticale della frase costruita dalla macchina in modo che questa possa riconoscerla e migliorarla. Se il linguista ignora l’output della MT e riscrive completamente la frase (over-editing) oppure non corregge opportunamente il testo prodotto dalla MT lasciando errori grammaticali e terminologici (under-editing), non sarà possibile migliorare il processo di MT e aumentare produttività e qualità. I migliori risultati del post-editing si ottengono non solo quando il traduttore è molto competente dell’argomento e riesce a valutare correttamente quali parti della MT possono essere opportunamente utilizzate e come/quanto modificare la parte restante, ma anche quando il traduttore sa esattamente quali problemi aspettarsi (generati dalla MT o dovuti alla tipologia di progetto) e, soprattutto, come intervenire. È necessario che gli studenti comprendano il funzionamento del sistema di traduzione automatica per trovare il giusto compromesso tra la riscrittura completa della frase e l’incondizionata fiducia nel testo di partenza fornito dalla macchina. Maggiore sarà la coerenza e l’uniformità della traduzione che viene alimentata nel sistema, migliori saranno i risultati. Il processo di alimentazione del sistema di traduzione automatica, inoltre, richiede l’utilizzo di traduttori molto esperti nell’argomento che si sta trattando, perché la possibilità di errori terminologici, traduttivi e di incoerenza è duplicata nei sistemi di traduzione automatica, anche se l’uso contemporaneo delle memorie di traduzione e dei sistemi di gestione terminologia può limitare questo problema.
Questo principio non solo contrasta con l’idea generale che la traduzione automatica faccia risparmiare perché consente di utilizzare risorse linguisticamente meno preparate (il che richiedere in fase successiva una “pesante” revisione che spesso non viene ammortizzata dal risparmio in fase di traduzione), ma anche con il timore diffuso che la traduzione automatica ridurrà le competenze richieste agli studenti di traduzione che potranno risparmiare tempo e fatica servendosi di questi sistemi. Nei sistemi di MT che richiedono un workflow complesso come quello appena descritto (statistici, a regole o ibridi) sono necessari competenza linguistica, profonda conoscenza della grammatica e della terminologia, ottime capacità di valutazione della qualità per poter arricchire il motore di MT e ottimizzare qualità e tempi. Gli eventuali errori introdotti in fase di post-editing riducono considerevolmente la qualità dell’output e sono molto più difficili da correggere dal momento che i passaggi per il training della macchina sono più complessi di quelli dalla traduzione assistita.
La capacità di saper creare un testo coerente e di buona qualità a partire da un testo “preparato” con traduzione automatica, richiede esattamente le stesse competenze necessarie per lo svolgimento di una traduzione tradizionale, oltre ad abilità tecniche aggiuntive e profonda conoscenza dell’argomento. Torna a porsi la stessa questione che si impose con l’introduzione dei CAT tool e della revisione dei match al 100%: ci vuole un buon traduttore per saper sfruttare bene il materiale preesistente, ripulendolo dagli errori senza stravolgerlo eccessivamente in modo che sia riutilizzabile anche in contesti leggermente diversi. È fondamentale che nell’approccio al post-editing, chi lo insegna, chi lo studia e chi lo propone ai clienti e ai traduttori, tenga conto dello svolgimento del progetto nella sua interezza e per tutto il ciclo di vita del progetto stesso, lavorando in prospettiva e non sul singolo task, nella consapevolezza che la curva di apprendimento è molto sfavorevole all’inizio e che soprattutto i guadagni non sono immediati, come si potrebbe pensare, ma richiedono uno sforzo quasi pari a quello richiesto per la traduzione assistita.
Se è vero che sul traduttore si sta allungando l’ombra del post-editor, è anche vero che così come accade per i CAT tool, la figura professionale del traduttore è destinata ad evolversi e ad arricchirsi di nuove competenze e potenzialità che si baseranno in ogni caso su conoscenze tradizionali utilizzate in modo diverso.
Bibliografia
Autodesk. 2011. “Machine Translation at Autodesk”.
Belham, Judith. 2001. “Transferable skills in an MT course”, MT Summit VIII Workshop on Teaching Machine translation, Santiago de Compostela.
Belam, Judith. 2003. “’Buying up to falling down’; a deductive approach to teaching post-editing”. Paper presented to the MT Summit IX, New Orleans. www.dlsi.ua.es/es/t4/belam.pdf
Bowker, Lynne. 2005. “Productivity vs. Quality? A pilot study on the impact of translation memory systems”. Localisation Focus 4:1. 13‐20.
EMT Expert Group. 2009. “Competences for professional translators, experts in multilingual and multimedia communication”.
García, Ignacio. 2010. “Is Machine Translation Ready Yet?” Target 22 (1): 7‐21.
Guerberof, Ana. 2009. “Productivity and Quality in the Post–‐editing of Outputs from Translation Memories and Machine Translation.” Localisation Focus 7(1): 11‐21
Kenny, Dorothy and Andy Way. 2001. “Teaching Machine Translation & Translation Technology: A Contrastive Study”. Machine Translation Summit VII, Teaching MT Workshop, Santiago de Compostela. http://www.dlsi.ua.es/tmt/proceedings.html.
Lee, Jason, and Posen Liao. 2011. “A Comparative Study of Human Translation and Machine Translation with Post–‐editing”. Compilation and Translation Review 4(2): 105‐149.
Mileto F. & Muzii L., Traduzione assistita e localizzazione. Didattica a progetto, in Cavagnoli S., Di Giovanni E., Merlini R. (eds.) “La ricerca nella comunicazione interlinguistica. Modelli teorici e metodologici”, Milano, Franco Angeli, 2009
O’Brien, Sharon. 2002. “Teaching Post-editing, a proposal for course content”. Paper presented to the 6th International Workshop of the European Association for Machine Translation, Manchester, UK
O’Brien, Sharon. 2007. “An Empirical Investigation of Temporal and Technical Post-Editing Effort.” Translation And Interpreting Studies, II, I
Plitt, Mirko, and François Masselot. 2010. “A Productivity Test of Statistical Machine Translation. Post‐Editing in a Typical Localisation Context”. The Prague Bulletin of Mathematical Linguistics 93 ufal.mff.cuni.cz/pbml/93/art-plitt-masselot.pdf
Pym, Anthony. 2011. “What technology does to translating”. Translation & Interpreting 3(1): 1‐9. http://www.trans–‐int.org/index.php/transint
Yuste Rodrigo, Elia. 2001. “Making MT commonplace in translation training curricula ‐ too many misconceptions, so much potential”. Paper presented to the Machine Translation Summit VII, Teaching MT Workshop, Santiago de Compostela.


