Posts Tagged ‘traduzione’

Raccontare una rivolta: lingua russa e alfabeto latino in Kazakistan

venerdì, Gennaio 28th, 2022

Gli avvenimenti del gennaio 2022 sono stati per qualcuno la prima volta che si sentiva parlare del Kazakistan in termini diversi da Borat o dall’Unione Sovietica. Nel giro di un paio di settimane il mondo ha realizzato che l’Asia Centrale non è un’entità monolitica allineata agli interessi della Russia, ma che al contrario in ogni stato si muove un complesso panorama sociale. Questo complesso panorama sociale è il motivo per cui ancora oggi è complicato affermare con certezza quale fosse la composizione di piazza delle rivolte kazake.

Ho letto parecchie buone analisi politiche sul Kazakistan (qui una di Yurii Colombo e qui la registrazione di un dibattito sul futuro del paese con Maria Chiara Franceschelli e Paolo Sorbello), ma nessuna conteneva alcun accenno alla situazione linguistica del paese. Questo silenzio mi è sembrato abbastanza stupefacente per due motivi. Il primo è legato a una questione di origine e interpretazione delle fonti. Il secondo ha a che vedere con lo specifico ruolo che la lingua kazaka, e in particolare il suo alfabeto, gioca nello scacchiere politico dell’area.

A beneficio di chi non si occupa di linguistica centro asiatica a tempo pieno, facciamo un riassunto della composizione del paese. Secondo gli ultimi dati (censimento del 2021), in Kazakistan vivono circa 18 milioni di persone, di cui il 70% circa si considera di etnia kazaka, il 20% di etnia russa, e il rimanente 10% è composto in prevalenza da persone provenienti da altri stati dell’Asia Centrale e del Caucaso. Nel 1997 una legge ha identificato russo e kazako come lingue ufficiali del paese. Se non consideriamo la possibilità che chi risponde al censimento possa non parlare né russo né kazako, nel 2007 il 26% della popolazione parlava russo, il 16% kazako, e il 58% era bilingue. Prendete questi dati con le pinze: chi ha mai lavorato con dei censimenti sa che questi sono spesso inaffidabili. Nel caso specifico della lingua, spesso non è chiaro come venga interpretata la competenza da chi compila e da chi risponde. Pensateci in questi termini: se domani vi chiedessero di indicare su un questionario statale se parlate inglese, senza darvi ulteriori informazioni, come rispondereste? Magari avete una laurea in lingua straniere e vi è stato ripetuto per anni che se non avete un livello C2 in una certificazione ufficiale allora non parlate davvero una lingua. Magari avete genitore 1 che vi parla in inglese giamaicano e voi capite tutto ma non sapete rispondere. Tirare la linea tra cosa conti come competenza linguistica e cosa no è una questione spinosa che non può prescindere da preferenze e identità individuali. Ad aggiungere ulteriore confusione c’è il fatto che le sezioni linguistiche dei censimenti sovietici (e degli stati eredi) sono state completamente ristrutturate nel tempo, e quindi i dati storici non sono esattamente comprabili a quelli odierni.

Nel 2007 l’ex presidente Nazarbayev ha dato l’avvio a una politica di trilinguismo che punta a rendere ugualmente competente in kazako, russo e inglese ogni persona educata nel sistema scolastico del paese. A 15 anni di distanza è probabile che questa politica abbia contribuito a un cambiamento delle percentuali riportate sopra. Nel 2023 il paese smetterà di utilizzare l’alfabeto cirillico e adotterà l’alfabeto latino.

Il russo come unica fonte?

Riguardo al primo punto, voglio dare il seguente caveat: questo è un blog di linguistica e capita che io mi occupi di Asia Centrale e che parli kazako. Chi ha coperto gli sviluppi della questione in tempo reale e ci ha costruito delle analisi ha fatto un lavoro incredibile e non è assolutamente mia intenzione sminuire questo lavoro. Penso che questo sia l’unico contesto in cui affrontare il problema della lingua d’origine delle fonti abbia senso. Una volta tolto il cappello da linguista mi rimetto alle analisi geopolitiche di chi ne sa più di me. Se sembra che sto mettendo le mani avanti, beh sì.

Non era necessariamente ovvio a chiunque abbia seguito gli sviluppi e i commenti sulla questione che le notizie pervenute in occidente sono arrivate quasi unicamente tramite il russo. Anche nel caso di media o attivisti kazaki, abbiamo unicamente avuto accesso al materiale prodotto o tradotto in questa lingua. Questo approccio nasce da una rappresentazione abbastanza monolitica delle culture centro asiatiche, a mio avviso abbastanza diffusa nel giornalismo e nell’accademia, ovvero dall’idea che la competenza in russo sia sufficiente ad avere una piena esperienza delle società locali. Questo approccio è storicamente sensato: la quasi totalità della produzione politica e scientifica in Asia Centrale era ed è ancora oggi prodotta in russo.

Se vi interessa monitorare l’evoluzione delle comunicazioni presidenziali sulle manifestazioni, il russo è sufficiente. Ma chiunque lavori con la popolazione kazaka sa che, se è vero che si può tranquillamente vivere nel paese parlando solo russo, è altrettanto vero che il kazako è usato molto e che alcune fasce demografiche lo preferiscono. E a maggior ragione potrebbero preferirlo in un contesto politico di questo tipo (ma ne parleremo dopo). Usare solo notizie in russo, quindi, anche quando prodotte dalla popolazione kazaka, significa scegliere di focalizzare la propria attenzione su una certa fetta demografica a scapito di altre. Questa decisione non è necessariamente un problema, e produrre un’analisi significa innanzitutto prendere una posizione. Nel caso in questione però sembra che spesso questa posizione fosse obbligata dalla mancanza di competenza in kazako e neache oggetto di critica.

La forza di un alfabeto

La questione della lingua in cui escono le notizie dal paese è relativamente banale per chi sta in occidente. Si potrebbe dire che va bene non stiamo rappresentando propriamente tutte le sfaccettature della società locale, ma comunque meglio che niente. E poi queste restrizioni sono sempre vere per chi fa giornalismo anche in relazione a paesi dove si usano lingue più studiate del kazako. Vero, ma sulla lingua kazaka negli ultimi anni si sta giocando un’importante partita politica e gli avvenimenti di gennaio 2022 hanno rinforzato questa impressione.

L’esempio più lampante del discorso politico sulla lingua kazaka arriva da Margarita Simonyan, capo redattore di Russia Today, un canale televisivo russo in lingua inglese finanziato dal Cremlino. A seguito della richiesta da parte del governo kazako di inviare le truppe dell’Organizzazione del trattato di sicurezza collettiva nel paese, Simonyan sui social un post dove elenca una serie di richieste da fare al Kazakistan come condizione per l’appoggio militare russo.

Le condizioni indicate qui sono il riconoscimento della Crimea come legittimamente parte della Russia (1), il ritorno del cirillico (2), l’ufficializzazione del russo come lingua di stato del Kazakistan (3), e la preservazione di un particolare tipo di istituzione educativa di lingua e ordinamento russi (4). Seguono altri post e rivendicazioni che non ho riportato. Per chi non si occupa di Asia centrale, il punto 2 potrebbe sembrare irrilevante, soprattutto a fronte degli sviluppi nel paese. Tuttavia, la lingua ha storicamente avuto un ruolo fondamentale nella costruzione delle entità nazionali, e la scelta di un sistema di scrittura contribuisce alla demarcazione ideologica di chi sta dentro o fuori la nazione.

In modo simile a quello dei paesi vicini, il kazako è stato scritto in caratteri arabi fino al 1929, quando il governo sovietico ha deciso di sostituire all’alfabeto arabo un alfabeto su base latina. Sulla campagna di latinizzazione degli alfabeti tradizionali delle lingue dell’Unione Sovietica ci si dovrà occupare in un altro post, ma basti sapere che nel caso delle popolazioni islamiche dell’Asia Centrale l’obiettivo del governo è quello di rompere la relazione culturale che le lega al mondo arabo. Questo viene fatto per evitare che l’Islam venga opposto ideologicamente al comunismo, dato che un sincretismo ideologico formalizzato di queste due posizioni arriverà solo con Ali Shariati dopo il ’60. Nel 1940, per fermare le rivendicazioni panturche, i sovietici cambiano ancora una volta il sistema di scrittura dell’area passando definitivamente al cirillico. Cambiare alfabeto di fatto toglie una piattaforma comunicativa ai gruppi intellettuali del paese e li isola dal resto della popolazione.

Nel 2007 l’ex presidente Nazarbayev annuncia la decisione di cambiare nuovamente l’alfabeto per tornare al latino. Questa nuove versione dell’alfabeto non è la stessa che era in uso nel 1929. A fine 2021 è stata identificata la versione definitiva che entrerà in vigore dal 2023. Nel discorso alla nazione, Nazarbayev cita a sostegno della decisione la necessità di aprire il Kazakistan alla globalizzazione: l’utilizzo di una scrittura latina faciliterà il collegamento del Paese con l’estero e l’accesso a internet. Viene anche suggerito che utilizzare un alfabeto latino incoraggerebbe l’apprendimento del kazako come lingua seconda all’estero. Saranno inoltre facilitati gli investimenti nel paese. Tutti questi argomenti, ovviamente, sono veri solo nel caso delle lingue scritte su base latina, perchè se la vostra lingua madre fosse scritta in alfabeto cirillico non avreste problemi col kazako contemporaneo. Insomma è chiaro che quando Nazarbayev parla di estero ha in mente solo alcuni interlocutori internazionali, e la lingua diventa un riferimento a questi paesi e alla loro posizione sul palcoscenico internazionale.

Il post di Margarita Simonyan ci dimostra che in Russia una certa parte della scena politica è ben consapevole del significato di questa riforma ortografica: eliminare il cirillico significa dare un colpo alla potenza culturale russa nell’area. Attenzione però a non semplificare la questione sui binari delle politiche governative. Una parte della popolazione kazaka si identifica come culturalmente e linguisticamente russa o slava: per queste persone il passaggio al latino significa una diminuzione del loro ruolo nella costruzione culturale del proprio paese. La popolazione più anziana, che è stata educata nel sistema sovietico, teme di incontrare problemi nel processo di rialfabetizzazione. Una certa parte della popolazione kazaka, inoltre, non vede necessariamente come un vantaggio l’idea di essere in maggior contatto con l’occidente, dal momento che la Cina ha grossi legami commerciali col paese. Insomma, come spesso accade in questioni di lingue nazionali, la situazione è meno chiara di quello che la politica ci vuole far credere.

OmegaT: uno strumento open-source per la traduzione assistita

giovedì, Luglio 12th, 2018
If you have a natural aversion to reading instructions, and your approach to new software is to click on every button you see until something resembling the desired effect occurs, then OmegaT is probably not suitable for you.

 

Anche per quest’anno si è concluso l’hackmeeting, l’incontro delle controculture digitali italiane, una tre giorni di condivisione critica di saperi, autogestione e riflessione collettiva sulle tecnologie che utilizziamo quotidianamente (qui una carrellata dei seminari presentati quest’anno). Tra i talk di quest’anno, anche il mio dedicato a uno strumento utile a chi si trova a tradurre documenti di testo medio-lunghi o documenti brevi ma simili tra loro (ad esempio volantini).

OmegaT è un software open-source per la traduzione assistita da computer (CAT). La traduzione assistita è un sistema nel quale un traduttore umano utilizza un programma per automatizzare il processo traduttivo. Non va confusa con la traduzione automatica (machine translation), che è invece il servizio che offrono Google Traduttore o Deep L.

Se imparare a usare un CAT può sembrare complesso o inutile, è importante invece considerare che questo tipo di strumenti hanno svariati vantaggi che rendono il loro uso ideale anche per chi non si occupa di traduzione a livello lavorativo. Un buon CAT infatti

  1. automatizza il processo di traduzione, lasciando la possibilità di concentrarsi sui compiti più difficili;
  2. mantiene in memoria le scelte traduttive, garantendo la coerenza tra testi diversi o all’interno dello stesso testo;
  3. permette di collaborare alla traduzione di un testo;
  4. restituisce il testo tradotto in un documento che mantiene la formattazione dell’originale.

 

OmegaT è uno strumento abbastanza intuitivo, ma richiede comunque un minimo di buona volontà nel leggersi le istruzioni: il tempo che impiegate ad imparare come usare questo software è tempo che recupererete al momento di tradurre. Se state valutando di usare uno di questi strumenti, ma OmegaT non vi convince, vorrete riconsiderare il vostro rapporto con i software proprietari. Ad ogni modo ricordatevi che un buon CAT dovrebbe avere almeno queste componenti:

  • una memoria di traduzione (TM) che possa essere esportata ed importata per nuovi progetti. La TM è un database che mantiene in memoria un segmento e la sua traduzione. Questi elementi vengono salvati in coppia e vengono riproposti dal programma ogni volta che il testo di partenza presenta una combinazione di parole identica o simile a quella tradotta precedentemente. Una memoria di traduzione ricca permette di ridurre notevolmente i tempi di traduzione perché permette di riutilizzare scelte effettuate in precedenza.
  • un glossario che possa essere modificato dall’utente e riciclato per altri progetti. Un glossario è una lista di termini con corrispondente traduzione che viene compilata dal traduttore o dall’autore del testo di partenza (o dal cliente se state effettuando una traduzione per lavoro). Una buona pratica per tradurre documenti politici è quella di salvarsi in un glossario le specifiche traduzioni di ogni concetto o gruppo politico e riciclare queste traduzioni in tutti i testi successivi per mantenere la coerenza nel corso del tempo.
  • diversi dizionari che vi vengano in soccorso quando non trovate le parole giuste per l’occasione.
  • la capacità di fare desktop publishing, ovvero mantenere la formattazione del documento di partenza in quello di arrivo, così da risparmiarvi l’onere di dover riformattare tutto una volta finita la traduzione.

 


Tradurre in 5 minuti

(Qui la presentazione utilizzata per il seminario con le schermate del programma. Qui un articolo che ho tradotto con OmegaT.)

Per prima cosa volete installare un dizionario e attivare la funzione di correzione ortografica (di default non attivi su OmegaT). Per fare questo seguite il percorso Opzioni > Preferenze > Correttore ortografico. Selezionando Installa nuovo dizionario il programma vi permetterà di scegliere tra i dizionari in dotazione per ogni lingua (dovete installare un dizionario per ogni lingua verso cui traducete). Cliccando su Controlla automaticamente l’ortografia il programma controllerà le vostre traduzioni man mano che lavorate.

 

Per avviare un nuovo progetto su OmegaT, basterà selezionare Progetto > Nuovo.

 

Una volta aperto un nuovo progetto, vi si presenterà una schermata che vi chiede di salvare il vostro progetto in una cartella. Questo passaggio è fondamentale, dal momento che in OmegaT ogni progetto è costituito da una serie di cartelle contenenti statistiche, glossari e TM, oltre al documento con la traduzione, a cui il programma avrà bisogno di accedere nel corso del lavoro. Prestate attenzione a dove salvate questa cartella, dal momento che se volete caricare nuovi glossari o TM avrete bisogno di accedervi.

 

A questo punto OmegaT vi chiederà di selezionare i parametri del vostro progetto. Qui vi viene chiesto di selezionare le due lingue con cui state lavorando: la lingua di partenza è la varietà in cui è scritto il testo su cui state lavorando, mentre la lingua di arrivo è la varietà in cui voi state traducendo il testo. Selezionando la casella Abilita la segmentazione a livello di frase permetterete al programma di dividere il testo in tanti segmenti di traduzione quanti sono i periodi del testo (o di spezzare i periodi se questi sono considerati troppo lunghi). Se deselezionate questa opzione, OmegaT tratterà il vostro testo come un unico segmento (o lo spezzerà in paragrafi): questa opzione vanifica l’utilità di avere una memoria di traduzione e dovrebbe essere evitata. L’opzione Propagazione automatica delle traduzioni dovrebbe essere automaticamente settata in un nuovo progetto: questa funzione permette ad OmegaT di tradurre in automatico un segmento se questo è identico al 100% ad un segmento da voi tradotto in precedenza.

 

Una volta selezionati i parametri del vostro progetto, si aprirà una finestra che vi chiederà di caricare i file contenenti il testo che volete tradurre (non tutti i formati sono supportati da OmegaT). Il programma vi permetterà di navigare fino al file desiderato e cliccando su Copia i file nella cartella di partenza, i file verranno inseriti nella corrispondente cartella \source\ del progetto e preparati per la traduzione.

 

A questo punto il vostro file è pronto per la traduzione e questa è la schermata che vi si presenterà. Il segmento in traduzione al momento sarà visualizzato in entrambe le lingue, mentre il testo già tradotto apparirà solo nella lingua di arrivo, e quello da tradurre solo nella lingua di partenza. Mano a mano che continuerete la traduzione, OmegaT vi avviserà di eventuali somiglianze con segmenti precedenti e vi ricorderà come avete tradotto quel segmento (Concordanze parziali – fuzzy). I tag che circondano alcuni dei segmenti sono indicazioni di formattazione e non vanno toccati se volete preservare il formato nel documento di arrivo.

 

Sull’angolo in basso a destra dell’interfaccia di OmegaT potete notare una serie di numeri. Questi sono indicatori sul progresso di traduzione. Il primo numero (7/26) si riferisce al numero di segmenti presenti nel testo: in questo caso sono stati tradotti 8 segmenti su un totale di 26. La seconda proporzione (2/18) si riferisce al numero di segmenti univoci presenti nel testo (segmenti che non si ripetono), mentre il terzo numero riporta nuovamente il numero totale di segmenti presenti nella traduzione (nel caso in cui il progetto sia composto da più di un file questo numero sarebbe costituito dalla somma dei segmenti presenti in ogni file). L’ultimo indicatore (54/29) si riferisce al numero dei caratteri presenti nel segmento nella lingua di partenza e in quella di arrivo: in questo caso il segmento nella prima è lungo 54 caratteri, mentre la traduzione è lunga 29 caratteri. Questa informazione può essere particolarmente utile se avete limiti di spazio da rispettare perché vi permette di regolarvi sulla lunghezza della vostra traduzione senza doverla vedere su carta o schermo.

 

Una volta che avete terminato di tradurre il testo, potete creare il documento di arrivo selezionando Progetto > Crea i documenti di arrivo. A questo punto potrete dedicarvi alla correzione del lavoro. Un buon consiglio è quello di stampare il testo di arrivo e leggere il vostro lavoro su carta (magari lasciando passare qualche ora dalla traduzione) per individuare meglio eventuali errori. Una volta corretto il testo, tuttavia, sarebbe una buona pratica quella di non correggere direttamente il testo nel file di arrivo, ma di tornare in OmegaT, recuperare i segmenti dove vanno implementate le correzioni e generare un nuovo testo di arrivo corretto. In questo modo verrà modificata anche la vostra memoria di traduzione e le modifiche verranno tenute in memoria per traduzioni future.

 


Impostare un progetto condiviso

La funzionalità che ho apprezzato maggiormente in questo programma è la possibilità di lavorare in collaborazione con altri utenti. OmegaT fornisce diverse possibilità per lavorare a un progetto condiviso, la soluzione che si è rivelata più comoda per me è stata quella di creare una repository git condivisa (nel mio caso su Lattuga, un server autogestito) e di darvi accesso alle compagne che stanno collaborando con me. Io ho provato ad avviare un progetto condiviso su Linux e su Windows, e nel primo caso il procedimento è molto più intuitivo e semplice. Se utilizzate Windows o Mac troverete i dettagli su come avviare un progetto condiviso nella documentazione di OmegaT. Se state valutando l’ipotesi di passare a un sistema non proprietario (es. Linux), ma temete che sia più complicato da usare, sappiate che in OmegaT i progetti condivisi creano molti meno problemi che in Windows (dove diverse versioni di OmegaT non sono sempre compatibili tra loro nei progetti condivisi).

Per avviare un progetto condiviso è necessario che una tra le utenti diventi amministratrice del progetto. Il primo passo è creare una nuova repository che ospiterà tutte le cartelle del vostro progetto.

 

A questo punto dovreste trovarvi davanti a questa schermata, che vi darà le indicazioni per inizializzare il vostro progetto e vi fornirà una URL che potrete condividere con tutte le vostre collaboratrici. Quello che avete davanti non è ancora un progetto. Non potete aprire una repository vuota, per cui non appena creata questa cartella condivisa, vi verrà chiesto di eseguire il primo commit. Se non siete pratiche di informatica, sappiate che Lattuga rende questo processo estremamente semplice, perché vi basterà copiare riga per riga il codice con le istruzioni per creare un commit e passarlo nel terminale (Ctrl+Alt+T per aprire il terminale). Potreste dover installare dei pacchetti aggiuntivi per far funzionare il programma, ma tutte le istruzioni vi verranno fornite nel terminale.

 

Al termine del processo, vi troverete davanti una nuova schermata. Questa è la vostra cartella condivisa. In un primo momento conterrà solamente questo file README.md che avete creato seguendo le istruzioni precedenti. Una buona idea è quella di scrivere una descrizione del vostro progetto in questo file, per permettere a chi accederà alla cartella in un secondo momento di orientarsi meglio.

 

Una volta creata, la vostra repository dovrà contenere una serie di file per funzionare correttamente per chiunque si aggiunga come collaboratrice al progetto. Senza questi file il programma non permetterà di scaricare i progetti in collaborazione. Credo ci siano modi più eleganti per questo passaggio, ma il metodo più sicuro per far funzionare il tutto per me è stato creare un progetto in OmegaT sul mio computer (e quindi seguire i passaggi indicati sopra), incollare le cartelle create dal programma nella repository su Lattuga, e cancellare il progetto non condiviso. Per far sì che il programma funzioni dovete includere nella repository condivisa i seguenti file:

  • il file di progetto omegat – omega.project
  • tutti i file contenuti nella cartella /source/ (ovvero i file contenenti i testi da tradurre)

 

A questo punto il vostro progetto condiviso è pronto. Se avete scelto di utilizzare Lattuga, le vostre collaboratrici dovranno creare un proprio account sul server ed essere da voi autorizzate ad avere accesso al progetto. A questo punto sia voi sia le vostre collaboratrici non dovrete fare altro che seguire il percorso Progetto > Scarica il progetto in collaborazione e inserire la URL della vostra repository. OmegaT riconoscerà che state caricando materiale da una cartella Git e vi chiederà nome utente e password per creare una copia locale della repository sul vostro computer.

 

Potete quindi iniziare a tradurre il documento dal vostro computer senza preoccuparvi di altro. OmegaT aggiornerà in automatico ogni 3 minuti circa il vostro progetto, distribuendo le modifiche ai glossari e alla memoria di traduzione a chiunque stia collaborando al progetto.

Se vi interessano altri tutorial, il sito di OmegaT fornisce un’ottima documentazione in diverse lingue, tra cui un tutorial con esercitazioni (in inglese), un breve tutorial con consigli di traduzione (in russo) e un video tutorial (in portoghese brasiliano). La documentazione inoltre vi spiegherà nel dettaglio svariate altre funzioni che non ho toccato in questa breve presentazione, ma che potranno rivelarsi utili (tra tutte la traduzione automatica).