Strumenti utilizzati per facilitare il lavoro di traduzione/aggiornamento

Alcune delle persone che contribuiscono alle traduzione del DDTP hanno creato strumenti con cui è possibile facilitare alcuni aspetti del lavoro di traduzione o di aggiornamento delle traduzioni. Gli script attualmente utilizzati più o meno regolarmente dal gruppo italiano di traduzione di DDTP sono

  1. lo script ricalcola_desc di Davide Prina

    • lo si può scaricare da qui

    • questo script permette di ricaricare automaticamente per la traduzione le descrizioni che erano già tradotte ma sono state modificate e sono da aggiornare. A partire da ottobre 2019 esiste una pagina web che elenca i pacchetti che erano in passato tradotti e sono da aggiornare (vedi più sotto). Lo script scarica inoltre i pacchetti elencati come Required. Important, Standard e Popcon500 nella pagine delle statistiche di sid (vedi sezione sulle Statistiche più avanti). È uno script internazionalizzato e rilasciato con licenza AGPL. Oltre a quanto detto crea anche elenchi dei pacchetti ordinati per lunghezza o pacchetti con possibile traduzione parziale.

  2. una pagina web per visualizzare le descrizioni in sid e cercare descrizioni simili o come sono state tradotte in passato le occorrenze di un dato termine.

    • la pagina permette, tramite un'interfaccia web, di fare ricerche a tutto testo nella traduzione o nell'originale con testo a fronte (l'aggiornamento delle descrizioni è saltuario, altrimenti quelle in corso di revisione scomparirebbero prima di poterle consultare!).
  3. uno script per l'estensione Greasemonkey di Iceweasel/Firefox installabile e aggiornabile direttamente da git e che aggiunge alcuni collegamenti per raggiungere velocemente le pagine Debian con le descrizioni dei pacchetti e altre cose; è possibile leggere il README

  4. una lista delle descrizioni ancora da tradurre con informazioni sul numero di paragrafi e righe tradotti/ancora da tradurre e altro

    • viene creata da uno script Python contribuito da uno dei traduttori del DDTP che permette di creare l'elenco dei pacchetti con descrizione da tradurre visualizzando, per ognuna, se è parzialmente tradotta, le righe e i paragrafi ancora da tradurre, il numero di paragrafi totali, la priorità, il numero della descrizione attiva e altro ancora. Lo scopo è quello di identificare su quali pacchetti indirizzare lo sforzo di traduzione (perché sono già quasi tradotti, perché hanno priorità alta, punteggio popcon alto, ...)
    • la lista creata con questo script viene aggiornata periodicamente (all'incirca una volta alla settimana). La lista creata il 7 luglio 2019 si può scaricare da elenco_ordinato.csv.gz

      • il file CSV creato dallo script contiene le descrizioni in ordine alfabetico; la lista scaricabile qui è stata riordinata in modo da avere i seguenti ordinamenti (applicati in ordine)
        • numero di righe da tradurre, in ordine crescente
        • priorità, in ordine decrescente
        • punteggio popcon
        naturalmente con i comuni programmi che gestiscono fogli di calcolo o data.frame è possibile stabilire l'ordinamento che più si preferisce
    • aprendo la lista con un programma per database tipo Base di Libreoffice, si possono cercare i pacchetti con una data priorità, o precedentemente tradotti e ora
      • non più, oppure aggiunti di recente...

Pagine informative sulla traduzione delle descrizioni

Dal sito del DDTP è possibile recuperare molte informazioni sullo stato delle traduzioni delle descrizioni dei pacchetti, sebbene non sia affatto immediato capire dove e cosa cercare.

Elenco descrizioni da tradurre

Innanzi tutto un elenco completo di tutte le descrizioni presenti in sid e non ancora (completamente) tradotte in italiano è disponibile qui (esistono ovviamente pagine simili per ogni lingua).

Ogni voce è anche un collegamento che porta alla pagina della traduzione italiana di quella descrizione in cui si possono vedere quali e quanti dei paragrafi che la compongono sono già tradotti oltre ad alcune altre informazioni trattate nella sezione seguente.

Elenco descrizioni da ritradurre/aggiornare

A partire da ottobre 2019, un elenco di pacchetti con la descrizione italiana presente in sid come da tradurre e che avevano in passato la descrizione tradotta che va quindi aggiornata è disponibile qui (esistono ovviamente pagine simili per ogni lingua).

Anche in questo caso ogni voce è anche un collegamento che porta alla pagina della traduzione italiana di quella descrizione in cui si possono vedere quali e quanti dei paragrafi che la compongono sono già tradotti; è inoltre possibile seguire il collegamento al diff delle differenze tra la versione originale passata (tradotta) e quella nuova da aggiornare.

Pagine delle descrizioni/pacchetti

In cima alla pagina principale del DDTP si trovano 26 collegamenti, ognuno indicato con una lettera dell'alfabeto, che portano all'elenco di tutti i pacchetti che iniziano con quella lettera. Questi 26 collegamenti si trovano in diverse pagine del DDTP, comprese alcune che verranno descritte più avanti, ed hanno sempre la stessa funzione.

Per rendere più facile capire quali informazioni si possono avere e come, facciamo un esempio reale utilizzando il pacchetto "extremetuxracer".

Pagine dell'elenco dei pacchetti con la stessa lettera iniziale

Per il nostro esempio, seguiamo il collegamento a cui punta la lettera e; ci troviamo in una pagina che elenca tutti i pacchetti che hanno o che hanno avuto una descrizione da tradurre nel sistema. Si vede subito che ci sono molti collegamenti ipertestuali, ma prima di vedere a cosa puntano scorriamo la pagina fino ad arrivare a vedere il pacchetto "extremetuxracer".

Troviamo una sezione che (alla data del 2015-03-01) ha questo aspetto:

extremetuxracer

57133: jessie 2013-08-08...2015-03-01; wheezy 2011-02-12...2015-01-13; lenny 2009-10-02...2011-07-22; etch 2009-10-02...2011-07-22; squeeze 2009-03-27...2014-07-22; sid 2009-03-16...2015-03-01;
45129: lenny 2008-03-05...2011-07-22; etch 2009-10-02...2011-07-22; squeeze 2009-02-16...2009-03-26; sid 2008-02-24...2009-10-02; 

Cosa sono quei numeri? Sono il numero identificativo di una specifica descrizione o forse meglio di una specifica versione di una descrizione.

Ogni pacchetto ha infatti una sua descrizione che però varia nel tempo. Il numero identificativo di una descrizione è slegato dal numero di versione del pacchetto corrispondente. Un pacchetto può cambiare, cambiando il suo numero di versione, e la sua descrizione può rimanere uguale; in questo caso il sistema di traduzione delle descrizioni mantiene lo stesso identificativo per la descrizione. Notare che l'opposto non è mai vero: il cambiamento della descrizione (originale) è di fatto un cambiamento al pacchetto Debian e pertanto comporta, anche se fosse l'unica modifica fatta, un nuovo numero di versione del pacchetto Debian. I cambiamenti alle traduzioni invece non comportano un cambiamento al corrispondente pacchetto Debian perché le traduzioni non sono inserite all'interno dei pacchetti ma gestite in modo centralizzato indipendentemente dai singoli pacchetti.

Ritornando a "extremetuxracer": come si vede è seguito da due voci ognuna con un numero di descrizione seguito dalle date che indicano il periodo per cui tale descrizione è rimasta "attiva" (valida o usata, se si preferisce) per una data distribuzione. Si vede anche che il primo numero (57133) corrisponde alla descrizione attiva al momento della visualizzazione della pagina poiché sia jessie che sid indicano come termine della validità il giorno 2015-03-01 che, come detto, è il giorno in cui è stata scritta questa sezione.

Pagine dei singoli pacchetti

Come detto sia il nome del pacchetto sia i singoli numeri di descrizione sono collegamenti ipertestuali; per il nostro esempio seguiamo il collegamento a cui punta il nome del pacchetto: extremetuxracer.

Nella pagina che otteniamo rivediamo alcuni elementi che abbiamo già visto, come i 26 collegamenti alle iniziali dei pacchetti in cima e le varie versioni delle descrizioni con il loro numero identificativo.

Le informazioni sulle versioni delle descrizioni sono le stesse di quelle visibili nella pagina di tutti i pacchetti con iniziale "e", ma visualizzate in modo di più immediata comprensione. In particolare nella prima parte (alla data del 2015-03-01) ha questo aspetto:

extremetuxracer

Description: 57133
This Description is active
This Description was in jessie from 2013-08-08 to 2015-03-01;
This Description was in wheezy from 2011-02-12 to 2015-01-13;
This Description was in lenny from 2009-10-02 to 2011-07-22;
This Description was in etch from 2009-10-02 to 2011-07-22;
This Description was in squeeze from 2009-03-27 to 2014-07-22;
This Description was in sid from 2009-03-16 to 2015-03-01;

Description: 45129
This Description was in lenny from 2008-03-05 to 2011-07-22;
This Description was in etch from 2009-10-02 to 2011-07-22;
This Description was in squeeze from 2009-02-16 to 2009-03-26;
This Description was in sid from 2008-02-24 to 2009-10-02;

è messo subito in chiaro che la descrizione 57133 è quella attiva ("This Description is active"), senza dover andare a controllare tutte le date.

Notare anche che il sistema tiene traccia di tutte le descrizioni passate (da quando è stato creato il DDTP) e quindi vi sono descrizioni di pacchetti che non sono più in Debian (un esempio è il pacchetto gimp-helpbrowser]. In tale caso nessuna delle descrizioni è indicata come attiva e perciò la loro traduzione è superflua.
Il lavoro di traduzione si concentra sulle descrizioni attive in sid.

Pagine delle singole descrizioni

Per il nostro esempio seguiamo il collegamento alla descrizione 57133 che è quella attiva alla data del 2015-03-01.

Questa pagina contiene ancora una volta molte informazioni e molti collegamenti. Vediamoli in ordine dall'altro verso il basso:

  1. I 26 collegamenti, corrispondenti alle lettere dell'alfabeto, alle pagine con gli elenchi dei pacchetti divisi per iniziale
  2. Il nome del pacchetto
  3. Una riga Source: che indica il pacchetto sorgente in cui è presente la descrizione ed è anche un collegamento alla pagina delle descrizioni dei pacchetto sorgente che vedremo più avanti

  4. Una riga Versions: che indica tutte le versioni del pacchetto che condividono quella descrizione; ciò comprende anche, da quando Debian ha il supporto per Multi-arch, le versioni per le diverse architetture. 1 Una riga Prioritize: che indica la priorità della descrizione all'interno del sistema di traduzione delle descrizioni. Per definire la priorità di una descrzione vengono presi in considerazione vari fattori come ad esempio la priorità del pacchetto corrispondente in Debian ("Required", "Important", "Standard", "Optional"), il tipo di pacchetto (programma, metapacchetto, pacchetto di sviluppo, di debug, di documentazione, ...), in modo da cercare di tradurre per primi i pacchetti per i quali è più probabile che un utente vada a leggere la descrizione.

  5. La sezione Description: che contiene la descrizione in lingua originale, con il "titolo" o più precisamente la descrizione breve seguito da uno o più paragrafi della descrizione separati da righe contenenti un punto.

  6. Una sezione con delle righe che descrivono il periodo di validità di questa specifica versione di descrizione in una determinata distribuzione e che hanno la forma "This Description was in <DISTRIBUZIONE> from <DATA> to <DATA>" ("Questa Descrizione era presente in <DISTRIBUZIONE> da <DATA> a <DATA>").

  7. Una sezione che elenca per tutte le lingue nel sistema se la descrizione è tradotta o meno in tale lingua e con collegamenti alle pagine della traduzione in tale lingua. I collegamenti possibili sono due e hanno la forma:

    • http://ddtp.debian.org/ddt.cgi?desc_id=<ID_DESCR>&getuntrans=<LINGUA> per le traduzioni ancora da completare

    • http://ddtp.debian.org/ddt.cgi?desc_id=<ID_DESCR>&language=<LINGUA> per le traduzioni completate

    dove <ID_DESCR> è il numero identificativo della versione della descrizione e <LINGUA> è la lingua per la quale si desidera vedere la traduzione. In realtà si possono usare entrambi gli URL per le descrizioni sia complete, sia non; al più non viene mostrata la traduzione se non è ancora disponibile. In tali pagine è possibile vedere la descrizione originale insieme alla traduzione attualmente memorizzata nel sistema

  8. Una sezione parts-md5sum. Questa sezione dà informazioni importanti quando si tratta di uniformare le traduzioni in più descrizioni. In particolare elenca le somme di controllo md5 per, in ordine:

    • la descrizione nel suo complesso
    • il titolo o descrizione breve della descrizione
    • ogni paragrafo che compone la descrizione, uno per riga.

    Tranne che per la prima riga (quella della descrizione in generale), ad ogni somma di controllo segue l'elenco delle lingue in cui quel particolare elemento (descrizione breve o paragrafo) è tradotto, seguito, se applicabile, da un elenco di numeri identificativi di descrizione.
    I nomi di lingua sono collegamenti che portano alla traduzione in una data lingua di quella specifica parte permettendo di confrontare facilmente le traduzioni in lingue diverse.
    Particolarmente importante è l'elenco delle descrizioni che condividono un medesimo paragrafo. Nel caso del nostro esempio la sezione "parts-md5sum" (alla data del 2015-03-01) ha questo aspetto:

    parts-md5sum:
    
    84a42aa1d0c4df7398fe25119f378163 pl sk fi cs nl uk ru ja da de it fr     
    724f7e5de488c24576a41e1b85653874 de pl fi cs da uk fr sk ru ja it nl     57134 57135 
    7390fa3a902eb42bea863c8c7a05a8c8 de pl cs fi uk da sk fr ja ru it nl     57135 
    908a04bcd4241958ce9e951edec73af3 de uk cs ja da sk fr ru it fi pl nl     57135 
    ea48726c2919dbd1e65e50de49cec762 de pl fi cs ja da sk fr uk ru it nl     57135 

    e indica che il primo paragrafo è condiviso anche dalle descrizioni con identificativo 57134 e 57135 e, se si seguono i collegamenti a cui puntano tali numeri si vede che esse corrispondono, rispettivamente, alle descrizioni dei pacchetti "extremetuxracer-data" e "extremetuxracer-dbg".
    Queste informazioni sono importantissime quando si tratta di uniformare la traduzione di un determinato paragrafo.

  9. Da ultimo vi è una sezione sulle altre versioni della descrizione di quel pacchetto. Se si sta guardando la descrizione attiva sono di solito le descrizioni passate; oltre a collegamenti alle pagine delle singole versioni è disponibile per ognuna un collegamento patch che punta ad una pagina in cui vengono mostrate le modifiche ("diff") rispetto alla versione della pagina attuale. Le informazioni sulle modifiche sono utili in fase di aggiornamento della traduzione di una descrizione. Il sistema DDTSS comunque mostra automaticamente nella pagina di traduzione tali informazioni, quindi non è necessario andarle a cercare manualmente.

Pagine dei pacchetti sorgenti

<NOME_PACCHETTO_SORGENTE> è appunto il nome del pacchetto sorgente per cui vengono visualizzate le informazioni.

Nel nostro esempio si può raggiungere la pagina delle descrizioni del pacchetto sorgente extremetuxracer seguendo il collegamento nella riga Source: della pagina descritta nel paragrafo precedente.

In questa pagina sono elencate tutti i pacchetti che fanno capo al medesimo pacchetto sorgente. Sono inclusi tutti i pacchetti, sia quelli ancora disponibili sia quelli che non lo sono più. Ad esempio la pagina di extremetuxracer elenca anche il pacchetto "planetpenguin-racer" che è disponibile solo fino a Wheezy ed era già da Squeeze semplicemente un pacchetto di transizione al nuovo nome di pacchetto "extremetuxracer".

A volte può essere interessante guardare tutti i pacchetti che fanno capo ad un medesimo pacchetto sorgente quando si tratta di uniformare le traduzioni. Capita infatti che più descrizioni non condividano un intero paragrafo (la cui traduzione viene automaticamente riconosciuta dal sistema) ma solo parte di esso; in tali casi, purtroppo, è necessario intervenire manualmente se si desidera mantenere una traduzione uniforme. La cosa però non è affatto semplice.

Vedere anche