Les différents formats de fichiers rencontrés en traduction

Voici la liste des formats, spéciaux ou non, que nous avons traduit depuis 2001, de façon occasionnelle pour certains, de façon régulière pour d’autres.

Notre objectif est de référencer les formats que nous avons été amenés à traduire et la méthode que nous avons parfois dû mettre en place pour y parvenir. XLSX, DOCX ou PPTX sont des formats simples pouvant être traduits sans difficulté technique, mais les formats spéciaux sont plus délicats à traiter et demandent une expertise plus ou moins poussée.

Certains formats de fichiers peuvent être traduits à l’aide d’outils de Traduction Assistée par Ordinateur. Lorsque c’est le cas nous l’avons indiqué dans notre explication. Lorsque le format de fichier n’est compatible qu’avec certains outils de TAO spécifiques, nous l’avons également mentionné.

Nous avons volontairement omis d’intégrer dans notre tableau des formats de fichiers en traduction, les outils d’intelligence artificielle et les moteurs de traduction automatique neuronale car, à ce jour, l’IA et les moteurs de traduction automatique ne peuvent pas gérer à eux seuls l’intégralité du processus de traduction professionnelle. Ainsi, Google translate sera en mesure de traduire la plupart des formats de fichiers usuels et même les images figées, mais le résultat ne sera pas directement publiable à des fins professionnelles.

Ce listing est fait pour vous si vous êtes amené(e) à traduire l’un des formats de fichiers ci-dessous. Pour obtenir un devis de traduction, nous vous invitons à toujours fournir, lorsque c’est possible, le fichier dans son format original.


Image

BMP, JPEG ou JPG, PNG, RAW, CRW, GIF, TIFF ou TIF, EPS :

Tous ces formats d’images sont figés, non éditables. C’est-à-dire que les textes sont aplatis et qu’il n’est pas possible de les modifier. Pour traduire ce type de fichiers, en vue de les réutiliser, une fois traduits, il faut obligatoirement passer par une étape intermédiaire consistant à :
• ressaisir les textes dans un fichier au format texte (DOCX, ODT ou équivalent) ou procéder à une reconnaissance de caractères (via un outil de TAO ou une application de type Readiris.)
• traduire les textes ressaisis (via un outil de TAO ou non).
• réintégrer les textes traduits dans les images via Adobe Photoshop ou un logiciel de montage photo.

Adobe Photoshop PSD, PDD, PSDT :

Les outils de TAO les plus performants prennent en charge les formats PSD, PDD et PSDT d’Adobe Photoshop. Mais du point de vue de l’Agence de traduction, le meilleur outil de traduction d’une image Photoshop est … Photoshop lui-même bien que cela requiert une certaine connaissance du logiciel.
Pour les néophytes, la méthode de traitement des images figées (ressaisie de textes, traduction, réintégratioin) fonctionne aussi pour les fichiers Photoshop.
En règle générale, nous n’utilisons pas d’outils de TAO pour traduire les images Photoshop car ce type d’image ne contient pas beaucoup de texte et doit être enregistré dans le format natif. La TAO pouvant générer des problèmes, nous privilégions l’intégration manuelle des textes traduits.

Adobe PDF :

Les fichiers PDF sont soit modifiables soit numérisés. Il y a plusieurs façons de les traduire :
• Traduire directement dans le fichier PDF à l’aide de l’outil « modification des textes » mais cette technique est longue, inconfortable, source d’erreurs et présuppose de disposer de la police de caractère utilisée dans le PDF original. Une technique à ne privilégier que si le volume de texte à traduire est très faible
• Par l’intermédiaire d’une OCR (procédure de reconnaissance de caractères) qui transforme le PDF en fichier texte, mais avec le risque d’une perturbation de la mise en page originale. Certains outils de TAO, tels que Trados, proposent la traduction de fichier PDF après une procédure d’OCR intégrée.
• Ressaisir les textes, les traduire et recomposer la mise en page du fichier via Adobe Indesign ou équivalent.
En règle générale, nous ne travaillons sur les fichiers au format PDF que si le fichier natif à partir duquel le PDF a été exporté n’est pas disponible, ce qui est rarement le cas.

Adobe Illustrator AI :

Traduire un fichier Illustrator présuppose de disposer du logiciel éponyme. La méthode consiste à intégrer directement la traduction dans le fichier de montage.
Lorsque le PDF a été généré sous Illustrator, les textes sont généralement vectorisés. Ils ne peuvent être modifiés et doivent être traités comme des images dont les textes sont figés.

SVG :


Le format de fichier vectoriel SVG (Scalable Vector Graphics) a été spécialement conçu pour la création de dessins optimisés pour le web. Pour traduire un fichier SVG, il faut utiliser un logiciel de TAO comme memoQ ou traiter le SVG comme un fichier Illustrator. Le SVG est éditable et modifiable dans les logiciels Inkscape, OpenOffice ou LibreOffice Draw (qui sont libres et gratuits) ou encore Illustrator.

Texte

RTF, TXT, ODT, DOC, DOCX, ODT, OTT, ODM, ODP, OTP, WPS, DOTX, DOCM, DOTM, WP :

Les fichiers textes sont les plus faciles à traiter. Les logiciels de traitement de texte sont la plupart du temps compatibles les uns les autres, il suffit de traduire les textes directement dans le fichier natif, car la mise en page est généralement très simple. Par ailleurs ils sont quasiment tous compatibles avec les outils de TAO les plus utilisés par les agences de traduction.

PAO et mise en page

INDD, IDML, INX :


Indesign est le format professionnel le plus utilisé à ce jour pour les travaux de Publication Assistée par Ordinateur multilingue.
Le logiciel permet une traduction directe des textes. Le traducteur sélectionne chaque bloc texte et remplace le texte original pas la traduction. Cette méthode est la plus longue, mais elle permet de bien voir le contexte et de bien voir ce qui est traduit et ce qui ne l’est pas encore. Inconvénient majeur : la source d’erreurs liées à l’intervention manuelle dans le fichier natif. Le respect de l’intégrité de la mise en page n’est ainsi pas garantie.
Les fichiers InDesign sont également parfaitement compatibles avec la plupart des outils de TAO. Les outils de TAO ne supportent pas le format de la mise en page complète (INDD), mais fonctionnent avec le format IDML qui désigne un type de fichier compatible entre les différentes éditions d’InDesign. Ce fichier est basé sur une structure XML, il est donc considéré comme tel par l’outil TAO. La traduction d’un fichier InDesign via un outil TAO sera beaucoup plus rapide, l’intégrité de la mise en page et des feuilles de style est respectée, car le traducteur ne peut modifier le code source. Pour combler la perte de contexte, il est recommandé, lorsqu’on aborde la traduction d’une composition InDesign via un outil TAO, de consulter en parallèle la composition en PDF.

PPT, PPTX, POT, PPTX, PPSX, POTX, PPTM, POTM, PPSM :


Les fichiers Microsoft PowerPoint sont faciles à traduire. Présents nativement dans la suite Microsoft, PowerPoint est abondamment utilisé et tous fournisseurs de services linguistiques disposent de ce logiciel dont les différents formats sont compatibles avec tous les outils de TAO. Traduire à l’intérieur d’un fichier PowerPoint n’est pas compliqué non plus, mais, comme pour les autres formats, ne pas recourir à la TAO empêche de prendre en compte les répétions de mots.
2 choses à prendre également en considération lorsqu’on traduit des fichiers PPT ou PPTX :
• Les commentaires qui sont souvent invisibles à l’ouverture.
• L’exécution graphique post traduction. En effet, le taux de foisonnement d’une langue à l’autre peut, dans certains cas, rendre la taille des blocs textes inadaptée au texte traduit. Une passe est donc nécessaire pour vérifier que les blocs textes sont adaptés à la version traduite.

KEY :


Keynote fait partie de ces logiciels Apple qu’il est difficile de traiter en traduction. À l’instar de Numbers ou Pages, malheur à celui qui veut confier la traduction de ses documents Keynote à un traducteur professionnel ou à une agence de services linguistiques.
Les fichiers KEY n’étant pas compatibles avec les outils de PAO, il faudra nécessairement traduire dans le fichier natif ou bien passer par une phase préalable d’export des textes (au format DOCX, PPTX par exemple), traduire les textes et les réintégrer.
Notez qu’une Keynote pouvant être exportée en PowerPoint, le fichier exporté peut-être traduit comme n’importe quel PowerPoint, et être ensuite réenregistré en KEY, mais cette procédure entraine généralement des erreurs et une révision complète est indispensable.

PAGES :


PAGES est un logiciel Apple qu’aucun outil de TAO, à notre connaissance et en 2023, n’acceptera d’ouvrir. Pour traduire un fichier PAGES, il faut donc disposer du logiciel du même nom ou bien passer par une étape de conversion. Par chance, il existe des convertisseurs en ligne capables de convertir un fichier PAGES en format traduisible tel que DOC ou DOCX, mais la conversion peut entrainer des erreurs, le respect de la mise en page n’est donc pas garantie.
Si vous souhaitez absolument récupérer un document PAGES traduit alors il faudra extraire les textes du fichier de traduction et recomposer le document sous PAGES.

PUB :

Traduire directement un fichier PUB n’est possible que si l’on dispose du logiciel MS Publisher, aucun logiciel de TAO n’accepte ce format de PAO dont la dimension n’est pas « professionnelle ». Si vous ne disposez pas de MS Publisher, il vous faudra passer par une conversion PUB vers PDF et traiter la traduction du fichier obtenu comme n’importe quel fichier PDF.

MIF :


Les fichiers MIF sont issus d’Adobe FrameMaker. Ils sont générés par l’application MapInfo, un logiciel dédié à la cartographie et à l’analyse géographique. MapInfo utilise le format MIF pour stocker les données de visualisation cartographique. Pour traduire un fichier MIF, il faut au choix :
• Traduire directement les images, index, tables des matières, références croisées, en-têtes, notes de bas de page, sous-titres dans le logiciel FrameMaker. Or seuls les traducteurs spécialisés dans la traduction de documents FrameMaker disposent du logiciel et savent s’en servir.
• Exporter la mise en page FrameMaker dans un format texte de type RTF. Cependant, il est important de noter qu’il existe un risque de compromettre la structure du document en traduisant dans un éditeur de texte. Cette méthode est donc déconseillée.
• Utiliser un outil TAO qui conservera l’ensemble de la mise en page.

QXP :


Ayant perdu sa place de leader de la PAO professionnelle au profit d’InDesign, le logiciel QuarkXpress est toujours utilisé, mais peu d’agences de services multilingues et de traducteurs professionnels disposent du logiciel contrairement à la suite Adobe. Traduire un fichier Xpress est donc un peu plus complexe que traduire un fichier INDD.
Pour traduire un fichier QXD, QXP, il faut donc au choix :
• Disposer du logiciel et traduire directement dans les blocs texte. Avantage : le traducteur traduit les textes dans leur contexte, la traduction est plus confortable. Inconvénient : pas de prise en compte des répétitions, ce qui augmente le budget.
• Exporter le fichier Xpress en un format « interchange » (XTG, TAG, équivalent au IDML d’InDesign) et le traduire via un outil de TAO à l’aide de SDL Trados ou Smartcat qui sont les rares outils à prendre en charge les formats XTG et TAG.

CANVA :

Traduire humainement les pages CANVA suppose d’exporter les pages au format PDF et de les traiter comme un fichier PDF classique.

 

Code source

HTM, HTML, XHTML, XML, YML, JSON, PLIST, YAML :


S’ils sont peu nombreux et courts, les fichiers encodés peuvent être traduits directement dans un éditeur de code de type BBedit, Smultron ou Sublime text, mais pour garantir le respect de l’intégrité du code source il est vivement conseillé de les traduire via un outil de TAO, dont la plupart sont compatibles. L’outil TAO va verrouiller les balises de code et ne laisser « modifiables » que les textes à traduire.
Selon la quantité de données à traduire et la diversité des balises, il se peut que l’outil de TAO génère ses propres balises et crée des erreurs. Par exemple, les outils TAO ont tendance à mal gérer les pluriels des fichiers PO. Pour les fichiers JSON, certains outils suppriment les sauts de paragraphe. Une vérification post-traduction du code source est donc indispensable lorsqu’on traduit des fichiers code source.

PO, POT :

Les fichiers GetText Portable Object (PO) sont largement présents dans l’industrie pour les sites Web multilingues en PHP.
Pour la traduction, l’outil d’analyse du code PHP génère un fichier POT qui contient uniquement les textes d’origine à traduire. Ce fichier est le premier fichier destiné à être traduit. Une fois réalisée sur le POT la traduction est enregistrée en PO (Objet portable). Il s’agit d’un fichier bilingue contenant les textes d’origine et les traductions. Ce fichier permet en général de gérer les mises à jour régulières.
MO (Objet machine) : le contenu du fichier MO est identique à celui du PO, seul leur format diffère. Les fichiers MO sont dédiés aux serveurs.
Pour traduire ces fichiers, il est théoriquement possible d’utiliser un éditeur de texte, mais cette méthode n’est clairement pas conseillée. La meilleure option consiste à passer par un outil TAO. Chez Atenao, nous utilisons de préférence Poedit. Localize gère également bien le format PO ainsi que les outils de TAO les plus usuels.

XLIFF, XLF :

Il y a 2 manières de traduire un fichier XLIFF, sans recourir à la TAO ou en l’utilisant. Sans TAO, l’affaire n’est pas évidente. Il faut d’abord ouvrir le fichier XLIFF à l’aide d’un éditeur de code, localiser et extraire le texte source, traduire le texte puis réimporter chaque traduction dans le fichier d’origine. Les fichiers XLIFF étant bilingues, il est possible de travailler directement dans le fichier en traduisant les textes nommés « target », mais c’est une méthode extrêmement délicate puisque le traducteur travaille dans le code avec le risque de le modifier.
Avec un outil TAO, dont la plupart sont compatibles, la méthode est beaucoup plus simple puisque seuls les textes à traduire apparaissent. Il suffit de télécharger le fichier XLIFF dans l’outil de TAO, le texte source apparait dans un tableau double entrée « langue source – langue cible » et le traducteur n’a qu’à porter la traduction dans la colonne « cible ».

LaTeX :


LaTeX, un traitement de texte opensource très répandu au sein de la communauté scientifique. Son utilisation est similaire à celle d’un langage de programmation : on rédige d’abord le texte et les commandes LaTeX dans un fichier texte, puis on procède à la compilation et à la visualisation. Le fichier résultant peut être traduit, mais la procédure n’est pas aisée.
S’il est possible d’extraire les textes sources par copier coller, de les traduire et de les réintégrer dans le fichier natif, cette procédure chronophage implique d’isoler les commandes LaTeX et les formules mathématiques du reste des textes sans oublier le problème de l’accentuation. Il est également possible de travailler à partir d’un export PDF converti en DOCX ou bien depuis l’export PDF de la source sous Illustrator, mais dans ce cas, vous ne disposerez pas de la cible au format LaTeX.
La meilleure option, du point de vue de l’agence de traduction est :
• d’utiliser un éditeur de LaTex de type Overleaf
• d’utiliser l’outil de TAO OmegaT qui est un logiciel libre prenant en charge le format TEX.
• d’installer les packages LaTeX et de travailler dans le fichier natif.

Base de données feuilles de calcul

CSV, XLSX, XLS, XLT, XLSM, ODS, OTS :

Tous ces formats de base de données peuvent être traduits dans leur format d’origine, mais selon la taille de la base de données et le nombre de répétitions de mots qu’elle peut contenir, il convient de travailler dans un outil de TAO, dont la plupart sont compatibles.

ODB :

Le fichier ODB (Apache OpenOffice Base) est une base de données relationnelle qui contient une collection de fichiers et de dossiers compressés au format Zip. Les bases de données ODB de petite taille peuvent être traduites directement dans OpenOffice, mais pour la majorité des bases, il faudra convertir le fichier ODB dans un format exploitable en TAO (de type XLS, XLSX, CSV ou ODS).

NUMBERS :

NUMBERS est un logiciel Apple qu’aucun outil de TAO n’acceptera d’ouvrir. Pour traduire un fichier NUMBERS, il faut donc disposer du logiciel du même nom ou bien passer par une étape de conversion. Par chance, il existe des convertisseurs en ligne capables de convertir un fichier NUMBERS en format traduisible tels que XLS ou XLSX.
Si vous souhaitez absolument récupérer un document NUMBERS traduit alors il faudra recomposer le document sous NUMBERS.

Sous-titres

ASS, SBV, SCC, SUB, LRC :

La plupart des fichiers de sous-titres ont une structure très simple qui les rend éditables dans les éditeurs de code ou de texte de type. En règle générale on peut changer l’extension de ces fichiers ou les réenregistrer dans un format exploitable par la plupart des outils de TAO : le format SRT
Si vous souhaitez en savoir plus sur le sous-titrages, n’hésitez pas à jeter un oeil à notre listing des outils de sous-titrage. Une quarantaine de logiciels y sont répertoriés

SRT :

SRT est le format de sous-titres le plus répandu et le plus compatible avec les logiciels, les plateformes et les réseaux sociaux. Sa traduction est relativement simple : il suffit de porter la traduction en lieu et place des textes sources sans modifier les numéros de séquence, les codes temporels (timecodes). Il est parfaitement compatible avec la majorité des outils de TAO.

VTT :

Le format de fichier de sous-titres VTT est dédié au web, il contient des annotations de temps spécifiques, des métadonnées et permet un formatage des textes plus riche que ses concurrents. Pour traduire le fichier VTT on l’ouvrira via un éditeur de code ou, plus simple, on utilise l’outil de TAO Smartcat qui est l’un des rares logiciels de traduction compatibles avec ce format.

Audio

FLAC, MP3, WAV, OGG, MID, WMA :

Tous ces formats de fichiers audio sont des structures de données utilisées en informatique pour stocker des sons tels que la musique et la voix humaine. Pour traduire un fichier audio, une étape de transcription est indispensable. Elle peut être humaine ou automatisée via des logiciels de transcription automatique, elle peut être timecodée (avec indications des marqueurs de temps) ou simple. La transcription peut être réalisée dans un fichier de sous-titres ou dans un fichier au format texte. La traduction du fichier transcrit pourra être effectuée via un outil de TAO ou non.

Dessin

DXF, DWG :


Les fichiers Autocad sont complexes à traduire, d’abord parce qu’il n’existe pas de compatibilité directe avec tous les outils de TAO et qu’il est rare que les traducteurs professionnels ou les agences de traduction non spécialisées dans les traductions techniques travaillent directement sur Autocad.
Le format DWG est le format natif d’Autocad tandis que le format DXF est un format « interchange » permettant de visionner un fichier Autocad avec une version antérieure à celle qui a servi à le créer.
Une application TranslateCAD, permet de traduire les fichiers interchange DXF, mais pas les fichiers au format DWG. Si vous ne disposez que d’un fichier DWG il faudra donc d’abord le transformer en DXF.
PowerCAD est une autre application de traduction des fichiers DWG qui peut traiter également les fichiers DXF.
Une autre méthode consiste à exporter un fichier DWG ou DMX sous Illustrator et de le traiter comme un fichier AI.

VSDX, VSX, VTX, VDX, VSSX, VSTX, VSDM, VSSM, VSTM :

Ces formats de fichiers propres à Microsoft Visio peuvent être traduits directement dans Visio ou à l’aide d’un outil de TAO.