Technologie

Que dois-je prendre en compte lors de la migration d'un TMS vers un autre ?

Si vous envisagez de changer de système de gestion de traduction (TMS) et que quelqu'un vous a dit que "c'est facile ! Il vous suffit de télécharger vos fichiers TMX et TBX et de les télécharger sur votre nouveau TMS !" - il y a de fortes chances que vous vous embarquiez dans une aventure. Changer de TMS, bien que cela semble simple en apparence, ouvre une boîte de Pandore de douleur.
Gabriel Fairman
2 min

Si vous envisagez de passer d'un TMS(Système de gestion de traduction) à un autre et que quelqu'un vous a dit que "c'est facile ! Il suffit de télécharger vos fichiers TMX et TBX et de les télécharger sur votre nouveau TMS !" - il y a de fortes chances que vous vous embarquiez dans une aventure. Changer de SMT, bien que cela semble simple en apparence, ouvre une boîte de Pandore de douleur.

Mais dans cet article, nous nous concentrerons sur ma source préférée de douleur et de terreur en ce qui concerne le stress de la migration du TMS : l'exploitation et l'adoption de la mémoire de traduction.

Le plus gros problème réside dans l'exploitation de la mémoire de traduction. Il s'agit d'un jargon de l'industrie qui fait référence à la comparaison entre les phrases stockées dans votre base de connaissances et le contenu nouvellement traité. Les mémoires de traduction génèrent d'énormes économies et des gains de temps. C'est l'une des raisons pour lesquelles les clients sont prêts à investir de manière optimiste dans des TMS de qualité entreprise. Si vous avez traduit "Le chat est sur le canapé." et que vous avez maintenant un nouveau contenu qui contient également "Le chat est sur le canapé.", votre TMS reconnaîtra que cette phrase est une correspondance parfaite et pourra peut-être la prévalider ou même la verrouiller afin que vous n'ayez plus jamais à y toucher.

Le défi est que les TMS stockent beaucoup plus d'informations que les simples mots que vous voyez. Même un simple fichier DOCX a son propre encodage et intègre du code pour le formatage, les styles et d'autres éléments qui sont invisibles à l'œil nu. Ainsi, la phrase "Ce chat est sur le canapé." pourrait être stockée comme "{1}Le chat {1} est sur le {2}canapé{2}." Si c'est le cas et que vous retraitez "Le chat est sur le canapé.", vous n'aurez pas une correspondance parfaite mais peut-être une correspondance de 95 à 99%.

Et bien que cela puisse sembler acceptable si vous avez une grande base de contenu qui fonctionne dans plusieurs langues, ce changement de comportement en matière d'exploitation pourrait entraîner des centaines de milliers de segments nécessitant une nouvelle traitement dans des dizaines de langues, ce qui aura des conséquences négatives pour la personne qui paie l'addition. Alors que faire dans ce cas ? Eh bien, à la lumière de cela, avant de migrer, assurez-vous d'avoir testé de manière approfondie l'utilisation de la mémoire de traduction sur une large gamme de vos référentiels de contenu et types de fichiers pour établir une attente de base pour l'utilisation. Cela vous permettra de résoudre tout problème potentiel avant de vous être pleinement engagé dans votre migration et de ne plus pouvoir faire marche arrière.

Que faire si ma référence de base ne fonctionne pas comme prévu ?

Si votre ligne de base ne fonctionne pas comme prévu, la première étape consiste à rechercher la cause de cette perte d'efficacité. Elle se trouve soit dans votre mémoire de traduction contenant l'empreinte de votre ancienne stratégie d'analyse et de segmentation de votre TMS, soit dans votre nouvelle stratégie d'analyse et de segmentation de votre TMS.

Avant d'aller plus loin, définissons l'analyse et la segmentation.

L'analyse

L'analyse est la façon dont un système donné découpe les données qui lui sont fournies. Par exemple, le parsing dans le langage parlé est la façon dont nos oreilles peuvent distinguer entre les sons pour comprendre des mots séparés, par exemple. L'analyse en localisation fait référence aux règles qu'un TMS suit pour décomposer le contenu source en contenu traduisible. Cela inclut par exemple : comment le TMS enregistre la mise en forme, comment il enregistre les variables et comment il sépare le code du contenu traduisible.

La segmentation

La segmentation se réfère uniquement à ce qui constitue une phrase. Une phrase est-elle définie par une certaine ponctuation ? Est-ce que les sauts de ligne entraînent une nouvelle phrase? Ces règles différentes permettront également une utilisation différente. Si vous avez traduit dans votre ancien système de gestion de traduction un fichier PPTX où plusieurs de vos phrases se chevauchent dans la zone de texte et que votre nouveau système de gestion de traduction ignore les sauts de ligne comme des fins de phrases, vous perdrez l'utilisation pour cette phrase en particulier. Ces différentes règles permettront également une utilisation différente. Si vous avez traduit dans votre ancien système de gestion de traduction (TMS) un fichier PPTX où plusieurs de vos phrases se chevauchent dans la zone de texte et que votre nouveau TMS comprend ces sauts de ligne comme des fins de phrases et que votre nouveau TMS ignore les sauts de ligne comme des fins de phrases, vous perdrez l'utilisation pour cette phrase particulière. La perte due aux sauts de ligne peut être encore plus dramatique que la perte due à l'analyse syntaxique, car la phrase peut devenir totalement méconnaissable. Que pouvez-vous faire à ce sujet? Heureusement, vous pouvez résoudre ces problèmes de différentes manières.

Heureusement, vous pouvez résoudre ces problèmes de différentes manières :

L'approche brute-force

Dans cette approche, vous acceptez simplement le fait que les migrations de TMS sont désordonnées et que certaines pertes sont attendues. Vous acceptez simplement la perte de levier et comprenez qu'au début, la traduction deviendra plus coûteuse et plus chronophage, mais cela se stabilisera rapidement et reviendra aux niveaux précédents une fois que votre base de contenu sera principalement adaptée à votre nouvelle réalité. Cette approche fonctionne particulièrement bien pour les petits programmes (Taille du programme = Taille de la base de contenu x Langues), mais elle peut poser des problèmes budgétaires sérieux si vous travaillez avec des programmes plus importants.

L'approche de la mémoire de traduction

Dans cette approche, vous pouvez faire analyser par des ingénieurs TMS les modèles d'encodage dans votre mémoire de traduction et rechercher des opportunités d'appliquer des scripts basés sur des règles qui transformeront ces modèles en modèles plus compatibles avec vos futures normes TMS. Disons par exemple que votre MT contient "Le chat est sur le canapé." mais que votre nouveau TMS ignore la balise {1} et l'enregistre simplement comme "Le chat est le canapé.". En traitant la MT, vous exécutez un script qui comprend dans quelles conditions la balise {2} a été introduite et si vous êtes sûr que vous pouvez supprimer cette balise {2} sans autres implications, vous exécutez ce script. Vous pouvez travailler de manière itérative et tester jusqu'à ce que vous atteigniez un point où vous constatez des rendements marginaux décroissants et où il n'est plus économiquement viable de poursuivre les efforts d'optimisation de la mémoire de traduction. Cette approche fonctionne bien pour les programmes de toutes tailles, mais elle introduit la possibilité de modifier fondamentalement la MT de manière inattendue, ce qui peut entraîner des conséquences indésirables et surtout imprévisibles.

L'approche de la nouvelle stratégie d'analyse et de segmentation

Dans cette approche, vous pouvez aborder la manière dont votre futur SMT analyse et segmente le contenu et ajuster ces règles de manière à ce qu'elles ressemblent davantage à votre mémoire de traduction. Ainsi, dans le même exemple que ci-dessus, au lieu de nettoyer la TM de la balise {2}, vous vous assureriez que votre futur TMS introduit également la balise {2} dans une situation d'encodage donnée pour maximiser l'efficacité.

Cette approche est la plus dynamique car vous laissez la mémoire de traduction intacte et pouvez adopter une approche personnalisée pour chaque type de contenu. Par exemple, vous pouvez avoir différentes stratégies d'analyse syntaxique pour les fichiers YAML par rapport aux fichiers DOCX, ce qui vous offre une flexibilité et une prévisibilité maximales pour l'avenir. Le défi avec cette approche est qu'elle est généralement plus complexe à mettre en œuvre et que tous les TMS ne vous offrent pas la flexibilité nécessaire en matière d'analyse et de segmentation.

Conclusion

Migrer d'un TMS à un autre n'est pas une promenade de santé. C'est plutôt une randonnée complexe à travers l'Amazonie péruvienne en montant les Andes. Il est important de signaler et de résoudre les complications potentielles dès le début et, comme pour tout ce qui concerne la localisation, les choses se multiplient rapidement. Assurez-vous de tester sérieusement votre TMS afin de savoir exactement dans quoi vous vous engagez et de créer des stratégies d'optimisation dès le départ.

Gabriel Fairman
Founder and CEO of Bureau Works, Gabriel Fairman is the father of three and a technologist at heart. Raised in a family that spoke three languages and having picked up another three over the course of his life, he's fascinated by the role of language in shaping identity. In recognition of his outstanding contributions, Gabriel was honored with the 2023 Innovator of the Year Award at LocWorld Silicon Valley. He enjoys cooking, playing the guitar, and leading teams toward innovation.

Essayez Bureau Works gratuitement pendant 14 jours

ChatGPT Intégrations
Commencer maintenant
Les 14 premiers jours sont gratuits
Assistance de base gratuite