
O que devo observar ao migrar de um TMS para outro?

Se você está pensando em mudar de TMS(Translation Management Systems) e alguém lhe disse que “é fácil! Basta baixar seus arquivos TMX e TBX e carregá-los em seu novo TMS!” - as chances são de que você está em um passeio. A troca de TMSs, embora aparentemente simples, abre uma caixa de pandora de dor.
Mas neste artigo vamos nos concentrar em minha fonte favorita de dor no terror quando se trata de estresse de migração de TMS: {5 }aproveitamento e adoção da memória de tradução.
O maior problema reside no Aproveitamento da memória de tradução. Este é o jargão da indústria que se refere a como as frases armazenadas em sua base de conhecimento se comparam ao conteúdo recém-processado. As memórias de tradução geram enormes quantidades de economia e eficiência de tempo. Essa é uma das razões pelas quais os clientes estão dispostos a investir fortemente em TMSs de nível empresarial. Se você traduziu “O gato está no sofá.” e agora tem um novo conteúdo que também tem “O gato está no sofá”. seu TMS reconhecerá que esta frase é uma correspondência perfeita e talvez pré-confirme ou até bloqueie esse conteúdo para que você não precise tocá-lo novamente. O desafio é que os TMSs armazenam muito mais informações do que apenas as palavras que você vê. Mesmo um arquivo DOCX simples tem sua própria codificação e incorpora código para formatação, estilos e outros assuntos que não podem ser observados a olho nu .Assim, a frase “Aquele gato está no sofá.” poderia ser armazenado como "O gato está no sofá". Se for esse o caso e você reprocessar “O gato está no sofá”. você não terá uma correspondência perfeita, mas talvez uma correspondência de 95 a 99%.
E embora isso possa parecer aceitável se você tiver uma grande base de conteúdo que opera em vários idiomas, essa mudança no comportamento de alavancagem pode levar a centenas de milhares de segmentos exigindo reprocessamento em dezenas de idiomas, o que levará a um resultado negativo para a pessoa que paga a conta. Então, o que fazer diante disso? Bem, à luz disso, antes de migrar, certifique-se de ter testado extensivamente a memória de tradução aproveitando uma ampla gama de seus repositórios de conteúdo e tipos de arquivo para estabelecer uma expectativa de linha de base para alavancagem. Isso permitirá que você resolva possíveis problemas antes de se comprometer totalmente com a migração e não poder mais voltar atrás.
O que fazer se minha linha de base não tiver o desempenho esperado?
Se sua linha de base não funcionar conforme o esperado, a primeira etapa é procurar a causa raiz dessa perda de alavancagem. Ele residirá em sua memória de tradução contendo a impressão de sua estratégia de análise e segmentação herdada do TMS ou sua nova estratégia de análise e segmentação do TMS.
Antes de prosseguirmos, vamos definir análise e segmentação.
Análise
A análise é como um determinado sistema divide os dados que são inseridos nele. A análise na linguagem falada, por exemplo, é como nossos ouvidos podem distinguir entre sons para entender palavras separadas, por exemplo. A análise na localização refere-se às regras que um TMS segue para dividir o conteúdo de origem em conteúdo traduzível. Isso inclui, por exemplo: como o TMS registra a formatação, como ele registra as variáveis e como ele separa o código do conteúdo traduzível.
Segmentação
A segmentação refere-se apenas ao que constitui uma frase. Uma frase é definida por certa pontuação? As quebras de linha resultarão em uma nova frase? Essas regras diferentes também permitirão diferentes alavancagens. Se você traduziu em seu TMS legado um arquivo PPTX em que várias de suas frases envolvem a caixa de texto e seu TMS entendeu essas quebras de linha como quebras de frase e seu novo TMS desconsidera a quebra de linha como uma quebra de frase, você perderá a alavancagem para esse determinado frase. A perda de quebra de linha, por exemplo, pode ser ainda mais dramática do que a perda de análise porque a frase pode se tornar totalmente irreconhecível. O que você pode fazer sobre isso?
Felizmente, você pode lidar com esses problemas com várias abordagens diferentes:
A abordagem de força bruta

Nesta abordagem, você apenas assume o fato de que as migrações TMS são confusas e algumas perdas são esperadas. Você simplesmente aceita a perda de alavancagem e entende que no início a tradução se tornará mais cara e demorada, mas isso logo se nivelará e retornará aos níveis anteriores, uma vez que sua base de conteúdo esteja ajustada à sua nova realidade. Essa abordagem funciona particularmente bem para programas pequenos (tamanho do programa = tamanho base do conteúdo x idiomas), mas criará alguns problemas sérios de orçamento se você estiver operando com programas maiores.
A abordagem da memória de tradução

Nesta abordagem, você pode fazer com que os engenheiros do TMS analisem padrões de codificação em sua memória de tradução e procurem por oportunidades para aplicar scripts baseados em regras que transformarão esses padrões em padrões mais compatíveis com seus futuros padrões de TMS. Então, digamos, por exemplo, que sua MT tem “ O gato está no sofá.” mas seu novo TMS ignora a tag e apenas a registra como “ O gato é o sofá.”. Ao endereçar a TM, você executaria um script que entende em quais condições a tag foi introduzida e, se tiver certeza de que pode remover esse sem maiores implicações, execute esse script. Você pode trabalhar de forma iterativa e testar até chegar a um ponto em que vê retornos marginais decrescentes e não faz mais sentido econômico promover os esforços de otimização da memória de tradução. Essa abordagem funciona bem para programas de todos os tamanhos, mas introduz a possibilidade de alterar fundamentalmente a TM de maneiras inesperadas que podem resultar em consequências indesejadas e, principalmente, imprevisíveis.
A nova abordagem de estratégia de análise e segmentação

Nesta abordagem, você pode abordar como seu futuro TMS analisa e segmenta o conteúdo e ajuste essas regras para que elas se assemelhem mais à sua memória de tradução. Portanto, no mesmo exemplo acima, em vez de limpar a TM da tag , você garantiria que seu futuro TMS também introduza a tag em uma determinada situação de codificação para maximizar a alavancagem.
Essa abordagem é a mais dinâmica, pois você deixa a memória de tradução intocada e pode ter uma abordagem personalizada para cada tipo de conteúdo. Assim, você pode ter, por exemplo, diferentes estratégias de análise para arquivos YAML x DOCX, que fornecerão o máximo de flexibilidade e previsibilidade no futuro. O desafio dessa abordagem é que ela normalmente é mais complexa de implementar e nem todos os TMSs oferecem a flexibilidade necessária em relação às estratégias de análise e segmentação.
Conclusão
Migrar TMSs não é uma tarefa fácil. É mais como uma caminhada complexa pela Amazônia peruana subindo os Andes. É importante sinalizar e abordar possíveis complicações desde o início e, como qualquer coisa na localização, as coisas crescem e se tornam exponenciais muito rapidamente. Certifique-se de realmente testar seu TMS para saber exatamente no que está se metendo e criar estratégias de otimização desde o início.