Tecnologia

O que devo ficar atento ao migrar de um TMS para outro?

Se você está considerando trocar de TMS (Sistemas de Gerenciamento de Tradução) e alguém lhe disse que "é fácil! Basta baixar seus arquivos TMX e TBX e enviá-los para o seu novo TMS!" - é provável que você esteja prestes a enfrentar dificuldades. A troca de TMSs, embora aparentemente simples, abre uma caixa de Pandora de problemas.
Gabriel Fairman
2 min

Se você está considerando trocar de TMS(Sistemas de Gerenciamento de Tradução) e alguém lhe disse que "é fácil! Basta baixar seus arquivos TMX e TBX e enviá-los para o seu novo TMS!" - é provável que você esteja prestes a enfrentar dificuldades. A troca de TMSs, embora aparentemente simples, abre uma caixa de Pandora de dor.

Mas neste artigo vamos nos concentrar na minha fonte favorita de dor e terror quando se trata de migração de TMS: alavancagem e adoção de memória de tradução.

O maior problema reside na Alavancagem de Memória de Tradução. Este é um jargão da indústria que se refere a como as frases armazenadas em sua base de conhecimento se comparam ao conteúdo recém-processado. Memórias de tradução geram quantidades enormes de economia e eficiência de tempo. Essa é uma das razões pelas quais os clientes estão dispostos a investir de forma otimista em TMSs de nível empresarial. Se você traduziu "O gato está no sofá." e agora tem um novo conteúdo que também tem "O gato está no sofá.", seu TMS reconhecerá que essa frase é uma correspondência perfeita e talvez pré-confirmará ou até mesmo bloqueará esse conteúdo para que você não precise mais mexer nele.

O desafio é que os TMSs armazenam muito mais informações do que apenas as palavras que você vê. Mesmo um arquivo DOCX simples possui sua própria codificação e incorpora código para formatação, estilos e outros assuntos que são invisíveis aos olhos. Portanto, a frase "That cat is on the couch." poderia ser armazenada como "{1}O gato {1} está no {2}sofá{2}." Se esse for o caso e você reprocesse "O gato está no sofá.", você não terá uma correspondência perfeita, mas talvez uma correspondência de 95 a 99%.

E embora isso possa parecer aceitável se você tiver uma grande base de conteúdo que opera em vários idiomas, essa mudança no comportamento de alavancagem pode levar a centenas de milhares de segmentos que exigem reprocessamento em dezenas de idiomas, o que resultará em um resultado negativo para a pessoa que arca com os custos. Então, o que fazer diante disso? Bem, diante disso, antes de migrar, certifique-se de testar extensivamente a alavancagem da memória de tradução em uma ampla variedade de repositórios de conteúdo e tipos de arquivo para estabelecer uma expectativa básica para a alavancagem. Isso permitirá que você resolva quaisquer problemas potenciais antes de se comprometer totalmente com sua migração e não poder mais voltar atrás.

O que fazer se minha expectativa básica não funcionar como esperado?

Se sua linha de base não funcionar como esperado, o primeiro passo é procurar a causa raiz dessa perda de alavancagem. Isso pode estar relacionado ao seu Memória de Tradução que contém a impressão da sua estratégia de análise e segmentação do TMS antigo ou da nova estratégia de análise e segmentação do TMS.

Antes de prosseguirmos, vamos definir análise e segmentação.

Análise

Análise é como qualquer sistema divide os dados que são inseridos nele. A análise na linguagem falada, por exemplo, é como nossos ouvidos podem distinguir entre sons para entender palavras separadas, por exemplo. A análise na localização refere-se às regras que um TMS segue para dividir o conteúdo de origem em conteúdo traduzível. Isso inclui, por exemplo: como o TMS registra a formatação, como registra as variáveis e como separa o código do conteúdo traduzível.

Segmentação

A segmentação refere-se exclusivamente ao que constitui uma frase. Uma frase é definida por certa pontuação? Quebras de linha resultarão em uma nova frase? Essas regras diferentes também permitirão diferentes alavancagens. Se você traduziu em seu TMS legado um arquivo PPTX onde várias de suas frases se dividem na caixa de texto e seu novo TMS entendeu essas quebras de linha como quebras de frase e seu novo TMS ignora a quebra de linha como uma quebra de frase, você perderá a alavancagem para aquela frase específica. Essas regras diferentes também permitirão diferentes alavancagens. Se você traduziu em seu TMS antigo um arquivo PPTX onde várias de suas frases são quebradas em torno da caixa de texto e seu novo TMS entende essas quebras de linha como quebras de frase e seu novo TMS ignora a quebra de linha como uma quebra de frase, você perderá a alavancagem para aquela frase específica. A perda de quebra de linha, por exemplo, pode ser ainda mais dramática do que a perda de análise, pois a frase pode se tornar completamente irreconhecível. O que você pode fazer sobre isso? Felizmente, você pode lidar com esses problemas com várias abordagens diferentes:

Felizmente, você pode lidar com esses problemas de várias maneiras diferentes:

A abordagem de força bruta

Nessa abordagem, você simplesmente aceita o fato de que as migrações de TMS são confusas e algumas perdas são esperadas. Você simplesmente aceita a perda de alavancagem e entende que, no início, a tradução se tornará mais cara e demorada, mas logo se nivelará e voltará aos níveis anteriores assim que sua base de conteúdo estiver ajustada à sua nova realidade. Esta abordagem funciona especialmente bem para programas pequenos (Tamanho do Programa = Tamanho da Base de Conteúdo x Idiomas), mas ela criará alguns problemas sérios de orçamento se você estiver trabalhando com programas maiores.

A abordagem da Memória de Tradução

Nessa abordagem, você pode ter engenheiros de TMS analisando padrões de codificação em sua Memória de Tradução e procurando oportunidades para aplicar scripts baseados em regras que transformarão esses padrões em padrões mais compatíveis com seus futuros padrões de TMS. Então, vamos supor que seu TM tenha "O gato está no sofá." mas seu novo TMS ignora a tag e registra apenas "O gato é o sofá.". Ao abordar a MT, você executaria um script que entende em quais condições a tag {2} foi introduzida e, se tiver confiança de que pode remover o {2} sem maiores implicações, execute esse script. Você pode trabalhar de forma iterativa e testar até chegar a um ponto em que perceba retornos marginais decrescentes e não faça mais sentido econômico continuar os esforços de otimização da Memória de Tradução. Esta abordagem funciona bem para programas de todos os tamanhos, mas ela introduz a possibilidade de alterar fundamentalmente o TM de maneiras inesperadas que podem resultar em consequências indesejadas e, o mais importante, imprevisíveis.

A nova abordagem de análise e segmentação

Nessa abordagem, você pode abordar como seu futuro TMS analisa e segmenta o conteúdo e ajustar essas regras para que elas se assemelhem mais à sua Memória de Tradução. Então, no mesmo exemplo acima, em vez de limpar a TM da tag {2}, você garantiria que seu futuro TMS também introduzisse a tag {2} em uma determinada situação de codificação para maximizar a alavancagem.

Essa abordagem é a mais dinâmica, pois você deixa o Translation Memory intocado e pode ter uma abordagem personalizada para cada tipo de conteúdo. Assim, você pode ter, por exemplo, estratégias de análise diferentes para arquivos YAML vs DOCX, o que lhe proporcionará máxima flexibilidade e previsibilidade no futuro. O desafio com essa abordagem é que geralmente é mais complexa de implementar e nem todos os TMSs oferecem a flexibilidade necessária sobre estratégias de análise e segmentação.

Conclusão

Migrar TMSs não é uma tarefa fácil. É mais como uma caminhada complexa pela Amazônia peruana subindo os Andes. É importante identificar e resolver possíveis complicações desde o início e, como em qualquer processo de localização, as coisas se multiplicam e se tornam exponenciais muito rapidamente. Certifique-se de testar completamente seu TMS para saber exatamente no que está se metendo e criar estratégias de otimização desde o início.

Experimente a Bureau Works gratuitamente por 14 dias.

Integração com ChatGPT
Comece agora mesmo
Os primeiros 14 dias são por nossa conta
Suporte básico gratuito