LEVERARING MULTILINGUAL MODELS AND RANK FUSION FOR TRANSLATION MEMORY RETRIEVAL
Translation Memory, Neural Information Retrieval, Rank
Fusion, Multiligual Neural Models
Memórias de Tradução (MTs) são componentes indispensáveis das modernas
ferramentas de Tradução Assistida por Computador (CAT). As MTs são
essencialmente bancos de dados que armazenam textos de tradução de uma
língua de origem para uma língua de destino. Elas funcionam como um
repositório de segmentos traduzidos anteriormente e são essenciais para
aumentar a produtividade e reduzir os custos no processo de tradução.
As bases de dados de TM atuais dependem principalmente de regras lexicais,
como distância de edição ou correspondências de n-gramas, para identificar
traduções candidatas correspondentes. Embora possam facilmente encontrar
traduções candidatas com conjuntos semelhantes de palavras, eles carecem da
capacidade de encontrar traduções semanticamente semelhantes.
Este trabalho explora a aplicação de modelos neurais de ponta para a tarefa
de recuperação de Memória de Tradução. Através de experimentação extensiva,
demonstramos que os modelos neurais não apenas proporcionam traduções
candidatas aprimoradas, mas também oferecem maior flexibilidade e
aplicabilidade mais ampla em comparação com os paradigmas lexicais
tradicionais.
Também mostramos que a aplicação de técnicas de fusão de classificação para
alavancar as capacidades de recuperação multilíngue dos modelos neurais
alcança resultados de ponta para a Recuperação de Memória de Tradução.