Campo DC | Valor | Idioma |
dc.contributor.advisor | Weigang, Li | pt_BR |
dc.contributor.author | Ruizhe, Guo | pt_BR |
dc.date.accessioned | 2024-08-13T18:13:31Z | - |
dc.date.available | 2024-08-13T18:13:31Z | - |
dc.date.issued | 2024-08-13 | - |
dc.date.submitted | 2023-01-31 | - |
dc.identifier.citation | RUIZHE, Guo. Melhorando a qualidade da maquina de tradução Chinês para Português com RoBERTa. 2023. 84 f., il. Dissertação (Mestrado em Informática) — Universidade de Brasília, Brasília, 2023. | pt_BR |
dc.identifier.uri | http://repositorio2.unb.br/jspui/handle/10482/49803 | - |
dc.description | Dissertação (Mestrado) — Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2023. | pt_BR |
dc.description.abstract | As mudanças contínuas na época da informação promovem o desenvolvimento do campo
da tradução e da tradução automática, acompanhadas pelo surgimento da inteligência
artificial, mostrando uma tendência e apresentando próspero desenvolvimento. A tradução
automática é um tópico importante no processamento de linguagem natural. A aplicação
da tradução automática neural na tradução automática foi revivida e desenvolvida nos
últimos anos. Com a introdução de algoritmos de excelência e a melhora da capacidade de
processamento dos computadores, a tradução automática neural mostrou-se com grande
potencial.
Existem grandes diferenças na forma e na expressão da linguagem entre o Português e
o chinês. A comunicação entre o chinês e o Português está em fase de desenvolvimento, e os
materiais básicos de tradução são muito escassos. O estudo da tradução automática entre
chinês e Português não só servirá no auxílio às populações de língua chinesa e portuguesa,
como também é tema de suma importância para a tradução entre idiomas onde os dados
básicos são escassos.
Esta dissertação apresenta um estudo sobre Tradução Automática Neurais (Neural
Machine Translation) para o par de línguas Português (PT) ↔ Chinês (ZH) e adiciona as
direções de tradução Chinês-Português (Brasil) e Português (Brasil)-Chinês. O objetivo
é buscar um modelo mais adequado entre as línguas acima com algoritmos e arquiteturas
avançadas, de forma a melhorar o nível atual de tradução chinês-Português, bem como o
nível de tradução Chinês-Português (Brasil).
Modelos de tradução de última geração são utilizados na tradução automática chinêsPortuguês. O modelo RoBERTa é o mais avançado e a estrutura de segmentação mistas
de palavras é usado para pré-treinamento, e o BERT é usado para tradução seguinte. No
corpus paralelo chinês-Português disponível e público, seleciona o Opensubtitles2016 que
tem maior quantidade dos dados. E usa BLEU e Rouge-dois indicadores de avaliação que
são mais versáteis na tradução automática.
No final, obtivemos os resultados dos impactos de fatores diferentes na tradução automática chinês-Português sob os recursos existentes e um modelo melhor de tradução
automática chinês-Português, ao mesmo tempo, descobrindo alguns trabalhos efetivos que devem ser feitos no campo da tradução automática chinês-Português no futuro. | pt_BR |
dc.description.sponsorship | Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES). | pt_BR |
dc.language.iso | por | pt_BR |
dc.rights | Acesso Aberto | pt_BR |
dc.title | Melhorando a qualidade da maquina de tradução Chinês para Português com RoBERTa | pt_BR |
dc.type | Dissertação | pt_BR |
dc.subject.keyword | Aprendizado profundo | pt_BR |
dc.subject.keyword | Tradução automática | pt_BR |
dc.subject.keyword | Redes neurais artificiais | pt_BR |
dc.rights.license | A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.unb.br, www.ibict.br, www.ndltd.org sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra supracitada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data. | pt_BR |
dc.description.abstract1 | The continuous changes in the information age have promoted the development of the
translation field, and machine translation, accompanied by the rise of artificial intelligence, is showing a trend of prosperity and development. Machine translation is an
important topic in natural language processing. The application of neural machine translation in machine translation has been revived and developed in recent years. With the
introduction of excellent algorithms and the improvement of computer computing power,
neural machine translation has shown great potential.
There are big differences in the form and expression of the language between Portuguese and Chinese.The communication between Chinese and Portuguese is in the development stage, and the basic translation materials are very scarce. The study of automatic
translation between Chinese and Portuguese will not only help Chinese and Portuguese
speaking populations, but it is also an important topic for translation between languages
where basic data are scarce.
This dissertation presents a study on Neural Machine Translation (NMT) for the
language pair Portuguese (PT) ↔Chinese (ZH) and adds the Chinese-Portuguese (Brazil)
and Portuguese (Brazil)-Chinese translation directions. The objective is to seek a more
suitable model among the above languages with advanced algorithms and architectures,
in order to improve the current level of Chinese-Portuguese translation, as well as the
level of Chinese-Portuguese (Brazil) translation.
State-of-the-art translation models are used in Chinese-Portuguese machine translation. The model RoBERTa is the most advanced, the mixed word segmentation framework
is used for pre-training, and BERT is used for subsequent translation. In the available
and public Chinese-Portuguese parallel corpus, select the Opensubtitles2016 that has the
largest amount of data. And it uses BLEU and Rouge-two evaluation indicators that are
more versatile in machine translation.
In the end, we got the results of the impacts of different factors on Chinese-Portuguese
machine translation under existing resources and a better model of Chinese-Portuguese
machine translation, at the same time discovering some effective works that should be
done in the field of Chinese-Portuguese machine translation in the future. | pt_BR |
dc.description.unidade | Instituto de Ciências Exatas (IE) | pt_BR |
dc.description.unidade | Departamento de Ciência da Computação (IE CIC) | pt_BR |
dc.description.ppg | Programa de Pós-Graduação em Informática | pt_BR |
Aparece nas coleções: | Teses, dissertações e produtos pós-doutorado
|