Skip navigation
Please use this identifier to cite or link to this item: http://repositorio.unb.br/handle/10482/15142
Files in This Item:
File Description SizeFormat 
2013_MichelleMachadoOliveiraVilarinho.pdf6 MBAdobe PDFView/Open
Title: Proposta de dicionário informatizado analógico de língua portuguesa
Authors: Vilarinho, Michelle Machado de Oliveira
Orientador(es):: Faulstich, Enilde Leite de Jesus
Assunto:: Língua portuguesa - dicionários
Língua portuguesa - lexicografia
Processamento de linguagem natural (Computação)
Semântica
Issue Date: 12-Feb-2014
Citation: VILARINHO, Michelle Machado de Oliveira. Proposta de dicionário informatizado analógico de língua portuguesa. 2013. xx, 307 f., il. Tese (Doutorado em Linguística)—Universidade de Brasília, Brasília, 2013.
Abstract: O tema desta tese se insere na linha de pesquisa Léxico e Terminologia, desenvolvida no Centro de Estudos Lexicais e Terminológicos (Centro Lexterm), da Universidade de Brasília. O objeto de estudo é o dicionário analógico, entendido como um tipo de repertório lexicográfico de caráter onomasiológico, no qual os lexemas são organizados partindo das ideias ou dos conceitos para chegar às unidades lexicais. Os lexemas são agrupados em um mesmo verbete por possuírem identidade de relações. A motivação para a realização deste trabalho é identificar como as analogias podem ser delimitadas no dicionário analógico, uma vez que constatamos que os dicionários analógicos não possuem critérios claros para o estabelecimento das relações analógicas na composição dos verbetes. O objetivo principal desta pesquisa é a criação de uma proposta de Dicionário Informatizado Analógico de Língua Portuguesa, por meio do uso de ferramentas de Processamento das Línguas Naturais (PLN). A metodologia que seguimos para a análise do Dicionário analógico da língua portuguesa de Azevedo (2010), Le nouveau Petit Robert: dictionnaire alphabétique et analogique de la langue française de Robert (2010), Le Dictionnaire des Analogies de Pechoin (2009) e Dizionario Analogico della lingua italiana de Garzanti (2011) foi o preenchimento do roteiro para avaliação de dicionários de língua comum e de dicionários ou glossários científicos e técnicos de Faulstich (1998, p. 234; 2011, p.183-185). Por meio das informações recolhidas, foi possível identificar a estrutura de organização dos dicionários analógicos e verificar que a falta de critérios desses dicionários levam as analogias a serem apresentadas com vagueza. A aplicação da metodologia proporcionou a seleção de lexemas para compor os verbetes transporte e vestuário constituintes do modelo de Dicionário Informatizado Analógico de Língua Portuguesa postulado nesta pesquisa. Ademais, com aplicação dos conceitos da Versão Ampliada da Teoria dos Protótipos de Kleiber (1990) e da Semântica de Frames de Fillmore (1977), mais lexemas foram inseridos nos verbetes propostos. Para elaborar o modelo de dicionário postulado, adotamos a proposta metodológica para elaboração de léxicos, dicionários e glossários de Faulstich (2001). Como resultado desta pesquisa, o modelo de dicionário analógico proposto, constitui-se de parte analógica e alfabética. A parte analógica será organizada por campos lexicais e a parte alfabética será semelhante a um dicionário de língua comum. O verbete da parte analógica possui definição e os demais lexemas são apresentados pelas relações semânticas: sinonímia, hiperonímia e hiponímia, holonímia e meronímia, e a relação associativa. O critério norteador da ligação associativa do dicionário analógico deve ter relação com, pelo menos, uma das entidades do significado: sentido, dimensão extensional, dimensão intencional e conceito. A relação associativa pode ser dividida em subclasses, com a finalidade de agrupar os conceitos com mais proximidade semântica. Como a aquisição do léxico ocorre de modo associativo, o Dicionário Informatizado Analógico de Língua Portuguesa – DIALP– pode ser usado como uma estratégia para aprendizagem de língua com vistas à aquisição do léxico. Como não existe modelo de dicionário analógico direcionado aos falantes de português como L2 ou como LE, a proposta do DIALP preenche parte da lacuna da Lexicografia, já que pode ser usado como ferramenta de aprendizagem. ______________________________________________________________________________ ABSTRACT
The topic of this dissertation is part of the research area known as Terminology and Lexical Studies, developed at the Center for Terminological and Lexical Studies (LexTerm Center), at the University of Brasília. The object of study is the analogical dictionary, understood as a kind of lexicographic inventory, onomasiological in nature, in which lexemes are organized from ideas or concepts to lexical units. Lexemes are grouped together in the same entry by virtue of displaying identity relations. The motivation behind this work is to understand how analogies can be delimited in an analogical dictionary, once we observed that analogical dictionaries do not exhibit clear criteria for establishing analogical relations. The main aim of this research is to present a proposal for an Informatized Analogical Portuguese Dictionary, by using Natural Language Processing (NLP) tools. In analyzing the following dictionaries: Dicionário analógico da língua portuguesa de Azevedo (2010), Le nouveau Petit Robert: dictionnaire alphabétique et analogique de la langue française de Robert (2010), Le Dictionnaire des Analogies de Pechoin (2009) and Dizionario Analogico della lingua italiana de Garzanti (2011), the methodology involved filling out a survey for the evaluation of both general language dictionaries and scientific and technical dictionaries and glossaries, as proposed by Faulstich (1998, p. 234; 2011, p.183-185). Based on the collected information, it was possible to identify the analogical dictionaries’ organizational structure and to verify that the lack of criteria in these dictionaries lead to vagueness in the presentation of analogies. The application of this methodology enabled us to select lexemes to compose the entries for transportation and clothing, both parts of the model for the Informatized Analogical Portuguese Dictionary proposed in this research. Moreover, based on the application of concepts from Kleiber’s (1990) Extended Version of Prototype Theory and Fillmore’s Frame Semantics, further lexemes were added to the proposed entries. In order to formulate the model for the proposed dictionary, we adopted the methodological proposal for the elaboration of lexicons, dictionaries and glossaries, as postulated by Faulstich (2001). As a result of this research, the proposed model for the analogical dictionary consists of both an analogical and an alphabetical part. The analogical part is organized by lexical fields, and the alphabetical part is similar to those of a general language dictionary. In the analogical part of the dictionary, the entry is comprised of a definition, and the other lexemes are presented based on the semantic relations they establish: synonyms, hyperonyms and hyponyms, holonyms and meronyms, and associative relations. The main criterion for the associative relation in the analogical dictionary has to do with least one of the following meaning entities: sense, extensional dimension, intentional dimension and concept. The associative relation can be divided into subclasses, in order to group together concepts with greater semantic relatedness. Assuming that lexical acquisition happens through association, the Informatized Analogical Portuguese Dictionary can be used as a strategy of language learning, aiming at lexical acquisition. Since there are no models for an analogical dictionary for speakers of Portuguese as a second language or as a foreign language, the present proposal fills this gap in the Lexicography field, because it can be used as a learning tool.
metadata.dc.description.unidade: Instituto de Letras (IL)
Departamento de Linguística, Português e Línguas Clássicas (IL LIP)
Description: Tese (doutorado)—Universidade de Brasília, Instituto de Letras, Departamento de Linguística, Português e Línguas Clássicas, Programa de Pós-Graduação em Linguística, 2013.
metadata.dc.description.ppg: Programa de Pós-Graduação em Linguística
Licença:: A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.bce.unb.br, www.ibict.br, http://hercules.vtls.com/cgi-bin/ndltd/chameleon?lng=pt&skin=ndltd sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra disponibilizada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data.
Appears in Collections:Teses, dissertações e produtos pós-doutorado

Show full item record " class="statisticsLink btn btn-primary" href="/jspui/handle/10482/15142/statistics">



Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.