Use este identificador para citar ou linkar para este item: http://repositorio.uem.br:8080/jspui/handle/1/2551
Autor(es): Silva, Leandro Lago da
Orientador: Valéria Delisandra Feltrim
Título: Análise automática de coerência textual em resumos científicos : avaliando quebras de linearidade
Título(s) alternativo(s): Automatic analysis of textual coherence in scientific abstracts: evaluating linearity breaks
Banca: Luciana Andréia Fondazzi Martimiano - DIN/UEM
Banca: Thiago Alexandre Salgueiro Pardo - ICMC/USP
Palavras-chave: Coerência;Quebra de linearidade;Grade de entidades;Auxilio à escrita científica;SciPo;Brasil.;Coherence;Linearity break;Entity grid;Scientific writing support;SciPo;Brazil.
Data do documento: 2016
Editor: Universidade Estadual de Maringá
Resumo: A coerência faz com que uma sequência de palavras, sentenças ou parágrafos, se torne um texto, estabelecendo relações entre os elementos e dando sentido ao discurso. Escrever textos coerentes é uma tarefa que requer prática e habilidade em diversos aspectos linguísticos. Um método para se conseguir essas habilidades é solicitar auxílio para revisores ou ferramentas computacionais específicas para esse fim. O Scientific Portuguese - SciPo é um exemplo de ferramenta de auxílio à escrita para a língua portuguesa que, dentre outros recursos, inclui um módulo de análise de coerência (MAC) que detecta potenciais problemas de coerência semântica em resumos científicos. Baseado em análise de semântica latente (LSA), o MAC analisa o relacionamento semântico entre as sentenças de um resumo, de acordo com um conjunto pré-estabelecido de dimensões. Para uma das dimensões propostas para o MAC, chamada Quebra de Linearidade, os resultados obtidos por meio de LSA foram pouco satisfatórios, sugerindo a utilização de outros modelos de coerência. Nesse contexto, este trabalho teve por objetivo estender o MAC, pela adição da dimensão chamada Quebra de Linearidade. A abordagem proposta para essa dimensão é baseada na combinação do modelo grade de entidades com informações provenientes da estrutura retórica do resumo, permitindo que o módulo faça sugestões indicando possíveis quebras de linearidade em regiões específicas do resumo. Os experimentos realizados mostraram que a combinação proposta consegue capturar quebras de linearidade e também confirmaram que as sugestões geradas para essa dimensão são úteis, guiando os usuários na construção de um texto com um maior nível de coerência.
Abstract: Coherence makes a sequence of words, sentences or paragraphs, become a text, connecting the elements and giving meaning to the speech. To write coherent texts is a task that requires practice and skill in various linguistic aspects. One way to achieve these skills is to request aid for reviewers or for computational tools developed for this purpose. The Scientific Portuguese - SciPo is an example of writing tool for Portuguese that includes, among other features, a coherence analysis module (MAC) which detects potential problems of semantic coherence in scientific abstracts. Based on latent semantic analysis (LSA), MAC analyzes the semantic relationship between sentences of the abstract, in accordance with a predetermined set of dimensions. For one of the proposed dimensions for the MAC, called Linearity Break, the results obtained by LSA were unsatisfactory, suggesting the use of other coherence models. In this context, this project aimed at extending MAC by adding the Linearity Break dimension. The proposed approach for it combines the entity grid model with information from the abstract rhetorical structure, allowing MAC to generate suggestions pointing possible breaks linearityin specific regions of the abstract. Experimental results have shown that the proposed combination captures linearity breaks, and confirmed that the generated suggestions are useful, guiding users in writing texts with a higher level of coherence.
URI: http://repositorio.uem.br:8080/jspui/handle/1/2551
Aparece nas coleções:2.4 Dissertação - Ciências de Tecnologia (CTC)

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
000221766.pdf3,25 MBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.