Please use this identifier to cite or link to this item: http://repositorio.uem.br:8080/jspui/handle/1/2540
Authors: Souza, Vinícius Mourão Alves de
Orientador: Valéria Delisandra Feltrim
Title: Análise automática de coerência semântica em recursos acadêmicos escritos em português
Banca: Sérgio Roberto Pereira da Silva - UEM
Banca: Thiago Alexandre Salgueiro Pardo - UCMC/USP
Keywords: Resumo acadêmico;Ciência da computação;Coerência semântica;Análise automática;Análise de semântica Latente;Latent Semantic Analysis;SciPo (Scientific Portuguese);Ambiente de auxílio à escrita;Natural Language Processing.;Academic abstract;Semantic coherece;Automatic analysis of coherence;Latent Semantic Analysis.
Issue Date: 2011
Publisher: Universidade Estadual de Maringá
Resumo: O resumo pode ser considerado uma das seções mais importantes de um trabalho acadêmico, dado que, em conjunto com o título, é utilizado por pesquisadores na divulgação de suas pesquisas no meio científico. Nesse sentido, com o objetivo de auxiliar o processo de escrita das seções Resumo e Introdução de teses e dissertações da área de Ciência da Computação em português, Feltrim (2004) propôs um ambiente de auxílio à escrita denominado SciPo. O auxílio fornecido pelo SciPo é dado por meio de críticas e sugestões apresentadas ao usuário em relação ao uso da estrutura retórica (ou esquemática) identificada no texto submetido a análise. Embora o ambiente forneça feedback indicando quais pontos do texto devem ser melhorados, não analisa características relacionadas à semântica do texto, como a coerência, fundamental para a legibilidade e interpretabilidade do texto. Dessa maneira, o principal objetivo deste trabalho foi desenvolver recursos computacionais para a detecção automática de aspectos semânticos da seção Resumo de trabalhos acadêmicos escritos em português, de modo que eles possam ser utilizados pelo SciPo para o retorno de sugestões relacionadas à coerência. Mais especificamente, foram desenvolvidos classificadores que, com base em um certo conjunto de características extraídas automaticamente da superfície do texto e a partir da técnica LSA - Latent Semantic Analysis e de algoritmos de aprendizagem de máquina supervisionados, apresentam indicações sobre aspectos semânticos que contribuem para que o resumo seja considerado coerente. Tanto as avaliações intrínsecas dos classificadores quanto a avaliação do protótipo em um contexto de uso com usuários reais demonstraram o potencial dos classificadores no auxílio à escrita de resumos acadêmicos com um nível maior de coerência por meio da apresentação das novas sugestões.
Abstract: The abstract can be considered one of the most important sections of an academic work. Along with the title, it is used by researchers to disseminate their research in scientic circles. In this context, Feltrim (2004) proposed an environment to support the writing of Abstract and Introduction sections called SciPo. This environment provides writing support by means of criticism and suggestions presented to the user with respect to the rhetorical (or schematic) structure identified in text submitted for analysis. Although the SciPo provides feedback indicating which parts of the text should be improved, it does not analyze features related to semantics, such as coherence, which is essential to the readability and interpretability of the text. Therefore, the main goal of this research was to develop computional resources to the automatic detection of semantic aspects of the Abstract section. We use these resources for the return of new suggestions related to coherence in the SciPo enviroment. In particular, we develop classifiers based on a set of features extracted automatically from the surface of the text and from the LSA technique - Latent Semantic Analysis and machine learning algorithms. Thus, the classifiers provide indications on the semantic aspects that contribute to the abstract is considered coherent. Both the intrinsic assessments of the classifiers as the evaluation of the prototype in a context of use with real users demonstrated the potential of classifiers to aid writing academics abstracts with higher lever of coherence through new suggestions.
URI: http://repositorio.uem.br:8080/jspui/handle/1/2540
Appears in Collections:2.4 Dissertação - Ciências de Tecnologia (CTC)

Files in This Item:
File Description SizeFormat 
000188287.pdf7,93 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.