Um estudo comparativo entre abordagens supervisionadas para a resolução de referências a autores

dc.contributor.advisor1ROSA, Thierson Couto
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/4414718560764818por
dc.creatorCANUTO, Sérgio Daniel Carvalho
dc.creator.Latteshttp://lattes.cnpq.br/5172447060300953por
dc.date.accessioned2014-07-29T14:57:49Z
dc.date.available2012-03-06
dc.date.issued2011-08-25
dc.description.abstractIn this work we investigate two classes of solutions for the problem of author name disambiguation.We refer to the approach of the first class as relational based on attributes (RBA) solutions. These approaches use similarity measures based on attributes of the two references being compared or based on the attributes of other references connected to them by authorship. The other class of approaches uses information on semantic relationships among entities in addition to attribute based similarity measures to decide if two references refer to the same author. We refer to the approaches of this class as relational based on entities (RBE) solutions. We present a supervised version of the RBE based on the work introduced by Bhattacharya and Gettor [7]. In the experiments we conducted our RBE solution presented statistically significant gains in efficacy over all the other methods studied. However, the gains are only marginal over the RBA methods experimented. On the other hand, the execution time of both training and testing phases of the RBE methods are notably greater than those of the RBA methods. As far as we know there is no other similar study reported in literature and we consider the results reported here are relevant because they inspire research about enhancing RBA solutions.eng
dc.description.provenanceMade available in DSpace on 2014-07-29T14:57:49Z (GMT). No. of bitstreams: 1 Dissertacao Sergio Daniel Carvalho Canuto.pdf: 584503 bytes, checksum: 6a393853a561ed8fec4bd9e4eef56628 (MD5) Previous issue date: 2011-08-25eng
dc.description.resumoNeste trabalho investigamos duas classes de soluções supervisionadas para o problema de resolver se duas ou mais referências a autores (nomes de autores) correspondem à mesma pessoa. Denominamos abordagens relacionais baseadas em atributo (RBA) as abordagens da primeira classe. Nessas abordagens são utilizadas medidas de similaridades entre atributos textuais de duas referências ou de referências ligadas a elas por coautoria. A outra classe de soluções estudada utiliza informações de relacionamento semântico entre entidades, em adição às similaridades por atributos, para decidir quando duas ou mais referências devem ser consideradas correferentes. Denominamos as abordagens dessa classe de relacionais baseadas em entidades (RBE). Apresentamos uma versão supervisionada de solução RBE que se baseia na proposta apresentada por Bhattacharya e Gettor [7]. Experimentos utilizando duas coleções reais e uma coleção artificial mostram que a solução RBE proposta neste trabalho apresenta ganhos de eficácia estatisticamente comprovados em relação a todos os métodos analisados. Entretanto, o ganho é apenas marginal em relação aos métodos da classe RBA analisados. Por outro lado, o custo computacional tanto de treino quanto de teste das abordagens RBE é consideravelmente maior que o custo dos métodos RBA. Consideramos que esse estudo comparativo é inédito e que as conclusões são importantes, pois incentivam pesquisas para o aprimoramento das soluções RBA.por
dc.formatapplication/pdfpor
dc.identifier.citationCANUTO, Sérgio Daniel Carvalho. A comparative study of supervised approaches for author reference resolution. 2011. 82 f. Dissertação (Mestrado em Ciências Exatas e da Terra - Ciências da Computação) - Universidade Federal de Goiás, Goiânia, 2011.por
dc.identifier.urihttp://repositorio.bc.ufg.br/tede/handle/tde/514
dc.languageporpor
dc.publisherUniversidade Federal de Goiáspor
dc.publisher.countryBRpor
dc.publisher.departmentCiências Exatas e da Terra - Ciências da Computaçãopor
dc.publisher.initialsUFGpor
dc.publisher.programMestrado em Ciência da Computaçãopor
dc.rightsAcesso Abertopor
dc.subjectResolução de entidadespor
dc.subjectDesambiguação de nomes de autorespor
dc.subjectEentity resolutioneng
dc.subjectAuthor name disambiguationeng
dc.subjectResolução de entidades; Desambiguação de nomes de autorespor
dc.subject.cnpqCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOpor
dc.titleUm estudo comparativo entre abordagens supervisionadas para a resolução de referências a autorespor
dc.title.alternativeA comparative study of supervised approaches for author reference resolutioneng
dc.typeDissertaçãopor

Arquivos

Pacote Original
Agora exibindo 1 - 1 de 1
Nenhuma Miniatura disponível
Nome:
Dissertacao Sergio Daniel Carvalho Canuto.pdf
Tamanho:
570.8 KB
Formato:
Adobe Portable Document Format