Aprendizaje automático versus expresiones regulares en la detección de la negación y la especulación en biomedicina

dc.contributor.authorCruz Díaz, Noa Patricia
dc.contributor.authorMaña López, Manuel Jesús
dc.contributor.authorMata Vázquez, Jacinto
dc.date.accessioned2015-10-26T12:17:19Z
dc.date.available2015-10-26T12:17:19Z
dc.date.issued2010
dc.description.abstractEn este artículo, presentamos un sistema de aprendizaje automático que identifica las expresiones de negación y especulación en textos biomédicos, en concreto, en la colección de documentos BioScope. El objetivo de este trabajo es contrastar la eficiencia de este enfoque centrado en aprendizaje automático con el que se basa en expresiones regulares. Entre los sistemas que siguen este último enfoque, hemos utilizado NegEx por su disponiblidad y popularidad. La evaluación se ha llevado a cabo sobre las tres subcolecciones que forman BioScope: documentos clínicos, artículos científicos y resúmenes de artículos científicos. Los resultados muestran la superioridad del enfoque basado en aprendizaje automático respecto a la utilización de expresiones regulares. En la identificación de expresiones de negación, el sistema propuesto mejora la medida F1 de NegEx entre un 20 y un 30%, dependiendo de la colección de documentos. En la identificación de la especulación, el sistema propuesto supera la medida F1 del mejor algoritmo de línea base entre un 10 y un 20%.en_US
dc.description.abstractIn this paper, we present a machine learning system that identify the negation and speculation signals in biomedical texts, in particular, in the BioScope corpus. The objective of this research is to compare the efficiency of this approach focused on machine learning with which it is based on regular expressions. Among the systems that follow the latter approach, we used NegEx because of its availability and popularity. The evaluation has been carried out on the three subcollections which make up Bioscope: clinical documents, scientific papers and abstracts of scientific articles. The results show the superiority of the approach based on machine learning over the use of regular expressions. In the detection of expressions of negation, the proposed system improves the F1 measure of NegEx by between 20 and 30%, depending on the collection of documents. In the speculation detection, the proposed system outperforms the F1 measure of the best system between 10 and 20%.en_US
dc.description.departmentTecnologías de la Información
dc.identifier.citationCruz Díaz, N.P., Maña López, M.J., Mata Vázquez, J.: "Aprendizaje automático versus expresiones regulares en la detección de la negación y la especulación en biomedicina". Procesamiento del Lenguaje Natural. Nº 45, págs. 77-85, (2010). ISSN 1135-5948en_US
dc.identifier.issn1135-5948
dc.identifier.issn1989-7553 (electrónico)
dc.identifier.urihttp://hdl.handle.net/10272/11257
dc.language.isospaen_US
dc.publisherSociedad Española para el Procesamiento del Lenguaje Natural (SEPLN)en_US
dc.rightsAtribución-NoComercial-SinDerivadas 3.0 España*
dc.rights.accessRightsopen accessen_US
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/es/*
dc.subject.otherDetección de la negación y la especulaciónen_US
dc.subject.otherAprendizaje automáticoen_US
dc.subject.otherExpresiones regularesen_US
dc.subject.otherBiomedicinaen_US
dc.subject.otherNegation and speculation detectionen_US
dc.subject.otherMachine learningen_US
dc.subject.otherBiomedicineen_US
dc.titleAprendizaje automático versus expresiones regulares en la detección de la negación y la especulación en biomedicinaen_US
dc.titleMachine learning versus regular expressions in negation and speculation detection in biomedicine
dc.typejournal articleen_US
dspace.entity.typePublication
relation.isAuthorOfPublication8eb22794-136c-4b46-bb56-af4406eb26f3
relation.isAuthorOfPublicationac76819b-d91a-4158-b947-4a9e827e5e9d
relation.isAuthorOfPublication.latestForDiscovery8eb22794-136c-4b46-bb56-af4406eb26f3

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
Aprendizaje automatico.pdf
Size:
602.11 KB
Format:
Adobe Portable Document Format
Description:
versión editor

Collections