RT Journal Article T1 Aprendizaje automático versus expresiones regulares en la detección de la negación y la especulación en biomedicina T1 Machine learning versus regular expressions in negation and speculationdetection in biomedicine A1 Cruz Díaz, Noa Patricia A1 Maña López, Manuel Jesús A1 Mata Vázquez, Jacinto AB En este artículo, presentamos un sistema de aprendizaje automático que identifica lasexpresiones de negación y especulación en textos biomédicos, en concreto, en la colección dedocumentos BioScope. El objetivo de este trabajo es contrastar la eficiencia de este enfoquecentrado en aprendizaje automático con el que se basa en expresiones regulares. Entre lossistemas que siguen este último enfoque, hemos utilizado NegEx por su disponiblidad ypopularidad. La evaluación se ha llevado a cabo sobre las tres subcolecciones que formanBioScope: documentos clínicos, artículos científicos y resúmenes de artículos científicos. Losresultados muestran la superioridad del enfoque basado en aprendizaje automático respecto a lautilización de expresiones regulares. En la identificación de expresiones de negación, el sistemapropuesto mejora la medida F1 de NegEx entre un 20 y un 30%, dependiendo de la colección dedocumentos. En la identificación de la especulación, el sistema propuesto supera la medida F1del mejor algoritmo de línea base entre un 10 y un 20%. AB In this paper, we present a machine learning system that identify the negation andspeculation signals in biomedical texts, in particular, in the BioScope corpus. The objective ofthis research is to compare the efficiency of this approach focused on machine learning withwhich it is based on regular expressions. Among the systems that follow the latter approach, weused NegEx because of its availability and popularity. The evaluation has been carried out onthe three subcollections which make up Bioscope: clinical documents, scientific papers andabstracts of scientific articles. The results show the superiority of the approach based onmachine learning over the use of regular expressions. In the detection of expressions ofnegation, the proposed system improves the F1 measure of NegEx by between 20 and 30%,depending on the collection of documents. In the speculation detection, the proposed systemoutperforms the F1 measure of the best system between 10 and 20%. PB Sociedad Española para el Procesamiento del Lenguaje Natural (SEPLN) SN 1135-5948 SN 1989-7553 (electrónico) YR 2010 FD 2010 LK http://hdl.handle.net/10272/11257 UL http://hdl.handle.net/10272/11257 LA spa NO Cruz Díaz, N.P., Maña López, M.J., Mata Vázquez, J.: "Aprendizaje automático versus expresiones regulares en la detección de la negación y la especulación en biomedicina". Procesamiento del Lenguaje Natural. Nº 45, págs. 77-85, (2010). ISSN 1135-5948 DS Repositorio Institucional de la Universidad de Huelva RD 30 may 2026