Reconocimiento de entidades nombradas para el idioma español utilizando Conditional Random Fields con características no supervisadas

dc.contributor.advisorOchoa Luna, José Eduardo
dc.contributor.authorCopara Zea, Jenny Linet
dc.date.accessioned2017-08-10T17:27:09Z
dc.date.available2017-08-10T17:27:09Z
dc.date.issued2017
dc.description.abstractEl reconocimiento de entidades nombradas es una tarea relevante en el área de Procesamiento de Lenguaje Natural, su función es identificar entidades en textos para un idioma dado. El estudio de esta tarea se ha enfocado principalmente en el idioma inglés. Recientes estudios en el idioma inglés han mostrado que utilizar características no supervisadas tales como word embeddings mejoran el reconocimiento de entidades nombradas. En este trabajo se investiga si características no supervisadas pueden mejorar la tarea de NER supervisado en el idioma español. Para esto, se propone utilizar características no supervisadas mediante word representations y colocaciones, así como características adicionales en un clasificador Conditional Random Field (CRF). Resultados experimentales (82.44% de F-score en el corpus CoNLL-2002) muestran que el enfoque propuesto, en particular cuando se utiliza cross-lingual word representations, es comparable a abordajes de aprendizaje profundo, actualmente el estado del arte para NER en español. es_PE
dc.description.uriTesises_PE
dc.formatapplication/pdfes_PE
dc.identifier.other1055563
dc.identifier.urihttps://hdl.handle.net/20.500.12590/15404
dc.language.isospaes_PE
dc.publisherUniversidad Católica San Pabloes_PE
dc.publisher.countryPEes_PE
dc.rightsinfo:eu-repo/semantics/openAccesses_PE
dc.rights.urihttps://creativecommons.org/licenses/by/4.0/es_PE
dc.sourceUniversidad Católica San Pabloes_PE
dc.sourceRepositorio Institucional - UCSPes_PE
dc.subjectProcesamiento de lenguaje naturales_PE
dc.subjectNER para españoles_PE
dc.subjectConditional Random Fieldses_PE
dc.subjectWord embeddingses_PE
dc.subject.ocdehttp://purl.org/pe-repo/ocde/ford#1.02.01es_PE
dc.titleReconocimiento de entidades nombradas para el idioma español utilizando Conditional Random Fields con características no supervisadases_PE
dc.typeinfo:eu-repo/semantics/masterThesis
thesis.degree.disciplineCiencia de la Computaciónes_PE
thesis.degree.grantorUniversidad Católica San Pablo. Facultad de Ingeniería y Computaciónes_PE
thesis.degree.levelMaestríaes_PE
thesis.degree.nameMaestro en Ciencia de la Computaciónes_PE
thesis.degree.programEscuela Profesional de Ciencia de la Computaciónes_PE
Files
Original bundle
Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
COPARA_ZEA_JEN_REC.pdf
Size:
777.73 KB
Format:
Adobe Portable Document Format
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed upon to submission
Description: