Construcción de un corpus académico para la generación automática de respuestas a preguntas puesto a prueba en el modelo BETO

dc.contributor.advisorOchoa Luna, Jose Eduardo
dc.contributor.authorMeza Lovon, Graciela Lecireth
dc.date.accessioned2023-03-27T15:14:07Z
dc.date.available2023-03-27T15:14:07Z
dc.date.issued2023
dc.description.abstractEn años recientes, se han publicado una variedad de modelos de aprendizaje profundo que se han destacado en diferentes tareas del procesamiento de lenguaje natural, como la generación automática de respuestas a preguntas. Una de las razones de este éxito, se debe a que dichos modelos incluyen estrategias de aprendizaje, que se enfocan en el uso de mecanismos de atención y transferencia de aprendizaje. A pesar de que el español es uno de los idiomas más hablados del mundo, la mayoría de estos modelos usan corpus en inglés, por lo cual, la comunidad científica que desea experimentar con estos modelos, en español, se ve limitada. En este contexto, esta tesis tiene por objetivo la creación de un corpus en español, y su posterior prueba usando un modelo para la generación automática de respuestas a preguntas. Dicho corpus, llamado Académico, fue creado usando la información de los sílabos de los cursos de la Escuela Profesional de Ciencia de la Computación. El corpus está compuesto por dos subconjuntos: Académico A y Académico B, que contienen 467 y 639 ejemplos, respectivamente. Con el propósito de garantizar la calidad del conjunto creado, se utilizaron métricas para evaluar el corpus, obteniéndose que, para el subconjunto Académico A, el CFR=100%, HQI de las buenas preguntas es 100%, MoOV=0%, Psi=100% y el coeficiente Kappa es 0.8478; mientras que, para el subconjunto Académico B, los valores de las métricas obtenidas fueron: CFR=100%, HQI de 100% para preguntas buenas, MoOV=0%, Psi=100% y un coeficiente Kappa de 0.8092. De esta evaluación, se puede concluir que el corpus Académico posee la calidad necesaria para realizar experimentos en modelos de generación automática de respuestas a preguntas. Además, en esta tesis se realizó un estudio de los modelos para la generación automática de respuestas a preguntas. De dicho estudio, se determinó que BETO es la mejor opción para poner a prueba el corpus creado. A fin de evaluar la implementación del modelo BETO, se diseñaron tres experimentos, a partir de los cuales se obtuvo que, EM=0.987 y F1=0.998, para Académico A; y que EM=0.831 y F1=0.91, para Académico B. En ambos conjuntos de datos, las métricas fueron mejores que las de BETO zero-shot.es_PE
dc.description.uriTesises_PE
dc.formatapplication/pdfes_PE
dc.identifier.other1076710
dc.identifier.urihttps://hdl.handle.net/20.500.12590/17485
dc.language.isospaes_PE
dc.publisherUniversidad Católica San Pabloes_PE
dc.publisher.countryPEes_PE
dc.rightsinfo:eu-repo/semantics/openAccesses_PE
dc.rights.urihttps://creativecommons.org/licenses/by/4.0/es_PE
dc.sourceUniversidad Católica San Pabloes_PE
dc.sourceRepositorio Institucional - UCSPes_PE
dc.subjectModelos de generación automática de respuestas a preguntases_PE
dc.subjectBETOes_PE
dc.subjectCorpuses_PE
dc.subjectMecanismo de atenciónes_PE
dc.subjectTransferencia de aprendizajees_PE
dc.subjectModelos basados en BERTes_PE
dc.subjectConjunto de datoses_PE
dc.subject.ocdehttp://purl.org/pe-repo/ocde/ford#1.02.01es_PE
dc.titleConstrucción de un corpus académico para la generación automática de respuestas a preguntas puesto a prueba en el modelo BETOes_PE
dc.typeinfo:eu-repo/semantics/bachelorThesis
dc.type.versioninfo:eu-repo/semantics/publishedVersiones_PE
renati.advisor.dni29738760
renati.advisor.orcidhttps://orcid.org/0000-0002-8979-3785es_PE
renati.author.dni40222974
renati.discipline611016es_PE
renati.jurorTúpac Valdivia, Yván Jesúses_PE
renati.jurorGutiérrez Cáceres, Juan Carloses_PE
renati.levelhttps://purl.org/pe-repo/renati/level#tituloProfesional
renati.typehttps://purl.org/pe-repo/renati/type#tesis
thesis.degree.disciplineCiencia de la Computaciónes_PE
thesis.degree.grantorUniversidad Católica San Pablo. Departamento de Ciencia de la Computaciónes_PE
thesis.degree.levelTítulo Profesionales_PE
thesis.degree.nameIngeniero Informáticoes_PE
thesis.degree.programEscuela Profesional de Ciencia de la Computaciónes_PE
Files
Original bundle
Now showing 1 - 4 of 4
No Thumbnail Available
Name:
ACTA_MEZA_LOVON_GRA.pdf
Size:
753.98 KB
Format:
Adobe Portable Document Format
Loading...
Thumbnail Image
Name:
MEZA_LOVON_GRA_CON.pdf
Size:
2.21 MB
Format:
Adobe Portable Document Format
No Thumbnail Available
Name:
QOLQA_MEZA_LOVON_GRA.pdf
Size:
802.59 KB
Format:
Adobe Portable Document Format
No Thumbnail Available
Name:
TURNITIN_MEZA_LOVON_GRA.pdf
Size:
13.11 MB
Format:
Adobe Portable Document Format
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed upon to submission
Description: