Postgrado - Ciencias de la Computación
Permanent URI for this community
Browse
Browsing Postgrado - Ciencias de la Computación by browse.metadata.advisor "Ochoa Luna, José Eduardo"
Now showing 1 - 5 of 5
Results Per Page
Sort Options
Item Deep neural networks based on gating mechanism for open-domain question answering(Universidad Católica San Pablo, 2018) Arch Tijera, Drake Christian; Ochoa Luna, José EduardoNowadays, Question Answering is being addressed from a reading comprehension approach. Usually, Machine Comprehension models are poweredby Deep Learning algorithms. Most related work faces the challenge by improving the Interaction Encoder, proposing several architectures strongly based on attention. In Contrast, few related work has focused on improving the Context Encoder. Thus, our work has explored in depth the Context Encoder. We propose a gating mechanism that controls the ow of information, from the Context Encoder towards Interaction Encoder. This gating mechanism is based on additional information computed previously. Our experiments has shown that our proposed model improved the performance of a competitive baseline model. Our single model reached 78.36% on F1 score and 69.1% on exact match metric, on the Stanford Question Answering benchmark.Item Desarrollo de un modelo híbrido usando modelos de aprendizaje profundo para la recuperación de información multi-modal en texto e imágenes(Universidad Católica San Pablo, 2017) Diaz Zeballos, Miler; Ochoa Luna, José EduardoActualmente el uso de los modelos de Aprendizaje Profundo en muchas áreas de investigación está demostrando excelentes resultados, el área de Recuperación de Información es una de ellas. Dentro de esta área existe una tarea que es la Recuperación de Información en múltiples modalidades. El objetivo principal de esta tarea es proyectar datos de diferentes modalidades dentro de un mismo espacio semántico o crear un modelo para establecer una relación entre estos espacios. En esta investigación se propone dos modelos híbridos intra-modales para tratar con imágenes y textos respectivamente y la elaboración de un modelo para establecer una relación entre ambas modalidades utilizando modelos de Aprendizaje Profundo. Los resultados serán evaluados en varios conjuntos de datos utilizados en el estado del arte para validar el rendimiento del modelo general.Item Un nuevo mecanismo de regularización para algoritmos de aprendizaje con pocas muestras(Universidad Católica San Pablo, 2021) Llerena Paricahua, Marcell; Ochoa Luna, José EduardoEl gran éxito de las redes neuronales profundas (DNN) incide sobre su capacidad de aprender características automáticamente aminorando la supervisión humana. No obstante, dicho éxito viene acompañado de la gran cantidad de datos necesarios para entrenar los modelos profundos. Por ejemplo, para que un modelo profundo aprenda a distinguir gatos de perros se necesitan cientos de miles de imágenes. Recientemente, una área del aprendizaje automático denominada meta aprendizaje ha recibido especial atención, cuyo principal objetivo es conseguir que los modelos profundos sean capaces de reutilizar experiencia aprendida en diferentes tareas para aplicarla en el aprendizaje de una nueva tarea, lo que en consecuencia debería otorgarle al modelo profundo la habilidad de aprender nuevas tareas a partir de pocas muestras. En respuesta a ello, en la literatura se han planteado algoritmos que son capaces de generalizar diferentes tareas con una sola muestra de entrenamiento. Sin embargo, aún adolecen de una baja tasa de exactitud. Motivo por el cual, en este proyecto de tesis se introduce un mecanismo de regularización con el objetivo que ayude a maximizar la generalización de las tareas. Nuestros experimentos han mostrado que nuestro método de regularización propuesto alcanza resultados competitivos respecto al estado del arte.Item Reconocimiento de entidades nombradas para el idioma español utilizando Conditional Random Fields con características no supervisadas(Universidad Católica San Pablo, 2017) Copara Zea, Jenny Linet; Ochoa Luna, José EduardoEl reconocimiento de entidades nombradas es una tarea relevante en el área de Procesamiento de Lenguaje Natural, su función es identificar entidades en textos para un idioma dado. El estudio de esta tarea se ha enfocado principalmente en el idioma inglés. Recientes estudios en el idioma inglés han mostrado que utilizar características no supervisadas tales como word embeddings mejoran el reconocimiento de entidades nombradas. En este trabajo se investiga si características no supervisadas pueden mejorar la tarea de NER supervisado en el idioma español. Para esto, se propone utilizar características no supervisadas mediante word representations y colocaciones, así como características adicionales en un clasificador Conditional Random Field (CRF). Resultados experimentales (82.44% de F-score en el corpus CoNLL-2002) muestran que el enfoque propuesto, en particular cuando se utiliza cross-lingual word representations, es comparable a abordajes de aprendizaje profundo, actualmente el estado del arte para NER en español.Item Traducción automática del español al inglés usando redes neuronales profundas con información conceptual de sentencias(Universidad Católica San Pablo, 2020) Bragagnini Mendizábal, César Marchelo; Ochoa Luna, José EduardoEl estado de arte en traducción automática está representado por una arquitectura encoder-decoder attention, teniendo como mayor criterio la atención específica de ciertas palabras durante diferentes momentos en la traducción de una oración fuente. El presente trabajo propone distintas modificaciones a una arquitectura encoder-decoder attention en que la información total de una sentencia es aprovechada por el mecanismo de atención, logrando que se considere por igual el vector representativo y las partes focalizadas de este. Nuestros resultados demuestran que estas modificaciones mejoran la traducción en relación a una línea base competitiva. Además, vale resaltar que la mayoría de trabajos se esfuerzan por construir modelos de Traducción Automática para varios idiomas, en su mayoría inglés, alemán, francés, ruso. Estas últimas técnicas no consideran al español por igual, pese a ser uno de los tres lenguajes más hablados en el mundo. Por este motivo, en esta tesis se enfatiza el aprendizaje de modelos para la traducción del español al inglés.