Ciencias de la Computación

Permanent URI for this community

https://hdl.handle.net/20.500.12590/18025

Browse

Now showing 1 - 9 of 9

Análisis comparativo de técnicas de aprendizaje automático para detectar fraude en tarjetas de crédito
(Universidad Católica San Pablo, 2022) Tong Chabes, Luis; Ochoa Luna, Jose Eduardo
Este estudio resalta la importancia de llevar un control para detectar fraudes en tarjetas de crédito para prevenir diferentes riesgos hacia nuestros bienes. Las técnicas de Aprendizaje Automático han demostrado ser la solución para aprendizaje supervisado. Este trabajo identifica técnicas como Máquinas de Vectores de Soporte, Clasificador Bayesiano Ingenuo, Bosques Aleatorios, Red Neuronal y Extreme Gradiente Boost como las mejores técnicas según los trabajos relacionados. Este trabajo se enfocó en realizar todo el proceso que aborda un proyecto como este, es decir ingeniería de características, preparar los datos, lidiar con el desbalance de datos, entre otros. Se usó como herramienta de evaluación de rendimiento la validación cruzada k-fold para encontrar la mejor parametrización de cada una de estas técnicas, que son evaluadas con métricas de desempeño como exactitud y puntaje f1. A continuación se realiza una comparación de estos resultados agregando pruebas estadísticas como t de estudiante para obtener la técnica más adecuada. Finalmente se obtiene la mejor técnica Red Neuronal que por sus resultados es realmente superior a las técnicas restantes.
Análisis comparativo de técnicas de aprendizaje automático para detectar fraude en tarjetas de crédito
(Universidad Católica San Pablo, 2019) Tong Chabes, Luis; Ochoa Luna, Jose Eduardo
Este estudio resalta la importancia de llevar un control para detectar fraudes en tarjetas de crédito para prevenir diferentes riesgos hacia nuestros bienes. Las técnicas de Aprendizaje Automático han demostrado ser la solución para el aprendizaje supervisado. Este trabajo identifica técnicas como Máquinas de Vectores de Soporte, Clasificador Bayesiano Ingenuo, Bosques Aleatorios, Red Neuronal y Extreme Gradiente Boost como las mejores técnicas según los trabajos relacionados. Este trabajo se enfocó en realizar todo el proceso que aborda un proyecto como este, es decir ingeniería de características, preparar los datos, lidiar con el desbalance de datos, entre otros. Se usó como herramienta de evaluación de rendimiento la validación cruzada k-fold para encontrar la mejor parametrización de cada una de estas técnicas, que son evaluadas con métricas de desempeño como exactitud y puntaje f1. Y finalmente hacer una comparación de estos resultados agregando pruebas estadísticas como t de estudiante para obtener la técnica ganadora.
Clasificación de la personalidad utilizando procesamiento de lenguaje natural y aprendizaje profundo para detectar patrones de notas de suicidio en redes sociales
(Universidad Católica San Pablo, 2022) Lazo Vasquez, Ricardo Manuel; Ochoa Luna, Jose Eduardo
La Clasificación automática de Personalidad es un campo de estudio reciente en el área de Inteligencia Artificial. En los últimos años, surgieron diversas aplicaciones en la misma como detección de patologías psicológicas/ psiquiátricas, avances en asistentes personales, criminología, etc. Por otro lado, los modelos de aprendizaje profundo denominados Transformers han tenido un avance importante en el Procesamiento de Lenguaje Natural (NLP) siendo el estado del arte en diversas tareas. Sin embargo, estos modelos han sido poco aprovechados en la tarea de Clasificación automática de Personalidad. En ese sentido, en la presente investigación se propuso investigar los modelos Transformers para la tarea de detección automática de trazos de personalidad basados en la categorización de Myers-Briggs. Asimismo, se usó los modelos de detección de personalidad para identificar tendencias suicidas de personas en redes sociales. Los resultados obtenidos indican que el mejor modelo Transformer para realizar la detección de suicidios es RoBERTa Distil.
Construcción de un corpus académico para la generación automática de respuestas a preguntas puesto a prueba en el modelo BETO
(Universidad Católica San Pablo, 2023) Meza Lovon, Graciela Lecireth; Ochoa Luna, Jose Eduardo
En años recientes, se han publicado una variedad de modelos de aprendizaje profundo que se han destacado en diferentes tareas del procesamiento de lenguaje natural, como la generación automática de respuestas a preguntas. Una de las razones de este éxito, se debe a que dichos modelos incluyen estrategias de aprendizaje, que se enfocan en el uso de mecanismos de atención y transferencia de aprendizaje. A pesar de que el español es uno de los idiomas más hablados del mundo, la mayoría de estos modelos usan corpus en inglés, por lo cual, la comunidad científica que desea experimentar con estos modelos, en español, se ve limitada. En este contexto, esta tesis tiene por objetivo la creación de un corpus en español, y su posterior prueba usando un modelo para la generación automática de respuestas a preguntas. Dicho corpus, llamado Académico, fue creado usando la información de los sílabos de los cursos de la Escuela Profesional de Ciencia de la Computación. El corpus está compuesto por dos subconjuntos: Académico A y Académico B, que contienen 467 y 639 ejemplos, respectivamente. Con el propósito de garantizar la calidad del conjunto creado, se utilizaron métricas para evaluar el corpus, obteniéndose que, para el subconjunto Académico A, el CFR=100%, HQI de las buenas preguntas es 100%, MoOV=0%, Psi=100% y el coeficiente Kappa es 0.8478; mientras que, para el subconjunto Académico B, los valores de las métricas obtenidas fueron: CFR=100%, HQI de 100% para preguntas buenas, MoOV=0%, Psi=100% y un coeficiente Kappa de 0.8092. De esta evaluación, se puede concluir que el corpus Académico posee la calidad necesaria para realizar experimentos en modelos de generación automática de respuestas a preguntas. Además, en esta tesis se realizó un estudio de los modelos para la generación automática de respuestas a preguntas. De dicho estudio, se determinó que BETO es la mejor opción para poner a prueba el corpus creado. A fin de evaluar la implementación del modelo BETO, se diseñaron tres experimentos, a partir de los cuales se obtuvo que, EM=0.987 y F1=0.998, para Académico A; y que EM=0.831 y F1=0.91, para Académico B. En ambos conjuntos de datos, las métricas fueron mejores que las de BETO zero-shot.
Desarrollo de un bot conversacional médico de dominio cerrado usando conocimiento de enfermedades integrado en BERT
(Universidad Católica San Pablo, 2022) Nuñez Montes, Sebastian Alberto; Ochoa Luna, Jose Eduardo
No disponible.
Mejorando el proceso de transferencia de estilo neuronal en imágenes añadiendo mid-level representation
(Universidad Católica San Pablo, 2020) Lazo Cahua, Jordan Raji; Ochoa Luna, Jose Eduardo
En los últimos años se ha demostrado el poder que tienen las Redes Neuronales para la creación de imágenes artísticas mediante la separación y posterior recombinación del estilo y contenido de dos distintas imágenes. A este proceso se le conoce como transferencia de estilo neuronal, y es un tópico que está recibiendo interés, tanto de la comunidad académica como de la industria. En este trabajo se aborda el enfoque basado en la optimización de imágenes que nos permite trabajar con estilos artísticos arbitrariamente; sin embargo, es un proceso con un costo computacional significativo. Debido a esto, se ha propuesto modificaciones que permitan realizar la transferencia de estilo neuronal con un menor coste computacional, y añadiendo también un indicador de similitud que determina si la imagen sintetizada ha logrado obtener el estilo deseado utilizando mid-level representación. Estas modificaciones, han dado mejores resultados visuales, además el tiempo de ejecución que demora en hacer una iteración ha mejorado hasta en 1.53⇥ veces frente a otros métodos y con el indicador de la similitud se ha logrado reducir el número de iteraciones necesarias para obtener la imagen estilizada.
Modelo secuencia a secuencia para construcción de un sistema de diálogo
(Universidad Católica San Pablo, 2021) Zevallos Aliaga, Joseline Maria; Ochoa Luna, Jose Eduardo
Los Sistemas de Diálogo han tenido una gran atención hoy en día. Ya que los avances recientes son aportados por las técnicas de aprendizaje profundo. Que se han aplicado para una gran cantidad de datos, o en este caso en conversaciones de preguntas y respuestas. Generalmente los sistemas de diálogo se dividen en dos: sistemas orientados a tareas y no orientados a tareas. El modelo Secuencia a Secuencia es parte del sistema no orientado a tareas, además es la parte clave de los sistemas de diálogo. Este modelo se convierte en uno de los principales modelos de tareas de generación de conversaciones. Para tener una correcta generación de respuestas proponemos un modelo secuencia a secuencia utilizando la red Redes Neuronales Recurrentes Bidireccionales (BRNN). La ventaja de la red BRNN es que permite trabajar simultáneamente en la dirección del tiempo positivo y negativo.
Quantum exordium for natural language processing: a novel approach to sample on decoders
(Universidad Católica San Pablo, 2021) Muroya Lei, Stefanie; Ochoa Luna, Jose Eduardo
The sampling task of Seq2Seq models in Natural Language Processing (NLP) is based on heuristics because of the Non-Deterministic Polynomial Time (NP) nature of this problem. The goal of this research is to develop a quantum sampler for Seq2Seq models, and give evidence that Quantum Annealing (QA) can guide the search space of these samplers. The contribution of this work is given by showing an architecture to represent Recurrent Neural Networks (RNN) in a quantum computer to finally develop a quantum sampler. The individual architectures (i.e. summation, multiplication, argmax, and activation functions) achieve optimal accuracies in both simulated and quantum environments. While the results of the overall proposal show that it can either outperform or match greedy approaches. As the very first steps of quantum NLP, these are tested against simple RNN with a synthetic data set of random numbers, and a real quantum computer is utilized. Since affine functions are the basis of most Artificial Intelligence (AI) models, this method can be applied to more complex architectures in the future.
Quantum exordium for natural language processing: A novel approach to sample on decoders
(Universidad Católica San Pablo, 2021) Muroya Lei, Stefanie; Ochoa Luna, Jose Eduardo
The sampling task of Seq2Seq models in Natural Language Processing (NLP) is based on heuristics because of the Non-Deterministic Polynomial Time (NP) nature of this problem. The goal of this research is to develop a quantum sampler for Seq2Seq models, and give evidence that Quantum Annealing (QA) can guide the search space of these samplers. The contribution of this work is given by showing an architecture to represent Recurrent Neural Networks (RNN) in a quantum computer to finally develop a quantum sampler. The individual architectures (i.e. summation, multiplication, argmax, and activation functions) achieve optimal accuracies in both simulated and quantum environments. While the results of the overall proposal show that it can either outperform or match greedy approaches. As the very first steps of quantum NLP, these are tested against simple RNN with a synthetic data set of random numbers, and a real quantum computer is utilized. Since ane functions are the basis of most Artificial Intelligence (AI) models, this method can be applied to more complex architectures in the future.

Browse

Browsing Ciencias de la Computación by browse.metadata.advisor "Ochoa Luna, Jose Eduardo"

Results Per Page

Sort Options