Implementación y optimización de algoritmos para aprendizaje automático con teoría de perturbaciones
- Ortega Tenezaca, Delfín Bernabé
- Cristian-Robert Munteanu Director
- Aliuska Duardo Sánchez Director/a
Universidad de defensa: Universidade da Coruña
Fecha de defensa: 31 de marzo de 2023
- Enrique Onieva Caracuel Presidente/a
- A. Pazos Secretario
- Miren Josune Pérez Estrada Vocal
Tipo: Tesis
Resumen
En la actualidad se ha acumulado una ingente cantidad de datos relacionados con sistemas complejos de muy variada indole: biomoleculares, economicos, sociales, etc. Estos sistemas son de gran relevancia en diferentes areas como las ciencias biomoleculares, ingenieria biomedica, y las ciencias sociales y juridicas. Las tecnicas de Inteligencia Artificial (IA) y/o Machine Learning (ML) pueden ser utiles para predecir propiedades de interes de estos sistemas. Para ello se necesitan al menos dos pasos principales. El primero se refiere a recopilar informacion similar de muchos casos de sistemas conocidos para poder entrenar los modelos AI/ML. El segundo paso indispensable esta relacionado con la cuantificacion numerica de informacion estructural, de las condiciones externas al sistema, y de las propiedades del mismo a ser predichas. En este segundo paso se definen las variables numericas de entrada y salida para entrenar los algoritmos AI/ML. Desafortunadamente los sistemas complejos estan compuestos por lo general por varios subsistemas no encontrandose informacion del sistema como un todo o de sus partes en la misma fuente. No obstante, si es habitual encontrar en varias fuentes dispersas informacion sobre cada uno de los subsistemas y sus propiedades. Para resolver esta problematica se ha desarrollado el algoritmo NIFPTML = NI + IF + PT + ML. Estos algoritmos involucran las siguientes etapas. En la etapa NI (Network Invariant) se usan redes complejas para representar distintos sistemas y/o sus subsistemas y se calculan las invariantes de estas redes para cuantificar su estructura. En la siguiente etapa es necesario utilizar tecnicas de Fusion de Informacion (IF) de diversas fuentes para obtener un conjunto de datos enriquecido. Posteriormente los operadores de la Teoria de Perturbacion (PT) procesan la informacion cuantificando las perturbaciones/desviaciones en las variables estructurales con respecto a valores esperados para diferentes subconjuntos de variables categoricas. Por ultimo, en la etapa de Aprendizaje Automatico (ML) se entrenan distintos algoritmos AI/ML permitiendo encontrar modelos predictivos. Los algoritmos NIFPTML han sido ampliamente utilizados y los resultados publicados en la literatura cientifica. Desafortunadamente, no existe una aplicacion de software de facil manejo (user-friendly) para los usuarios habituales de estos algoritmos. Por lo tanto, los desarrolladores de algoritmos NIFPTML necesitan utilizar varias herramientas diferentes para cada una de las etapas. Por otra parte, existe desconocimiento de las implicaciones juridicas del desarrollo de algoritmos computacionales como los NIFPTML en investigacion cientifica en estas areas. En esta tesis nos proponemos desarrollar (programar) una version beta de un software, al que hemos llamado SOFT.PTML, en el que se implementan por primera vez algoritmos NIFPTML en una misma aplicacion. Ademas, se demostrara la utilidad de este programa aplicandolo a distintos problemas practicos en las areas mencionadas: diseno de farmacos, descubrimiento de nanomateriales, estudio de sistemas juridicos. Por ultimo, se aportara un analisis de las implicaciones juridicas del desarrollo y aplicacion de este tipo de algoritmos en investigacion.