Análisis de Datos Funcionales (FDA)
Profesores implicados
Director del grupo de investigación:
Coordinadora de la línea de investigación Análisis de Datos Funcionales:
Miembros del grupo que trabajan en las líneas que se describen a continuación:
- Manuel Escabias Machuca
- M. Carmen Aguilera Morillo Dpto. de Estadística e I.O. aplicadas y calidad de la Universidad Politécnica de Valencia
- Christian J. Acal González
Otros miembros del grupo de investigación:
Colaboradores del grupo de investigación:
- Tonio Di Battista Universidad de “G. d’Annunzio” Chieti-Pescara
- Francesca Fortuna (Universidad de Roma)
- Christian Preda (Universidad de Lille)
- Juan Bautista Roldán Aranda (Universidad de Granada)
- Mario Lanza (Universidad de Soochow, China)
- …
Los profesores sin adscripción explícita son miembros del Dpto. de Estadística e Investigación Operativa
Tipologías posibles
- Complemento de profundización
- Docencia e innovación
- Herramientas informáticas
- Iniciación a la investigación
Breve descripción
Hoy en día es muy frecuente disponer de datos de alta dimensión asociados a un gran número de variables muy correladas, de las que usualmente se dispone de muestras pequeñas. Los métodos estadísticos tradicionales de regresión, clasificación y predicción con frecuencia no son eficientes para estos datos debido a problemas de tamaño muestral y sobreajuste. Los datos funcionales son un tipo de datos de alta dimensión en los que se dispone de un gran número de observaciones de una o varias variables en un argumento continuo, generalmente el tiempo, sobre una muestra de individuos.
En general, el Análisis de Datos Funcionales (FDA) engloba una gran variedad de métodos estadísticos en los que los datos proporcionan información sobre curvas o cualquier otra función que varía de forma continua. En la mayoría de los casos se dispone de una muestra de curvas que proceden de la evolución temporal de una variable aleatoria (proceso estocástico). La principal ventaja del análisis de datos funcionales es que se tiene en cuenta la información proporcionada por las funciones como su continuidad, suavidad, etc. El FDA adquiere cuerpo de doctrina a mediados de los años noventa en base a la primera edición del libro de Ramsay y Silverman, (1997) y desde entonces, el número de contribuciones a este campo no ha parado de incrementar con el fin de intentar generalizar las metodologías clásicas al caso funcional.
El punto de partida en la investigación del equipo es la proyección de las curvas muestrales en un espacio de dimensión finita generado por una base de funciones adecuadamente seleccionada y la obtención de los coeficientes básicos a partir de las observaciones discretas disponibles para cada curva. A su vez, en cada uno de las líneas se pretende desarrollar un software de fácil manejo, partiendo de programas implementados en R. Finalmente, se pretende abordar diversos problemas con datos reales en quimiometría, ciencias medioambientales, ingeniería y bibliometría.
Descripción de líneas
Representación básica de curvas muestrales.
Fourier, B-splines, Wavelets. Estimación penalizada.
Reducción de dimensión
Análisis funcional en componentes principales (FPCA) y en componentes independientes (FICA).
Aprendizaje estadístico funcional
Regresión lineal y logística con datos funcionales, regresión en componentes principales y regresión PLS, regresión ridge y lasso, análisis discriminante funcional, análisis clúster funcional.
Bibliografía
Algunos de nuestros artículos más recientes son:
- Basis expansion approaches for functional analysis of variance with repeated measures
- logitFD: an R package for functional principal component logit regression
- Memristor variability and stochastic physical properties modeling from a multivariate time series approach
- Functional ANOVA approaches for detecting changes in air pollution during the COVID-19 pandemic
- Linear-Phase-Type probability modelling of functional PCA with applications to resistive memories
- Comparison of Positivity in Two Epidemic Waves of COVID-19 in Colombia with FDA
- Introducing a bibliometric index based on factor analysis
- Assessing Social Interest in Burnout Using Google Trends Data
- Functional Modeling of High-Dimensional Data: A Manifold Learning Approach
- Fast partial quantile regression
- Bi-Smoothed Functional Independent Component Analysis for EEG Artifact Removal