TFG(Re)Search Investigación en Matemáticas

Análisis de Datos Funcionales (FDA)

Profesores implicados

Director del grupo de investigación:

Coordinadora de la línea de investigación Análisis de Datos Funcionales:

Miembros del grupo que trabajan en las líneas que se describen a continuación:

Otros miembros del grupo de investigación:

Colaboradores del grupo de investigación:

Los profesores sin adscripción explícita son miembros del Dpto. de Estadística e Investigación Operativa

Tipologías posibles

  • Complemento de profundización
  • Docencia e innovación
  • Herramientas informáticas
  • Iniciación a la investigación

Breve descripción

Hoy en día es muy frecuente disponer de datos de alta dimensión asociados a un gran número de variables muy correladas, de las que usualmente se dispone de muestras pequeñas. Los métodos estadísticos tradicionales de regresión, clasificación y predicción con frecuencia no son eficientes para estos datos debido a problemas de tamaño muestral y sobreajuste. Los datos funcionales son un tipo de datos de alta dimensión en los que se dispone de un gran número de observaciones de una o varias variables en un argumento continuo, generalmente el tiempo, sobre una muestra de individuos.

En general, el Análisis de Datos Funcionales (FDA) engloba una gran variedad de métodos estadísticos en los que los datos proporcionan información sobre curvas o cualquier otra función que varía de forma continua. En la mayoría de los casos se dispone de una muestra de curvas que proceden de la evolución temporal de una variable aleatoria (proceso estocástico). La principal ventaja del análisis de datos funcionales es que se tiene en cuenta la información proporcionada por las funciones como su continuidad, suavidad, etc. El FDA adquiere cuerpo de doctrina a mediados de los años noventa en base a la primera edición del libro de Ramsay y Silverman, (1997) y desde entonces, el número de contribuciones a este campo no ha parado de incrementar con el fin de intentar generalizar las metodologías clásicas al caso funcional.

El punto de partida en la investigación del equipo es la proyección de las curvas muestrales en un espacio de dimensión finita generado por una base de funciones adecuadamente seleccionada y la obtención de los coeficientes básicos a partir de las observaciones discretas disponibles para cada curva. A su vez, en cada uno de las líneas se pretende desarrollar un software de fácil manejo, partiendo de programas implementados en R. Finalmente, se pretende abordar diversos problemas con datos reales en quimiometría, ciencias medioambientales, ingeniería y bibliometría.

Descripción de líneas

Representación básica de curvas muestrales.

Fourier, B-splines, Wavelets. Estimación penalizada.

Reducción de dimensión

Análisis funcional en componentes principales (FPCA) y en componentes independientes (FICA).

Aprendizaje estadístico funcional

Regresión lineal y logística con datos funcionales, regresión en componentes principales y regresión PLS, regresión ridge y lasso, análisis discriminante funcional, análisis clúster funcional.

Bibliografía

Algunos de nuestros artículos más recientes son: