La temática de nuestra investigación es la aplicación de la teoría del muestreo estadístico a situaciones reales, ya sea en muestras extraídas a partir de encuestas o en el análisis de grandes volúmenes de datos que representan subconjuntos de poblaciones mayores. Concretamente, estas aplicaciones suelen conllevar una serie de errores y sesgos que terminan afectando a los estimadores usuales que se aplican en el muestreo. Algunos ejemplos de estos errores serían:
En esta línea, investigamos los métodos de entrevista que permiten a la persona entrevistada proporcionar una respuesta indirecta, en la cual el anonimato de su respuesta quede completamente garantizado. De esta forma, se puede reducir el sesgo de deseabilidad social (responder a una pregunta con lo que el entrevistado considera que es socialmente deseable, en lugar de responder con sinceridad), al tener la seguridad de que no será juzgado. Algunas de las técnicas que estudia nuestro grupo son: las respuestas aleatorizadas, las técnicas de conteo de ítems, las técnicas nominativas y los modelos no aleatorizados.
Esta línea se centra en el estudio y desarrollo de métodos para paliar los efectos que tiene la falta de respuesta (tanto parcial como total) sobre las estimaciones a partir de muestras. Si dicha falta de respuesta está relacionada de alguna manera con la variable objeto de estudio, los efectos de cara a las estimaciones pueden ser muy significativos. Los métodos más habituales en la literatura son: la reponderación a partir de información auxiliar poblacional, la imputación de datos faltantes mediante técnicas paramétricas y no paramétricas, y la sustitución de unidades no seleccionadas.
Las muestras no probabilísticas son aquellas en las que las probabilidades de inclusión (probabilidad de un miembro de la población de pertenecer a la muestra que se extraiga de ella) de cada individuo de la población o bien son desconocidas o bien son nulas para un subconjunto de ellos. Estos casos son habituales al emplear muestras de conveniencia (p. ej. encuestas online) donde los individuos se autoseleccionan, o al emplear muestras extraídas de marcos muestrales que no cubren toda la población (p. ej. listines telefónicos desactualizados o que no cubren toda la red de teléfonos móviles). Nuestro grupo de investigación trabaja desde hace años con técnicas como el Propensity Score Adjustment y la calibración para estimar las probabilidades de inclusión y mitigar el error de cobertura, así como con otros métodos basados en la modelización (modelos de superpoblación, imputación en masa).
http://ofertaimasd.ugr.es/fqm/grupos-de-investigacion/fqm-365-diseno-y-analisis-estadistico-de-encuestas-por-muestreo-dae/
https://www150.statcan.gc.ca/n1/edu/power-pouvoir/toc-tdm/5214718-eng.htm