lunes, 13 de noviembre de 2017

SPSS 25: Introducción a la correlación bayesiana

La correlación bayesiana no deja de ser una distribución, y con objeto de ilustrarlo hemos creado esta breve referencia en este blog, usando como base de datos un antiguo estudio de nuestro grupo de investigación en Psicología Criminal y Forense. Para ello hemos utilizado el SPSS 25  tanto para explorar los datos de forma gráfica como para realizar las correspondientes estadísticas bayesianas. 


 En primer lugar programamos los gráficos de dispersión por pares para los tres tipos clásicos de variables de control (edad primer delito no sancionado, edad del primer delito sancionado y edad de la primera entrada en prisión) usadas en los comportamientos de sujetos sometidos al régimen de institucionalización en un presidio:

Estos gráficos muestran cierto grado de correlación entre estas tres variables. Y con objeto de obtener más detalles sobre estas correlaciones, usamos el correspondiente procedimiento bayesiano implementado en SPSS 25 para caracterizar la distribución posterior de la correlación lineal entre edades, manteniendo todas las opciones como predeterminadas, incluyendo la distribución uniforme apriori (que se muestra en las líneas rojas planas en los gráficos que veremos posteriormente). 

El intervalo de 95% de credibilidad del coeficiente de correlación de Pearson para edad primer delito no sancionado versus edad primer delito sancionado es (0,375 a 0,612), para la edad del primer delito no sancionado versus edad primera entrada en prisión es (0,223 a 0,495) y para edad primer delito sancionado versus edad primera entrada en prisión es (0,705 a 0,832). 

Es interesante ver cómo estas correlaciones difieren, pero este ejemplo sirve sobre todo como un buen recordatorio de que en las estadísticas bayesianas las correlaciones no son números individuales sino más bien distribuciones (Edwards,  Lindman &  Savage, 1963):

edad primer delito no sancionado versus edad primer delito sancionado

edad del primer delito no sancionado versus edad primera entrada en prisión

edad primer delito sancionado versus edad primera entrada en prisión

Por otra parte, la estimación del factor de Bayes, cuando se selecciona como opción constituye una razón natural para comparar las probabilidades marginales entre una hipótesis nula y una alternativa.
Aplicado a nuestro caso el resultado será:

En la siguiente tabla (reformulación de SPSS 25, 2017), se encuentran descritos los criterios comúnmente usados a la hora de valorar la importancia de las evidencias tanto para Ho como para H1.

Factor bayesianoEvidencia de la categoría
>100Evidencia Extrema de Ho
30-100Muy Fuerte Evidencia de Ho
10-30Fuerte Evidencia de Ho
3-10Moderada Evidencia de Ho
1-3Evidencia Anecdótica de Ho
1No Evidencia
0,33-1Evidencia Anecdótica de H1
0,1-0,33Evidencia Moderada de H1
0,033-0,1Fuerte Evidencia de H1
0,01-0,033Muy Fuerte Evidencia de H1
<0,01Evidencia Extrema de H1

Referencias.
* Edwards, W.; Lindman, H. & Savage, L.J. (1963). Bayesian statistical inference in psychological research. Psychological Review, 70, 193-242
*SPSS 25 (2017). Bayesian Independent - Sample Inference. IBM Knowledge Center. New York, EU. Recuperado de https://www.ibm.com/support/knowledgecenter/en/SSLVMB_sub/statistics_mainhelp_ddita/spss/advanced/idh_bayesian_independent_sample_inference.html