La correlación bayesiana no deja de ser una distribución, y con objeto de ilustrarlo hemos creado esta breve referencia en este blog, usando como base de datos un antiguo estudio de nuestro grupo de investigación en Psicología Criminal y Forense. Para ello hemos utilizado el SPSS 25 tanto para explorar los datos de forma gráfica como para realizar las correspondientes estadísticas bayesianas.
En primer lugar programamos los gráficos de dispersión por pares para los tres tipos clásicos de variables de control (edad primer delito no sancionado, edad del primer delito sancionado y edad de la primera entrada en prisión) usadas en los comportamientos de sujetos sometidos al régimen de institucionalización en un presidio:
Estos gráficos muestran cierto grado de correlación entre estas tres variables. Y con objeto de obtener más detalles sobre estas correlaciones, usamos
el correspondiente procedimiento bayesiano implementado en SPSS 25 para caracterizar la distribución posterior de la correlación lineal entre edades,
manteniendo todas las opciones como predeterminadas, incluyendo la distribución uniforme apriori (que se muestra en las líneas rojas planas en los gráficos que veremos posteriormente).
El intervalo de 95% de credibilidad del coeficiente de correlación de Pearson para edad primer delito no sancionado versus edad primer delito sancionado es (0,375 a 0,612),
para la edad del primer delito no sancionado versus edad primera entrada en prisión es (0,223 a 0,495) y para edad primer delito sancionado versus edad primera entrada en prisión es (0,705 a 0,832).
Es interesante ver cómo estas correlaciones difieren, pero este ejemplo sirve sobre todo como un buen recordatorio de que en las estadísticas bayesianas las correlaciones
no son números individuales sino más bien distribuciones (Edwards, Lindman & Savage, 1963):
edad primer delito no sancionado versus edad primer delito sancionado
edad del primer delito no sancionado versus edad primera entrada en prisión
edad primer delito sancionado versus edad primera entrada en prisión
Por otra parte, la estimación del factor de Bayes, cuando se selecciona como opción constituye una razón natural para comparar las probabilidades marginales entre una hipótesis nula y una alternativa.
Aplicado a nuestro caso el resultado será:
En la siguiente tabla (reformulación de SPSS 25, 2017), se encuentran descritos los criterios comúnmente usados a la hora de valorar la importancia de las evidencias tanto para Ho como para H1.
Factor bayesiano | Evidencia de la categoría | |
>100 | Evidencia Extrema de Ho | |
30-100 | Muy Fuerte Evidencia de Ho | |
10-30 | Fuerte Evidencia de Ho | |
3-10 | Moderada Evidencia de Ho | |
1-3 | Evidencia Anecdótica de Ho | |
1 | No Evidencia | |
0,33-1 | Evidencia Anecdótica de H1 | |
0,1-0,33 | Evidencia Moderada de H1 | |
0,033-0,1 | Fuerte Evidencia de H1 | |
0,01-0,033 | Muy Fuerte Evidencia de H1 | |
<0,01 | Evidencia Extrema de H1 |
Referencias.
* Edwards, W.; Lindman, H. & Savage, L.J. (1963). Bayesian statistical inference in psychological research. Psychological Review, 70, 193-242
*SPSS 25 (2017). Bayesian Independent - Sample Inference. IBM Knowledge Center. New York, EU. Recuperado de https://www.ibm.com/support/knowledgecenter/en/SSLVMB_sub/statistics_mainhelp_ddita/spss/advanced/idh_bayesian_independent_sample_inference.html