jueves, 5 de mayo de 2016

Tamaño del efecto en la prueba U de Mann-Whitney

Una alternativa clásica a la prueba de la t de Student, es la prueba no paramétrica conocida como U de Mann-Whitney (Mann-Whitney-Wilcoxon, prueba de suma de rangos Wilcoxon, o prueba de Wilcoxon-Mann-Whitney), y aplicada a dos muestras independientes, con datos a nivel de escala ordinal o intervalo/razón pero donde no se puede asumir normalidad. 

Es un procedimiento que es fácil de programar en sistemas como el SPSS, como podemos comprobar en el siguiente caso:
En esta entrada nos vamos a ceñir a describir como podemos obtener el tamaño del efecto a posteriori, necesario en el análisis estadístico científico, de acuerdo a las últimas recomendaciones de la APA (2009) y ASA (Wasserstein & Lazar, 2016), y que no aparece recogido en el programa estadístico del SPSS.

Este estadístico, frecuentemente se describe por:
...donde la Z se toma en valor absoluto.

Mirando en el ejemplo anterior encontraremos los elementos en las celdas resaltadas en rojo....
Ahora sustituyendo, en la fórmula con los datos anteriores ofrecidos por el SPSS...
                       2,685/SQRT(10)= 0,849

Donde, a la hora de valorar el tamaño de los efectos obtenidos, se puede usar el criterio  descrito por Cohen (1988): r=0,10 (bajo)/r=0,30(medio)/r=0,50(grande)/r=0,70(muy grande)

Para una interpretación mas detallada puede servir la siguiente tabla recogida de la web Psychometrica (2016), que incluye las interpretaciones de Cohen (1968) y Hattie (2009) :
Por supuesto, en los casos de tener diversas pruebas estadísticas es mejor programar el procedimiento bien en la ventana de sintaxis del propio SPSS o en R. En nuestro caso hemos elegido usar R:

Una forma de referenciar los resultados anteriores en un artículo sería: 
"Encontrando un efecto significativo entre los grupos (la media de rangos del grupo 1 y 2 son 3 y 8 repectivamente; U = 0, Z = -2.685, p = 0.007, r = 0.849)". 

Un procedimiento completo en R también es posible programarlo, como podemos ver a continuación:
############################
library("coin")
x1<-c(1,2,2,2,1,6,7,7,8,7)
g<-c(1,1,1,1,1,2,2,2,2,2)
g<-as.factor(g)
N            <- length(x1) # tamaño muestral
Test   <- wilcox_test( x1 ~ g, distribution = "exact" )
Test
tamaEfecto <- statistic( Test ) / sqrt( N )
tamaEfecto
############################

Es muy útil (recomendable) cuando tenemos porcentajes que contrastar en dos situaciones independientes.

Referencias.
*APA. (2009). Publication Manual of the American Psychological Association (6th ed.). Washington, DC: American Psychological Association.
*Cohen, J. (1988), Statistical Power Analysis for the Behavioral Sciences, 2nd Edition. Hillsdale: Lawrence Erlbaum.
*Hattie, J. (2009). Visible Learning. London: Routledge.
*Psychometrica (2016). Computation of Effect Sizes. Recuperado de http://www.psychometrica.de/effect_size.html.
*Wasserstein,R.L. & Lazar,N.A. (2016): The ASA's statement on p-values: context, process, and purpose, The American Statistician, DOI: 10.1080/00031305.2016.1154108 , recuperado de  http://dx.doi.org/10.1080/00031305.2016.1154108)