lunes, 17 de enero de 2011

Prueba de T pareada en R.

A diferencia de la prueba de T para muestras independientes, la prueba de T pareada se utiliza para muestras o variables que pertenecen a un mismo individuo o entidad en estudio (por ejemplo, la altura de los niños de la guardería "gotita de gente" (viva el ICBF) antes y después de un tratamiento con bienestarina durante 6 meses). Entonces, por obvias razones las columnas deben tener el mismo numero de casillas porque esto representaría medidas antes y después de "algo".

Para explicar la T pareada utilizaremos una matriz llamada "ej4" que presenta las medidas de longitud de las alas de un ave antes y después de aplicar una vitamina. Hlength(antes) y Flength(después):

 Hlength Flength
1      142     138
2      140     136
3      144     147
4      144     139
5      142     143
6      146     141
7      149     143
8      150     145
9      142     136
10     148     146

>ej4 <- read.csv("ej4.csv",header=T)

#(leo mi matriz desde un directorio previamente escogido, tal y como se vio en el ejercicio de T para muestras independientes)


>attach (ej4)

#(tomo mis columnas como objetos para realizar el análisis)


> var.test(Hlength,Flength)

# (Realizo mi test de homogeneidad de varianzas, para saber si debo realizar una prueba de T o de U)
Resultados:

        F test to compare two variances
data:  Hlength and Flength
F = 0.7111, num df = 9, denom df = 9, p-value = 0.6197
alternative hypothesis: true ratio of variances is not equal to 1
95 percent confidence interval:
 0.1766186 2.8627458
sample estimates:
ratio of variances
         0.7110656


> shapiro.test(Hlength)
#(Prueba de normalidad para mis datos antes de la vitamina)
resultados:

Shapiro-Wilk normality test
data:  Hlength
W = 0.9258, p-value = 0.408

> shapiro.test(Flength)
#(Prueba de normalidad para mis datos después de la vitamina)
resultados:

 Shapiro-Wilk normality test
data:  Flength
W = 0.9306, p-value = 0.4541

> t.test(Hlength,Flength,"two.sided",paired=TRUE)
#(realizo mi prueba de T pareada, para dos colas, el argumento "paired=TRUE" es el que le dice a R que la prueba que debe realizar es pareada de lo contrario el argumento deberia ser cambiado por "paired=FALSE")
resultados:

 Paired t-test
data:  Hlength and Flength
t = 3.4138, df = 9, p-value = 0.007703
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 1.113248 5.486752
sample estimates:
mean of the differences
                    3.3
> boxplot (Hlength,Flength)
#(visualizo mis resultados gráficamente con un diagrama de cajas y bigotes)




Y hemos terminado con nuestro análisis!!!!, es importante recomendar que se debe leer algo de fundamento teórico acerca de las pruebas que se realizan acá para que no se pierdan con los resultados y las bases de los análisis!!!

hasta la vista!

No hay comentarios:

Publicar un comentario en la entrada