LEYENDO ENTRE NUMEROS

 Mucho llamó la atención los resultados de dos encuestas realizadas al mismo tiempo para muestras de ciudadanos del mismo tamaño en Ecuador, 800, y en Perú, 804, sobre el grado de aceptación de los acuerdos de paz firmados hace un año por los Presidentes Fujimori y Mahuad, culminando décadas de animosidad entre vecinos. Los porcentajes escuetamente reportados indicaban una aprobación del 58 % en Perú versus una del 50 % en Ecuador. Se hubiera pensado que una clarísima mayoría, 80 % o más hubieran aprobado la paz, ¿ significa que existe mayor belicosidad en Ecuador que en Perú ?. La respuesta requiere porcentajes en términos relativos. Ese 8 % de mayor aprobación en Perú representa un 16 % del 50 % ecuatoriano (8/50*100) pudiendo así decirse que, en términos relativos, la aprobación en Perú es 16 % mayor que en Ecuador. Ningún moco de pavo, por cierto. Una segunda duda es si la diferencia, nuevamente ese 8 %, pudo haber ocurrido por casualidad. Aquí los porcentajes ya no sirven y debe regresarse a las frecuencias brutas, es decir, a las respuestas mismas. Así el 58 % peruano representa la aprobación de 464 personas aplicando el % a la muestra de 804, y 340 peruanos desaprobando. La aprobación del 50 % de la muestra ecuatoriana de 800 personas arroja 400 personas aprobando y otras 400 desaprobando. El siguiente paso es comparar estas frecuencias, como formalmente se les llama, a las que hubieran ocurrido por causalidad. Según las probabilidades, la probabilidad de un evento es la inversa del número de opciones, pero para lograrlo en una matriz es un embrollo que puede simplificarse, como se hará a continuación. Primer paso colocar las frecuencias en dos columnas y producir la suma de cada columna, cada fila, y el total de la matriz:

  PERU ECUADOR Total
Si 464 400 864
No 340 400 740
Total 804 800 1604

Para obtener la frecuencia esperada teóricamente de peruanos aprobando, es decir, si la casualidad hace muy parecida la opinión positiva de peruanos y ecuatorianos, se multiplica el total de la primera columna por el total de la primera fila, dividiendo el resultado por el total de la tabla: 804 x 864/1604= 433.

La diferencia entre 433 y lo que se observó, 464, es decir la opinión de 31 peruanos, permitirá establecer si la diferencia no fue casualidad. En jerga científica se trata de establecer si la diferencia fue "estadísticamente significativa" con una probabilidad determinada.
El cálculo se le llama la Chi cuadrada (pronunciada como Ji) porque suma las diferencias al cuadrado entre lo que observado y lo que teóricamente sería esperado convertido en una razón de lo esperado, tanto más o tanto menos. Por ejemplo, 31 x 31 = 961, dividido esto por la frecuencia esperada teórica, 433 produce una razón de 2.22. La diferencia entre lo observado en Perú y lo teóricamente esperable, si hubiera intervenido la casualidad es 2 veces mayor. Haciendo la misma operación con cada celda de la matriz, y sumándolas, se obtiene la Chi cuadrada total de 9.60. Se toman luego los grados de libertad, 1 en este caso (número de filas menos 1*número de columnas menos 1) y mirando a una tabla se lee la probabilidad de encontrar una X tan grande para 1 grado de libertad. La tabla dice que un coeficiente de ése tamaño hubiera ocurrido por casualidad con una probabilidad de 0.00025. Conclusión: la aprobación ecuatoriana es muy significativamente menor que la peruana.