«Es necesario que la técnica de muestreo mediante la cual se seleccionan las personas que van a responder la encuesta sea la correcta»
POR: Carlos Rodado Noriega
Una de las preguntas más frecuentes que se hace un ciudadano común y corriente en épocas de elecciones es esta: ¿cómo es posible que con una muestra de 2.000 personas se pueda predecir cuál va a ser el comportamiento de 21 millones de electores? La respuesta no tiene que ver con magia sino con una ley matemática conocida como la ley de los grandes números. Uno de los teoremas derivados de esta ley dice que el promedio de una muestra tomada al azar tiende a acercarse al valor de la media de la población total.
Este resultado de fórmulas matemáticas se puede explicar en términos sencillos de la siguiente manera. La probabilidad es una medida de la posibilidad de que un evento ocurra. En forma empírica se puede estimar observando la frecuencia con que un evento sucede mediante la repetición de ensayos hechos al azar. Esa frecuencia tiende a un número determinado, que es la probabilidad de que el evento ocurra. Así, la probabilidad de que salga el número 1 cuando lanzamos un dado es 1/6, o 16,66%. Sin embargo, si lo lanzamos unas 5 o 10 veces es posible que la frecuencia con que ocurre sea diferente al 16.66%, (puede ser mayor o menor); pero si lo lanzamos unas 2.000 veces la frecuencia se irá aproximando al valor 16.66%, por ejemplo 16,60%; y si aumentamos el número de lanzamientos el resultado se acercará más y más al valor promedio o número esperado: 16.66%. Pero llega un momento en que ya no tiene sentido aumentar el número de tiradas, para tener un resultado confiable porque las desviaciones con respecto al número esperado se tornan cada vez más insignificantes (centésimas o milésimas). Confiable no significa exacto sino un estimativo que se tiene un grado de certidumbre razonable.
Lo mismo acontece con las encuestas que se realizan para medir intención de voto en las elecciones. Si aumenta el tamaño de la muestra mejora la calidad de la predicción (disminuye el margen de error), pero la mejora es cada vez más pequeña, de tal manera que con una muestra de un tamaño adecuado se puede realizar un pronóstico que sea razonablemente confiable desde el punto de vista estadístico.
Por supuesto, hay unas condiciones que se tienen que cumplir para que la ley de los grandes números funcione. Una primera es que la muestra sea representativa, es decir, que el subconjunto que se selecciona para hacer la medición predictiva, tenga las mismas propiedades que la población total que va a representar. Y para que la muestra sea representativa tiene que ser aleatoria, y esta es una condición fundamental para que se pueda aplicar correctamente la ley de los grandes números. Esa aleatoriedad requiere que la muestra sea tomada al azar, con lo cual se garantiza que cada persona seleccionada tiene la misma probabilidad de ser escogida que cualquier otra.
Estas no son las únicas condiciones para que la muestra sea razonablemente confiable y permita hacer predicciones verosímiles. Es necesario que la técnica de muestreo mediante la cual se seleccionan las personas que van a responder la encuesta sea la correcta. Y en esa selección es donde generalmente fallan las encuestas, porque hay muchos factores que pueden alterar la representatividad de la muestra. Cuando se presentan esos eventos perturbadores la muestra es sesgada y, por lo mismo, no va a tener una buena capacidad predictiva.
Los encuestadores generalmente utilizan el método de muestreo aleatorio estratificado, que consiste en segmentar la población total en estratos o subpoblaciones de acuerdo con una característica que los determina (edad, sexo, estrato socio económico, etc). Para seleccionar el número de individuos que van a ser encuestados en cada estrato se emplea la regla de la proporcionalidad: el tamaño de la muestra de cada estrato debe ser proporcional al tamaño del estrato respecto a la población total. En síntesis: el azar y la calidad de las muestras son las claves de una buena predicción. Más importante que el tamaño de la muestra es la representatividad de la misma. Si la muestra es representativa de la población total, una encuesta puede predecir lo que va a acontecer con un grado de error aceptable. Cuando se presentan grandes desviaciones de la encuesta con la realidad es porque no se ha cumplido con una o varias de las condiciones que son requisitos insoslayables de la ley de los grandes números.
En el caso de encuestas sobre intención de voto esas exigencias no se cumplen si la muestra de un estrato está sobredimensionada o lo contrario; si el entrevistado no dice la verdad o por muchas otras razones. Otro motivo que puede producir discrepancia entre el resultado de una encuesta y la realidad es el conocimiento de hechos que pueden modificar la opinión de los electores unos días después de tomadas las muestras. Colombia es un ejemplo de libro de sucesos que diariamente sacuden a la opinión pública y, como es bien sabido, hay un componente emocional que es determinante en la decisión del voto. Siempre debemos tener presente que una encuesta es una foto tomada en un momento dado, pero la película es dinámica y esto hace que las encuestas deban tomarse con un cierto grado de cautela.