https://frosthead.com

Uso de las matemáticas para examinar los resultados electorales de Irán

Los estadísticos y los politólogos han tenido un día de campo con los resultados de las elecciones iraníes a principios de este mes. ¿Fueron manipuladas las elecciones? Puede que nunca lo sepamos, pero hay suficientes cosas enterradas en las matemáticas para hacernos pensar que podría haber sido así. Incluso entonces, sin embargo, también hay suficiente para hacernos creer que todo es legítimo. Aquí hay algunos análisis que encontré particularmente interesantes:

Datos limpios

Inmediatamente después de las elecciones, se plantearon dudas sobre la legitimidad de los datos porque cada vez que se publicaba un nuevo lote de resultados de la votación (salen en pedazos en Irán, similar a los Estados Unidos), el porcentaje de votos para el presidente Mahmoud Ahmadinejad fue lo mismo: 67 por ciento. Los datos generalmente no están limpios, y algunos comenzaron a preguntarse si los resultados se habían fabricado.

Sin embargo, un análisis realizado por el profesor de matemáticas de la Universidad de Wisconsin, Jordan Ellenberg en Slate, profundiza en los datos para mostrar que en realidad era más desordenado de lo que cabría esperar. Los resultados no se obtuvieron ciudad por ciudad, sino en grandes lotes que combinaban datos de varias áreas, lo que significaba que los totales de votos de Ahmadinejad eran realmente promedios. Y la Ley de Grandes Números dicta, como escribió Ellenberg:

Los promedios de cantidades muy variables pueden, y generalmente lo hacen, producir resultados que se ven casi perfectamente uniformes. Con suficientes datos, los valores atípicos tienden a cancelarse entre sí.

Ellenberg concluye que los datos son "definitivamente lo suficientemente desordenados para ser verdad".

Ley de benford

Varios análisis han examinado los primeros dígitos de los resultados electorales de Irán para ver si cumplen con la Ley de Benford, que es:

En las listas de números de muchas (pero no todas) fuentes de datos de la vida real, el dígito principal se distribuye de una manera específica y no uniforme. De acuerdo con esta ley, el primer dígito es 1 casi un tercio del tiempo, y los dígitos más grandes aparecen como el primer dígito con menor y menor frecuencia, hasta el punto en que 9 como primer dígito ocurre menos de una vez en veinte. Esta distribución de los primeros dígitos surge lógicamente siempre que un conjunto de valores se distribuye logarítmicamente.

Un análisis que utilizó esta táctica, realizado por Boudewijn Roukema de la Universidad Nicolaus Copernicus en Polonia, concluyó que había casi el doble de recuentos de votos comenzando con el dígito 7 para Mehdi Karroubi de lo que cabría esperar con la Ley de Benford. Además, Roukema sospechaba que los resultados para Ahmadinejad, en el que había menos 1s y más 2s y 3s de lo esperado, habrían sido probables si alguien eligiera manipular los resultados cambiando los 1s al comienzo de los totales de votos a 2s y 3s. También habría llevado a una sobreestimación de los totales de Ahmadinejad por varios millones de votos.

Walter Mebane, politólogo y estadístico de la Universidad de Michigan, también utilizó la Ley de Benford en su análisis, en el que también encuentra varias irregularidades en los resultados electorales de Irán. Pero incluso él admite que aunque sus resultados son "compatibles con el fraude generalizado", también son "compatibles con que Ahmadinejad haya ganado".

Los dos últimos dígitos

Dos estudiantes de posgrado en ciencias políticas en la Universidad de Columbia tomaron una tercera toma de los datos. En un análisis que resumieron en un artículo de opinión del Washington Post, examinaron los dos últimos dígitos de los recuentos de votos de 29 provincias para cada uno de los cuatro candidatos (por ejemplo, si alguien recibió 14.579 votos, solo se consideraron los 7 y 9 en el analisis).

Los últimos dos dígitos en los resultados electorales son ruido aleatorio, y la distribución de los dígitos debe ser bastante uniforme: cada dígito debe aparecer alrededor del 10 por ciento del tiempo. Sin embargo, los humanos son pobres generadores de números aleatorios y cuando inventamos números, tendemos a elegir algunos números con más frecuencia que otros. En los resultados de Irán, solo el 4 por ciento de los números terminan en el dígito 5, mientras que el dígito 7 aparece el 17 por ciento del tiempo. Se esperarían resultados que se desvíen tanto en aproximadamente cuatro de cada 100 elecciones.

Los humanos también tienen problemas para crear números que tienen dígitos no adyacentes (es decir, es menos probable que obtengas 72 que 23), pero estos números también deben seguir patrones aleatorios y alrededor del 70 por ciento de los pares deben consistir en no adyacentes dígitos Sin embargo, en los resultados de Irán, solo el 62 por ciento lo hace. Nuevamente, estos resultados serían esperados en aproximadamente 4 de cada 100 elecciones. Pero la combinación de los dos resultados se esperaría en solo 1 de cada 200 elecciones. Improbable, tal vez, pero no imposible.

¿Dónde nos deja eso? Es posible que nunca sepamos si los resultados informados son reales o no. Sin embargo, mi dato personal favorito de todo esto no requiere cálculos para dar lugar a cuestiones de legitimidad electoral. Esta cita, de Abbas-Ali Kadkhodaei, un portavoz del Consejo Guardián de Irán, haría que casi cualquiera lo piense dos veces:

Las estadísticas proporcionadas por Mohsen Resaei en las que afirma que más del 100% de los elegibles han emitido su voto en 170 ciudades no son precisas: el incidente ocurrió en solo 50 ciudades.

(Para más información sobre el análisis de los resultados electorales de Irán, consulte Nate Silver en fivethirtyeight.com)

Uso de las matemáticas para examinar los resultados electorales de Irán