Sergey Nivens - Fotolia

Evaluar Conozca los pros y contras de las tecnologías, productos y proyectos que está considerando.

Cómo el modelado predictivo falló en elegir al ganador de las elecciones de EE.UU.

Casi todos los algoritmos predictivos de modelado estuvieron muy equivocados al elegir el ganador de la elección presidencial de EE.UU. Lo que salió mal puede afectar a cualquier proyecto de analítica predictiva si los científicos de datos y otros analistas no son cuidadosos.

Antes de las elecciones presidenciales de 2016 en Estados Unidos, casi todo el mundo –desde el sitio web FiveThirtyEight del gurú de ciencias de datos Neth Silver, hasta The New York Times– estaba prediciendo una gran probabilidad de una cómoda victoria para Hillary Clinton. Y entonces sus modelos se rompieron.

Lo que salió mal para los pronosticadores no fue un conjunto único de problemas, y puede golpear a cualquier proyecto de modelado predictivo y pronóstico si los equipos analíticos toman el camino equivocado. Se trata de una mezcla de exceso de confianza, mala calidad de los datos y confundir una probabilidad estadística con una certeza ordenada.

"Desafortunadamente, [los pronosticadores] dan estos números a un lugar decimal, y suena como que es una fórmula científica, pero no lo es", dijo Pradeep Mutalik, científico investigador asociado del Centro de Informática Médica de Yale, que comenta sobre las elecciones en la Revista Quanta. "Es el exceso al vender la certeza, y ellos terminaron con huevos en sus rostros".

Predecir lo impredecible

El día antes de las elecciones, el pronóstico electoral de The New York Times le dio a Clinton un 85% de posibilidades de victoria. El modelo del Huffington Post le dio a Clinton un 98% de posibilidades de ganar. El pronóstico de FiveThirtyEight estaba entre los más modestos, dando a Clinton una ventaja de 71.4%.

Estas previsiones no eran erróneas, per se. El modelo de FiveThirtyEight esencialmente dijo que Donald Trump ganó tres de cada 10 de sus simulaciones. Incluso el modelo de The Huffington Post, alcista como lo fue sobre una victoria de Clinton, no descartó por completo la posibilidad de una victoria de Trump.

Y, para ser justos, Nate Silver tuiteó poco después de las 6 pm EST del 8 de noviembre: "Esta no parece una elección en la que un candidato tenía un 99% de posibilidades de ganar", y habló con frecuencia de la incertidumbre que rodea las encuestas y pronósticos en las semanas previas a la votación.

Pero no fue así como muchos de los pronósticos fueron promovidos por los pronosticadores o interpretados por el público. Al proporcionar tanto detalle de grano fino en sus pronósticos, los modeladores dieron al público una impresión de certeza.

La gente no entiende las probabilidades

"El problema con eso es que es una probabilidad, y la gente no entiende las probabilidades", dijo Mutalik. "Creo que fue un problema de presentación de datos. Es muy irresponsable presentar datos como estos a un público laico. Creo que esa probabilidad no debería haber sido usada para anotar en la carrera".

Mutalik agregó que las previsiones como el Informe Político Cook, que dio una escala cualitativa basada en la forma en que algunos estados se inclinaban, en lugar de tratar de cuantificar los votos probables, hizo un mejor trabajo al describir la incertidumbre de la carrera.

Una de las razones por las que los pronósticos perdieron la marca fue una dependencia exagerada en los datos de las encuestas. Los pronosticadores de hoy desarrollan sus modelos agregando tantas encuestas como puedan obtener. Cada encuesta tiene un margen de error, pero los pronosticadores suponen que reunir encuestas de diferentes fuentes anula este error. La presunción es que cada encuesta tendrá diferentes razones para el error, como el sobremuestreo de un grupo demográfico. Siempre que cada encuesta no tenga la misma razón de error, la fuerza global de las encuestas agregadas compensa las debilidades de las encuestas individuales.

Pero, en esta elección, puede haber habido más error en las encuestas de lo que se reconoció en ese momento. Se ha hablado mucho de los tímidos votantes de Trump, que consideraron socialmente inaceptable admitir, incluso a los encuestadores, a quién apoyaban, y esta causa común de error de encuesta podría haber llevado a las agregaciones lejos de la marca.

Los pronosticadores descartan eventos significativos

También está el tema del entusiasmo. Michael Cohen, profesor adjunto en la Escuela de Postgrado de Administración Política de la Universidad George Washington, que anteriormente dirigía una firma de investigación de opinión pública, dijo que los pronosticadores descartaron las grandes multitudes en los mítines de Trump y el fuerte compromiso que el candidato obtuvo en Twitter.

Estos factores son más difíciles de trabajar que los datos de encuestas en el modelado predictivo y los pronósticos, pero, en última instancia, ellos apuntaban a votantes que estaban más dispuestos a aparecer en las urnas el día de las elecciones que los partidarios nominales de Clinton.

"Cuando usted está tratando de entender lo que está pasando en el país, o en su empresa, no se limite solo a mirar una pieza de datos", dijo Cohen. "La conclusión para mí es que las encuestas no pueden ser los únicos datos a los que usted mira".

En última instancia, la industria que se ha construido alrededor del modelado predictivo y el pronóstico para las elecciones puede necesitar un ajuste de cuentas. James Taylor, CEO de la consultora Decision Management Solutions, dijo que una elección entre dos candidatos específicos es un evento único que generará sus propias circunstancias. Por regla general, los eventos de una sola vez no pueden predecirse bien utilizando datos históricos. "Las estadísticas básicas significan que los eventos únicos no pueden ser analizados por precisión", dijo.

La idea de asignar una probabilidad de número único a un determinado resultado puede ser más difícil de lo que hemos llegado a creer, y puede no ser tan útil para la forma en que los votantes promedio piensan. "Es la naturaleza humana", dijo Mutalik. "Incluso cuando las encuestas dan el margen de error, la gente solo toma el resultado esperado".

Profundice más

Inicie la conversación

Envíenme notificaciones cuando otros miembros comenten sobre este artículo.

Por favor cree un Nombre de usuario para poder comentar.

- ANUNCIOS POR GOOGLE

Close