Introducción
Cómo mentir con estadísticas
El problema real […] no está en demostrar que algo es falso, sino en demostrar que el objeto auténtico es auténtico.
U MBERTO E CO
¿T e suena aquello de que a los bebés los traen las cigüeñas? Es verdad.
Puedo demostrarlo con estadísticas.
Echemos un vistazo a la población estimada de cigüeñas en cada país, y luego al número de niños que nacen cada año. En toda Europa hay una correlación notablemente fundamentada. Más cigüeñas, más bebés; menos cigüeñas, menos bebés.
El patrón es lo bastante sólido para cumplir con los requisitos de publicación de una revista académica. De hecho, se ha publicado un ensayo científico con el título «Las cigüeñas traen a los bebés (p = 0,008)». Para no ponernos demasiado técnicos, todos esos ceros significan que no es una coincidencia.
Quizá ya te hayas dado cuenta de dónde está el truco. Países europeos de gran tamaño, como Alemania, Polonia y Turquía, son el hogar de muchos bebés y muchas cigüeñas. Países pequeños, como Albania y Dinamarca, tienen menos bebés y menos cigüeñas. Aunque en los datos hay un patrón claro, ese patrón no significa que las cigüeñas sean la causa de los bebés.
Al parecer, con las estadísticas se puede «demostrar» cualquier cosa…, incluso que a los bebés los traen las cigüeñas.
Sin duda eso es lo que pensarías después de leer Cómo mentir con estadísticas. Publicado en 1954 por un periodista freelance llamado Darrell Huff, este librito ocurrente y cínico recibió de inmediato una crítica elogiosa de The New York Times, llegó a convertirse en el que quizá sea el libro sobre estadística más popular jamás publicado y vendió más de un millón de ejemplares.
El libro se merece la popularidad y los elogios. Es una maravilla de la comunicación estadística. También convirtió a Darrell Huff en una leyenda entre los entendidos. Ben Goldacre, epidemiólogo y autor superventas de Mala ciencia, afirmó con admiración que «The Huff» había escrito un libro «impactante». El escritor estadounidense Charles Wheeland describe su libro Naked Statistics como un «homenaje» al «clásico» de Huff. La respetada revista Statistical Science organizó una retrospectiva de Huff cuando se cumplieron cincuenta años de su publicación.
Yo antes también pensaba eso. De adolescente me encantaba leer Cómo mentir con estadísticas. Brillante, perspicaz e ilustrado con diagramas atractivos, este libro me permitió mirar bajo la alfombra de la manipulación estadística y me enseñó cómo se falseaban los datos, con lo que ya no volverían a engañarme.
Huff da un montón de ejemplos. Comienza sopesando cuánto dinero ganan los graduados en Yale. Según una encuesta de 1950, la promoción de 1924 tenía unos ingresos medios cercanos a los 500.000 dólares anuales, al valor actual. Parece posible, creíble —al fin y al cabo, se trata de Yale—, pero medio millón de dólares al año es mucho dinero. ¿De verdad es esa la media?
No. Huff explica que esta cifra tan «improbablemente generosa» proviene de los datos que aportan los exalumnos, y cabe sospechar que exageren sus ingresos por una simple cuestión de vanidad. Además, solo se tuvieron en cuenta las encuestas que los exalumnos se molestaron en responder, y la encuesta solo les llegó a los exalumnos que Yale consiguió encontrar. ¿Y quiénes son fáciles de encontrar? Los ricos y famosos. «¿Quiénes son los corderitos perdidos que Yale etiqueta como “dirección desconocida”?», se pregunta Huff. Yale controlaba a los exalumnos millonarios, pero es muy posible que pasara por alto a algunos de sus compañeros con menos éxito. Todo esto significa que la encuesta presentará una conclusión extraordinariamente sobredimensionada.
Huff se mueve como pez en el agua en un amplio abanico de crímenes estadísticos, desde anuncios de dentífricos basados en investigaciones elegidas por conveniencia hasta mapas que cambian de significado dependiendo de cómo los coloreemos. Como escribió Huff: «Los timadores conocen todos estos trucos; las personas honestas deben aprenderlos para defenderse».
Si lees Cómo mentir con estadísticas, te volverás más escéptico respecto a cómo pueden engañarte los números. Es un libro inteligente e instructivo.
Pero yo me he pasado más de una década tratando de comunicar ideas estadísticas y hechos contrastados numéricamente, y a medida que pasan los años cada vez me incomoda más Cómo mentir con estadísticas y lo que representa. ¿Qué dice de las estadísticas —y de nosotros— que el libro más exitoso sobre esta cuestión sea, de la primera a la última página, una advertencia sobre la desinformación?
Darrell Huff publicó Cómo mentir con estadísticas en 1954. Pero ese mismo año ocurrió otra cosa: dos investigadores británicos, Richard Doll y Austin Bradford Hill, elaboraron uno de los primeros estudios convincentes para demostrar que fumar causa cáncer de pulmón.
Doll y Hill no habrían podido llegar a esta conclusión sin estadísticas. Las tasas de cáncer de pulmón se habían multiplicado por seis en el Reino Unido en solo quince años; en 1950, las del Reino Unido eran las más altas del mundo, y las muertes por cáncer de pulmón superaron por primera vez a las de tuberculosis. Incluso para tomar conciencia de esta situación era necesaria una perspectiva estadística. Un médico, en soledad, solo habría podido hacerse una idea vaga.
Para demostrar que los cigarrillos eran los culpables, se necesitaban, de nuevo, estadísticas. Mucha gente pensaba que los coches con motor eran la causa del aumento de cáncer de pulmón. Tenía sentido. En la primera mitad del siglo XX , los coches con motor se volvieron omnipresentes, con los gases de los tubos de escape y las emanaciones extrañamente atractivas del alquitrán de las carreteras nuevas. El cáncer de pulmón se incrementó en la misma época. Descubrir la verdad —que la causa eran los cigarrillos y no los coches— requería algo más que observar la situación. Era necesario que los investigadores empezaran a contar, y a comparar, con mucho detalle. Se necesitaba, en suma, la estadística.
Muchos valoraban con escepticismo la hipótesis de los cigarrillos, aunque no era del todo nueva. Por ejemplo, en la Alemania nazi se invirtieron considerables recursos para conseguir pruebas de que el tabaco era peligroso; Adolf Hitler lo detestaba. Sin duda lo complació que los médicos descubrieran que causaba cáncer. No obstante, por razones obvias, el hecho de que los nazis lo detestaran no impidió su popularidad.
Así que Doll y Hill decidieron llevar a cabo sus propias investigaciones estadísticas. Richard Doll era un joven apuesto, sereno e indefectiblemente educado. Había vuelto de la Segunda Guerra Mundial con la cabeza rebosante de ideas sobre cómo la estadística podía revolucionar la medicina. Su mentor, Austin Bradford Hill, había sido piloto en la Primera Guerra Mundial antes de estar al borde de la muerte por tuberculosis. Su labor como detectives de datos logró salvar vidas.
Su primer estudio sobre la relación entre el hecho de fumar y el cáncer empezó el día de Año Nuevo de 1948. Se centró en veinte hospitales del noroeste de Londres, y Richard Doll estuvo al cargo.
Cada vez que un paciente con cáncer llegaba al hospital, las enfermeras —de forma aleatoria— buscaban a otro paciente del mismo centro con una edad parecida y del mismo sexo. Ambos pacientes eran interrogados en profundidad sobre dónde vivían y trabajaban, su estilo de vida y su dieta, y su historial con el tabaco. Semana tras semana, mes tras mes, los resultados fueron llegando.