Matemáticas para detectar camelos: el contraste de hipótesis

de Javier Oribe el 06/07/2011

Por Javier Oribe para El Máquina de Turing

Imagine por un momento que usted sufre de algún tipo de dolencia crónica no muy grave pero fastidiosa, como por ejemplo jaquecas, dolores de espalda, insomnio o afición a programas de televisión presentados por Jordi González.

Imagine también que un día un amigo de mucha confianza le comenta que una tía suya a la que le pasaba lo mismo se tomó unas perlitas, se puso una pulsera o incluso durmió con una pirámide debajo de su cama, y que desde entonces ha notado una ostensible mejoría. Usted, que ya ha ido en varias ocasiones al médico sin mucho éxito, piensa que no tiene nada que perder y decide probar suerte. Y resulta que le funciona.

Su cabeza o su espalda dejan de dolerle, duerme mejor o deja de ver telebasura. Y todo gracias a un «método de curación» (que a partir de ahora llamaremos el método) que no sólo no está avalado por la medicina, sino que además es objeto de ataque continuo por parte de científicos, escépticos y demás.

¿No funciona y me lo quieren vender, o funciona y no quieren que lo sepa?

Ante una situación así, la mayor parte de las personas suelen adoptar alguna de estas dos posturas:

Opción A: El método funciona y la «ciencia oficial» se equivoca.

Opción B: Si no tiene respaldo científico es porque no se puede afirmar que el método funcione, lo que lo convierte en un fraude.

Para defender su postura, los defensores de la opción A suelen afirmar por ejemplo que existen aspectos de la naturaleza que la ciencia aún no comprende, o que se trata de remedios milenarios que llevan usándose mucho tiempo; y suelen explicar la no aprobación oficial defendiendo que desde ciertos grupos de poder se impide que los «métodos de curación alternativa» lleguen al público. Por otro lado, los defensores de la opción B argumentan que si el método es rechazado por la comunidad científica es porque ha sido puesto a prueba y se ha concluido que no hay manera de saber si lo sucedido se debe simplemente al azar o a un efecto placebo, o bien ni siquiera se ha intentado probar su valía.

Sea cual sea la opción escogida por usted, estaremos de acuerdo en que cualquier argumento a favor de una determinada hipótesis no puede basarse en cosas como «hace mil años que lo sabemos, y por tanto debe ser cierto», ya que estos argumentos son fácilmente rebatibles (por ejemplo, durante más de mil años los europeos occidentales «sabíamos» que la Tierra era plana y sin embargo es redonda). Así que, tanto si usted defiende la postura A como la B, está obligado a aportar alguna prueba que todos aceptemos como válida para apoyar sus argumentaciones si no quiere que éstas sean consideradas meras opiniones, respetables pero sin mayor valor.

Pero ¿es esto posible? ¿existe alguna manera de encontrar argumentos sólidos, que cualquiera pueda comprobar, y que nos indiquen si la postura correcta ante una situación como la descrita es la A o la B? O, para ser más concretos, ¿hay alguna forma de averiguar si nuestro método es un fraude, o si por el contrario es útil y aun así se rechaza?

La respuesta es sí.

Las matemáticas al rescate

Por suerte, existe toda una colección de procedimientos y de herramientas matemáticas que nos ayudan a resolver este problema. Una de estas herramientas, desarrollada durante el segundo cuarto del siglo XX primero por Fisher y después por Neyman y Pearson, se llama contraste de hipótesis y nos ayuda a decidir cuestiones como si un tratamiento realmente sirve para curar o no.

La idea básica del contraste de hipótesis se puede esbozar con el siguiente ejemplo: imaginemos que tenemos un dado, y que pensamos que está cargado de tal forma que el 5 sale en más ocasiones de las que debería. Entonces enunciamos nuestra hipótesis que dice «el dado no está cargado a favor del 5″ (aunque parezca un poco raro enunciar la hipótesis de esta manera, no es una elección caprichosa, como veremos más adelante).

Para comprobar si la hipótesis es cierta debemos partir de algún dato objetivo a partir del cual podamos contrastar si nuestra afirmación tiene sentido o no. En este caso el dato adecuado es bien conocido: si un dado no está cargado, cada cara saldrá por término medio 1 de cada 6 veces que sea lanzado. Por tanto, si lanzamos el dado un número de veces lo suficientemente alto (este número de lanzamientos se llama tamaño muestral y se puede calcular) y comprobamos cuántas veces ha salido cada resultado, observando la frecuencia con la que aparece el 5 podremos comprobar si el comportamiento del dado es distinto al que cabe esperar de un dado equilibrado.

En concreto, si la frecuencia con la que aparece cada resultado es de 1 de cada 6 tiradas, podemos inferir que el dado no está cargado ya que es el resultado a esperar; y si por el contrario vemos que el 5 sale 3 de cada 6 veces y el resto de resultados sale 1 de cada 10, parece obvio que el dado está cargado a favor del 5 y nuestra hipótesis es falsa. En el primer caso diremos que se acepta la hipótesis, mientras que en el segundo se dice que se rechaza.

Contrastemos nuestra hipótesis

Vamos a aplicar este razonamiento a nuestro método. La situación es que nos encontramos ante un método que se supone cura una determinada dolencia, y que ésta ha desaparecido tras la aplicación del método. Obviando el efecto placebo para no complicar demasiado la explicación, nos planteamos la siguiente pregunta:

– ¿La dolencia ha remitido por azar o realmente el método la ha curado?

En la pregunta se identifican con facilidad dos afirmaciones contrapuestas, la primera dice «el método no cura la dolencia», mientras que la segunda afirma, con otras palabras, que «el método cura la dolencia». A la primera afirmación la llamaremos hipótesis nula o cero, mientras que la segunda, que obviamente será cierta si la primera no lo es, se conoce como hipótesis alternativa. Como hemos mencionado ya, esta elección en el orden de las hipótesis no es casual.

La hipótesis cero es el resultado que ya se conoce a partir del cual vamos a contrastar la hipótesis alternativa, que realmente es la que hay que comprobar. Recuerden que antes utilizábamos el comportamiento de un dado equilibrado para contrastar la hipótesis «el dado está equilibrado». Ahora la cuestión, aunque es análoga, no es tan sencilla, ya que lo que necesitamos saber es el número medio de personas con la misma dolencia que experimentan una mejoría sólo por azar. Por suerte, la estadística matemática y un buen equipo de trabajo pueden dar respuesta a esta pregunta si se realiza un estudio adecuado, así que supongamos que lo realizamos y concluimos, por ejemplo, que 10 de cada 100 personas experimenta una sensible mejoría sin recibir tratamiento.

Lo siguiente será estudiar, por supuesto siguiendo de nuevo los procedimientos adecuados, la evolución de una muestra aleatoria de personas a las que se aplica el método. Si el número medio de mejorías es sensiblemente mayor al 10%, parece razonable pensar que el método funciona, mientras que si es del 10% es evidente que no existe diferencia alguna entre aplicar el método o no aplicarlo.

En definitiva, básicamente lo que hay que hacer es poner a gente con insomnio a dormir, unas con una pirámide de cuarzo bajo la cama y otras sin nada, y comprobar si hay más gente que se recupera del insomnio entre los primeros que entre los segundos. Si hacemos bien el estudio, podremos estar razonablemente seguros de que el resultado es correcto. Y más importante aún, cualquier otra persona podrá repetir el mismo estudio y comprobar si nuestros resultados están bien o si nos hemos equivocado.

Ajustando el modelo

Aunque parece sólido, el razonamiento expuesto hasta aquí tiene una fisura por donde podría ser atacado: no estamos tratando con hechos que irrefutablemente obedezcan a una relación de causa efecto (lanzo una piedra/la piedra cae al suelo), sino que tratamos con fenómenos aleatorios y que por tanto siempre estarán sujetos a cierto nivel de incertidumbre. Alguien podría decirnos: «Si usted parte de argumentos sujetos a incertidumbre, las conclusiones a las que llegue también lo estarán, luego ¿cómo puede afirmar con rotundidad que su resultado es correcto?». Y como tendría toda la razón, se hace necesario precisar más el contraste de hipótesis tanto en su planteamiento como en sus conclusiones. Veamos, sin entrar en detalles técnicos, cómo se resuelve este problema.

Concretando con nuestro ejemplo de los dados, lo que quiere decir este señor es que, por poco probable que parezca, no podemos descartar que hayamos obtenido cincos con una frecuencia de 3 de cada 6 veces por puro azar, aunque el dado en realidad esté equilibrado. A esta situación, en la que descartaríamos la hipótesis nula siendo correcta, se la conoce (en un derroche de creatividad) error del Tipo I. Y por supuesto, tampoco podemos descartar que en nuestros lanzamientos hayamos obtenido una frecuencia de un 5 cada seis lanzamientos por casualidad, cuando el dado en realidad está cargado en favor del 5. A esta otra posibilidad, en la que aceptamos la hipótesis nula siendo falsa, la llamaremos error del Tipo II.

Como no podemos eliminar la probabilidad de cometer alguno de estos errores, parece que el camino correcto sería construir un modelo que al menos la redujera al máximo, es decir, que nos permitiera decidir si el dado está cargado o no sabiendo que es muy difícil que estemos cometiendo un error del Tipo I o del Tipo II. Pero por desgracia, esto no es posible: al intentar reducir la probabilidad de cometer un error del Tipo I, aumentará la probabilidad de cometerlo del Tipo II y viceversa.

La solución aceptada es considerar que es mejor (o menos malo) cometer un error del Tipo II que del Tipo I, es decir, que es preferible equivocarnos por un exceso de celo y descartar como malo un método que en realidad funciona (error Tipo I) que pecar por defecto y dar como bueno un método de curación que no sirva para nada (error Tipo II) (esto me lleva a considerar si no sería mejor llamarlos Error por Exceso y Error por Defecto, lo que haría mucho más sencillo tanto la explicación como el estudio del tema). En la práctica, técnicamente lo que se hace es tratar de que la probabilidad de cometer un error de Tipo I sea lo más pequeña posible, aun a costa de aumentar la probabilidad de estar cometiendo otro del Tipo II, para así poder cuantificar el efecto del azar sobre el resultado asegurándonos de que sea muy difícil rechazar una hipótesis siendo correcta.

Por tanto, respondiendo a la pregunta que nos hacía nuestro amigo, en cuanto al uso de argumentos no determinísticos el contraste de hipótesis se realiza asumiendo que todo el proceso está sujeto al azar, pero identificando perfectamente el efecto de la incertidumbre sobre el resultado y minimizándolo en el sentido más apropiado. Y en cuanto a las conclusiones, aunque los efectos del azar no permiten que obtengamos respuestas concretas como «si usas el método te vas a curar», sí podemos hacer afirmaciones que nos ayuden a decidir acerca de la cuestión, a saber:

– Si la hipótesis nula (el método no funciona) se rechaza (se concluye que sí funciona) será porque tenemos la suficiente certeza de que el método sí funciona, ya que hemos minimizado la probabilidad de aceptar algo que en realidad no lo hace.

– Si la hipótesis nula (el método no funciona) se acepta (se concluye que efectivamente no funciona), se hace porque no hay suficiente evidencia para descartar que la recuperación de la dolencia se deba al azar. Como hemos llegado a esta conclusión asumiendo que podemos estar aceptando una hipótesis falsa, no podemos afirmar que el método no funcione con la misma rotundidad con la que afirmaríamos que sí lo hace.

A o B , he ahí la cuestión.

Pero, ¿son suficientes éstas afirmaciones para posicionarnos a favor de la opción A o de la B? En realidad esta cuestión no es tan sencilla de dirimir, y está sujeta a debates que ya entran dentro del campo de la filosofía más que de las matemáticas, pero si aceptamos los convenios establecidos la respuesta a esta pregunta es de nuevo sí.

Al realizar un contraste de hipótesis, si se concluye que el método no funciona no tenemos pruebas de que haya diferencia entre usar el método y no usarlo, por lo que si se comercializa afirmando que tiene propiedades curativas o sin informar de que no está muy claro que las tenga, estaremos ante un fraude evidente, lo que nos lleva a la opción B. Si por el contrario se admite que el método funciona es porque estamos muy seguros de que es así, y por tanto tendremos argumentos suficientes para defender que postura oficial es incorrecta, lo que nos sitúa en la opción A.

Curiosamente, si conseguimos demostrar esto último la postura oficial cambiará y el método pasará a considerarse científicamente probado, y por tanto al final acabaremos estando de nuevo en la B, lo que convierte el debate entre ciencia oficial y ciencia alternativa en completamente absurdo.

En conclusión, la ciencia puede afirmar, no con una seguridad del 100% pero sí como poco al 95%, que un método que supuestamente cura una dolencia funciona. Luego cabe preguntarse: si las matemáticas aportan una herramienta tan potente, y al alcance de cualquiera, ¿porqué los defensores de las «medicinas alternativas» no se limitan a aportar pruebas en lugar de atacar a quiénes dudan de su efectividad?

Y además, si la misma herramienta nos permite afirmar que no hay diferencia entre consumir perlas homeopáticas y agua del grifo, ¿por qué no quedarnos directamente con el agua, que hace lo mismo y es más barata?

Sevilla, Julio de 2011

Lo publicó Javier Oribe Moreno en El Máquina de Turing

Gracias a Antonio Quintana Déniz por sus aportaciones, a Guillermo García Linazasoro por sus comentarios y Zaida Quintero Ruiz por su ayuda con la edición.

Y a los tres por su paciencia y apoyo.

Fuentes:

«Principios de Inferencia Estadística» – Ricardo Vélez Ibarrola y Alfonso García Pérez, Universidad Nacional de Educación a Distancia, Madrid, 1993

Wikipedia

Vitutor.com

Publicado en: Divulgación, Escepticismo, Probabilidad y Estadística | Etiquetado:Ciencia, contraste de hipótesis, Divulgación, error por defecto, error por exceso, error Tipo I, error Tipo II, escepticismo, estadística, homeopatía, Matemáticas, medicina alternativa, placebo, pseudociencia

7 comentarios

Allen 07/07/2011 en 10:32 am|Responder

No sé porqué pero desde el primer momento tenía la impresión que éste artículo iba a atacar a la homeopatía :P. El caso es que tu conclusión parece dejarlo todo un poco en evidencia en el sentido de «curan porque sí», pero creo que deberíamos de arrojar un partícipe más a la hora de comentar este tipo de medicina, y no es otro más que el individuo como ser particular, y me refiero a él porque si bien hay personas que han mejorado con algunos tratamientos, existen otras que se sienten igual con homeopatía o sin ella.. ¿es eso suficiente para tacharla como la frenopatía del siglo XX? No voy a ponerme a defender nada en éste lugar, simplemente soy de esos chalados que han mejorado ostensiblemente tras un tratamiento homeopático, no voy a comentar ni qué dolencia o «mal» era, ni los «ingredientes mágicos» ni nada por el estilo… pero me gustaría romper una lanza a favor de ésta «patraña» tan atacada a muerte por ciertos sectores «epicureanos» o científicos, quizás es una medicina «sublime» o «de segundo plano», incluso acepto que puede tener cierto grado de agente placebo en algunas ocasiones, y que es demasiado cara ¿qué no lo es en éstos tiempos?. Bueno que me estoy liando, comparto tu opinión de que si es tan fácilmente demostrable si un fármaco es efectivo contra una dolencia ¿por qué no sacan pruebas concluyentes al respecto?, a ésta pregunta podrían darle respuestas de toda clase y con toda una legión de argumentos que hicieran callar al mismísimo Induráin. La mía es que, si te funciona… adelante ¿placebo? eso está en tu propia mente.

Se me ocurre un ejemplo: A veces te da un dolor de cabeza «tipo 1» (tengo identificados al menos hasta el tipo 4), te tomas el comprimido de paracetamol más grande que hay en el mercado… sin resultado… te tomas un comprimido de «esto te quita el dolor aunque te estés muriendo»… mismo resultado nulo… ¿es lícito acudir a la homeopatía para ver qué tal? yo creo que el ser humano por definición debe de ser curioso y «experimentar» con todo lo que tenga a mano. ¿Qué pasa si es mano de santo? ¿qué pasa si te timan? nunca lo sabrás si no lo intentas. (Empire Strikes Back) 😉

Por cierto, no sé si fue mi traumático paso por la carrera de estadística, pero siempre le he visto un punto «freak» a dicha especialidad, ¿acaso medir la probabilidad de que saques una bola verde de un cesto lleno es relevante? Me dirás que tiene aplicaciones infinitas, pero ¿qué te puedo decir? será que le tengo cierto odio… 😛

Muy currado el artículo, creo que próximamente podrás ser todo un profesor, siento decirte que el Delorean está ya cogido, pero siempre puedes montar una máquina del tiempo en un Renault Fuego…
1. Javi Oribe 07/07/2011 en 12:07 pm|Responder
  
  -» El caso es que tu conclusión parece dejarlo todo un poco en evidencia en el sentido de “curan porque sí”,»
  
  No es que curen porque sí, es que no existe diferencia entre usarlos y no usarlos, y por tanto no se puede defender que sean útiles. Lo que no es de recibo es que se publiciten como útiles cuando no lo son. Y aunque se podría debatir acerca de si entra en la libertad individual el usarlos o no, el peligro aparece cuando alguien abandona una terapia médica para tratarse con una alternativa, poniendo en peligro su salud o incluso la de sus hijos: http://blogs.elcorreo.com/magonia/2010/6/17/la-homeopatia-la-picota-australia-la-muerte-una/3
  
  – » incluso acepto que puede tener cierto grado de agente placebo en algunas ocasiones»
  
  Que la homeopatía actúa como un placebo no es opinable, está comprobado en cada caso que se ha estudiado, te remito a los estudios publicados en la página que enlazo al final del artículo.
  
  – «No sé porqué pero desde el primer momento tenía la impresión que éste artículo iba a atacar a la homeopatía»
  
  No tengo nada en contra de la homeopatía en especial, me parece un tongo del mismo calibre de la Magnetoterapia, la Vitaljoya, la Power Balance y demás. Si la menciono más a menudo es porque está más institucionalizada y llama más la atención. El márketing me puede.
  
  -» yo creo que el ser humano por definición debe de ser curioso y “experimentar” con todo lo que tenga a mano. ¿Qué pasa si es mano de santo? ¿qué pasa si te timan? nunca lo sabrás si no lo intentas»
  
  No digo que no tengas razón, pero si ya otros han experimentado y se ha visto que es «pa ná», ya me dirás.
  
  – «Por cierto, no sé si fue mi traumático paso por la carrera de estadística, pero siempre le he visto un punto “freak” a dicha especialidad, ¿acaso medir la probabilidad de que saques una bola verde de un cesto lleno es relevante?»
  
  En mi opinión para estudiar matemáticas en general hay que tener un punto freak :p La estadística tiene una importancia fundamental a la hora de explicar la realidad por una sencilla razón: la mayor parte de los fenómenos que afectan a nuestra vida diaria no son determinísticos, sino aleatorios. Y el ejemplo de la bola verde tiene la misma relevancia para esto como la tabla del cuatro para la ingeniería aeronáutica: no te va a resolver un problema, pero son conceptos básicos si los cuales no podemos avanzar en otros más complejos que sí son relevantes.
  
  -«Muy currado el artículo, creo que próximamente podrás ser todo un profesor, siento decirte que el Delorean está ya cogido, pero siempre puedes montar una máquina del tiempo en un Renault Fuego…»
  
  Muchas gracias, Allen. Me mola la idea de un Renault Fuego con un condensador de fluzo 😀
karina 07/07/2011 en 11:18 am|Responder

¿tal vez porque el agua del grifo no tiene aspecto de medicina, ni de jarabe?
¿debe el efecto placebo tenerse más en cuenta (de lo que se tiene) y ser un elemento más que agregar a ese cálculo de probabilidad, sabiendo, por ejemplo, que dicho efecto puede ayudar a segregar sustancias como la serotonina que hacen que nos sintamos mejor, y por tanto realmente mejorar?
Me ha entusiasmado este artículo, cuidaros! 🙂
1. Javi Oribe 07/07/2011 en 12:12 pm|Responder
  
  Karina, el efecto placebo se tiene muy en cuenta en este tipo de estudios, yo lo he obviado por no liar más la explicación, que ya de por sí es difícil (y la he simplificado todo lo que he podido).
  
  Además, por lo que yo sé, el efecto placebo también se usa a veces a propósito por los médicos (esto no lo sé seguro, si me equivoco que alguien me corrija), pero no podemos «institucionalizar» el uso de un placebo precisamente porque si un paciente sabe que está tomando un placebo el efecto se perdería.
  
  Saludos y cuidaros vostoros también 😀
Antonio Quintana Déniz 07/07/2011 en 1:14 pm|Responder

Pongamos que Hahnemann haya dicho que si llevo en los bolsillos dos esmeraldas puedo volar como los pajaros, sin la ayuda de ningún tipo de artefacto. Yo, como buen hombre ilustrado y de mente abierta, meto dos esmeraldas bien gordas en los bolsillos de mis vaqueros, me encamino al edificio más alto de Las Palmas y me lanzo a volar. ¿Estoy actuando de manera cuerda? ¿Serán capaces las gordas esmeraldas de cambiar todas las leyes de la física que se usan con esplendidos resultados desde el siglo XVII?

Algo parecido ocurre con la homeopatía; los principios de la misma van en contra de lo que sabemos de química y que tan buenos resultados nos ha dado al manipular el mundo físico en el que vivimos. Las diluciones homeopáticas son tan diluídas que podemos afirmar que casi todas las dosis de productos homeopáticos sólo contienen el disolvente y ni una sóla molécula del principio activo. La teoría de la presunta memoria del agua, no sólo supone que el agua tiene memoria, sino que esta es selectiva, sólo recordaría lo que es beneficioso y no lo que es pernicioso. ¿Puedo aceptar que una dosis de disolvente es una terapia valida? ¿Puedo aceptar que el agua tiene esta memoria selectiva y tan arbitrariamente ajustada a mis necesidades?

Lo cierto, es que en la epoca de Hanehmann la homeopatía podría ser benigna porque acudir a la medicina oficial era poco menos preferible que acudir al verdugo. Pero la medicina, por fortuna para nosotros, ha cambiado.
Juanila 09/07/2011 en 10:01 pm|Responder

Javi de pm colega! En estos momentos estoy intentando acercarme de nuevo al mundillo de la estadística, así que cualquier información que creas interesante mándamela por favor, saludos!
Mark VR 30/07/2015 en 5:27 am|Responder

A ver si mi razonamiento es correcto:

La ciencia como forma de razonamiento es consistente pero incompleta.
1) Incompleta porque no puede demostrar todas las verdades del universo (y no creo que llegue a lograrlo algún día), pero se puede acercar de manera asintótica.
2) Consistente porque no tiene contradicciones internas (o por lo menos intenta no demostrar una cosa y su opuesto simultáneamente, y si lo hace, detecta el error y lo elimina o corrige).

En mi opinión, la Naturaleza es esencialmente inconsistente, es decir, no tiene una lógica, la lógica es un producto de nuestras mentes, las cuales son un producto de nuestros cerebros y de nuestra interacción con el entorno, un evento, y como todo evento, es meramente temporal. Lo que llamamos leyes del universo, sí son hechos a escala humana, pero en la eternidad no tienen importancia, significado ni lógica alguna.

O como diría un amigo mutuo, la Naturaleza no es computable.
Saludos!…

P.D.: Se que estoy cantando por fonética, apenas terminé secundaria pero espero no haber estado muy errado.

El Máquina de Turing

Matemáticas para detectar camelos: el contraste de hipótesis