Problemas en la Teoría de los Juegos: El dilema del prisionero


Cooperantes, desertores, gente que hace el primo y donde las dan las toman

Por Javier Oribe para Carnaval de Matemáticas.

Imagine por un momento que es usted un gangster. Con la ayuda de un socio ha atracado un banco y ha conseguido un suculento botín. Pero un policía que les andaba pisando los talones desde hacía tiempo los ha detenido, tras la correspondiente persecución con tiroteo incluido, por supuesto subido al estribo de un Buick Sedan del 39. Justo antes de que les encontraran tuvieron tiempo de esconder el dinero en un lugar seguro y, como llevaban la cara oculta tras unas medias negras de nylon, por suerte nadie puede acusarles de haber cometido el atraco si el botín no aparece.

Una vez en comisaría, les separan para ser interrogados y les mantienen completamente incomunicados. El policía, un viejo sabueso, sabe que puede enviarles a pasar un año a la sombra sólo por la mala costumbre que tienen de sacar la Thompson en cuanto aparece la pasma, pero como quiere apuntarse un tanto ante el fiscal del distrito, le propone a usted un trato.

Sabes que por atracar un banco tu amigo y tú podéis pasar 15 años emparejando calcetines en una prisión de máxima seguridad, pero si nos ayudas a resolver esto pronto y nos dices dónde habéis escondido el dinero, te soltaremos y podrás vivir como testigo protegido – le dice.

En principio podría parecer que la propuesta es algo absurda, pues si no confiesa y no aparece el dinero (que no va a aparecer) sólo pueden condenarle a un año de cárcel. Pero hay un problema: le han hecho la misma propuesta a su socio, y usted lo sabe, así que si se calla se arriesga a que el que hable sea él, enviándole 15 años a Alcatraz. Pero la cosa se puede complicar más aún, pues si ambos confiesan, la policía no podrá soltarlos a los dos y acabarán en la cárcel, aunque con toda probabilidad conseguirán una reducción de condena por  colaborar con la justicia y saldrán en 6 años.

¿Qué haría en esta situación? Piense en ello un momento y escoja una de las opciones (hablar o no)  antes de continuar.

Cooperar o desertar, he ahí la cuestión

En esta situación su compañero y usted tienen dos opciones: mantener la boca cerrada o cantar, o dicho de otro modo, cooperar o desertar. Veamos qué ocurriría en cada uno de los cuatro casos que se podrían dar:

1.- Si tanto su compañero como usted cooperan y no dicen nada, la policía sólo puede encerrarlos 1 año.

2.- Si usted coopera y su compañero deserta, pasará 15 años en la cárcel mientras que él saldrá libre.

3.- Si usted  deserta y su compañero coopera, será usted quien salga a la calle y su compañero estará 15 años encerrado.

4.- Si ambos desertan, pasarán los dos 6 años en prisión.

El problema está en que hay un claro conflicto entre el interés común y el individual. La mejor opción para ambos es la primera (ambos cooperan), pues aunque pasan un año en la cárcel descartando la opción de quedar libres,  al menos no condenan a su compañero a pasar 15 años escribiendo rayitas en la pared. Pero si usted decide desertar obtendrá una reducción sensible de la condena haga lo que haga  su compañero (salir libre ó 6 años, frente a 15). El hecho de estar incomunicados es un factor clave, pues aunque el cooperar parezca la mejor solución común, el no saber lo que va a hacer su compañero la convierte en la opción más arriesgada para usted, pues si le traiciona quedará en la peor de las situaciones posibles. Esto es lo que en la Teoría de los Juegos (y en mi barrio) se llama hacer el primo. Así, si usted decide desertar pasará 6 años en prisión pero se asegurará no pasar 15, lo que convierte a esta opción en un mal menor.

El miedo a hacer el primo, tanto por su parte como por la de su compañero, puede llevarnos fácilmente a optar por el mal menor en lugar de hacer la elección con la que  podríamos conseguir el mayor beneficio común. Así, el sargento John McClane del departamento anti-crimen organizado tiene muchas posibilidades de salirse con la suya y encontrar el botín, aun a riesgo de que uno de ustedes salga libre. Pero es que además existen bastantes probabilidades de que ambos confiesen, y acaben entregando el dinero y paseando ambos de la manita por el patio de la prisión.

Dilemas del prisionero

Ésta situación que hemos descrito se conoce como el dilema del prisionero y, aunque parezca algo fantasiosa, encontrarse en ella es mucho más habitual de lo que parece. Imagine que ha tenido usted una discusión muy fuerte con su pareja, de tal modo que llevan varias semanas sin verse. Cada uno quiere hablar con el otro y arreglar las cosas, pero como no se comunican ninguno lo sabe. Si uno decide llamar (cooperación) arreglarán las cosas y volverán a estar juntos, pero ambos temen que si llaman el otro les rechaze y la relación se rompa definitivamente. Por eso no es tan raro que en estas situaciones, ante el miedo de dar el primer paso y ser rechazado (hacer el primo), ambas personas opten por no llamarse (desertar) aun queriendo hacerlo. Estoy seguro que tiene algún amigo al que le pasó esto alguna vez.

Se pueden encontrar otras situaciones análogas, aunque quizás algo menos románticas, en casi cualquier ámbito de las relaciones humanas. Por ejemplo, en un acuerdo bilateral de desarme ambos bandos tienen la posibilidad de cooperar y deshacerse de los arsenales acordados, o de hacer el primo por haber destruido el suyo mientras que el contrario no lo hizo, encontrándose en una situación peor que cuando ambos tenían las mismas armas. O en un grupo de trabajo, todos los participantes pueden optar por trabajar al máximo para obtener el mejor resultado, pero pueden también decidir rendir a medias por no hacer el primo si alguno de los compañeros no hace nada.

Lo que ocurre es que, en este tipo de juegos, la opción menos perjudicial para cada participante no coincide con la más beneficiosa para el grupo. Así, es la primera opción y no la segunda la que, en teoría, tenderán a escoger los jugadores, como demostró John Nash en 1950 (a quién representó Russell Crowe en “Una mente Maravillosa“). Por tanto parece que estamos abocados a ser desertores, pues no podemos confiar en que nuestros compañeros no lo sean.

Donde las dan la toman

Sin embargo, en realidad vivimos en una sociedad bastante cooperativa. Si uno piensa en los problemas que hay a nivel global puede parecer que esto que digo es cuanto menos optimista, pero fíjese en lo que ocurre a nivel local. Gran parte de la estructura social en la que nos movemos se basa en la confianza. Usted coge un avión y confía en que la tripulación estará formada por personas responsables que saben pilotar con seguridad. Va al médico y confía en que no le van a quitar el apéndice si no es estrictamente necesario. Lleva su coche a arreglar y confía en que no le van a poner una pieza vieja en lugar de una nueva.

Pero, ¿cómo encaja esto en situaciones como el dilema del prisionero? ¿No sería más lógico que el mecánico le pusiera una pieza de segunda mano y que usted le dejara a deber la mitad de la cuenta (deserción mutua)? Que en nuestro comportamiento diario seamos cooperativos y no desertores se explica porque en la vida real no solemos encontrarnos con dilemas del prisionero aislados, sino con los conocidos como dilemas del prisionero iterativos. Veámoslo con un nuevo ejemplo.

Imagine que vuelve usted a ser el mismo gansgter. En plena prohibición ha conseguido que un contacto le suministre cierto bourbon, muy cotizado y difícil de encontrar. Como ninguno quiere ver la cara del otro, para no poder delatarse si les pillan, acuerdan que una vez por semana usted dejará una caja con el dinero debajo del puente viejo, mientras que él dejará otra caja con las botellas en el muelle. Ambos pueden cooperar y hacer lo acordado, pero también podrían caer en la tentación de dejar la caja vacía y así quedarse con el dinero y con el bourbon. Hay dos razones para no hacerlo.

La primera es que si ambos desertan se quedarán como estaban al principio y no obtendrán lo que querían, riesgo que seguramente asumirían ante la posibilidad de hacer el primo en una situación que no se volviera a repetir. Pero la otra razón es más fuerte: si alguno de los dos deserta, el otro puede adoptar la misma postura la siguiente semana, con lo que se acabaría el negocio. Es lo que se conoce como la estrategia del donde las dan las toman, que está demostrado que tumba a cualquier otra estrategia no cooperativa del contrario.

Por suerte los ejemplos de dilemas iterativos son mucho más frecuentes que los aislados, y por tanto en general cooperar sale más a cuenta que desertar. Si volvemos al ejemplo de la  discusión con su pareja, en realidad podemos considerar que cada vez que piensa sobre la posibilidad de coger el teléfono se está planteando un dilema del prisionero distinto del anterior, por lo que es fácil que tarde o temprano llegue a la conclusión de que si siguen así, al final ninguno llamará al otro.

Por esto, seguramente alguno tomará la iniciativa y llamará, aun a riesgo de escuchar un “huy, es que ahora me pillas mal, ya te llamaré yo”.

Y es que las matemáticas pueden ayudar a tomar decisiones, pero no hacen milagros.

Sevilla, Abril de 2010

Lo publicó Javier Oribe Moreno en El Máquina de Turing para Carnaval de Matemáticas

*Este artículo es una versión corregida del original, en el que por error se planteaba un juego bipersonal cuya matriz de pagos no correspondía con un dilema del prisionero en sentido estricto. Gracias a Juan Pablo por el aviso.

Para saber más:

El dilema del prisionero“, William Poundstone, Alianza Ed. 1995

Theory of Games and Echonomic Behaviour (Commemorative Edition)“, John von Neumann y Oskar Morgenstern, Princeton University Press, 2007

www.gametheory.net

Dilema del prisionero – wikipedia

Juegue al dilema del prisionero iterativo aquí

Anuncios

15 comentarios

  1. Gracias a este artículo, a partir de ahora mis relaciones con las mujeres irán mucho mejor! Al menos, doblemente mejor! 😛

    En serio, me ha encantado. Lo discutimos en el Mirador Pop 🙂

    Seluk!!

    1. Gracias Seluk!

      Este fin de semana lo intentas poner en práctica por Cádiz, a ver que tal. 😀

  2. Muy bien expuesto.

    Hay, también, estudios de psicología social, antropología y primatología que parecen indicar que la evolución ha echado una manita en esto de que colaboremos casi de una manera instintiva; es decir, parece que desde el punto de vista de la transmisión de los genes el comportamiento colaborativo es una ventaja, y en cierta medida es innato en los primates. Naturalmente, esto no es excluyente de los razonamientos que expones en el texto, sino simplemente otra visión del mismo.

    Un Saludo

    1. Hola Antonio,

      Todo esto es una modelización extrema de situaciones en las que influyen muchas variables, está claro que la Teoría de Juegos no es capaz de predecir comportamientos, pero sí puede ayudar a definir estrategias bastante útiles.

      De todas formas, en el libro de “El Dilema del Prisionero” se describe cómo la Teoría de Juegos es capaz de explicar ciertos comportamientos animales que en principio parecían contradecir los principios de la selección natural. Es muy interesante, ya me curraré alguna entrada sobre eso.

      Saludos desde Melmak.

  3. Hola Javier, perdón que moleste, pero no es este el dilema del prisionero. Si no hice mal las cuentas, el equilibrio de Nash es cooperar con probabilidad 5/8, y tracionar con probabilidad 3/8. Observá que la estrategia ‘traicionar’ no domina a ‘cooperar’ (es preferible 2 años a 5). Un saludo.

    1. (también (2,2) y (5,5) son equilibrios de Nash puros, ninguno tiene incentivos para desviarse)

      1. Qué tal, Juan Pablo

        A no ser que yo esté mal informado, el hecho de que el la búsqueda del mejor resultado pueda llevarte al peor si tu compañero te traiciona es un dilema del prisionero. A priori es preferible 2 años a 5, pero no lo es a posteriori si tu compañero escogió 5 en lugar de 2, y sí tiene una buena razón para hacerlo: el evitar hacer el primo si eres tú el que escoge 5. Es un círculo vicioso en el que pueden caer ambos jugadores, y al no haber comunicación entre ellos, no pueden salir de él salvo confiando en el otro.

        En cuanto al equilibrio de Nash, es cierto que está metido con calzador en el ejemplo, pero mi intención era sólo nombrarlo “de pasada”, aun asumiendo que técnicamente ni está bien definido ni bien estudiado en este caso (si te fijas, tampoco me pillo mucho los dedos con el tema). Creo que merecía la pena mencionarlo, simplemente.

        Gracias por tu comentario, y un saludo!

      2. preferiría seguirla por mail, para no molestarte aquí, pero no es un dilema del prisionero. Para que lo sea, la opción de traicionar debería dominar a la de cooperar, pero acá no tenés ese incentivo. Si mirás los ejemplos de la wikipedia o game theory net, vas a ver que el pago por traicionar (0 años) es mejor que por colaborar (2 años) si uno solo traiciona. Justamente, con los pagos que ponés, hay muchos incentivos para cooperar (incluso el mixto te dice que más de la mitad de las veces deberías hacerlo).

        Un muy buen análisis del Dilema del Prisionero lo podés ver en el primer capítulo de Playing for Real, de Binmore; es una actualización de Fun and Games, pero justo ese capítulo lo reescribe completamente, centrado en el DdP. Saludos!

      3. Juan Pablo, no molestas en absoluto! Por supuesto que si meto la pata en algo, lo reconozco y lo corrijo, no soy ni por asomo “infalible” :D.

        Ya veo lo que quieres decir, el problema está en los pagos: para que sea un dilema del prisionero en sentido estricto el pago de la opción “yo deserto, tú cooperas” debe ser menor que los demás, y aquí no lo es.

        Muchas gracias por el apunte, lo corregiré ahora mismo.

        Saludos!!!

      4. Hala, ya está arreglado, gracias por el aviso!

        Espero que te haya gustado el artículo, meteduras de pata aparte.

        Más saludos.

      5. Ahora si! Justamente, necesitabas que traicionar siempre pagara mejor que cooperar. Saludos!

  4. Muy interezante muchas gracias

  5. Información Bitacoras.com…

    Valora en Bitacoras.com: Cooperantes, desertores, gente que hace el primo y donde las dan las toman Por Javier Oribe para Carnaval de Matemáticas. Imagine por un momento que es usted un gangster. Con la ayuda de un socio ha atracado un banco y ha co……

  6. Me ha encantado, y no es porque sea un público fácil… es un estilo directo que engancha y está muy bien hilado. Mantiene el interés y nos ayuda a plantearnos hasta qué punto somos todos desertores o cooperantes, y el miedo que tenemos a hacer el primo…Y la ética? No la tuvo en cuenta John Nash? Imagínate que educamos a nuestros alumnos para que sean leales y no tengan miedo a hacer el primo, le daríamos la vuelta a esta teoría??

    1. Hello, Kitty,

      La respuesta a tu pregunta es que no, en la Teoría de Juegos se simplifica la actitud del jugador hasta una sencilla ley de la búsqueda del máximo beneficio y el mínimo perjuicio (que no siempre coinciden) y no se tienen en cuenta factores éticos ni morales ni socioculturales.

      La teoría no pretende ser una respuesta infalible para los dilemas de relaciones sociales, sólo son una herramienta más a tener en cuenta que puede ayudarnos a tomar decisiones y a construir modelos de negociación. Desde cierto punto de vista, se podría pensar que ayuda a construir una ética adecuada, pues analiza cuáles pueden ser las consecuencias de determinados comportamientos (como desertar, por ejemplo), pero ésto, aparte de ser una opinión bastante cuestionable en muchos aspectos, no es su objetivo ni de lejos.

      En definitiva, ante una situación de decisión, digamos que lo suyo sería tener en cuenta por un lado qué dice la teoría de juegos, añadirle cuál sería el mejor comportamiento desde un punto de vista ético y por último tener en cuenta los factores ambientales y socioculturales que pueden añadir o restar valor a los posibles resultados de la decisión. Complicao, ¿verdad?

      Sobre lo que te planteas acerca de la educación de los chavales, me parece muy interesante.

      En realidad lo ideal sería que todos cooperásemos en estas situaciones, está claro, pero el problema es que con que uno sólo deserte ya todo se iría al garete, y por tanto esa opción es bonita, pero bastante utópica. Para poder darle la vuelta a la teoría debería ser aceptable la suposición “es absolutamente imposible que nadie que reciba una formación adecuada deserte en lugar de cooperar”, y me temo que no lo es.

      Una alternativa más realista sería enseñar a los chavales a cooperar, pero también a defenderse de los desertores, y la técnica del “donde las dan las toman” es una manera muy buena hacerlo. No estaría mal trabajar con este tipo de juegos en la enseñanza, ¿verdad? Se podrían enseñar muchas claves de las relaciones sociales y ayudar a que los chavales aprendieran a enfrentarse a las consecuencias de sus decisiones, y a las de los demás.

      Qué ganas tengo de acabar la carrera para dedicarme a estas cosas 😀

Si tiene algo que decir, éste es el momento

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s

Matemáticas 2º de ESO

Blog de matemáticas para los alumnos de 2º de ESO del Colegio Marcelo Spínola

Historias de la Historia

La historia contada de otra forma

Cuentos Cuánticos

Un sitio donde los cuentos de ciencia están contados y no contados al mismo tiempo

El escéptico de Jalisco

"Usted tiene perfecto derecho a elegir entre conocer las matemáticas o no, pero debe ser consciente de que, en caso de no conocerlas, podrá ser manipulado más fácilmente." John A. Paulos

Los Matemáticos no son gente seria

"Usted tiene perfecto derecho a elegir entre conocer las matemáticas o no, pero debe ser consciente de que, en caso de no conocerlas, podrá ser manipulado más fácilmente." John A. Paulos

Francis (th)E mule Science's News

La Ciencia de la Mula Francis. Relatos breves sobre Ciencia, Tecnología y sobre la Vida Misma

El mundo de Rafalillo

"Usted tiene perfecto derecho a elegir entre conocer las matemáticas o no, pero debe ser consciente de que, en caso de no conocerlas, podrá ser manipulado más fácilmente." John A. Paulos

Mati, una profesora muy particular

"Usted tiene perfecto derecho a elegir entre conocer las matemáticas o no, pero debe ser consciente de que, en caso de no conocerlas, podrá ser manipulado más fácilmente." John A. Paulos

Hablando de Ciencia

La Ciencia al Alcance de tu mano

Tito Eliatron Dixit

"Usted tiene perfecto derecho a elegir entre conocer las matemáticas o no, pero debe ser consciente de que, en caso de no conocerlas, podrá ser manipulado más fácilmente." John A. Paulos

Gaussianos

Porque todo tiende a infinito...

La Ciencia y sus Demonios

La primera gran virtud del hombre fue la duda y el primer gran defecto la fe (Carl Sagan)

A %d blogueros les gusta esto: