LEARNING AND RECIPROCITY IN COAL TITS PLAYING THE PRISONER’S DILEMMA GAME

 

APRENDIZAJE Y RECIPROCIDAD EN CARBONEROS GARRAPINOS JUGANDO EL DILEMA DEL PRISIONERO

 

Luis M. Bautista and Beatriz Martín

Department of Evolutionary Ecology, National Museum of Natural Sciences MNCN, Spanish Research Council CSIC

Descargar / Download PDF

http://dx.doi.org/10.5514/rmac.v44.i2.68833

Abstract

Foraging tests of the Iterated Prisoner’s Dilemma (IPD) show animals defect, contrary to evolutionary models that predict cooperative animals will prevail and spread in populations. This contradiction could be due to IPD rules that could be too challenging to understand for most animals. We explored this hypothesis relaxing the payoff matrix of the IPD (T>R>P>S=0) to a weak payoff-matrix (T=R>P=S>0) and tested it with coal tits, which did not play one another; rather, each one played against a computer programmed to deliver food pellets according to the ‘Tit for Tat’ strategy. Despite the IPD was programmed with a weak payoff matrix, coal tits preferences to defect increased a 10% when playing the Game condition as compared to a previous Control condition. In the Control condition they foraged at random (48±11%) between two pellet dispensers that delivered food rewards at the same rate, while in the Game condition they increased the preference towards the defection option (58±10%). A sequential (trial by trial) analysis showed that these small birds defected regularly and cooperated at random. While the small preference (10%) for defection observed in a weak version of the IPD suggests IPD standard experiments may be exceedingly stringent for research on animal reciprocity, the absence of cooperation even in a weak IPD demands further research with our reciprocity experimental design and with other species to shed light on the underlying learning processes.
Keywords: weak Iterated Prisoner’s Dilemma, Tit-for-Tat, foraging games, reciprocity, Periparus ater

Resumen

Los estudios del Dilema del Prisionero Iterado (DPI) en obtención del alimento muestran que los animales no cooperan, en contradicción con los modelos evolutivos que predicen que los animales cooperativos prevalecerán y se extenderán en las poblaciones. Esta contradicción podría deberse a una dificultad para aprender las reglas de DPI. Exploramos esta hipótesis con carboneros garrapinos, que en lugar de jugar entre ellos lo hicieron individualmente contra una computadora programada para entregar alimento aplicando la estrategia ‘Toma y Daca’ en una versión modificada del DPI, en la cual la típica matriz de pagos T>R>P>S=0 se relajó disminuyendo la tentación por defraudar y el castigo al ser defraudado según la relación T=R>P=S>0. Los carboneros garrapinos aumentaron la preferencia por defraudar un 10% durante el juego en comparación con una condición de referencia en la que el computador entregó la misma cantidad de alimento con una estrategia fija e independiente de las preferencias de las aves. Un análisis secuencial (ensayo por ensayo) demostró que las aves defraudaron regularmente y cooperaron al azar. Si bien la pequeña preferencia (10%) por defraudar observada en una versión del DPI relajada muestra que los experimentos del DPI podrían ser excesivamente estrictos para investigar la reciprocidad en animales, la ausencia de cooperación consigo mismos incluso en un DPI relajado sugiere que el diseño experimental utilizado en este trabajo es un buen punto de partida para explorar con otras especies los procesos de aprendizaje subyacentes a la cooperación.

Palabras clave: Dilema del prisionero iterado débil, toma y daca, juegos de forrajeo, Auto-reciprocidad, Periparus ater

Inicia la discusión (0)

Parece que no hay comentarios en esta entrada. ¿Porqué no agregas uno e inicias la discusión?

Trackbacks y Pingbacks (0)

Abajo hay un recuento de los trackbacks y pingbacks relacionados con este artículo. Estos se refieren a los sitios que hacen mención o referencia de esta entrada.