نامگذاری مدل معمای زندانی
معمای زندانی یا مخمصهی زندانی (Prisoner’s Dilemma) یکی از مدلهای نظریه بازی است. در شرایطی که سرنوشت افرادی در یک موقعیت خاص به هم گرهخورده، اما نه کنترلی روی محیط دارند و نه حتی امکان مشورت و قولوقرار با یکدیگر دارند، معمولا میتوان با این مدل نتیجهی تصمیمات را تحلیل و پیشبینیکرد.
مثال کلاسیک معمای زندانی، موقعیت دو مظنون بازداشتشده را بررسیمیکند که جداگانه تحت بازجویی قرار گرفتهاند تا بدون اطلاع از یکدیگر اعتراف کنند. این دو، مظنون به همکاری در یک جرم هستند. در چنین شرایطی، معمولا پلیس برای گرفتن اعتراف، با مظنونین معامله میکند. دلیل نامگذاری این مدل نیز همین مثال است.
پیچیدگی این موقعیت در این است که اگر پیشنهاد پلیس وسوسهبرانگیز باشد، احتمال اعتراف (یا حتی خیانت به همدست) افزایشمییابد. پلیس از یک سو مظنونین را تهدیدمیکند که درصورت تأیید اتهام، حکم سنگینی برای هر دو میبُرد. از سوی دیگر، تلاشمیکند با وعدهی آزادی مشروط یا تخفیف در مجازات، هر یک از مظنونین را جداگانه به لودادن همدست ترغیبکند.
بازی تکمرحلهای
برای مدلسازی معمای زندانی معمولا از ماتریس ارزش استفادهمیکنند.
| انتخابها | دومی همکاری کند | دومی اعتراف کند |
| اولی همکاری کند | هر دو بهدلیل همکاری با هم و اعترافنکردن، با کمترین مجازات مواجهمیشوند. | اولی بدترین نتیجه را بهدلیل همکاری یکطرفه میگیرد، اما دومی بابت اعتراف پاداش میگیرد. |
| اولی اعتراف کند | اولی بابت اعتراف پاداش میگیرد، اما دومی بدترین نتیجه را بهدلیل همکاری یکطرفه میگیرد. | مجازات بینشان تقسیم میشود. |
نکته این است که اگر یکی از طرفین همکاری را انتخاب کند، ممکن است طرف مقابل به جای اعتراف کردن، همهی کاسهکوزهها را سر دیگری خرابکند. پس تعادل نش میگوید که اعتراف انتخاب بهتری است! اما نتیجهی همین بازی تکمرحلهای هم بستگی دارد به مقدار اختلاف بین «پاداش همکاری با پلیس» و «مجازات لورفتن». چون اگر این مقدار زیاد نباشد، ممکن است اعترافکردن نیرزد.
تأثیر تکرارِ بازی و افق بلندمدت
اما شرایط همیشه همینقدر ساده نیست و عوامل مختلفی ممکناست ماتریس ارزش را بسیار پیچیدهکند. مثلا:
- میزان ارزش ادامهی همکاری با آن همدست در آینده پس از آزادی
- مقدار اختلاف بین «پاداش همکاری با پلیس» و «هزینهی انتقام همدست در آینده» که میتواند حتی مرگ یا فشار به خانواده و موارد اینچنینی باشد.
با درنظرگرفتن این ملاحظات، لزوما تعادل نش اعتراف نیست. با تغییر ماتریس ارزش گاهی حتی ممکن است یکی از زندانیها اعتراف اجباری را انتخابکند. مثلا از ترس جان خودش یا خانوادهاش یا همقطارانش، یا بابت کسب منفعتی مثل دریافت حقالسکوت و… به ارتکاب جرم اعترافکند.

یک مثال سینمایی از فیلم «گلادیاتور»:
تعدادی برده را درنظر بگیرید که با دستور امپراطور برای نبرد گلادیاتوری انتخابشدهاند. اگر نجنگند، امپراطور اعدامشان میکند، اما اگر بجنگند ممکناست زندهبمانند. پس انتخاب طبیعی، جنگیدن است!
اما ائتلافی بین تعدادی از بردهها به سرکردگی «ماکسیموس»، سردار سابق سپاه امپراطور سابق، شکل میگیرد تا با کسب شهرت و محبوبیت، بتوانند خیانت امپراطور فعلی به امپراطور سابق را علنیکنند. همهی اعضای این ائتلاف میدانند که خیانت به ماکسیموس میتواند شرایط خوبی را برایشان فراهمکند. اما نهتنها نقشه و آرمانشان را فاشنمیکنند، بلکه تا پای جان از او محافظتمیکنند.
بهاینترتیب:
- افق زمانی بلندمدت بر تصمیمگیری مؤثر است.
- حتی تهدید جانی لزوماً به خیانت نمیانجامد.
- شهرت، تصمیمگیری را تحتتأثیر قرارمیدهد.
جمعبندی
نداشتن کنترل بر عوامل محیطی، میتواند تصمیمگیریهای وابسته به دیگران را به موقعیتی پیچیده تبدیلکند. معمولا معمای زندانی با «همکاری نکردن» شناختهمیشود. اما عواملی وجود دارد که میتواند نتیجهای متفاوت را رقمبزند. مثل:
- تکرار بازی
- شهرت و اعتبار
- احتمال مقابلهبهمثل در آینده
- هنجارهای اخلاقی
- روابط خویشاوندی
- وابستگی متقابل
- هزینهی بالای خیانت
- افق زمانی بلند
تصویر دست زندانی را از mashreghnews و تصویر فیلم گلادیتور را از filimo برداشتم.






