عدم اليقين في التفكير التحليلي – الجزء الثاني

قرارات في ظل عدم اليقين

تكمن الصعوبة الرئيسية مع عدم اليقين في أننا لا نستطيع التأكد من نتيجة قرارنا في الوقت الذي نختار فيه إجراءاتنا. كما هو شائع ، ينكشف عدم اليقين بمجرد أن نتخذ قرارًا ، وعند هذه النقطة قد نأسف على اختيارنا إذا لم يكن الإدراك مرضيًا.

يوضح الشكل أدناه  الصعوبات الرئيسية والحل عندما نتخذ قرارات في ظل عدم اليقين

. بدءًا من أعلى اليسار ، تعرض اللوحة 1 خيارنا وكيف تربط رافعاتنا  A  و B مع العواقب في ضل عدم اليقين (قبول / رفض كل عرض). يقبلون الرافعة A مع احتمال PA ورافعة B مع احتمال PB. هذا هو عدم اليقين الكامن في هذا السيناريو الافتراضي.

تُظهر اللوحة 2 المشكلة الرئيسية التي نواجهها: يجب علينا اتخاذ القرار قبل حل حالة عدم اليقين ، والتي يشار إليها عادةً بالمرحلة السابقة (ex-ante stage). من الناحية المثالية ، إذا تمكنا من رؤية النتيجة الفعلية بعد حل حالة عدم اليقين ، كان بإمكاننا اتخاذ القرار الأمثل اللاحق ، ولكن هذه ليست الطريقة التي تعمل بها القرارات في ظل عدم اليقين. يجب أن نتعامل مع حقيقة أن القرارات تُتخذ قبل حل عدم اليقين .

تُظهر اللوحة 3 كيف نقوم بالاختيارات في ظل عدم اليقين: نقوم بتقييم كل من البدائل (رافعاتنا) عن طريق حساب قيمها المتوقعة واختيار القيمة التي تزيد من التوقعات. يجب أن يكون واضحًا أن هذا لا يضمن تحقيق أمثلية لاحقة: قد نختار الخيار الذي يزيد من القيمة المتوقعة إلى الحد الأقصى ، ولكن لا يزال ينتهي بنا المطاف بنتيجة دون المستوى الأمثل بمجرد حل حالة عدم اليقين.

لماذا يحدث هذا؟ من المحتمل جدًا أننا لم تكن لدينا تقديرات جيدة لاحتمالاتنا ، إما بسبب نقص البيانات الجيدة ، أو لأننا لم نستخدم مجموعة أدوات تعلم الألة على أفضل وجه ، أو لأننا لم نقضي وقتًا كافيًا لفهم مصادر عدم اليقين الكامن لدينا. ولكن حتى لو فعلنا ذلك ، في بعض الأحيان يكون لدينا حظ سيئ.

هل هذا هو أفضل ما يمكننا فعله؟

أصبحت منهجية القيمة المتوقعة هي المعيار عند اتخاذ القرارات في ظل عدم اليقين. لكن هل هذا هو أفضل ما يمكننا القيام به مسبقًا ، أو قبل حل عدم اليقين؟ دعونا نستكشف بعض البدائل.

لنفترض أنه بدلاً من سحب الرافعة التي تزيد من القيمة المتوقعة إلى الحد الأقصى ، فإننا نتجاهل عدم اليقين ونختار دائمًا البديل ذي العائد الأعلى. إذا واجهت هذا القرار مرة واحدة فقط ، فستندم أحيانًا وأحيانًا لن تندم: فهذا يعتمد حقًا على قيم الاحتمالات والإدراك ا بالضبط.

نظرًا لأن تكرار القرار مرة واحدة لم يكن نهائيًا ، تخيل أننا نواجه نفس الرهان بالضبط عدة مرات . إذا قمت بحساب الأرباح التراكمية لكلتا الطريقتين ، فسوف يسعدك حينئذٍ أن تستنتج أن تعظيم المنفعة المتوقعة أفضل بلا شروط على المدى الطويل.

يوضح الشكل أدناه  الأرباح التراكمية من معياري القرار هذين إذا واجهنا نفس القرار 100 مرة.

القرار اللاحق (ex-post  ) و يسمى كذلك بالقرار الأفضل-الأول  (first-best). هذا لأننا نختار بشكل فعال استبعاد أي عدم يقين، كما لو كان لدينا كرة سحرية ونعرف ما سيقبله العميل. على هذا النحو ، يعد هذا دائمًا معيارًا جيدًا لمقارنة أي معيار قرار آخر. أعرض أيضًا أرباح المحاكاة لمعيارين إضافيين: تعظيم القيمة المتوقعة (المسمى Ex-ante) واختيار البديل دائمًا بأعلى عائد معين (المسمى Max-Value ، الخيار B في مثالنا).

يظهر الرسم على اليسار أن  الأفضل-الأول  (first-best) هو في الواقع أفضل نتيجة ممكنة. في هذه المحاكاة ، كان للخيار B عدد قليل من العوائد الأولية الجيدة ، مما يجعله متفوقًا على حساب القيمة المتوقعة (“سابقًا (Ex-ante)”) على المدى القصير. ولكن على المدى الطويل ، يتغير هذا السلوك ، وإذا كنا نستخدم حساب القيمة المتوقعة ، فقد حققنا المزيد من الإيرادات. الجواب هو أنه مع هذه المجموعة من العوائد ، كنا سنأسف لو لم نستخدام معيار القيمة المتوقعة.

يُظهر المخطط الأيمن بالضبط نسبة الأرباح الإضافية التي كان من الممكن أن نحققها. في البداية ، جعلت العوائد الأولية الجيدة للاختيار B (مع CLV أعلى) معيار MaxValue يتفوق على استخدام القيم المتوقعة. نظرًا لأن تواتر التكرار يتقارب مع الاحتمالات على المدى الطويل ، فإننا نبدأ في رؤية أن المعيار السابق (ex-ante ) يبدأ بالهيمنة.

لاحظ أنه يمكن تقديم حجة مماثلة إذا كان اختيارك يعتمد فقط على الاحتمالات – لنقل ، اختر دائمًا الرافعة ذات الاحتمالية العالية للقبول.

يوضح الكود أدناه كيف تم توليد الشكل :

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

def get_exante_earnings(accepts_a, accepts_b, exante_choice, clv_a, clv_b):
    '''
    
    تعتمد أرباحنا على قبول العملاء لكل عرض و فائدة المتوقع
     1.A نختار تقديم البديل :E (A)> E (B) إذا كانت   
       0 وإلا CLV_A فإننا نحصل على  A إذا قبل العميل
     2. B فنحن نقدم :E (A) <E (B) إذا كانت  
      0 وإلا CLV_B فإننا نحصل على B إذا قبل العميل   
    '''
    
    earn_ea = 0
    if accepts_a == True and exante_choice=='a':
        earn_ea = clv_a
    elif accepts_b == True and exante_choice =='b':
        earn_ea = clv_b
    return earn_ea

def get_expost_earnings(accepts_a, accepts_b, clv_a, clv_b):
    '''
     هي الأفضل الأول : نختارها كما لو أن ليس هناك عدم يقين Ex-post 
    1.A نحصل على العرض B وليس  A لو قبل العميل
    2.B نحصل على العرض A وليس  B لو قبل العميل
    1.لو قبل العميل العرضين نختار الأفضل لنا
    '''
    earn_ep =0
    if accepts_a ==True and accepts_b == False :
        earn_ep = clv_a
    elif accepts_a == False and accepts_b == True :
        earn_ep = clv_b
    elif accepts_a == True and accepts_b == True:
        earn_ep = np.max(np.array([clv_a, clv_b]))
    return earn_ep


def get_maxvalue_earnings(accepts_a, accepts_b, clv_a, clv_b):  
    '''
   B و إلا A نختار العرض  CLV_A>CLV_B  القاعدة : لو  
    '''
    
    earn_mv = 0
    if clv_a>=clv_b and accepts_a ==True:
        earn_mv = clv_a
    elif clv_a<=clv_b and accepts_b == True:
        earn_mv = clv_b
    return earn_mv

np.random.seed(50)
# قيمة العميل طويلة الأجل
clv_a = 10
clv_b = 11
# إحتمالية القبول
prob_a = 0.6
prob_b = 0.5

# القيم المتوقعة و الخييار الأفضل للمنفعة المتوقعة
evalue_a = prob_a*clv_a + (1-prob_a)*0
evalue_b = prob_b*clv_b + (1-prob_b)*0
if evalue_a> evalue_b:
    exante_choice = 'a'
else:
    exante_choice = 'b'

# المحاكاة لـ مئة مرة
T = 100
total_earnings = pd.DataFrame(index=np.arange(T),
                         columns=['exante','expost','max_prob','max_value'])
for t in range(T):
    
    # محاكاة خيارات عدم اليقين بالنسبة لعملائنا 
    accepts_a = np.random.rand() <= prob_a
    accepts_b = np.random.rand() <= prob_b
    # المثلى Ex-ante
    total_earnings.exante.loc[t] = get_exante_earnings(accepts_a, accepts_b,
                     exante_choice, clv_a, clv_b)
    # المثلى Ex-post 
    total_earnings.expost.loc[t] = get_expost_earnings(accepts_a, accepts_b,
                     clv_a, clv_b)
    #  max_value دائما إختار 
    total_earnings.max_value.loc[t] = get_maxvalue_earnings(accepts_a,
                     accepts_b, clv_a, clv_b)

# الرسم
fig, ax = plt.subplots(1,2, figsize=(12,4))
total_earnings.expost.cumsum().plot(ax=ax[0],color='k', ls='-',lw=5)
total_earnings.exante.cumsum().plot(ax=ax[0],color='k', ls='--')
ax[0].set_title('Cumulative Realized Earnings', fontsize=16)
total_earnings.max_value.cumsum().plot(ax=ax[0],color='k', ls='dotted')
df_relative_earnings = pd.DataFrame(total_earnings.max_value.cumsum() /
                       total_earnings.exante.cumsum(), columns=['ratio'])
df_relative_earnings.ratio.plot(ax=ax[1],fontsize=16, legend=None, color='k')
ax[1].plot([0,100],[1,1], ls='--', alpha=0.5, color='0.15')
ax[1].set_title('Ratio of Max Value to Ex-Ante', fontsize=16)
ax[1].set_xlabel('Number of times you make the same decision', fontsize=12)
ax[0].set_xlabel('Number of times you make the same decision', fontsize=12)
ax[0].set_ylabel('Dollars',fontsize=12)
ax[1].set_ylabel('Dollars',fontsize=12)
plt.tight_layout()

لكن هذه حجة متكررة (Frequentist Argument)

يوضح المثال السابق أن تعظيم القيمة المتوقعة أفضل من البديلين اللذين اقترحناهما: إهمال عدم اليقين واختيار الرافعة التي تعطي أعلى الإيرادات إذا تم قبولها ، وإهمال الإيرادات واختيار الرافعة ذات أعلى احتمال للقبول. في كلتا الحالتين ، كنا سنأسف ، على المدى الطويل ، باستخدام معايير القرار هذه.

لكنني جادلت سابقًا أن هذا التفسير المتكرر قد لا يكون مناسبًا في العديد من سيناريوهات الأعمال الواقعية: الفكرة الكاملة لمحاكاة نفس القرار عدة مرات في ظل نفس الظروف بالضبط ، فقط مع الإدراك المختلف لعدم اليقين هي مشكلة.

لقد حارب منظرو القرار مع هذه المعضلة لعقود ، وكانت الإجابة هي ما يسمى بالنهج البديهية. في ظل هذا الحل ، لا نحتاج إلى افتراض منطق تكراري ، بل طرح بعض البديهيات السلوكية التي عند الرضا تضمن أننا نتصرف كما لو أننا قمنا بتعظيم القيمة المتوقعة. 

النظريات المعيارية والوصفية لاتخاذ القرار

يمكن اعتبار معيار القيمة المتوقعة كنظرية لصنع القرار في ظل عدم اليقين. عند تقديم قرار يتضمن نتائج غير مؤكدة ، كيف أقرر؟ وكيف يجب أن أقرر؟ هذان سؤالان مختلفان تمامًا واجهناهما بالفعل: الأول يصف ما تم فعله والآخر يقدم وصفة أو توصية بشأن أفضل مسار للعمل.

نظرًا لأن معظمنا في اختياراتنا اليومية لا يقوم بحسابات القيمة المتوقعة ، فإن هذا يعني أن نظرية المنفعة المتوقعة – كما يطلق عليها – ليست وصفًا دقيقًا لكيفية اتخاذنا للقرارات. لكن هل هي نظرية معيارية جيدة ، أي إذا تمكنا من إجراء مثل هذه الحسابات ، فهل سنكون أفضل حالًا؟ كما نوقش في القسم السابق ، في ظل التفسير المتكرر ، تكون الإجابة إيجابية. سنتخذ قرارات أفضل لشركاتنا إذا اعتمدنا معيار المنفعة المتوقع. هذا هو سبب تضميننا لها في مجموعة أدواتنا التحليلية.

بعض التناقضات في اتخاذ القرار في ظل عدم اليقين

لنفترض أنك حصلت على المقامرة التالية: يمكنك الفوز بجائزة قدرها مليون دولار مع احتمال 0.001 ولا شيء غير ذلك. ما هو الحد الأقصى الذي يجب أن تكون على استعداد لدفعه مقابل تذكرة اليانصيب هذه؟ كما قد تتوقع ، إنها القيمة المتوقعة للمقامرة.

دعونا نحسب الأرباح المتوقعة لأي سعر ندفعه للمشاركة (y):

E(profit) = 0.0001 x $1M – y >= 0

يشير عدم المساواة الأخير فقط إلى أنه بالنسبة لنا للمشاركة يجب أن يكون من الأفضل ألا نخسر في التوقع. ويترتب على ذلك أن الحد الأقصى للسعر الذي يجب أن ندفعه يمكن إيجاده عند نقطة التعادل: Ym = 1،000 دولار.

لجعل هذا المثال أكثر واقعية ، دعنا نفكر في يانصيب Mega Millions في الولايات المتحدة ، ونأخذ احتمال أن تكون بطاقة اليانصيب الخاصة بنا واحدة من المحظوظين لتكون 1 من 302،575،350.3 تكلفة كل تذكرة 2 دولار . عند هذا السعر ، فإن الحد الأدنى للجائزة الكبرى التي يجب أن نرغب في اللعب بها هو 605 مليون دولار

يلعب العديد من الأشخاص اليانصيب حتى عندما لا تكون الطريقة المثلى وفقًا لمعييار القيمة المتوقعة ، مرة أخرى ، كنظرية وصفية لاتخاذ القرار يبدو أنها لا تقوم بعمل جيد.

فكر الآن في اليانصيب التالي: للمشاركة يجب أن تدفع كل مدخراتك (لنفترض 100 دولار). مع احتمال 1E-6أن تربح 1،000،001 ضعف مدخراتك. مع الاحتمال المتبقي لن تفوز بأي شيء (وبالتالي تخسر كل شيء) .

E(prize) = 0.000001 x (1000001 x $100) = $1000001

يتم هنا اختيار الاحتمالات والجوائز بحيث يكون من الأفضل دائمًا ، وفقًا لمعايير المنفعة المتوقعة ، الدخول في المقامرة بصرف النظر عن مدخراتك. لكن هل تدخل؟ أعلم أنني لن أفعل.

يؤدي هذا إلى أشهر مفارقة في نظرية القرار فيما يتعلق بعدم اليقين.

مفارقة سانت بطرسبرغ (St. Petersburg Paradox)

لنفترض أنك عُرضت عليك المقامرة التالية: سأرمي عملة عادلة – بحيث يكون الاحتمال متساويًا – وأعطيك 2^n دولارات إذا ظهر الرأس الأول في الرمية n. نظرًا لأن هذه عملة عادلة ، فإن احتمال ظهور رأس في الرمية الأولى هو 1/2 ، في الثانية  (½)^2 مع احتمال ½  أن تظهر الرمية الأولى ذيلًا ، وبنفس الاحتمال ، تظهر الرأس في  الأولى – وبالتالي فإن احتمال ظهور الرأس في الرمية n  هو (1/2)^2  لنحسب القيمة المتوقعة للجائزة:

 يتم اختيار الاحتمالات والجوائز بحيث تنمو الجائزة المتوقعة دون قيود. تنشأ المفارقة لأن لا أحد على استعداد لدفع مثل هذا المبلغ للدخول في هذا الرهان – عادة ما يسمى السعر العادل لليانصيب.

في القرن الثامن عشر ، اقترح عالم الرياضيات دانييل برنولي حلاً: لا ينبغي لنا أن نقدر كل جائزة بالقيمة الاسمية ، بدلاً من ذلك ، يجب أن نستخدم دالة المنفعة التي تعرض القيمة المتناقصة التي يمثلها كل دولار إضافي بالنسبة لنا. كان الحل الذي اقترحه هو تقييم كل جائزة باللوغاريتم الطبيعي (وظيفة مقعرة لطيفة ، وبالتالي عرض تناقص المنفعة الحدية ، أي تجنب المخاطرة).

يوضح الشكل أدناه القيم المتوقعة للبديلين.

 كما هو موضح سابقًا ، فإن المنفعة المتوقعة للحالة الخطية تنمو بمعدل واحد لواحد مع عدد مرات الرمي. من ناحية أخرى ، فإن المنفعة المتوقعة لحالة اللوغاريتم تتقارب بشكل جيد مع أقل من 1.4 منفعة (utils )  (وحدة قياس المنفعة) ، والتي يتم الوصول إليها بعد حوالي 15 رمية . ويترتب على ذلك أن أقصى ما يجب أن ندفعه للإشتراك هو مقدار 15 جولة من الرهان. القيمة المتزايدة بعد ذلك هي صفر بالنسبة لنا.

التناقض مهم بالنسبة لنا ، لأننا حتى الآن نقدر منفعتنا بالقيمة الاسمية مع الدولارات التي نجنيها. لقد وجدنا الحد الأقصى للقيمة – القيمة العادلة – باستخدام حسابات القيمة المتوقعة. تذكرنا المفارقة أنه يجب علينا توخي الحذر عند استخدام دوال المنفعة المحايدة للمخاطر ، حيث قد ينتهي بنا المطاف بالإفلاس.

تجنب المخاطرة

كما تذكرنا مفارقة سانت بطرسبرغ ، من المهم أحيانًا أن نصمم اختياراتنا بدوال المنفعة المقعرة ، لأنها لا تعرض فقط المنفعة الحدية المتناقصة ولكنها تعرض أيضًا تفضيلات تجنب المخاطرة. لقد ذكرنا بإيجاز تجنب المخاطرة  سابقًا ، ولكن لم يكن من الواضح سبب أهميته في تطبيقات الأعمال ، لذلك دعونا نعيد النظر في المثال التالي 

يمكنك الآن التحقق من أن القيمة المتوقعة للقرار المحفوف بالمخاطر تساوي الإيرادات المؤكدة من الحملة التسويقية. بالمعنى الدقيق للكلمة ، نظرًا لأن كلا الرافعتين لهما نفس التوقعات الرياضية ، يجب أن نكون غير مبالين بين الاثنين. يمكننا أن نختار بينهما بشكل عشوائي ، دائمًا الأول ، دائمًا الأخير ، أو نستخدم معيارًا آخر لكسر التعادل غير حساب القيمة المتوقعة. 

قد تتذكر أنه حتى الآن استخدمنا وظائف المنفعة الخطية (المحايدة للمخاطر) التي تربط كل دولار بوحدة واحدة من المنفعة (u(x) = x ). لكن المناقشة السابقة تشير إلى أننا لسنا محايدين حقًا في المخاطرة ؛ في واقع الأمر ، بحيث يجنب الكثير الدخول في مقامرة و الحصول على عائد معين. إذن هنا تكمن الإجابة على اللغز لدينا: يجب أن نستبدل دالة المنفعة المحايدة للمخاطر بدالة مقعرة تجسد تفضيلاتنا للمخاطرة بشكل أفضل. دعنا نستخدم الحل الذي اقترحه دانيال برنولي والذي يربط الدولارات بلوغاريتم الدولارات.

بالنسبة لخصم السعر تحت عدم اليقين نحصل على:

E(Revenue|Discount) = 131/155 x log(155) = 4.3

ونحن نعلم بالفعل كيفية حساب الإيرادات المتوقعة لحملة التسويق:

E(Revenue | Marketing Campaign) = 1 x log(131) = 4.9 

يتبع الآن أنه يجب علينا المضي قدمًا في حملة التسويق. إذا كنت تتساءل عما إذا كان هذا سيعمل مع أي دالة منفعة ة مقعرة أخرى ، فإن الإجابة هي نعم لأنها تتبع بشكل جيد من تعريف التقعر.

والخبر السار إذن هو أنه يمكننا الاستمرار في استخدام معيار المنفعة المتوقع لحل مشاكل العمل. الخبر السيئ هو أننا أضفنا مستوى آخر من التعقيد وقد نحتاج الآن إلى اختيار دالة تجنب مخاطر  لتطبيقاتنا: نحصل على قرارات أوضح  ولكن على حساب فقدان الخطية.

 نصيحتي هي أن نبدأ ببساطة وافترض حيادية المخاطر (من السهل التعامل مع العالم الخطي في البداية). بمجرد أن تفهم هذه المشكلة الأبسط ، يمكنك أن تبذل قصارى جهدك لفهم تفضيلات مخاطر أصحاب المصلحة ، وإذا لزم الأمر ، قم ببعض المعايرة. إذا كنت مهتمًا ، فإن دوال المنفعة المستخدمة بشكل شائع لنمذجة تجنب المخاطر مدرجة في المعادلات أدناه . 

  •  وظيفة المنفعة اللوغاريتمية 
  • دالة المنفعة متعددة الحدود

دالة المنفعة الأسية: تجنب المخاطر ة المطلق المستمر (CARA)

يمكننا الجمع بين نسخة مسوية من كثير الحدود و دالة اللوغاريتم لإنشاء دالة تجنب المخاطر النسبية الثابتة التي يشيع استخدامها من قبل الاقتصاديين. تعتمد معايير تجتب المخاطرة على الانحناء النسبي لدالة المنفعة. على سبيل المثال ، في الحالة الأسية ، a هو معامل تجنب المخاطر المطلق. في حالة CRRA الموضحة ادناه، p هو معامل النفور النسبي من المخاطرة.

  • تجنب المخاطر ة النسبي المستمر (CRRA)

يوضح الشكل أدناه كيف تبحث بعض هذه البدائل عن معايير مختلفة. كما كنت تتوقع ، تغير البدائل و المعايير المختلفة انحناء دوال المنفعة ، مما يوفر طرقًا منهجية لنمذجة تفضيلاتنا للمخاطر.

ختاماً 

أتمنى الآن أن أكون قد أقنعتك بأن معيار القيمة المتوقعة هو طريقة قوية ولكنها بسيطة لاتخاذ القرارات في ظل عدم اليقين. آمل أيضًا أن أكون قادرًا على نقل بعض الصعوبات التي قد يواجهها المرء. تأتي البساطة من حقيقة أن التوقعات الرياضية خطية في الاحتمالات ، وإذا افترضت حيادية المخاطرة ، أيضًا في قيم النتيجة غير المؤكدة.

إضافة تعليق