في المقالين السابقين تحدثنا عن عدم اليقين و ذكرنا في المقال السابق كيف أن معيار القيمة المتوقعة هو طريقة قوية ولكنها بسيطة لاتخاذ القرارات في ظل عدم اليقين.
دعونا نلخص النهج الآن:
اتخاذ القرار في ظل عدم اليقين
إذا كان لدينا رافعتان (A,B) مع عواقب في ظل عدم اليقين ، فإننا نختار الرافعة التي تزيد من القيمة المتوقعة للمقياس قيد الدراسة:
- اختر A في حالة E(x|A) >= E(x|B)
- خلاف ذلك ، اخترB .
نفس المبدأ يعمم على الحالات التي لديها أكثر من رافعتين.
ما الدور الذي يلعبه الذكاء الاصطناعي في هذا الحساب؟
هناك طريقتان يمكن اتباعهما بناءً على نوع المشكلة التي تواجهها:
- يمكنك تقدير القيم المتوقعة بشكل مباشر باستخدام مجموعة أدوات تعلم الألة(نماذج الانحدار الخاضعة للإشراف).
- يمكنك تقدير الاحتمالات في حساب القيمة المتوقعة (نماذج التصنيف الخاضعة للإشراف).
تقدير الاحتمالات
تعتمد القيم المتوقعة على الاحتمالات والمكافآت لنتائج تحت ضل عدم اليقين. سننظر أولاً في طرق تقدير الاحتمالات.
تقدير الاحتمالات غير المشروطة
بالعودة إلى التفسير المتكرر للاحتمالات ، قد نرغب في البدء بتقدير التكرارات غير المشروطة للوقائع. لقد ناقشنا بالفعل بعض المشكلات المتعلقة بهذه الطريقة ، ولكن إذا كانت لدينا بيانات تاريخية ، فقد تكون أفضل طريقة البدء بفضل بساطتها. في واقع الأمر ، حتى إذا كنت لا تخطط لاستخدام هذه الطريقة ، فمن الجيد دائمًا أن تبدأ بالتخطيط لبعض تكرارات الحوادث لاكتساب بعض الفهم لبياناتك.
يوضح الشكل أدناه كيف سيبدو هذا النهج لبيانات تاريخية افتراضية عن معدلات التحويل لحملات الاحتفاظ بالعملاء
هنا نرى أنه ، تاريخيًا ، قبل 20٪ من عملائنا على حملات الاحتفاظ لدينا. لذلك يمكننا استخدام هذا كتقدير أساسي لحساب القيمة المتوقعة إذا أردنا اختيار هذه الرافعة أو أي رافعة أخرى قد نقوم بتحليلها.
الجانب الإيجابي هو بساطته: إذا كانت لدينا البيانات (و هي “إذا” كبيرة) فإن حساب التكرارات لا يتطلب أي وقت . ومع ذلك ، هناك العديد من العيوب. بافتراض أن لدينا بيانات ، نظرًا لأننا نجمع المعلومات من حملات مختلفة محتملة مع عينات مختلفة من العملاء ، فليس لدينا طريقة للتحكم في هذه الاختلافات.
على سبيل المثال ، هل حملة العطلة هي مشابهة لعروض الاحتفاظ المتكررة لدينا؟ هل العملاء نفسهم؟ من المرجح أن تكون الإجابات على هذه الأسئلة بالنفي. نظرًا لأننا لا نتحكم في هذه العوامل ، و بالتالي فهي تسمى عمومًا تقديرات الاحتمالات غير المشروطة.
قد يبدأ المرء في تصفية بعض الحملات ، أو تقطيع بياناتك للحصول على تقديرات مختلفة قد تبدو مشابهة لتلك الموجودة في الشكل ، وبالطبع سيساعد ذلك في تحليلك. لكن قد تكون الطرق الأخرى أكثر قوة إذا كنت تريد التحكم في ما يمكن ملاحظته بطريقة منهجية.
تقدير الاحتمالات المشروطة
إن الفئتين الرئيسيتين من الأساليب تعلم الألة الخاضع للإشراف هما الانحدار والتصنيف. يشيع استخدام التصنيف للتنبؤ بالفئات المنفصلة مثل تلك المستخدمة في الأمثلة السابقة (يقبل العميل عرضًا أو يرفضه ، أو يتخبط أو يظل مخلصًا ، وما إلى ذلك). للحصول على هذه التوقعات ، ًنقدر أن الاحتمالات المشروطة لهذه الفئات صحيحة ؛ تسمح لنا تقديرات الاحتمالية الشرطية هذه بالابتعاد عن التعميمات الواسعة والاقتراب من عالم التخصيص.
على سبيل المثال ، بدلاً من استخدام معدل تسرب العملاء الإجمالي (churn rate) ، يمكننا الشرط على مدة كل عميل (حيث أنه من الشائع جدًا أن يكون العملاء الذين كانوا موالين لشركتنا أقل احتمالًا لتغيير الشركات ، والعكس صحيح). يمكن للمرء بعد ذلك تقدير نموذج تصنيف يعتمد على مدة العملاء وعناصر التحكم الأخرى التي تراها ذات صلة.
P(المدة بالأشهر | التسرب ) = f( الأشهر)
إذا سمحت بما يكفي من اللاخطية ، فقد ينتهي بك الأمر بشيء مثل النمط الموضح في الشكل أدناه.
في هذا السيناريو الافتراضي ، العملاء الذين ظلوا مخلصين لمدة 18 شهرًا هم الأقل احتمالًا لتغيير الشركات ، لكن لاحظ أن حوالي 15٪ ما زالوا يغادرون.
لاحظ أيضًا أنني لا أبلغ عن أي تقديرات لمدى عدم اليقين من دالة الملائمة الإفتراضية هذه . من الممارسات الجيدة أن تفعل ذلك في عملك الخاص.
الشيء المهم الذي يجب تذكره هو أن نماذج التصنيف تسمح لنا بإجراء تقييمات احتمالية مشروطة. من خلال شرط بعض الملاحظات ، لا نحصل فقط على صورة أوضح عن عدم تجانس عينة العملاء لدينا ، ولكنه يتيح لنا أيضًا أن نخطو خطوة واحدة نحو تخصيص القرارات المثلى. لم نعد نجمع كل عميل في عينتنا في نفس الحقيبة ، لكننا بدأنا في تخصيص تقديراتنا ، وبالتالي قراراتنا.
اختبار A / B
دكرت في حديثنا عن السببية ، بعض مخاطر استخدام بيانات المراقبة ، وعلى وجه الخصوص ، ذكرت حقيقة أنه عندما يختار العملاء بأنفسهم (أو نختارهم نحن) قد تظهر تقديراتنا تحيزًا كبيرًا. تسمح لنا الطريقة التجريبية (اختبار A / B) بالتخلص من تأثير الاختيار وتقديم تقديرات أفضل.
وبغض النظر عن بعض الفروق الدقيقة ، فإن إستخدام اختبار A / B للحصول على تقديرات الاحتمالية أمر واضح ومباشر. بمجرد انتهاء الاختبار ، يمكنك إما استخدام تحليل التردد أو التحليل الشرطي .
لتلخيص إيجابيات وسلبيات الاختبار ، على الجانب الإيجابي، نعلم بالفعل أنه يسمح لنا بتقدير الآثار السببية من خلال القضاء على تحيز الاختيار السائد في بيانات المراقبة ، ومن السهل نسبيًا تطبيقة بمجرد معرفة كيفية اختيار أحجام العينات . على الجانب السلبي ، تجدر الإشارة إلى أن اختبار A / B يسمح لنا فقط بتقدير متوسط التأثيرات لعينة من عملائنا (التي نعتزم تعميمها على كامل عملائنها) ، لذا فإن كيفية الحصول على تقديرات مخصصة للعملاء الفرديين ليست واضحة بشكل فوري . أيضًا ، هناك أوقات لا يمكنك فيها ببساطة إجراء اختبار A / B أو أنها مكلفة للغاية .
مشاكل اللصوص
مشاكل اللصوص (Bandit problems) هي فئة من مشاكل القرار المتسلسلة (sequential decision problems) حيث يجب أن نتخذ خيارًا يتكرر بمرور الوقت ، ومع مرور الوقت ، نتعلم طريقة عمل عدم اليقين الضمني ، إما عن طريق تحسين تقديرات الاحتمالات أو القيم المتوقعة نفسها.
لن أخوض في التفاصيل ، لكني أريد فقط أن أذكر المقايضة الرئيسية التي نواجهها مع هذه المشاكل المتسلسلة. الفكرة بسيطة: في كل مرة تقوم فيها باختيار سحب رافعة ، تكشف النتيجة عن بعض المعلومات حول عدم اليقين الضمني ، مثل الاحتمالات التي يقبلها عملاؤنا. لنفترض أنك سحبت رافعة خصم السعر ووجدت أن معدل قبول عملائك هو 80٪ ، مما يجعل الإيرادات المتوقعة لهذه الرافعة أعلى من الرافعة المنافسة. نظرًا لأنك اتخذت القرار مرة واحدة فقط ، فلا يزال هناك قدر كبير من عدم اليقين بشأن الاحتمالات المقدرة (بعبارة أخرى ، ربما كنت محظوظًا جدًا في تلك التجربة الأولى).
أنت الآن تواجه قرارًا: يمكنك الاستمرار في سحب أو استغلال رافعة الخصم ، أو يمكنك استكشاف الرافعة التي لم تمسها. ليس من غير المألوف أن يضغط علينا أصحاب المصلحة في العمل لدينا لاختيار الأول (كانت النتيجة الأولى جيدة جدًا) ، ولكن قد يكون من الأفضل تجربة الآخر لفترة والحصول على تقديرات احتمالية أفضل. هذه هي التجارة الاستكشافية الشهيرة السائدة في المشاكل المتسلسلة لعملية صنع القرار في ظل حالة عدم اليقين.
تقدير القيم المتوقعة
تقول فرضية المنفعة المتوقعة أنه في ظل حالة عدم اليقين ، من الأفضل اختيار الرافعة التي تزيد من قيمة التوقعات الرياضية للموضوع قيد التحليل. قد نستخدم مجموعة أدوات تعلم الألة الخاصة بنا ونقدر الاحتمالات ، أو يمكننا تقدير القيم المتوقعة بشكل مباشر. تعد الاحتمالات مفيدة لحساب القيم المتوقعة ، ولكن اعتمادًا على المشكلة ، قد نتخطى هذه الخطوة ونحاول تقدير التوقعات.
إذا كان المقياس الذي نرغب في التنبؤ به مستمرًا – مثل الإيرادات أو الأرباح أو قيم العمر أو ما شابه ، فيمكننا حينئذٍ استخدام خوارزميات الانحدار. خوارزميات الانحدار ذات الدوافع الإحصائية تسمح لنا عادةً بتقدير التوقع الرياضي الشرطي للموضوع محل الاهتمام: إذا كان المتغير مستمرًا ، فقد ينتهي بنا الأمر مع التقديرات الضرورية لاتخاذ قرارنا ، وإذا كان فئوي، فستكون النتيجة تقديرًا للاحتمال الشرطي.
الطرق المتكررة و البايزية
لقد واجهنا بالفعل بعض الاختلافات بين مدارس الفكر البايزية والمتكررة (أو الكلاسيكية) ، بدءًا من التفسيرات البديلة للاحتمالات والقيم المتوقعة. تتمثل إحدى طرق التعبير عن ذلك في أن تفسير بايز له شعور من أسفل إلى أعلى بينما يتعامل المتكررون مع المشكلة من منظور من أعلى إلى أسفل.
في الإحصاء الكلاسيكي ، تعتبر الاحتمالات حقيقة موضوعية في الطبيعة ، وبالتالي يمكننا تخيل تكرار التجربة عدة مرات. في هذه الحالة ، تتقارب التكرارات النسبية للوقائع مع الاحتمالات المقابلة ، كما هو الحال في مثال تقليب العملة. ليس من قبيل المصادفة أن تكون النظريات المحدودة – ما يحدث عندما نكرر تجربة عددًا لا نهائيًا من المرات – هي القيمة الأساسية لهذه المدرسة الفكرية بمعنى أخر ، نكشف هذه الاحتمالات عن طريق تكرار تجربة تحت نفس الظروف بالضبط.
من ناحية أخرى ، يبني البايزيون نظريتهم من الألف إلى الياء ، بدءًا من كل تقييم فردي لاحتمال حدوث شيء ما. على هذا النحو ، يبحثون عن شروط (مسلمات) بحيث يمكن قياس هذا الجهل بحساب الاحتمال القياسي (بما في ذلك نظرية بايز). الاحتمالات هنا ذاتية بمعنى أن شخصين قد يكون لهما تقييمات مختلفة حول احتمالية وقوع حدث ما ، ولا يلزم الاتفاق مع أي تكرارات طويلة المدى.
خذ مثالاً على كيفية اختلاف احتمالية الاضطراب باختلاف فترة بقاء عملائنا.
النمط في البيانات افتراضي ، لكنه لا يختلف عما ستجده في بيانات الحياة الواقعية من عملك. ولكن هل هناك دليل حقيقي على أن عملائنا يتصرفون بهذه الطريقة؟
في معظم التطبيقات نقوم بالإبلاغ عن فترات الثقة عند وصف هذا النوع من الأدلة ، وعلى الأقل يجب أن نفعل ذلك. لكن اسمحوا لي فقط أن أشير إلى أن هناك العديد من الصعوبات عندما تحاول تفسير هذه الفترات من منظور احتمالي (وكذلك مع قيم p). مرة أخرى.
إعادة النظر في حالات الاستخدام الخاصة بنا
حان الوقت لبدء تحليل كل حالة من حالات الاستخدام المحددة. فيما يلي ، ضع في اعتبارك أنني قد قمت بتبسيط العديد من أوجه عدم اليقين التي ليست ذات أهمية أو من الدرجة الأولى لكل مشكلة محددة.
تسرب العميل (Customer churn)
ضع في اعتبارك أولاً حالة تقديم عرض احتفاظ واحد – أي أننا قد نهمل في الوقت الحالي حالة العروض المنافسة لأنه ، من وجهة نظر عدم اليقين الجوهري ، يمكن تحليلها جميعًا بالطريقة نفسها. عدم اليقين الضمني في هذا السيناريو هو ما إذا كان عملاؤنا سيتركوننا أم لا ، وربما يعتمد ذلك على ما إذا كنا قد قدمنا العرض أم لا ، كما هو موضح في أدناه .
دعونا نتعمق قليلاً في مصادر عدم اليقين هنا. للبدء ، لا نعرف ما إذا كان من المحتمل أن يغادر العميل.، يحب العملاء عادةً الجودة والسعر (العرض) وتجربة العميل ، وهم على استعداد عمومًا لمقايضتها ، على الأقل إلى درجة معينة.
لذا فإن مصدر عدم اليقين الأول لدينا هو رضاهم بالنسبة لتوقعاتهم بشأن كل من هذه الأبعاد. كما أننا لا نعرف كيف يرتبونها – أي مدى حساسيتهم للتغييرات في كل واحدة – وإلى أي مدى هم على استعداد لاستبدال أحدهم بآخر.
لإعطائك فكرة عن كيفية نمذجة عدم اليقين هنا ، دعنا نبسط وننظر أولاً في حالة بُعد واحد فقط ، على سبيل المثال ، الجودة. يبدو من المعقول أن نتخيل أن رضا العملاء يزداد مع الجودة:
رياضيًا ، يمكنك التفكير في المنفعة أو دالة رضا تعتمد على تصورهم للجودة u(q) ، وهذه الدالة تآخذ في الازدياد. يمكننا أيضًا تضمين بعض النتائج في أدبيات علم الاقتصاد السلوكي ، وتخيل أن العملاء يحكمون على الجودة المدركة بالنسبة لتوقعاتهم أو نقطة مرجعية ، لنفترض q0 ، و بالتالي u(q-q0).
لدينا الآن نظرية حول مدى اختلاف الرضا مع الجودة ، وقد نبدأ في ربط هذا بقرارهم بالتبديل بين الشركات أم لا. في هذه المرحلة ، من الملائم أن نفترض أن كل واحد منا لديه مستوى عتبة ، أي حد أدنى من الرضا نجده مقبولاً. أقل من هذا المستوى ، عندما لا نتمكن من التعامل معه بعد الآن ، قررنا تبديل الشركات . نظرًا لأن هذا المستوى غير المعروف يختلف من عميل إلى آخر ، فهذه هي الحالة التي يتبعها عدم اليقين من عدم تجانس التفضيلات.
دعنا نجمع كل الأجزاء معًا ونصوغ نموذجًا أوليًا جدًا لسبب تسرب العملاء:
u(q – q0) = a0 + a1(q – q0) + e
في هذا النموذج السلوكي البسيط ، يزيد رضا العملاء خطيًا مع الجودة (نتوقع a1>=0) ، ونسمح بالاختلافات بين العملاء من خلال تضمين مصطلح عشوائي e. لاحظ أن هذه ليست شكليات رياضية في حد ذاتها ، بل تسمح لنا بالتفكير بوضوح في عدم التجانس ، وستكون مهمتنا بعد ذلك وضع افتراضات تصف شكل التوزيع هنا (توزيع طبيعي إذا اعتقدنا أن هذا متماثل و أن الذيول ليست طويلة).
أخيرًا ، سيتركنا العميل عندما يكون مستوى الرضا هذا الغير المرصود (أو الكامن ، كما يطلق عليه في الأدبيات) أقل من مستوى الحد الأدنى:
- يتسرب العميل إذا :
a0 +a1(q -q0) +ei < ki
نظرًا لأن مستوى العتبة ki غير ملحوظ أيضًا ويختلف من عميل إلى آخر ، فقد نرغب في دمجه مع المصدر العشوائي لعدم التجانس ei ونقول فقط:
- يتسرب العميل إذا :
a0 +a1(q -q0) +ni <0
يتيح لنا هذا النموذج السلوكي البسيط أن نبني من الألف إلى الياء طريقة لتقدير احتمالات الإضطراب . بمجرد أن نفترض افتراض التوزيع على مصدر عدم اليقين لدينا (ni) ، فنحن الآن على استعداد لتقدير الاحتمال على النحو التالي:
Prob(Customer churn) = Prob(a0 +a1(q-q0) + ni<0) = F(-a0 -a1 (q – q0)) = 1 – F(a0 +a1(q -q0))
حيث F() هي دالة التوزيع التراكمي لمتغيرنا العشوائي.
إذا كنت تتساءل ، فهذه هي الطريقة التي يقدِّر بها علماء الاقتصاد الجزئي التطبيقي نماذج الاختيار المنفصل ، وهي طريقة شاعها الحائز على جائزة نوبل في الاقتصاد دانييل مكفادين والعديد من الآخرين.
قبل المضي قدمًا ، دعونا نناقش عدة نقاط. أولاً ، قد تتساءل عما إذا كان من الضروري حقًا كتابة كل شيء رياضيًا وأن تكون واضحًا جدًا بشأن عدم اليقين. الإجابة هي أن الغالبية العظمى من الممارسين لا يواجهون مشكلة إضفاء الطابع الرسمي على كل شيء. أعتقد أنها ممارسة جيدة لأنها تجبرك على التفكير بجدية في مصادر عدم اليقين وكيفية نمذجة كل منها ، بالإضافة إلى الافتراضات المبسطة التي تم إجراؤها. أيضًا ، نظرًا لأنك تقوم بنمذجة السلوك وعدم اليقين من الألف إلى الياء ، فهذا يضمن أن تقديراتك ستكون قابلة للتفسير.
تتعلق النقطة الثانية بجعل النموذج أكثر واقعية: هنا افترضنا أن العملاء يهتمون فقط بالجودة ، لكنني جادلت أنهم يهتمون أيضًا (والمفاضلة) بالسعر وتجربة العميل. بمجرد فهمك لكل من هذه الأمور وقياس كل شيء من حيث المعيار المشترك – المنفعة أو الرضا – يمكنك المضي قدمًا والجمع بينهما للحصول على مقياس إجمالي لرضا العملاء. لاحظ أن الافتراضات الوظيفية المختلفة (على سبيل المثال ، الجمع) تشير إلى معدلات مختلفة من الاستبدال بين كل بُعد.
أخيرًا ، عدنا إلى مشكلة تقدير احتمالاتنا. إذا كنت تأخذ عدم اليقين على محمل الجد ، فستحتاج إلى وضع افتراضات توزيعية لمصادر عدم اليقين والمضي قدمًا في التقدير وفقًا لذلك. على سبيل المثال ، إذا افترضت الوضع الطبيعي ، فسوف ينتهي بك الأمر بنموذج اختباري. النماذج اللوجيستية مناسبة إذا افترضت أن عدم اليقين يتبع توزيعًا لوجستيًا ، وما إلى ذلك.
البيع المتقاطع
يوضح الشكل ادناه طريقة واحدة لتحليل مشكلة بيع المتقاطع للمنتجات المختلفة لعملائنا.
لكل منتج (رافعة) علينا أن نقرر تقديم عرض قد يقبله عميلنا أو لا يقبله. المشكلة أكثر إثارة للاهتمام كلما قمنا بتحليل المزيد من الروافع ، ولكن بالنسبة للمناقشة الحالية ، يمكننا فقط التفكير في رافعة فريدة ، حيث يوجد عدم اليقين الضمني الأساسي. سوف لذا فلنبدأ الآن بالتعرف على مكان عدم اليقين وكيف يمكننا المضي قدمًا لتقريبه.
يشتري العملاء المنتجات التي يريدونها ويمكنهم تحمل تكلفتها ، ولا نعرف حقًا ما هو أي منها. ومع ذلك ، فإن الشيء الجيد في البيع المتقاطع هو أن لدينا بالفعل معلومات حول سجل الشراء السابق لعملائنا ، لذلك يمكننا استخدام هذه المعرفة لتقريب يضاهي احتمال قبولهم عرض البيع التقاطعي . ومع ذلك ، لاحظ أن هذا وحده لن يكفي لتقدير الاحتمالات: نحتاج إلى تباين بين العملاء الذين اشتروا والذين لم يشتروا كل منتج.
باختصار ، من الضروري أن يكون لدينا عينة من العملاء الذين اشتروا ولم يشتروا كل منتج. يمكننا بعد ذلك محاولة نمذجة مثل هذه الخيارات: على سبيل المثال ، ما الذي اشتروه من قبل؟ هل هناك تسلسلات للمشتريات تظهر بشكل متكرر ، ربما بسبب تشابه المنتجات ، أو نوع القيمة التي تخلقها؟ تذكر أننا نحاول كشف تفضيلات عملائنا وقيود الميزانية ، وقد تكشف البيانات عن بعض الأنماط المثيرة للاهتمام إذا طرحنا الأسئلة الصحيحة وعرفنا أين نبحث عن الإجابات.
قبل الانتقال إلى حالة الاستخدام التالية ، من الجيد أن نتذكر أن بيانات المراقبة قد تحتوي على تحيزات يمكن أن تؤثر بشكل كبير على جودة تقديراتنا الاحتمالية. خذ حالة اتخاذ قرار تقديم عرض بطاقة الائتمان. نظرًا لأن البنوك رفضت تاريخيًا منح بطاقة الائتمان لمجموعات سكانية محددة ليس لديها معلومات كافية عنها لإجراء تقييم للمخاطر ، فإن معظم النماذج التي نلائمها ستعكس بالضبط هذا الاحتمال المنخفض “للقبول”.
المشكلة هنا هي أنه لم يتم تقديم العرض أبدًا لهذه المجموعات ، لذلك لم يكن هناك “رفض للعرض”. من وجهة نظر أخلاقية ، فإن الخطر هو خلق حلقة مفرغة حيث تقدر نماذج اتعلم الألة لدينا احتمالات منخفضة لقبول مجموعات الأقليات التي حُرمت تقليديًا من الوصول. من وجهة نظر تجارية، قد نحرم أنفسنا بشكل منهجي من أرباح أعلى لمجرد هذا التحيز.
الحل؟ قبل استغلال الرافعة ، قد ترغب في قضاء بعض الوقت في استكشاف عوامل أخرى محتملة ، حتى لو كانت مكلفة على المدى القصير. على سبيل المثال ، قد تفكر في إجراء بعض اختبارات A / B للتحايل على بعض تحيزات الاختيار السائدة في بيانات المراقبة.
تحسين النفقات الرأسمالية
كما أوضحنا المشكلة من قبل ، نسعى إلى تخصيص ميزانية استثمارية عبر مجموعات مختلفة – لنقل المناطق الجغرافية – بهدف الحصول على أكبر عائد استثمار ممكن. من المعتاد أن تستخدم الشركات الميزانية بأكملها ، لذا فإن هذه المشكلة تعادل الحصول على أكبر قدر ممكن من الإيرادات الإضافية.
أين هو عدم اليقين الكامن هنا؟ يتمثل عملنا في مقدار الاستثمار في كل مجموعة ، والمعيار الذي نسعى إلى نقله هو الإيرادات. من الواضح أن هناك فجوة كبيرة يجب سدها: لماذا تزداد الإيرادات مع زيادة تخصيص رأس المال؟ نظرًا لأن هذا يختلف عبر الشركات وعبر القطاعات ، فلا توجد إجابة فريدة لتقديمها. لكن يمكننا المضي قدمًا وتخيل سيناريو افتراضي. افترض أن النفقات الرأسمالية الإضافية مخصصة لتحسين متاجرنا المادية أو الرقمية. من الأسهل الآن فهم كيفية تأثير النفقات الرأسمالية على الإيرادات: من المفترض أن المتاجر الأكبر أو الأفضل يمكنها زيادة حجم أو تذكرة المبيعات (وإلا فلن تؤثر على الإيرادات بشكل مباشر).
بشكل عام ، يجب أن يحدث شيء مشابه في كل حاوية كالأتي :
R(x) = P x Q x ( 1 + g(x))
هنا g(x)، هو عامل الزيادة الذي يعتمد على حجم الاستثمار x ؛ أي أنه معدل نمو قد نرغب في تقديره ، وقد يشمل كلاً من السعر أو تأثير التذكرة. نظرًا لأنه يتضمن كلا التأثيرين ، وهناك عدم يقين أساسي مع كل منهما ، قد ترغب في أن تكون أكثر تحديدًا قبل المتابعة:
R(x) = P(1 + gp(x)) x Q(1 + gq(X))
إذا كنت تتساءل عما اكتسبناه من التحديد حول التأثيرين ، فتذكر أن البيانات لا تتحدث عن نفسها ؛ نحتاج إلى طرح الأسئلة الصحيحة ، وفي هذه الحالة ، على الأقل مع الأخذ في الاعتبار أن تأثيرات السعر والكمية قد تكون سائدة ستسمح لنا بالنظر في بيانات التذكرة والحجم بشكل منفصل.
أظهرنا في مقال سابق أنه حتى عندما نفهم جميع الدوافع المحتملة للإيرادات المتزايدة ، فإن تأثيرات الاختيار منتشرة مع بيانات المراقبة. في هذه الحالة ، قد يؤدي استخدام البيانات التاريخية إلى تحيز تقديراتنا نظرًا لأنه قد يتم تخصيص النفقات الرأسمالية السابقة في مجموعات ذات أداء أقل من المتوسط (مدن ومواقع وما إلى ذلك) ، لذلك حتى إذا كان هناك تأثير إيجابي ، فقد يظل مقياس الناتج لدينا دون المستوى بالنسبة لبقية عينة الحاويات.
لا يوجد حل بسيط لهذه المشكلة ، وقد يكون اختبار A / B مكلفًا للغاية في حالة تخصيص النفقات الرأسمالية. إذا كانت هذه هي الحالة ، فقد تحاول العثور على بعض عناصر التحكم التركيبية ، أو القيام ببعض المطابقة أو الاختلاف ، أو بعض الطرق الأخرى المناسبة لمشكلتك المحددة.
مواقع المتاجر
نحاول تحديد مكان فتح متجرنا التالي ، بهدف الحصول على أكبر عائد استثمار. نظرًا لأن اختيارنا هو موقع المتجر (Profits(loc)) ، فمن الناحية المثالية ، نود أن نعرف كيف تختلف الأرباح باختلاف المواقع ،. بدون عدم اليقين ، سيكون الأفضل هو فتح المتاجرذّات الأرباح أكبر.
لاحظ أننا قمنا ببعض التبسيط الكبير ، نظرًا لأن الأرباح لا تظهر من العدم عندما نفتح متجرًا: عادةً ما يستغرق الأمر بعض الوقت لاستثماراتنا الوصول إلى نقطة التعادل (ناهيك عن أعلى إمكانات) وقد يرتبط ذلك الوقت بعوامل تختلف باختلاف المواقع. إذن ما هي هذه العوامل؟
كبداية، الأرباح هي الإيرادات مطروحًا منها التكاليف ، لذلك:
Profits(loc) = Revenues(loc) – Cost(loc)
كما في حالة الاستخدام السابقة ، تعتمد الإيرادات على السعر الذي نفرضه والحجم الذي يتوافق مع هذا السعر ، وهذه بالطبع تختلف باختلاف الموقع. قد تكون التكاليف ثابتة (مثل الإيجار) أو متغيرة (على سبيل المثال ، العمالة والكهرباء) ، وهي تختلف أيضًا عبر المواقع:
Profits(loc) = P(loc) X Q(loc) -FC(loc) – VC(loc)
إذا لزم الأمر ، يمكنك تحليل التكاليف إلى أبعد من ذلك ، لكن هذا المستوى من التجميع يكفي لفهم ماهية عدم اليقين الضمني والعوامل المحتملة. على سبيل المثال ، إذا اخترت فتح متجر في مركز تجاري ، وكانت الأشياء الأخرى متساوية ، فيجب أن يكون حجم مشترياتك أعلى من المواقع غير الموجودة في مراكز التسوق ، نظرًا لأن العملاء المحتملين ينجذبون بسبب تنوع الإمدادات . ولكن حتى في مراكز التسوق ، ستجد تباينًا من حيث السعر الذي قد تتقاضاه ، اعتمادًا على مستوى دخل الحي ، على سبيل المثال ، من بين العديد من العوامل الأخرى.
افترض الآن أن لديك مجموعة بيانات بأرباح تاريخية لجميع المتاجر التي فتحتها في الماضي. هناك استراتيجيتان محتملتان هنا: يمكنك تقدير الأرباح المتوقعة مباشرة (الجانب الأيسر من المعادلة الأخيرة) كدالة لعوامل تختلف باختلاف المواقع ، أو يمكنك تقدير كل عنصر من المكونات على الجانب الأيمن وتوصيلها للحصول على الأرباح المقدرة لمواقع مختلفة. يعتمد الأمر حقًا على مدى دقة تقدير كل من محركات الأرباح بشكل منفصل: إذا كان بإمكانك القيام بذلك ، فسيكون هذا النهج أكثر قابلية للتفسير وسيجبرك على التفكير مليًا في عدم اليقين الأساسي والأساسيات الاقتصادية للمشكلة.
من يجب عليّ توظيفه؟
من أصعب المشكلات التي نواجهها في شركاتنا قرار تعيين شخص ما ، نظرًا لوجود العديد من أوجه عدم اليقين ذات الصلة. قد نبسط الأمور التي ليست من الدرجة الأولى لمشكلتنا الحالية ونأخذ في الاعتبار الثلاثة التالية:
هل سيكونون منتجين؟
كم من الوقت سيبقون مع الشركة؟
هل سيكون هناك توافق جيد مع فرقهم ومع قيم الشركة؟
لقد ناقشنا بالفعل بعض الصعوبات في محاولة الإجابة على هذه الأسئلة. على سبيل المثال ، هل لدينا مقاييس إنتاجية صارمة ، مثل عدد المبيعات شهريًا أو ربع سنوي؟ أم نعتمد على مقاييس أكثر ليونة ، مثل مراجعة الأداء التي يقوم بها المدير أو استبيان 360؟ اعتمادًا على الإجابة على هذه الأسئلة ، قد تكون الطلبات على بياناتنا أعلى.
دعونا ننظر في حالة المرشحين لمنصب المبيعات: الميزة هنا هي أن قياس الإنتاجية لدينا صعب ، حيث يمكننا مراقبة الأداء على المستوى الفردي بشكل مباشر. لمراعاة أول مصدرين لعدم اليقين ، قد نحاول تقدير القيمة الحالية لأرباح كل مندوب مبيعات لفترة معينة ، أي القيمة الدائمة لموظفهم. في الوقت الحالي نهمل النوع الثالث من عدم اليقين.
لماذا لدينا مثل هذا التوزيع الواسع لأداء المبيعات عبر فريق المبيعات لدينا؟ نحتاج إلى فهم هذه العوامل إذا أردنا تقريب عدم اليقين الأساسي. يمكن أن يكون بعض مندوبي المبيعات لديهم شبكات أكبر وأفضل ، أو أنهم يفهمون منتجنا بشكل أفضل ، أو لديهم مهارات تواصل أفضل ، أو لديهم دوافع عالية بشكل طبيعي. يجب تقييم هذه العوامل وأي عوامل أخرى نعتبرها مهمة في المرحلة السابقة ، أي قبل أن نقرر تقديم عرض أم لا. علاوة على ذلك ، من خلال التفكير الجاد في الأمر ، يمكننا تحضير المقابلات حتى نحصل على نسبة إشارة إلى ضوضاء عالية.
القول أسهل من الفعل ، لكننا نتحسن الآن في تقدير النماذج التي تسمح لنا بالتنبؤ بقيم عمر الموظف للمهام أو المناصب المختلفة. كما في السابق ، يجب أن نكون أكثر حرصًا مع التحيزات المتأصلة السائدة في بياناتنا ، لأننا نريد إعطاء فرص متساوية للمرشحين من مجموعات مختلفة.
قبل المضي قدمًا ، لنتحدث بإيجاز عن المصدر الثالث لعدم اليقين: كيف يمكننا تقييم ما إذا كان المرشح مناسبًا مسبقًا؟ يجب أن نبدأ بسؤال أنفسنا عن سبب اهتمامنا به ، ويفترض أن هذا يرجع إلى أن الأداء السيئ قد يكون له أداء دون المستوى (يعتمد هذا على الدافع ، وتعتمد مستويات طاقتنا ودوافعنا حقًا على الشعور بالسعادة تجاه مكان العمل لدينا ، وزملائنا في الفريق ، رئيس ، إلخ) ، أو قد يؤثر سلبًا على إنتاجية الفريق. قد نحاول معالجة الأول كما ناقشنا بإيجاز بالفعل – باستخدام البيانات التاريخية ، والتي نأمل أن تتضمن أيضًا بعض الاختبارات السيكومترية – لكن الأخير يحتاج إلى مقياس مخرجات مختلف: نحن لا نهتم فقط بالأداء الفردي ، ولكننا نهتم أيضًا بالأداء الكلي للفريق . يصعب نمذجة هذا ، والطلب على البيانات التي نحتاجها أعلى بكثير. فقط لتوضيح هذه النقطة ، ضع في اعتبارك مشكلة قياس قيمة عمر الفريق المقابلة: يمكن للفريق أن يستمر إلى أجل غير مسمى ، ولكن يمكن للأعضاء الفرديين تغيير الفريق أو حتى الاستقالة والانتقال إلى شركة أخرى. من حيث المبدأ يجب أن يكون لدينا بيانات لكل من هذه الحركات حتى نتمكن من التحكم في التغييرات داخل الفريق.
معدلات التأخر في السداد
في أبسط مستوى ، مع إعطاء قرض نريد أن نعرف ما إذا كان سيتم سداده بالكامل أم لا. في المستوى التالي ، قد نرغب في معرفة كيف يتغير هذا الاحتمال مع حجم القرض وسعر الفائدة الذي نفرضه. لاحظ ، مع ذلك ، أن هناك العديد من الأسباب التي تجعل الناس يتخلفون عن سداد ديونهم. يمكن أن يكون ذلك:
- يريد العميل الدفع ولكن لا يمكنه ذلك
- العميل لديه الأموال ولكنه لا يريد الدفع
هذه أسباب مختلفة تمامًا ، ومن أجل إجراء تقييم مسبق ، نحتاج إلى بيانات مختلفة تمامًا: الأول يفترض الصدق ويأتي عدم اليقين من الصدمات قصيرة أو متوسطة الأجل التي تتعرض لها الموارد المالية للأسرة (على سبيل المثال ، البطالة ، والتأخير في الحصول على مدفوعة ، مصاريف أخرى غير متوقعة مثل رسوم الرعاية الصحية والمستشفى ، وما إلى ذلك) ، والأخيرة لها علاقة بالدافع الأساسي.
خذ بيانات تسجيل الائتمان: الشخص الذي لم يتخلف عن الوفاء بالتزاماته سيكون لديه تاريخ ائتماني رائع ، لذلك من هذه البيانات سيكون من الصعب جدًا إجراء تقييمات احتمالية بشأن تمويل أسرته في المستقبل القريب. وغني عن القول ، إذا لم يتم منحك ائتمانًا ، فلن يكون لديك حتى تاريخ ، وبالتالي ستستمر في الرفض.
من المفترض أن التاريخ الائتماني للفرد قد يساعد في تقييم النوع الثاني من الدوافع ، بافتراض أن هذه خاصية هيكلية دائمة: إذا كنت من النوع الذي يحاول الاستفادة من الآخرين ويتجاهل التزاماتك بشكل منهجي ، فسوف ينعكس ذلك في درجة الائتمان الخاصة بك. لكن في كثير من الأحيان ، لا يدفع العملاء لأنهم لا يعتقدون أن هذا أمر عادل بالنظر إلى الطريقة التي عوملوا بها أو جودة الخدمة التي تلقوها. لن تكون درجة الائتمان مفيدة بدرجة كافية في هذه الحالة.
تحسين المخزون
لقد ذكرنا بالفعل أن تكلفة الإفراط في التخزين هي تكلفة الفرصة البديلة لبيع ضائع في مكان آخر أو تكلفة الإهلاك المباشر للوحدات التي يتم تخزينها لفترة أطول من الوقت المطلوب. مع نقص المخزون ، تكون التكلفة عبارة عن مبيعات ضائعة كان من الممكن أن تحدث لو كان لدينا مخزون كافٍ في هذا الموقع المحدد.
تشير هذه المناقشة إلى أن المصدر الرئيسي لعدم اليقين الذي نواجهه هو حجم الطلب في كل فترة. هل هذا كافي؟ لنفترض أننا نعرف عدد الوحدات التي سيتم شراؤها في أي يوم. هل تم حل مشكلة تحسين المخزون لدينا؟ الجواب في هذه الحالة بالنفي بشكل عام: ما هي تكاليف المواصلات؟ كم ستنخفض قيمة وحداتنا؟ وبالمثل ، هل هناك مخاطر السرقة؟ لاحظ كيف أن خدعة افتراض نوع معين من عدم اليقين تتيح لنا تحديد العوامل الأخرى التي لم تظهر في البداية أنها من الدرجة الأولى ، ولكن بعد مزيد من الدراسة أصبحت مهمة الآن.
ختاما
دراسة عدم اليقين هي دراسة رياضيات الإحتمالات و هناك عدة كتب أنصح بها للتعمق في هذا الأمر :
- كتاب A First Course in Probability يعتبر بداية ممتازة
- كتاب An Introduction to Probability Theory and Its Applications يعتبر مرجع متقدم ممتاز .
أما لو رغبت في التعمق في طرق تطبيق النظريات الإحصائية و الإحتمالية :
- كتاب Data Analysis Using Regression and Multilevel/Hierarchical Models
- كتاب Machine Learning: A Probabilistic Perspective
أما بخصوص الإنحيازات في البيانات الملاحظة فأنصح :
إضافة تعليق