منذ وقت ليس ببعيد ، كانت ملكة عناوين الأخبار التقنية هي البيانات الضخمة ، ولم يتحدث أي شخص عن الذكاء الاصطناعي (وفقًا لمجلة The Economist ، في عام 2017 ، كانت البيانات الضخمة هي النفط الجديد). دعنا نحكي بإيجاز قصة كيف ارتفعت البيانات الضخمة إلى القمة وكيف سرق الذكاء الاصطناعي الأضواء بشكل مدهش في السنوات الأخيرة.
في عام 2004 ، نشرت Google ورقتها الشهيرة MapReduce التي مكنت الشركات من توزيع حساب أجزاء كبيرة من البيانات (التي لا يمكن حسابها في جهاز كمبيوتر واحد) عبر أجهزة مختلفة. في وقت لاحق ، Yahoo قامت بإنشاء إصدار مفتوح المصدر خاص بها من خوارزمية Google ، مما مثل بداية ثورة البيانات.
استغرق الأمر بضع سنوات حتى يبدأ خبيروا التكنولوجيا والشركات الاستشارية في الادعاء بأن البيانات ستوفر للشركات فرصًا لا حصر لها لخلق القيمة. في البداية ، بُنيت هذه الثورة على ركيزة واحدة: الحصول على المزيد من البيانات المتنوعة ، وسهولة الوصول إليها. مع نضوج الضجيج ، تمت إضافة ركيزتين أخريين: الخوارزميات التنبؤية والثقافة القائمة على البيانات.
الـ Vs الثلاثة
تضمنت الدعامة الأولى العناصر الثلاثة المعروفة الآن: الحجم (volume) والتنوع (variety) والسرعة (velocity) .
الحجم (volume)
زود تحول الإنترنت الشركات بكميات متزايدة من البيانات. زعم أحد التقديرات لعام 2018 أن 90٪ من البيانات التي تم إنشاؤها في تاريخ البشرية قد تم إنشاؤها في العامين الماضيين ، والعديد من هذه الحسابات كثيرة. كان على التكنولوجيا أن تتكيف إذا أردنا تحليل هذا العرض غير المحدود للمعلومات. لم يكن علينا تخزين ومعالجة كميات أكبر من البيانات فحسب ، بل احتجنا أيضًا إلى التعامل مع أنواع جديدة غير منظمة من البيانات مثل النصوص والصور ومقاطع الفيديو والتسجيلات التي لم يتم تخزينها أو معالجتها بسهولة باستخدام البنية التحتية للبيانات المتاحة في ذلك الوقت .
التنوع (variety)
ويؤكد التنوع، على أهمية تحليل جميع أنواع البيانات ، وليس فقط البيانات المنظمة أو المهيكلة (Structured ) . إذا لم تكن قد سمعت عن هذا التنوع من قبل ، ففكر في برنامج جداول البيانات المفضل لديك (Excel أو Google Sheets ، إلخ). تنظم هذه البرامج المعلومات في ترتيبات جدولية للصفوف والأعمدة التي توفر الكثير من البنية حتى نتمكن من معالجة المعلومات بكفاءة داخل واجهة سهلة الاستخدام. هذا مثال بسيط للبيانات المنظمة: أي شيء يمكنك تخزينه وتحليله باستخدام الصفوف والأعمدة ينتمي إلى هذه الفئة.
هل سبق لك نسخ ولصق صورة في Excel؟ لا يمكنك لصق الصور فحسب ، بل يمكنك أيضًا استخدامها لتخزين نصوص كاملة وحتى مقاطع فيديو. لكن حقيقة أنه يمكنك لصقها لا تعني أنه يمكنك تحليلها. كما أن التخزين غير فعال أيضًا: يمكنك توفير مساحة كبيرة على القرص باستخدام نوع من الضغط أو التنسيقات الفعالة. لا يتم تخزين مجموعات البيانات غير المهيكلة (Unstructure )أو تحليلها بكفاءة باستخدام تنسيقات مجدولة ، وتشمل هذه جميع أنواع الوسائط المتعددة (الصور ومقاطع الفيديو والتغريدات وما إلى ذلك). الآن ، توفر هذه الكثير من المعلومات القيمة للشركات ، فلماذا لا نستخدمها؟
بعد إجراء الابتكارات ، توصل المستشارون والبائعون إلى طرق جديدة لتسويق هذه التقنيات الجديدة. قبل عصر البيانات الضخمة ، كان يتم استخدام Enterprise Data Warehouse لتخزين البيانات المهيكلة وتحليلها. احتاج العصر الجديد إلى شيء جديد بنفس القدر ، وبالتالي ولدت بحيرة البيانات (data lake) مع وعد بتوفير المرونة والقدرة الحسابية لتخزين وتحليل البيانات الضخمة.
بفضل “قابلية التوسع الخطي (linear scalability)” ، إذا احتاجنا إلى القيام بضعف العمل ، فسيتعين علينا فقط زيادة قوة الحوسبة للضعف للوفاء بالمواعيد النهائية نفسها. وبالمثل ، بالنسبة لمهمة معينة ، يمكننا خفض الوقت الحالي إلى النصف عن طريق مضاعفة حجم البنية التحتية. يمكن إضافة قوة الحوسبة بسهولة عن طريق الأجهزة المتوفرة في السوق ، والتي يتم تشغيلها بكفاءة بواسطة برامج مفتوحة المصدر متاحة بسهولة لنا لاستخدامها. لكن بحيرة البيانات سمحت أيضًا بالوصول السريع إلى مجموعة أكبر متنوعة من مصادر البيانات.
السرعة (velocity)
بمجرد أن تعاملنا مع مشاكل الحجم والتنوع ، كانت السرعة هي الحد التالي ، وكان هدفنا هو تقليل الوقت اللازم لاتخاذ إجراء ووقت اتخاذ القرار. تمكنا الآن من تخزين ومعالجة كميات كبيرة من البيانات المتنوعة للغاية في الوقت الفعلي أو شبه الحقيقي إذا لزم الأمر. كان من السهل تحقيق الثلاثة Vs لأي شركة ترغب في الاستثمار في التكنولوجيا والمعرفة. ومع ذلك ، لم تكن الثروات في الأفق بعد ، لذلك تمت إضافة ركيزتين جديدتين – التنبؤ والثقافة القائمة على البيانات – جنبًا إلى جنب مع وصفة للنجاح.
نماذج نضج البيانات
نظرًا لأن البيانات وحدها لا تخلق القيمة الموعودة ، فقد احتجنا إلى بعض الإرشادات الإضافية ؛ هذا هو المكان الذي دخلت فيه نماذج النضج مع وعد بمساعدة الشركات على التنقل عبر المياه المضطربة التي خلقتها ثورة البيانات. تم تصوير أحد هذه النماذج أدناه ، والذي سأقوم بشرحه الآن.
المرحلة الوصفية (Descriptive stage)
بدءًا من اليمين، كان هناك شيء واحد واضح منذ البداية: وجود المزيد من البيانات وأفضلها وفي الوقت المناسب يمكن أن يوفر رؤية أكثر دقة لأداء أعمالنا. ومن المؤكد أن قدرتنا على الاستجابة بسرعة ستسمح لنا بخلق بعض القيمة. كمثال :
تخيل أنك تقوم بتثبيت أجهزة استشعار في جسمك ، إما خارجيًا من خلال الأجهزة القابلة للارتداء أو عن طريق أجهزة داخلية أخرى سيتم اختراعها قريبًا ، والتي توفر لك بيانات أكثر وأفضل وفي الوقت المناسب عن صحتك. نظرًا لأنك قد تعرف الآن إذا إرتفع معدل ضربات القلب أو ضغط الدم لديك فوق مستوى حرج ، يمكنك اتخاذ أي تدابير لازمة لإعادة الأمور إلى طبيعتها. وبالمثل ، يمكنك تتبع أنماط نومك أو مستويات السكر وتعديل عاداتك اليومية وفقًا لذلك. إذا تفاعلنا بسرعة كافية ، فقد تنقذ هذه البيانات المتوفرة حديثًا حياتنا. قد يوفر هذا النوع من التحليل الوصفي للبيانات السابقة بعض الأفكار حول صحتك ، ويعتمد إنشاء القيمة بشكل حاسم على قدرتنا على الاستجابة بسرعة كافية.
المرحلة التنبؤية (Predictive stage)
ولكن في كثير من الأحيان يكون الوقت قد فات عندما نتفاعل. هل يمكننا أن نفعل ما هو أفضل؟ يتمثل أحد الأساليب في استبدال رد الفعل بالإجراء التنبئي. طالما أن القوة التنبؤية قوية بدرجة كافية ، يجب أن توفر لنا هذه الطبقة الوقت لإيجاد إجراءات أفضل ، وبالتالي فرصًا جديدة لخلق القيمة.
سمحت لنا هذه المرحلة الجديدة بتطوير منتجات بيانات جديدة ، مثل محركات التوصية (فكر في Netflix) ، كما أدت إلى عصر تسييل البيانات (data monetization) . وهكذا ولدت أعمال الإعلان عبر الإنترنت ، مما يمثل نقطة انعطاف مهمة في قصتنا. تحقق حلم المسوقين بوعد بيع المنتج المناسب للشخص المناسب في الوقت المناسب ، كل ذلك بفضل البيانات والتنبؤات التي تم إنشاؤها باستخدامه.
أهمية الإعلان عبر الإنترنت
كانت معظم الثروات الناتجة عن البيانات الضخمة نتاج نجاح الإعلان عبر الإنترنت. إن نشاط الإعلان عبر الإنترنت ضخم ومربح للغاية. يقدر أحد المصادر أنه سيتم إنفاق أكثر من 500 مليار دولار خلال عام 2023 في جميع أنحاء العالم. إذا كان هذا الرقم وحده لا يوضح الكثير ، فاعتبر أنه قريب من الناتج المحلي الإجمالي لبلجيكا.
اللاعبان الرئيسيان في هذا المجال هما Google و Facebook. لقد بنوا أعمالهم ممولة إلى حد كبير من عائدات هذه الصناعة المربحة ، وبفضل الثروات التي جاءت معها ، تمكنوا من تمويل التطور الأخير السريع في مجال الذكاء الاصطناعي (مرات عديدة من خلال عمليات الاستحواذ).
لذلك يبدو من العدل أن نقول إن نجاح البيانات الضخمة في الإعلان عبر الإنترنت قد لعب دورًا مهمًا في تسهيل الازدهار الحالي للذكاء الاصطناعي.
المرحلة التوجيهية(Prescriptive stage)
تأتي أعلى مرتبة في هذا التسلسل الهرمي لخلق القيمة من خلال قدرتنا على أتمتة وتصميم أنظمة ذكية. نحن الآن في المرحلة التوجيهية: بمجرد أن يكون لديك قوة تنبؤية كافية ، يمكنك البدء في العثور على أفضل الإجراءات لأهداف عملك. هذه هي المرحلة التي تنتقل فيها الشركات من التنبؤ إلى التحسين ، العرش في أولمبياد البيانات ، ومن المثير للاهتمام أن هذه هي الخطوة الأقل استكشافًا في معظم نماذج النضج.
و السبب في ذلك هو أن السوق يلعب دورا محورياً في جميع قرارات الشركات ، و بما أن لا يزال هناك الكثير من الأموال و الفرص التي لم يتم إستعلالها بعد في المرحلة التنبؤية فليس هناك حاجة ملحة للإنتقال للمرحلة التالية .
ولكن من الصحيح أيضًا أننا لكي ننتقل للمرحلة الإلزامية ، نحتاج إلى اكتساب مجموعة جديدة من المهارات التحليلية. اعتبارًا من اليوم ، مع التكنولوجيا الحالية ، يتم تنفيذ هذه المرحلة من قبل البشر ، لذلك نحن بحاجة إلى إعداد البشر لطرح المشكلات التوجيهية وحلها.
إضافة تعليق