معالجة اللغة في التجارة الإلكترونية

في عالم اليوم ، أصبحت التجارة الإلكترونية مرادفة للتسوق. عززت تجربة العملاء الثرية مقارنة بما يقدمه متجر البيع بالتجزئة هذا النمو في التجارة الإلكترونية. بلغت مبيعات تجارة التجزئة الإلكترونية على مستوى العالم في عام 2019ما يقدر 3.5 تريليون دولار أمريكي ومن المتوقع أن تصل إلى 6.5 تريليون دولار أمريكي بحلول عام 2022 (إحصائية). لعبت التطورات الحديثة في تعلم الألة و معالجة اللغة الطبيعية دورًا رئيسيًا في هذا النمو السريع.

قم بزيارة الصفحة الرئيسية لأي بائع تجزئة إلكتروني ، وستجد الكثير من المعلومات في شكل نصوص وصور. يتكون جزء كبير من هذه المعلومات من نصوص في شكل أوصاف المنتج ، والمراجعات ، وما إلى ذلك.

يسعى تجار التجزئة إلى استخدام هذه المعلومات بذكاء لتقديم الخدمات ، إسعاد العملاء وبناء ميزة تنافسية. تواجه بوابة التجارة الإلكترونية مجموعة من المشكلات المتعلقة بالنص والتي يمكن حلها من خلال تقنيات معالجة اللغة الطبيعية.

في هذا المقال. سنناقش بعض مهام معالجة اللغة الطبيعية الرئيسية في هذا المجال ، بما في ذلك البحث وإنشاء كتالوج المنتجات وجمع المراجعات وتقديم التوصيات.

يوضح الشكل أدناه بعض مهام التجارة الإلكترونية هذه. لنبدأ بنظرة عامة عنها.

كتالوج التجارة الإلكترونية

تحتاج أي مؤسسة تجارية إلكترونية كبيرة إلى كتالوج منتجات يسهل الوصول إليه. كتالوج المنتج هو قاعدة بيانات للمنتجات التي تتعامل معها المؤسسة أو يمكن للمستخدم شراؤها. يحتوي هذا على سمات وصف المنتج بالإضافة إلى صور لكل منتج.

تساعد الأوصاف الأفضل للمنتج بالمعلومات ذات الصلة العميل على اختيار المنتج المناسب من خلال الكتالوج. يمكن أن تساعد هذه المعلومات أيضًا في البحث عن المنتج والتوصيات. تخيل محرك توصية يعرف تلقائيًا أنك تحب اللون البنفسجي!

هذا بالتأكيد غير ممكن ما لم يلاحظ المحرك أن معظم عمليات الشراء أو عمليات البحث الأخيرة التي أجريتها كانت على ملابس ذات لون بنفسجي. أول شيء مطلوب لتحقيق ذلك هو تحديد أن “البنفسجي” مرتبط بالمنتجات كسمة لونية.

يُطلق على استخراج هذه المعلومات تلقائيًا اسم استخراج السمة. يمكن أن يضمن استخراج السمات من أوصاف المنتج فهرسة جميع معلومات المنتج ذات الصلة وعرضها بشكل صحيح لكل منتج ، مما يؤدي إلى تحسين إمكانية اكتشاف المنتج.

تحليل المراجعات

الجزء الأكثر بروزًا في منصة التجارة الإلكترونية هو قسم مراجعات المستخدم لكل منتج. توفر المراجعات منظورًا مختلفًا للمنتج لا يمكن الحصول عليه من سمات المنتج وحدها ، مثل الجودة وإمكانية الاستخدام والمقارنات مع المنتجات الأخرى وملاحظات التسليم.

قد لا تكون جميع المراجعات مفيدة ، أو قد لا تأتي من مستخدمين موثوق بهم. علاوة على ذلك ، من الصعب معالجة المراجعات المتعددة لمنتج معين يدويًا. توفر تقنيات معالجة اللغة الطبيعية (NLP) منظورًا شاملاً لجميع المراجعات من خلال أداء مهام مثل تحليل المشاعر وتلخيص المراجعة وتحديد فائدة المراجعة وما إلى ذلك. لقد رأينا مثالًا واحدًا على معالجة اللغة الطبيعية لتحليل المراجعة في هذا المقال عندما ناقشنا استخراج العبارة الرئيسية.

بحث المنتج

تختلف أنظمة البحث في التجارة الإلكترونية عن محركات البحث العامة مثل Google و Bing و Yahoo. يرتبط محرك بحث التجارة الإلكترونية ارتباطًا وثيقًا بالمنتجات المتاحة وأنواع المعلومات المختلفة المرتبطة بها.

على سبيل المثال ، في محرك البحث العادي ، نتعامل بشكل كبير مع بيانات النص الحر (مثل المقالات الإخبارية أو المدونات) بدلاً من المبيعات المنظمة وبيانات المراجعة للتجارة الإلكترونية. قد نبحث عن “قميص بنفسجي مربعات لحضور حفل زفاف” ، ومن المفترض أن يتمكن محرك بحث التجارة الإلكترونية من جلبه.

يمكن أيضًا مشاهدة أشكال مماثلة من البحث المركّز على مواقع السفر لحجوزات الطيران والفنادق ، مثل Airbnb و TripAdvisor. تستدعي الطبيعة المحددة للمعلومات المرتبطة بكل نوع من أنواع أعمال التجارة الإلكترونية بخط إنتاج مخصص لمعالجة المعلومات واستخراجها والبحث فيها.

توصيات المنتج

بدون محرك التوصيات ، ستكون أي منصة للتجارة الإلكترونية غير مكتملة. يحب العميل عندما تفهم المنصة بذكاء خياراته وتقترح منتجات لشرائها بعد ذلك. إنه في الواقع يساعد العميل على تنظيم أفكاره حول التسوق ويساعد على تحقيق فائدة أفضل.

يمكن لتوصيات العناصر المخفضة أو المنتجات ذات العلامة التجارية نفسها أو المنتجات ذات السمات المفضلة جذب العميل حقًا على موقع الويب وجعله يقضي وقتًا أطول.

هذا يزيد بشكل مباشر من إمكانية شراء العملاء لتلك المنتجات. بالإضافة إلى تسهيلات التوصية القائمة على المعاملات ، هناك مجموعة غنية من الخوارزميات التي تم تطويرها بناءً على معلومات محتوى المنتج والمراجعات ذات الطبيعة النصية. يستخدم معالجة اللغة الطبيعية لبناء أنظمة التوصية هذه.

من خلال هذه النظرة العامة ، نحن جميعًا على استعداد لاستكشاف دور معالجة اللغة الطبيعية في التجارة الإلكترونية بمزيد من التفاصيل. دعونا نبدأ مع كيف تستخدم في بناء محرك البحث في التجارة الإلكترونية.

البحث في التجارة الإلكترونية

يزور العملاء موقعًا للتجارة الإلكترونية للعثور على المنتجات المطلوبة وشرائها بسرعة. من الناحية المثالية ، يجب أن تمكّن ميزة البحث العميل من الوصول إلى المنتج المناسب بأقل عدد من النقرات.

يجب أن يكون البحث سريعًا ودقيقًا وأن يجلب النتائج التي تتوافق تمامًا مع احتياجات العملاء. تؤثر آلية البحث الجيدة بشكل إيجابي على معدل التحويل ، مما يؤثر بشكل مباشر على إيرادات بائع التجزئة الإلكتروني.

على الصعيد العالمي ، في المتوسط ، يتم تحويل 4.3٪ فقط من محاولات بحث المستخدم إلى عملية شراء. حسب بعض التقديرات ، فإن 34٪ من نتائج البحث في أفضل 50 بوابة لا تؤدي إلى نتائج مفيدة ، وغالبًا ما يكون هناك مجال كبير للتحسين.

في مقال السابق ، ناقشنا كيفية عمل محركات البحث العامة وأين تكون معالجة اللغة الطبيعية مفيدة. ومع ذلك ، بالنسبة للتجارة الإلكترونية ، يجب أن يكون محرك البحث أكثر دقة لاحتياجات العمل.

يعد البحث في التجارة الإلكترونية مجالًا مغلقًا – أي أن محرك البحث عادةً ما يجلب العناصر من داخل معلومات المنتج ، بدلاً من مجموعة عامة من المستندات أو المحتوى على الويب المفتوح (مثل Google أو Bing). معلومات المنتج الأساسية مبنية على كتالوج المنتج والسمات والمراجعات.

يعمل البحث على جوانب مختلفة من هذه المعلومات ، مثل اللون أو النمط أو الفئة. يُطلق على هذا النوع من البحث في التجارة الإلكترونية عمومًا “البحث الجانبي (faceted search)” .

البحث الجانبي

البحث الجانبي هو نوع متخصص من البحث يسمح للعميل بالتنقل بطريقة مبسطة باستخدام عوامل التصفية. على سبيل المثال ، إذا كنا نخطط لشراء جهاز تلفزيون ، فقد نبحث عن عوامل تصفية مثل العلامة التجارية والسعر وحجم التلفزيون وما إلى ذلك. في مواقع التجارة الإلكترونية ، يتم تقديم مجموعة من عوامل التصفية للبحث للمستخدمين بناءً على المنتج.

يوضح الشكل التالي البحث في التجارة الإلكترونية من خلال أمازون و نون .

يوضح القسم الموجود في أقصى اليسار من كلتا الصورتين مجموعة من عوامل التصفية (بدلاً من ذلك ، “الجوانب”) التي تتيح للعميل توجيه بحثه بطريقة تتوافق مع احتياجات الشراء الخاصة به.

في الشكل أعلاه ، نرى بحثًا عن طرازات التلفزيون ، لذا تُظهر المرشحات جوانب مثل الدقة وحجم العرض. إلى جانب هذه المرشحات المخصصة ، هناك أيضًا بعض الميزات العامة الصالحة للعديد من عمليات البحث عن المنتجات ، مثل العلامة التجارية ونطاق السعر وطريقة الشحن .

عوامل التصفية هذه هي أبعاد واضحة لإدراك المنتج. وهذا البحث الإرشادي يمكّن المستخدم من ترتيب نتائج البحث بنفسه للحصول على مزيد من التحكم في التسوق ، بدلاً من الاضطرار إلى التدقيق في الكثير من النتائج للحصول على ما يبحثون عنه.

عوامل التصفية هي المفتاح الذي يعرّف البحث الجانبي. ومع ذلك ، قد لا تكون متاحة دائمًا بسهولة لجميع المنتجات. بعض أسباب ذلك هي:

لم يُحمِّل البائع جميع المعلومات المطلوبة أثناء إدراج المنتج على موقع التجارة الإلكترونية. هذا هو الحال عادةً عندما تكثف شركة تجارة إلكترونية جديدة وتشجع بقوة على الانضمام السريع للعديد من البائعين. لتحقيق ذلك ، غالبًا ما يسمحون للبائعين بالقائمة دون إجراء فحوصات جودة للبيانات الوصفية للمنتج.

يصعب الحصول على بعض عوامل التصفية، أو قد لا يكون لدى البائع المعلومات الكاملة لتقديمها – على سبيل المثال ، قيمة السعرات الحرارية لمنتج غذائي ، والتي تُشتق عادةً من معلومات العناصر الغذائية المتوفرة في علبة المنتج. لا يتوقع بائعو التجزئة الإلكترونيون أن يقدم البائع هذه المعلومات ، ولكنها مهمة لأنها قد تلتقط إشارات مهمة من العملاء ترتبط ارتباطًا مباشرًا بمحادثة بيع هذا المنتج.

يمكن إنشاء البحث الجانبي باستخدام أكثر محركات البحث الخلفية شعبية مثل Solr و Elasticsearch. إلى جانب البحث العادي عن النص ، تتم أيضًا إضافة سمات وجه مختلفة إلى استعلام البحث. يأتي Elasticsearch من DSL مزودًا بواجهة بحث جانبي مدمجة .

بصرف النظر عن خوارزميات البحث ، هناك العديد من الفروق الدقيقة المرتبطة بالبحث الجانبي . تتعلق المشكلات المذكورة أعلاه بالمشكلة التي سنناقشها في القسم التالي: إنشاء كتالوج للتجارة الإلكترونية.

بناء كتالوج التجارة الإلكترونية

كما رأينا سابقًا في هذا المقال، يعد إنشاء كتالوج أحد المشكلات الأساسية في التجارة الإلكترونية. يمكن تقسيمها إلى عدة مشاكل فرعية:

استخراج السمة
تصنيف المنتج وإنشاء التصنيف
إثراء المنتج
إلغاء تكرار المنتج ومطابقته

دعونا نلقي نظرة على كل من هؤلاء في هذا القسم.

استخراج السمة

السمات هي الخصائص التي تحدد المنتج. على سبيل المثال ، في الصورة أعلاه، رأينا العلامة التجارية والدقة وحجم التلفزيون وما إلى ذلك كسمات ذات صلة.

سيوفر العرض الدقيق لهذه السمات نظرة عامة على المنتج على موقع التجارة الإلكترونية بحيث يمكن للعميل اتخاذ قرار. ترتبط مجموعة غنية من السمات ارتباطًا مباشرًا بتحسين النقرات ونسب النقر إلى الظهور ، والتي تؤثر على بيع المنتج. يوضح الشكل التالي مثالاً لوصف منتج تم الحصول عليه بواسطة مجموعة من المرشحات أو السمات.

كما ترى ، فإن سمات مثل {clothing، color، size} هي أساسًا ما يحدد هذا المنتج للعميل. يمكن أن تحتوي كل سمة من هذه السمات على قيم متعددة ، كما هو موضح في الشكل. في هذا المثال ، يأخذ اللون سبع قيم. ومع ذلك ، من الصعب الحصول على سمات مباشرة من البائعين لجميع المنتجات. علاوة على ذلك ، يجب أن تكون جودة السمات متسقة بما يكفي للسماح للعميل بالحصول على المعلومات الصحيحة وذات الصلة بالمنتج.

تقليديًا ، استخدمت مواقع التجارة الإلكترونية تقنيات وضع العلامات اليدوية أو التعهيد الجماعي (crowdsourcing ) للحصول على السمات. يتم ذلك عادةً بواسطة شركات خارجية أو منصات التعهيد الجماعي (على سبيل المثال ، Mechanical Turk) ، حيث يتم طرح أسئلة محددة حول كل منتج ومن المتوقع أن يجيب عليها عمال الحشد.

في بعض الأحيان ، يتم تأطير الأسئلة بطريقة متعددة الخيارات لتقييد الإجابة في مجموعة من القيم. لكنها بشكل عام مكلفة وغير قابلة للتطوير مع زيادة حجم المنتجات. هذا هو المكان الذي تدخل فيه تقنيات تعلم الألة. هذه مهمة صعبة لأنها تتطلب فهم سياق المعلومات الموجودة في المنتج. على سبيل المثال ، انظر إلى وصف المنتجين الموضحين في الشكل أدناه.

الحاللات التي يكون فيها pink هو قيمة السمة لسمتين مختلفتين

Pink هي علامة تجارية مشهورة لدى النساء الأصغر سنًا. وبالمثل ، فإن اللون الوردي (pink) هو لون شائع جدًا للملابس. ومن ثم ، في الحالة الأولى ، يعتبرPink سمة اسم علامة تجارية ، بينما في الحالة الأخرى ، يكون Pink مجرد لون، نرى أن حقيبة الظهر من ماركة “Pink” بلون أحمر نيون ، في حين أن قميص من النوع الثقيل من اللون الوردي. حالات مثل هذه وغيرها الكثير منتشرة وتشكل مهمة صعبة على الكمبيوتر لحلها.

إذا تمكنا من الحصول على مجموعة من السمات في بعض تنسيقات البيانات المنظمة ، فيمكن لآلية البحث استخدامها بدقة لاسترداد النتائج وفقًا لاحتياجات العملاء. تسمى الخوارزميات التي تستخرج معلومات السمة من أوصاف المنتجات المختلفة بشكل عام خوارزميات استخراج السمة. تأخذ هذه الخوارزميات مجموعة من البيانات النصية كمدخلات وتنتج أزواج السمة والقيمة كمخرجات. هناك نوعان من خوارزميات استخراج السمات: مباشر ومشتق.

تفترض خوارزميات استخراج السمات المباشرة وجود قيمة السمة في نص الإدخال. على سبيل المثال ، يحتوي تلفزيون Sony XBR49X900E 49-Inch 4K Ultra HD Smart LED (موديل 2017) على العلامة التجارية “Sony”.

عادةً ما تكون العلامة التجارية سمة من المتوقع أن تكون موجودة في عنوان المنتج في معظم الحالات. من ناحية أخرى ، لا تفترض خوارزميات استخراج السمات المشتقة أن السمة محل الاهتمام موجودة في نص الإدخال. إنهم يستمدون تلك المعلومات من السياق.

الجنس هو أحد هذه السمات التي لا توجد عادةً في عنوان المنتج ، ولكن من نص الإدخال ، يمكن للخوارزمية تحديد ما إذا كان المنتج مخصصًا للرجال أو النساء. ضع في اعتبارك وصف المنتج: “بلوزة غير رسمية من YunJey بأكمام قصيرة ورقبة دائرية ثلاثية الألوان.” المنتج مخصص للسيدات ، لكن لم يتم ذكر الجنس “أنثى” صراحة في وصف المنتج أو العنوان. في هذه الحالة ، يجب الاستدلال على الجنس من النص (على سبيل المثال ، من وصف المنتج).

استخراج السمة المباشرة

عادةً ما يتم نمذجة استخراج السمة المباشرة كمشكلة تسمية تسلسل إلى تسلسل. يأخذ نموذج تسمية التسلسل تسلسلًا (على سبيل المثال ، من الكلمات) كمدخلات وإخراج تسلسل آخر بنفس الطول. في مقال سابق ، تطرقنا بإيجاز إلى هذا النوع من المشاكل حول تدريب أداة التعرف على الكيانات المسماة. باتباع نهج مماثل ، دعنا نلقي نظرة على كيفية عمل خوارزميات استخراج السمات المباشرة.

ستكون بيانات التدريب الخاصة بنا بالشكل الموضح في أدناه ، على سبيل المثال منتج بعنوان ، “The Green Pet Shop Self Cooling Dog Pad”.

هنا ، ما يتعين علينا استخراجه هو “The Green Pet Shop” ، والذي يُشار إليه بعلامات -attribute ، بينما يُشار إلى باقي العناصر بعلامة O (أخرى).

يعد الحصول على البيانات المصنفة في BIO أمرًا بالغ الأهمية لأي عملية استخراج سمة مباشرة. يجب أن يكون لدينا أيضًا بيانات تمثل فئات مختلفة (على سبيل المثال ، B-Attribute1 و B-Attribute2 وما إلى ذلك).

هناك طريقتان واسعتان لجمع هذه البيانات. قد يكون أبسط واحد هو استخدام التعبيرات العادية على أوصاف النص الحالية مع العلامات التجارية والسمات واستخدام مجموعة البيانات هذه.

يمكننا أيضًا الحصول على مجموعة فرعية من البيانات التي تم تصنيفها بواسطة التعليقات التوضيحية البشرية. مع مثل هذه البيانات المصنفة ، يجب استخراج مجموعة غنية من السمات لتدريب نموذج تعلم الألة.

من الناحية المثالية ، يجب أن تلتقط سمات الإدخال خصائص السمة والمعلومات الموقعية والسياقية. فيما يلي قائمة ببعض السمات التي يمكنها التقاط جميع هذه الجوانب الثلاثة. يمكننا تطوير سمات أكثر تعقيدًا على طول الخطوط المتشابهة وإجراء تحليل لفهم ما إذا كانت مهمة في تحسين الأداء. بعض الميزات المشتركة لهذه المهمة هي:

السمات الحرفية

عادةً ما تكون هذه السمات قائمة على العملات (Token) ، مثل حالة الأحرف للعملة وطول العملة وتكوين حرفه.

السمات الموضعية

تلتقط هذه السمات الجانب الموضعي للعملة في تسلسل الإدخال ، مثل عدد العملات قبل العملة المحدد أو نسبة موضع العملة والطول الإجمالي للتسلسل.

السمات السياقية

تعمل هذه السمات في الغالب على ترميز المعلومات حول العملة المجاورة ، مثل هوية العملة السابق / التالي ، وعلامة جزء من الكلام (POS) للعملة ، وما إذا كانت العملة السابقة عبارة عن أداة ربط ، وما إلى ذلك.

بمجرد إنشاء السمات وترميز علامات الإخراج بشكل صحيح ، نحصل على أزواج التسلسل لتدريب النموذج. في هذه المرحلة ، تشبه عملية التدريب عملية نظام التعرف على الكيانات المسماة (named entity recognition) أو (NER) .

على الرغم من أن خط الإنتاج يبدو بسيطًا ويشبه أنظمة NER ، إلا أن هناك تحديات مع مخططات إنشاء السمات وتقنيات النمذجة هذه بسبب المعرفة الخاصة بالمجال. علاوة على ذلك ، يعد الحصول على مجموعات بيانات كبيرة بما يكفي تغطي مجموعة من السمات تحديًا.

للتعامل مع مثل هذه البيانات المتفرقة وقضايا عدم اكتمال السمات الأخرى ، تقترح بعض الأساليب استخدام سلسلة من عمليات تضمين الكلمات في الإدخال.

سيتم تمرير تسلسل الإدخال إلى النموذج كما هو ، ومن المفترض أن يتنبأ بتسلسل الإخراج. تتضمن الجهود الأخيرة معماريات عصبية متكررة مثل RNN أو LSTM-CRF لأداء مهمة وضع العلامات seq2seq.

استخراج السمات غير المباشرة

السمات غير المباشرة هي سمات لم يتم ذكرها مباشرة في الوصف. ومع ذلك ، يمكن الاستدلال على هذه السمات من السمات المباشرة الأخرى أو الوصف العام. على سبيل المثال ، يمكن الاستدلال على الكلمات الخاصة بالجنس أو العمر من النص. تشير عبارة مثل “بدلة لطفلك الذي يتراوح عمره بين 1 و 5 سنوات” إلى أن المنتج مخصص للأطفال الصغار. نظرًا لغياب الإشارات الصريحة ، لن يعمل نهج تصنيف التسلسل.

بالنسبة لتصنيف السمات غير المباشرة ، نستخدم تصنيف النص ، لأنه بدلاً من استخراج المعلومات ، يمكننا استنتاج الفئات عالية المستوى (أي السمات غير المباشرة) من المدخلات الإجمالية. مثال “YunJae Short Sleeve Round Neck Triple Color Block Stripe T-Shirt Casual Blouse.”

في هذه الحالة ، نمثل سلسلة الإدخال بأكملها باستخدام أي من طرق تمثيل الجملة (هنا ) . يمكننا أيضًا إنشاء سمات ، مثل وجود كلمات خاصة بالفئة ، وحرف n-grams ، وكلمة n-grams.

بعد ذلك ، يمكننا تدريب نموذج لتصنيف الإدخال إلى تسمية سمة غير مباشرة. في هذا المثال هنا ، بالنسبة لسمة “الجنس” ، يجب أن نستخدم الرجال والنساء و للجنسين والطفل كتسميات مختلفة للتصانيف.

لقد ناقشنا حتى الآن استخراج السمات من البيانات النصية والمقاربات الحديثة المختلفة التي توسع ذلك إلى استخراج السمات متعددة الوسائط ، مع دمج الأساليب المختلفة مثل العنوان والوصف والصورة والمراجعات وما إلى ذلك حول المنتج .

في الأقسام التالية ، سنتحدث عن توسيع التقنيات المشابهة لتلك التي طبقناها على سمات المنتج في جوانب أخرى من التجارة الإلكترونية وتجارة التجزئة.

تصنيف المنتج

تصنيف المنتج هو عملية تقسيم المنتجات إلى مجموعات. يمكن تحديد هذه المجموعات على أساس التشابه – على سبيل المثال ، يمكن تجميع المنتجات من نفس العلامة التجارية أو المنتجات من نفس النوع معًا. بشكل عام ، التجارة الإلكترونية لديها فئات عريضة محددة مسبقًا من المنتجات ، مثل الإلكترونيات ومنتجات العناية الشخصية والأطعمة. عندما يصل منتج جديد ، يجب أن يصنف في التصنيف قبل وضعه في الكتالوج. يوضح الشكل ادناه تصنيفًا لفئة الإلكترونيات مع تسلسل هرمي للفئات الفرعية.

يمكننا تحديد مجموعات أصغر بشكل متتالي مع تعريفات أكثر صرامة للمنتجات ، مثل أجهزة الكمبيوتر المحمولة والأجهزة اللوحية داخل فئة الكمبيوتر.

يمكن أن يكون التصنيف الجيد والمنتجات المرتبطة بشكل صحيح أمرًا بالغ الأهمية لأنه يسمح لموقع التجارة الإلكترونية بما يلي:

عرض منتجات مماثلة للمنتج الذي تم البحث عنه
تقديم توصيات أفضل
تحديد حزم المنتجات المناسبة لصفقات أفضل للعميل
استبدال المنتجات القديمة بأخرى جديدة
عرض مقارنات أسعار المنتجات المختلفة في نفس الفئة

عادة ما تكون عملية التصنيف هذه يدوية لتبدأ على نطاق صغير ، ولكن مع زيادة تنوع المنتجات ، تزداد صعوبة معالجتها يدويًا. على نطاق واسع ، يتم طرح هذا التصنيف عادةً كمهمة تصنيف حيث تأخذ الخوارزمية المعلومات من مجموعة متنوعة من المصادر وتطبق تقنية التصنيف لحلها ، كما هو مذكور في الورقتين البحثيتين [هنا ، هنا].

على وجه التحديد ، هناك حالات تأخذ فيها الخوارزميات المدخلات كعنوان أو وصف وتصنف المنتج في فئة مناسبة عندما تكون جميع الفئات معروفة. هذا مرة أخرى يقع في الحالة النموذجية لتصنيف النص.

بهذه الطريقة ، يمكن أتمتة عملية التصنيف. بمجرد تحديد الفئة ، يتم تمديدها مباشرةً إلى عملية استخراج السمات ذات الصلة التي ناقشناها سابقًا. من المنطقي أن يتم تمرير المنتج إلى عملية استخراج السمات فقط عند اكتشاف فئته.

يمكن تحسين دقة الخوارزمية عندما يمكن استخدام كل من الصور والنص لحل المشكلة. يمكن تمرير الصور إلى شبكة عصبية تلافيفية (CNN) لتوليد دمج للصور ، ويمكن تشفير تسلسل النص عبر شبكة ذاكرة طويلة قصيرة المدى ( LSTM) ، وكلاهما ، بدوره ، يمكن ربطهما وتمريرهما إلى أي مصنف من أجل الإخراج النهائي .

يعتبر بناء شجرة التصنيف عملية واسعة النطاق. يمكن وضع المنتجات في المستوى الصحيح في التصنيف من خلال تصنيف نص هرمي. إن تصنيف النص الهرمي في السياق ليس أكثر من تطبيق نماذج التصنيف في التسلسل الهرمي وفقًا للمستويات في التصنيف.

تُستخدم طرق التصنيف البسيطة المستندة إلى القواعد بشكل عام للفئات عالية المستوى. يمكنهم استخدام المطابقة المستندة إلى القاموس كبداية. يتم التعامل مع الفئات الفرعية المعقدة والتي تتطلب سياقًا أعمق لتحديد المستوى التصنيفي الصحيح بواسطة تقنيات تصنيف لغة الألة مثل SVM أو شجرة القرار . يوضح الشكل أدناه مستويات التصنيف المختلفة لمثال منتج معين.

بالنسبة لمنصة التجارة الإلكترونية الجديدة ، يمكن أن يكون إنشاء تصنيف منتج عبر تصنيف المنتج مهمة لا يمكن التغلب عليها. يتطلب إنشاء محتوى ثري قدرًا هائلاً من البيانات ذات الصلة والتدخلات اليدوية ومعرفة نطاق خبراء الفئة. كل هذا يمكن أن يكون مكلفًا لمنصة التجارة الإلكترونية الناشئة. ومع ذلك ، هناك بعض واجهات برمجة التطبيقات التي تقدمها Semantics3 و eBay و Lucidworks والتي يمكن أن تساعد في هذه العملية.

تعتمد واجهات برمجة التطبيقات هذه عادةً على محتوى كتالوج كبير للعديد من تجار التجزئة الكبار وتوفر المعلومات الداخلية لتصنيف منتج عن طريق مسح رمز المنتج الفريد الخاص به.

يمكن للتجارة الإلكترونية على نطاق صغير استخدام قوة واجهات برمجة التطبيقات السحابية لإنشاء تصنيف تمهيدي. يوضح الشكل 9-10 لقطة لواحد من واجهات برمجة التطبيقات من Semantics3 . تساعد واجهة برمجة التطبيقات الخاصة بهم في تصنيف المنتج من اسمه.

بمجرد جمع قدر كبير من معلومات المنتج ، يُنصح باستخدام أنظمة قائمة على قواعد مخصصة. تدعم بعض واجهات برمجة التطبيقات هذه أيضًا القواعد التي يحددها المستخدم ، بالإضافة إلى إثراء المنتج وإلغاء البيانات المكررة .

إثراء المنتج (Product enrichment)

للحصول على توصيات وبحث أفضل ، من المهم جمع معلومات أكثر ثراءً عن المنتج. بعض المصادر المحتملة لهذه المعلومات هي العناوين القصيرة والطويلة وصور المنتج وأوصاف المنتج. لكن هذه المعلومات غالبًا ما تكون إما غير صحيحة أو غير كاملة.

على سبيل المثال ، يمكن أن يؤدي العنوان المضلل إلى إعاقة البحث الجانبي في منصة التجارة الإلكترونية. لن يؤدي تحسين عنوان المنتج إلى تحسين نسبة النقر و إلى الظهور في البحث فحسب ، بل سيؤدي أيضًا إلى تحسين معدل التحويل من حيث شراء المنتج.

في المثال الموضح هنا

عنوان المنتج طويل جدًا ويحتوي على كلمات مثل iPad و iPhone و Samsung ، مما قد يؤدي إلى تضليل عملية البحث بسهولة. العنوان الكامل هو “Stylus Pen LIBERRWAY 10 Pack of Pink Purple Black Green Silver Stylus Universal Touch Screen Capacitive Stylus for Kindle Touch ipad iphone 6 / 6s 6Plus 6s Plus Samsung S5 S6 S7 Edge S8 Plus Note.” هذا النص معقد للغاية حتى بالنسبة للإنسان لتحليله وفهمه ، ناهيك عن آلة. مثل هذه الحالات مثالية لإثراء المنتج.

لجعل عنوان المنتج أكثر تعبيرًا ودقة. من الضروري تصفية العملات (tokens ) التي لا تعد جزءًا من قيم سمات المنتج. في المثال ، المنتج عبارة عن قلم ، ولا يعتبر iPad و iPhone جزءًا من قيم سماته. هذه العملات مضللة ويمكن أن تؤثر على جودة البحث الجانبي. و بالتالي، يجب إزالتها من عنوان المنتج ، إلا إذا كانت مهمة للإشارة إلى سياق المنتج الخاص بالنطاق.

من الناحية المثالية ، يساعد النموذج المحدد مسبقًا لعناوين المنتجات في الحفاظ على التناسق عبر المنتجات. من الأساليب الجيدة إنشاء قالب يتكون من سمات من شجرة التصنيف. يمكن أن تكون فئة المنتج أو النوع هو العملة الأولى في عنوان المنتج – على سبيل المثال ، “iPad” أو “Macbook”.

سيتبع ذلك السمات ذات المستوى الأدنى أو المحبب من شجرة التصنيف ، مثل العلامة التجارية والحجم واللون وما إلى ذلك ، لذا سيصبح العنوان: “iPad 64GB – Space Gray”. يمكن حذف السمات من صفحة التصنيف لإبقاء عنوان المنتج بسيطًا.

يُنظر إلى إثراء المنتج عادةً على أنه عملية أكبر وأكثر استمرارًا من مجرد تحسين عناوين المنتجات في أي إعداد بيع بالتجزئة عبر الإنترنت. بصرف النظر عن المستويات التصنيفية ، هناك طرق أخرى لتحديد مستويات الإثراء . يعتمد معظمها على أهمية معلومات السمة.

إلغاء تكرار المنتج ومطابقته

غالبًا ما تتم إضافة المنتجات إلى النظام الأساسي من قبل البائعين الخارجيين ، ويمكن للبائعين المختلفين الإشارة إلى نفس المنتج بأسماء مختلفة. نادرًا ما يتبعون نفس المصطلحات ، مما قد يؤدي إلى إدراج المنتج نفسه مع العديد من العناوين وصور المنتج. على سبيل المثال ، يشير “Garmin nuvi 2699LMTHD GPS Device” و “nuvi 2699LMTHD Automobile GPS Navigator” إلى نفس المنتج.

بالإضافة إلى تصنيف المنتج واستخراج السمات ، يعد إلغاء البيانات المكررة للمنتج أيضًا جانبًا مهمًا من جوانب التجارة الإلكترونية. يعد تحديد المنتجات المكررة مهمة صعبة أيضًا.

مطابقة السمات

إذا كان منتجان متطابقين ، فيجب أن تكون قيم السمات المختلفة متماثلة. ومن ثم ، بمجرد استخراج السمات ، فإننا نقارن قيم السمات لكل من المنتجين المعنيين. من الناحية المثالية ، سيشير الحد الأقصى من التداخل في السمات إلى مطابقة قوية للمنتج. من أجل مطابقة قيم السمات ، يمكننا استخدام مطابقة السلاسل. يمكن مطابقة سلسلتين عبر مطابقة الأحرف التامة أو باستخدام مقاييس تشابه السلسلة. عادةً ما يتم إنشاء مقاييس تشابه السلسلة للتعامل مع الأخطاء الإملائية الطفيفة والاختصارات وما إلى ذلك.

الاختصارات مشكلة كبيرة في البيانات المتعلقة بالمنتج. يمكن تمثيل نفس الكلمة في العديد من الاختصارات المقبولة. يجب تعيينها إلى شكل متسق (تمت مناقشته في “إثراء المنتج”) أو صياغة قواعد غير محددة للتعامل مع المشكلة. القاعدة البديهية للتعامل مع الاختصارات أثناء مطابقة كلمتين يمكن أن تكون مطابقة للحرفين الأول والأخير والتحقق مما إذا كانت هذه الأحرف تنتمي إلى كلمة أقصر أم أطول.

مطابقة العنوان

غالبًا ما يكون لمنتج واحد عدة متغيرات عنوان. فيما يلي بعض متغيرات العنوان لنفس جهاز GPS ، والتي تم بيعها بواسطة بائعين مختلفين:

Garmin nuvi 2699LMTHD GPS Device
nuvi 2699LMTHD Automobile Portable GPS Navigator
Garmin nuvi 2699LMTHD — GPS navigator — automotive 6.1 in
Garmin Nuvi 2699lmthd Gps Device
Garmin nuvi 2699LMT HD 6” GPS with Lifetime Maps and HD Traffic (010–01188–00)

لاسترداد كل هذه الحالات ، هناك حاجة إلى آلية مطابقة لتحديدها على أنها متماثلة. طريقة بسيطة يمكن أن تكون مقارنة الغرام الثنائي (bigrams) و الغرام الثلاثي (trigrams ) بين هذه العناوين.

من الممكن أيضًا إنشاء سمات على مستوى العنوان (مثل عدد الغرامات الثنائية و الثلاثية الشائعة) ثم حساب المسافة الإقليدية بينهما. يمكننا استخدام التضمين على مستوى الجملة وزوج من العبارات النصية في وقت واحد لتعلم مقياس المسافة الذي يحسن دقة المطابقة كما هو موضح في هذا البحث .

يمكن القيام بذلك أيضًا باستخدام بنية شبكة عصبية تسمى شبكة سيامي. تأخذ الشبكة السيامية تسلسلين في وقت واحد وتتعلم إنشاء التضمينات بطريقة بحيث إذا كانت التسلسلات متشابهة ، فإنها تظهر أقرب إلى بعضها البعض في مساحة التضمين ، أو أبعد من ذلك.

تطابق الصورة

أخيرًا ، قد لا تزال هناك شواذب (على سبيل المثال ، الاختصارات أو استخدام الكلمات الخاصة بمجال معين) في السمات والعناوين ، والتي يصعب مطابقتها مع بعضها البعض.

في هذه الحالات ، يمكن أن تكون صور المنتج بمثابة مصدر غني للمعلومات لمطابقة المنتج وإلغاء البيانات المكررة. لمطابقة الصور ، أو مطابقة البكسل إلى البكسل ، أو مطابقة خريطة السمات ، أو حتى تقنيات مطابقة الصور المتقدمة مثل شبكات سيامي طرق شائعة ، وعند تطبيقها في هذا الإعداد يمكن أن يقلل مقدار تكرار المنتج. تستند معظم الخوارزميات على مبادئ نهج التبصير الحاسوبي وتعتمد على جودة الصورة والتفاصيل الأخرى المتعلقة بالحجم.

تحليل المراجعات

تعد المراجعات جزءًا لا يتجزأ من أي بوابة للتجارة الإلكترونية. يحصلون على ردود فعل مباشرة من العملاء حول المنتجات. من المهم الاستفادة من هذه المعلومات الوفيرة وإنشاء إشارات مهمة لإرسال التعليقات إلى نظام التجارة الإلكترونية حتى يتمكن من استخدامها لتحسين تجربة العميل بشكل أكبر. علاوة على ذلك ، يمكن لجميع العملاء عرض المراجعات ، وهي تؤثر بشكل مباشر على مبيعات المنتجات. في هذا القسم ، سوف نتعمق أكثر في الجوانب المختلفة لتحليل آراء المراجعة.

تحليل المشاعر

لقد قمنا بتغطية تحليل المشاعر العامة كمهمة تصنيف في( هنا ). ولكن هناك فروق دقيقة مختلفة عندما يتعلق الأمر بتحليل المشاعر لمراجعات التجارة الإلكترونية. يوضح الشكل أدناه لقطة شاشة لمراجعات العملاء لـ iPhone X على Amazon. معظمنا على دراية برؤية مثل هذه المراجعات على مستوى الجانب على مواقع التجارة الإلكترونية – هذا هو المكان الذي يمكنك فيه تحليل المراجعات وتقطيعها بناءً على الجوانب والسمات.

كما ترى ، 67٪ من المراجعات لها تصنيف خمس نجوم (أي الأعلى) ، و 22٪ من المراجعات لها أدنى تقييم بنجمة واحدة. من المهم لشركة التجارة الإلكترونية أن تعرف ما الذي يدفع العملاء إلى منح تقييمات سيئة. لتوضيح هذه النقطة ، يوضح الشكل التالي مثالين على المراجعات المتطرفة لنفس المنتج.

بالتأكيد ، تحتوي كلتا هاتين المراجعتين على بعض المعلومات حول المنتج ، مما يعطي بائع التجزئة إشارات حول ما يفكر فيه العملاء. على وجه التحديد ، من المهم فهم المراجعات السلبية. بالنظر إلى المراجعة الأولى حيث ذكر العميل أن هناك مشكلات في الهواتف التي يتم شحنها. يتعلق الأمر في الغالب بالشاشة المعيبة ، والتي يجب على بائع التجزئة العناية بها.

في المقابل ، تعبر المراجعة الإيجابية عن المشاعر الإيجابية العامة بدلاً من الإشارة صراحةً إلى الجوانب التي أحبها المستخدم حقًا. وبالتالي ، من الضروري أن يكون لديك فهم كامل للمراجعات. بطبيعتها ، فهي موجودة في النص وغالبًا بتنسيق غير منظم ، مليء بالأخطاء غير المقصودة مثل الأخطاء الإملائية ، وتركيبات الجمل غير الصحيحة ، والكلمات غير المكتملة ، والاختصارات. هذا يجعل تحليل المراجعة أكثر صعوبة.

تعتبر التقييمات متناسبة بشكل مباشر مع المشاعر العامة للمراجعات. هناك حالات قام فيها المستخدم بتصنيف المنتج عن طريق الخطأ بشكل سيئ ولكنه يعطي تقييمًا إيجابيًا. سيساعد فهم المشاعر مباشرة من النص تجار التجزئة على تصحيح هذه الحالات الشاذة أثناء التحليل. ولكن في معظم الحالات ، لا تتحدث المراجعة عن جانب واحد فقط من المنتج ، ولكنها تحاول تغطية معظم جوانب المنتج ، مما يعكس في النهاية كل شيء في تقييم المراجعة.

ألق نظرة أخرى على لقطة شاشة مراجعة iPhone X في الشكل أعلاه . ألق نظرة على القسم الذي يظهر فيه: “Read reviews that mention”. هذه ليست سوى الكلمات الرئيسية الهامة التي وجدتها أمازون و التي قد تساعد العملاء على التنقل بشكل أفضل عند تصفح المراجعات.

يشير هذا بوضوح إلى أن هناك جوانب معينة يتحدث عنها العملاء. قد تكون تجربة المستخدم أو جوانب التصنيع أو السعر أو أي شيء آخر. كيف يمكننا معرفة ما هي مشاعر العميل أو ملاحظاته؟ حتى الآن ، قدمنا فقط مؤشرًا عالي المستوى للعاطفة للمراجعة بأكملها ، لكن ذلك لن يسمح لنا بالبحث بشكل أعمق لفهمها بشكل أفضل.

وهذا يتطلب فهمًا على مستوى الجانب للمراجعات. يمكن تحديد هذه الجوانب مسبقًا أو استخراجها من بيانات المراجعة نفسها. بناءً على ذلك ، سيتم الإشراف على النهج أو عدم الإشراف عليه وفقًا لذلك.

تحليل المشاعر على مستوى الجانب

قبل ان ابدأ مناقشة التقنيات المختلفة لتحليل المشاعر على مستوى الجانب ، فنحن بحاجة إلى فهم ماهية الجانب. الجانب عبارة عن مجموعة كلمات غنية بالمعنى تتمحور حول المفهوم والتي تشير إلى خصائص أو خصائص معينة للمنتج. على سبيل المثال ، في الشكل أدناه، سنرى نوع الجوانب التي قد يتضمنها موقع السفر: الموقع والقيمة والنظافة.

لا يقتصر هذا على السمات المتأصلة في المنتج فحسب ، بل يقتصر أيضًا على أي شيء وكل ما يتعلق بالتوريد والعرض التقديمي والتسليم والإرجاع والجودة وما إلى ذلك ، حول المنتج. عادةً ما يكون التمييز الواضح بين هذه الجوانب صعبًا ما لم يتم افتراضه بالفعل.

إذا كان بائع التجزئة لديه فهم واضح لجوانب المنتج ، فإن العثور على الجوانب يندرج تحت فئة الخوارزميات الخاضعة للإشراف. هناك أسلوب شائع لاستخدام الكلمات الأولية أو معاجم البذور ، والتي تشير بشكل أساسي إلى العملات (Token) التي يمكن أن تكون موجودة في جانب معين.

على سبيل المثال ، فيما يتعلق بتجربة المستخدم كجانب من جوانب iPhone X ، يمكن أن تكون الكلمات الأولية هي دقة الشاشة ، واللمس ، ووقت الاستجابة ، وما إلى ذلك. مرة أخرى ، الأمر متروك لبائع التجزئة في مستوى الدقة الذي يرغب في تشغيله. على سبيل المثال ، يمكن أن تكون جودة الشاشة وحدها جانبًا أكثر دقة.

النهج الخاضع للإشراف

يعتمد النهج الخاضع للإشراف بشكل أساسي على الكلمات الأولية. يحاول التعرف على وجود هذه الكلمات الأولية في الجملة. إذا كان يحدد كلمة أولية معينة في الجملة ، فإنه يميز الجملة بالجانب المقابل.

بمجرد وضع علامة على جميع الجمل لأي من الجوانب ، يجب إجراء تحليل المشاعر على مستوى الجملة. الآن ، نظرًا لأن لدينا بالفعل علامة إضافية لكل جملة ، يمكن تصفية الجمل التي تحتوي على علامة واحدة ، ويمكن تجميع المشاعر المتعلقة بها لفهم ملاحظات العميل حول هذا الجانب. على سبيل المثال ، يمكن تجميع جميع جمل المراجعة المتعلقة بجودة الشاشة واللمس ووقت الاستجابة معًا.

لإجراء تغيير ، دعنا نلقي نظرة على مثال من موقع للسفر ، حيث يكون تحليل المشاعر على مستوى الجانب واضحًا. كما ترى ، هناك تقييمات محددة للموقع ، وتسجيل الوصول ، والقيمة ، والنظافة ، وهي مفاهيم دلالية مستخرجة بشكل صحيح من البيانات لتقديم عرض أكثر تفصيلاً للمراجعات.

نهج غير خاضع للإشراف

كما هو مفهوم ، يعد ترتيب معجم البذور عالي الجودة أمرًا صعبًا ، لذلك توجد طرق غير خاضعة للإشراف لاكتشاف الجوانب. تعد نمذجة الموضوع أسلوبًا مفيدًا في تحديد الموضوعات الكامنة الموجودة في المستند.

يمكننا التفكير في هذه الموضوعات كجوانب في حالتنا. تخيل لو تمكنا من تجميع الجمل التي تتحدث عن نفس الجانب. هذا هو بالضبط ما تفعله خوارزمية نمذجة الموضوع. واحدة من أكثر أساليب النمذجة شيوعًا هي خوارزمية دريشليت الكامنة (latent Dirichlet algorithm) أو (LDA).

بطريقة مماثلة ، يمكننا تحديد عدد الجوانب التي نتوقعها من مجموعة الجمل مسبقًا. تُخرج خوارزمية نمذجة الموضوع أيضًا احتمالية أن تكون كل كلمة في جميع الموضوعات (هنا ، الجوانب). وبالتالي ، من الممكن أيضًا تجميع الكلمات التي لديها فرصة كبيرة للانتماء إلى جانب معين وتسميتها كلمات مميزة لهذا الجانب المعين. سيساعد هذا في النهاية في وضع تعليقات توضيحية على الجوانب غير المشروحة.

ربط التقييمات الإجمالية بالجوانب

لقد رأينا بالفعل كيف يمكننا اكتشاف المشاعر لكل جانب. عادةً ما يعطي المستخدمون أيضًا تقييمًا عامًا. الفكرة هنا هي ربط هذا التصنيف بالمشاعر الفردية على مستوى الجانب.

لهذا ، نستخدم تقنية تسمى تحليل انحدار التصنيف الكامن (latent rating regression analysis ) أو (LARA) . إليك مثالاً على قيام النظام بإنشاء تقييمات على مستوى الجانب لمراجعة الفندق.

يمكننا أن نفترض أن التقييم النهائي ليس سوى مزيج مرجح من المشاعر الفردية على مستوى الجانب. سيكون الهدف هو تقدير الأوزان والمشاعر على مستوى الجانب معًا. من الممكن أيضًا إجراء هاتين العمليتين بالتتابع – أي تحديد المشاعر على مستوى الجانب أولاً ثم الأوزان.

ستشير هذه الأوزان الموجودة في مقدمة المشاعر المختلفة لكل جانب في النهاية إلى مدى الأهمية التي يوليها المراجع لهذا الموضوع المحدد.

من الممكن أن يكون العميل غير راضٍ للغاية عن بعض الجوانب ، ولكن ربما هذا الجانب ليس من أولوياتهم. هذه المعلومات ضرورية لتجار التجزئة الإلكترونيين قبل اتخاذ أي إجراء.

فهم الجوانب

إنه هدف تجاري لبائعي التجزئة لتحليل جانب معين من المنتج وكيف انعكست المشاعر والآراء المختلفة في المراجعات. وبالمثل ، قد يكون المستخدم مهتمًا بجانب معين من المنتج وقد يرغب في فحص جميع المراجعات عليه.

ومن ثم ، بمجرد اشتقاق كل الجوانب ووضع علامة على كل جملة بها ، يمكن تجميع الجمل حسب الجوانب. ولكن بالنظر إلى الحجم الهائل من المراجعات التي يواجهها موقع التجارة الإلكترونية ، فلا يزال هناك الكثير من الجمل تحت أحد الجوانب. هنا ، قد تنقذ خوارزمية التلخيص الموقف. فكر في موقف نحتاج فيه إلى اتخاذ إجراء بشأن جانب ما ولكن ليس لدينا القدرة على استعراض جميع الجمل المتعلقة بهذا الجانب المحدد. سنحتاج إلى خوارزمية تلقائية يمكنها انتقاء واختيار أفضل الجمل التمثيلية لهذا الجانب.

LexRank عبارة عن خوارزمية تشبه PageRank ، تفترض أن كل جملة هي عقدة وتتصل عبر تشابه الجملة. بمجرد الانتهاء من ذلك ، فإنه يختار الجمل الأكثر مركزية منه ويقدم ملخصًا مقتطفًا للجمل تحت أحد الجوانب.

يمكننا إجراء تحليل المشاعر لكل جانب بالإضافة إلى تجميعها بناءً على الجوانب. بعد التجميع ، يمكن استخدام خوارزميات التلخيص مثل LexRank لتلخيصها. في النهاية ، يمكننا التخلص من المشاعر العامة تجاه جانب من جوانب المنتج وكذلك الحصول على ملخص للآراء يشرح المشاعر.

ملحوظة

لا يمكن تحقيق الفهم الكامل للمنتج إلا من خلال مراجعات المستخدم والمراجعات التحريرية. يتم توفير المراجعات التحريرية بشكل عام بواسطة مستخدمين خبراء أو خبراء في المجال.

هذه المراجعات أكثر موثوقية ويمكن عرضها في الجزء العلوي من قسم المراجعة. ولكن من ناحية أخرى ، تكشف تقييمات المستخدمين العامة عن الصورة الحقيقية لتجربة المنتج من جميع وجهات نظر المستخدمين. وبالتالي ، من المهم دمج المراجعات التحريرية مع مراجعات المستخدمين العامة. يمكن تحقيق ذلك عن طريق خلط كلا النوعين من المراجعات في القسم العلوي وترتيبها وفقًا لذلك.

لقد رأينا كيف يمكن إجراء تحليل المراجعة من منظور الجوانب ، والمشاعر ، والتقييمات. في الأقسام التالية ، سنغطي بإيجاز الفروق الدقيقة في التخصيص للتجارة الإلكترونية.

ختاماً

كان الدافع الأساسي وراء النجاح الهائل الذي حققته صناعة التجارة الإلكترونية هو جمع البيانات الهائل وتكييف القرارات التي تعتمد على البيانات. لعبت تقنيات معالجة اللغة العصبية دورًا مهمًا في تحسين تجربة المستخدم وزيادة الإيرادات في التجارة الإلكترونية وصناعات البيع بالتجزئة.

في هذا المقال، تناولنا جوانب مختلفة من معالجة اللغة العصبية في التجارة الإلكترونية. بدأنا بمقدمة عن البحث الجانبي، ثم تعمقنا في سمات المنتج. ترتبط هذه المجالات ارتباطًا وثيقًا بإثراء المنتجات وتصنيفها. ثم غطينا تحليل المراجعة وتوصيات المنتج للتجارة الإلكترونية.

معالجة اللغة في التجارة الإلكترونية

كتالوج التجارة الإلكترونية

تحليل المراجعات

بحث المنتج

توصيات المنتج

البحث في التجارة الإلكترونية

البحث الجانبي

بناء كتالوج التجارة الإلكترونية

استخراج السمة

استخراج السمة المباشرة

استخراج السمات غير المباشرة

تصنيف المنتج

إثراء المنتج (Product enrichment)

إلغاء تكرار المنتج ومطابقته

مطابقة السمات

مطابقة العنوان

تطابق الصورة

تحليل المراجعات

تحليل المشاعر

تحليل المشاعر على مستوى الجانب

النهج الخاضع للإشراف

نهج غير خاضع للإشراف

ربط التقييمات الإجمالية بالجوانب

فهم الجوانب

ختاماً

إضافة تعليق

قد يعجبك أيضاً

التصنيفات

أخر المقالات

إنضم إلى النشرة البريدية

الوصول السريع