معالجة اللغة الطبيعية في الخدمات المالية والقانون

في هذا المقال سنتحدث عن منافع معالجة اللغة الطبيعية في الخدمات المالية والقانون.

الخدمات المالية

الخدمات المالية مجال متنوع يشمل مجموعة واسعة ، من مراقبة الشركات العامة إلى تدفق الصفقات المصرفية الاستثمارية. على الصعيد العالمي ، من المتوقع أن تنمو صناعة الخدمات المالية إلى 26 تريليون دولار أمريكي بحلول عام 2022 . يمكننا النظر إلى التمويل من الزوايا الثلاث التالية:

وجهات نظر المنظمة

أنواع المنظمات المختلفة لها متطلبات ووجهات نظر مختلفة يجب أخذها في الاعتبار. تشمل وجهات النظر هذه:

  • الشركات الخاصة
  • الشركات العامة
  • المؤسسات غير الهادفة للربح
  • المنظمات الحكومية

أجراءات

هناك إجراءات مختلفة يمكن أن تتخذها المنظمة ، بما في ذلك:

  • تخصيص الأموال وإعادة تخصيصها
  • المحاسبة والمراجعة ، والتي تشمل تحديد الانحرافات والقيم المتطرفة للتحقيق في كل من القيمة والمخاطر
  • تحديد الأولويات وتخطيط الموارد
  • الامتثال للمعايير القانونية والسياساتية

السياق المالي

يمكن أن يكون لهذه الإجراءات سياقات مختلفة ، بما في ذلك:

  • التنبؤ والميزانية
  • الخدمات المصرفية للأفراد
  • الخدمات المصرفية الإستثمارية
  • عمليات سوق الأوراق المالية
  • عمليات العملات المشفرة

لاتخاذ قرارات مدروسة ومخططة في الوقت الفعلي حول هيكلة التدفقات المالية وعرضها وإدارتها والإبلاغ عنها ، يجب أن يكون هناك تركيز مستمر على الطبيعة المتغيرة للشركة ، ويجب بناء البنية التحتية المالية وتصميمها وفقًا لذلك. يمكن أن يساعد تعلم الألة و معالجة اللغة الطبيعية في تصميم مثل هذا النظام. يوضح الشكل أدناه كيف يعتقد المصرفيون البريطانيون أن تعلم الألة و معالجة اللغة الطبيعية  يمكن أن يحسن عملياتهم وفي أي مجالات.

 فوائد ML المقدرة في المملكة المتحدة

تطبيقات معالجة اللغة الطبيعية في المالية

سنغطي بعض التطبيقات المحددة لـ NLP في التمويل ، بما في ذلك تقييمات مخاطر القروض ، ومشاكل التدقيق والمحاسبة ، وتحليل المعنويات المالية.

المشاعر المالي

يعتمد تداول سوق الأسهم على مجموعة من المعلومات حول شركات معينة. تساعد هذه المعرفة في إنشاء مجموعة من الإجراءات التي تحدد ما إذا كنت تريد شراء الأسهم أو الاحتفاظ بها أو بيعها.

 يمكن أن يستند هذا التحليل إلى التقارير المالية ربع السنوية للشركات أو على ما يعلق عليه المحللون حول الشركات في تقاريرهم. يمكن أن يأتي هذا أيضًا من وسائل التواصل الاجتماعي.

يساعد تحليل وسائل التواصل الاجتماعي ، في مراقبة منشورات وسائل التواصل الاجتماعي والإشارة إلى الفرص المحتملة للتداول. 

على سبيل المثال ، في حالة استقالة رئيس تنفيذي ، غالبًا ما تكون هذه المشاعر سلبية ، مما قد يؤثر سلبًا على سعر سهم الشركة. من ناحية أخرى ، إذا لم يكن أداء الرئيس التنفيذي جيدًا ورحبت الأسواق باستقالته ، فقد يؤدي ذلك إلى زيادة سعر السهم.

 من أمثلة الشركات التي تقدم هذه المعلومات للتداول DataMinr و Bloomberg. يوضح الشكل التالي محطة DataMinr ، حيث يتم عرض التنبيهات والأخبار التي تؤثر على التسويق المتعلقة بشركة Dell على المستخدم.

محطة داتامينر الاجتماعية

يختلف تحليل المعنويات المالية عن تحليل المعنويات المنتظم. لا يختلف الأمر في النطاق فحسب ، بل في الغرض أيضًا. بشكل عام ، الغرض هو التخمين كيف ستتفاعل الأسواق مع خبر ما ، على عكس ما إذا كانت الأخبار إيجابية بطبيعتها أم لا. تمامًا كما رأينا سابقًا في BioBERT للرعاية الصحية ، كانت هناك جهود لتكييف BERT مع المجال المالي. واحد من هؤلاء هو FinBERT .

تستخدم FinBERT مجموعة فرعية من الأخبار المالية من رويترز. لتصنيف المشاعر ، فإنه يستخدم Financial PhraseBank ، الذي يحتوي على أكثر من 4000 جملة مصنفة من قبل أشخاص لديهم خلفيات في الأعمال التجارية والمالية. على عكس تحليل المعنويات المنتظم ، حيث يعني الإيجابي أن شيئًا ما له عاطفة إيجابية ، في Financial PhraseBank ، يشير الشعور الإيجابي إلى أن سعر سهم الشركة سيرتفع بناءً على الأخبار الواردة في الجملة. 

أدت FinBERT إلى دقة تبلغ 0.97 و F1 تبلغ 0.95 – وهو تحسن كبير مقارنة بأحدث الأساليب العامة الأخرى. FinBERT هي مكتبة متاحة على GitHub ، إلى جانب بياناتها. يمكننا البناء على هذه المكتبة للمشكلات المخصصة واستخدام النماذج المدربة مسبقًا لتصنيف المشاعر المالية.

تقييم المخاطر

مخاطر الائتمان هي طريقة لقياس فرص نجاح سداد القرض. يتم حسابها بشكل عام من خلال الإنفاق السابق للفرد وسجل سداد القرض. ومع ذلك ، فإن هذه المعلومات محدودة في العديد من السيناريوهات ، خاصة في المجتمعات المحرومة. 

تشير التقديرات إلى أن أكثر من نصف سكان العالم مستبعدون من الخدمات المالية . يمكن أن تساعد معالجة اللغة الطبيعية في التخفيف من هذه المشكلة. يمكن لتقنيات معالجة اللغة الطبيعية أن تضيف الكثير من نقاط البيانات التي يمكن استخدامها لتقييم مخاطر الائتمان. 

على سبيل المثال ، في القروض التجارية ، يمكن قياس القدرة والموقف الرياديين باستخدام معالجة اللغة الطبيعية. يتم استخدام هذا النهج من قبل Capital Float و Microbnk. وبالمثل ، يمكن أيضًا إظهار عدم الاتساق في البيانات المقدمة من قبل المقترض لمزيد من التدقيق. يمكن أيضًا تضمين جوانب أخرى أكثر دقة ، مثل مشاعر المقرضين والمقترضين أثناء التقدم للحصول على قرض. 

في كثير من الأحيان في اتفاقيات القروض الشخصية ، يجب الحصول على معلومات مختلفة من مستندات القروض ، والتي يتم تغذيتها بعد ذلك لنماذج مخاطر الائتمان.

 تساعد المعلومات التي يتم الحصول عليها في تحديد مخاطر الائتمان ، ويمكن أن يؤدي استخراج البيانات الخاطئة من هذه المستندات إلى تقييمات معيبة. 

يمكن أن يؤدي التعرف على الكيان المسمى (NER) ، والذي تناولناه بالتفصيل في الفصل الخامس ، إلى تحسين ذلك. يظهر مثال على اتفاقية القرض في الشكل أدناه، حيث نرى اتفاقية قرض وكيانات مختلفة ذات صلة مستخرجة منها. هذا المثال مأخوذ من عمل حول تكييف مجال NER للمجال المالي

اتفاقية قرض مع كيانات مشروحة

المحاسبة والمراجعة

تركز الشركات العالمية Deloitte و Ernst & Young و PwC الآن بشكل كبير على تقديم استنتاجات وملاحظات تدقيق أكثر جدوى وقابلية للتنفيذ وذات صلة حول الأداء السنوي للشركة.

 أثناء تطبيق جوانب NLP و ML في مجالات مثل مراجعات مستندات العقد واتفاقيات الشراء طويلة الأجل ، طورت Deloitte ، على سبيل المثال ، لغة أوامر التدقيق الخاصة بها إلى تطبيق معالجة لغة طبيعية أكثر كفاءة. تم تغطية هذا بمزيد من التفصيل في تقريرهم حول البيانات الحكومية .

بالإضافة إلى ذلك ، بعد عقود من التكتكات الطويلة والممتدة وربط رزم من المعاملات اليومية النموذجية التي لا نهاية لها وغيرها من القطع الورقية مثل الفواتير ، أدركت الشركات أخيرًا أن معالجة اللغة الطبيعية و تعلم الألة لها ميزة كبيرة في عملية التدقيق . 

تتجلى هذه الميزة في التحديد المباشر ، والتركيز ، والتصور ، وتحليل الاتجاه للقيم المتطرفة في أنواع المعاملات. يتم إنفاق الوقت والجهد على التحقيق في هذه القيم المتطرفة وأسبابها. ينتج عن ذلك تحديد مبكر للمخاطر الكبيرة المحتملة والنشاط الاحتيالي المحتمل مثل غسيل الأموال إلى جانب الأنشطة المولدة للقيمة التي يمكن محاكاتها واستقراءها عبر الشركة وتخصيصها لمختلف العمليات التجارية.

معالجة اللغة الطبيعية والمشهد القانوني

استمر تكامل واستخدام الأدوات التكنولوجية في مهنة المحاماة منذ عقود. نظرًا لحجم البحث ، وإحالة القضايا ، والإعداد الموجز ، ومراجعة المستندات ، وتصميم العقود ، وتحليل الخلفية ، وصياغة الرأي ، فقد بحث العاملون في المهنة القانونية ، بما في ذلك مكاتب المحاماة وأنظمة المحاكم ، منذ فترة طويلة عن العديد من الطرق والوسائل و الأدوات لخفض ساعات الجهد اليدوي. لن نغطي معالجة اللغات الطبيعية القانونية بقدر كبير من التفاصيل ، لأن العمل البحثي في ​​المجال محمي ببراءات الاختراع بدلاً من فتحه أو فتحه جزئيًا. لذلك ، سنناقش الأفكار بشكل عام.

تتضمن بعض المهام الأساسية التي يساعد فيها معالجة اللغة الطبيعية (NLP) الخدمات القانونية ما يلي:

  • بحث قانوني

يتضمن ذلك البحث عن المعلومات ذات الصلة بحالة معينة ، بما في ذلك البحث في كل من الهيئات التشريعية والسوابق القضائية واللوائح. إحدى هذه الخدمات هي ROSS Intelligence . يسمح بمطابقة الحقائق والقضايا ذات الصلة وأيضًا تحليل المستندات القانونية. يمكننا رؤيته في العمل في الشكل أدناه.

 تطابق روس للمقاطع ذات الصلة ROSS Intelligenc

  • مراجعة العقد

يشير هذا إلى مراجعة العقد والتأكد من أنه يتبع مجموعة من القواعد واللوائح. يتضمن إبداء التعليقات واقتراح تعديلات على عبارات مختلفة. أحد الأمثلة هو SpotDraft ، الذي يركز على اللوائح القائمة على GPDR.

  • توليد العقد

يشير هذا إلى إنشاء عقود بناءً على إعداد السؤال والجواب. قد تتطلب الحالات البسيطة فقط نموذجًا بسيطًا ، بينما في الحالات الأكثر تعقيدًا ، قد يكون نظام chatbot التفاعلي أكثر ملاءمة. بعد أخذ جميع الردود ، تقوم خوارزمية ملء الفتحة بإنشاء العقد.

  • الاكتشاف القانوني

يشير هذا إلى إيجاد الانحرافات والأنماط في المعلومات المخزنة إلكترونيًا والتي يمكن استخدامها للحالة. في بعض الحالات ، يكون هذا الاكتشاف غير خاضع للرقابة تمامًا.

 في حالات أخرى ، يمكن أن يتضمن تعلمًا أكثر نشاطًا (أي توفير مجموعة أولية من المستندات ذات العلامات). أحد هذه المنتجات هو siren.io، والذي يساعد في اكتشاف مجالات الاستخبارات وإنفاذ القانون والأمن السيبراني والجرائم المالية.

استخراج الكيان القانوني باستخدام LEXNLP

في أي نوع من العقود ، هناك مجموعة من المصطلحات والكيانات القانونية التي نحتاج إلى استخراجها قبل إنشاء أي نوع من التطبيقات الذكية. يساعد LexNLP في ذلك لأنه يحتوي على تجزئة قانونية للكلمات وترميز. هذا مهم بسبب الاختصارات القانونية مثل LLC أو F.3d ، والتي لا يمكن للمحللين العاديين التعامل معها.

 وبالمثل ، تساعدنا LexNLP في تقسيم المستندات إلى أقسام واستخراج الحقائق مثل تواريخ العقود المتكررة أو اللوائح. علاوة على ذلك ، يتم توصيله بـ ContraxSuite ، الذي يحتوي على مجموعة من الميزات القانونية الأخرى.

الآن ، دعونا نرى كيف يعمل هذا :

import lexnlp.extract.en.acts
import lexnlp.extract.en.definitions

print("List of acts in the document")

data_contract = list(lexnlp.extract.en.acts.get_acts(text))
df = pd.DataFrame(data=data_contract,columns=data_contract[0].keys())
df['Act_annotations'] = list(lexnlp.extract.en.acts.get_acts_annotations(text))

df.head(10)

print("Different ACT definitions in the contract")

data_acts = list(lexnlp.extract.en.definitions.get_definitions(text))
df = pd.DataFrame(data=data_acts,columns=["Acts"])
df.head(20)


يوضح الشكل التالي قائمة الأعمال الواردة في المستند المستخرج باستخدام LexNLP.

كما هو موضح في الكود ، قمنا باستخراج المعلومات من SAFE (اتفاقية بسيطة لرأس المال المستقبلي) ، وهي وثيقة مشتركة للاستثمارات. استخرجنا جميع الأفعال وتعريفاتها التي كانت موجودة في الوثيقة. وبالمثل ، يمكن أن يمتد هذا لاستخراج الشركات ، والاستشهادات ، والقيود ، والمدد القانونية ، واللوائح ، وما إلى ذلك.

إلى جانب استخراج الكيانات القانونية ، توفر LexNLP أيضًا القواميس القانونية ومجموعات المعرفة لدول متعددة للمحاسبة والمعلومات المالية والهيئات التنظيمية والمجالات القانونية والطبية. 

يتكامل أيضًا مع ContraxSuite ، مما يسمح لنا بإلغاء تكرار المستندات وتجميع الكيانات القانونية وفقًا لكيفية ذكرها (كما هو موضح في الشكل أدناه) ، وما إلى ذلك. 

 تجميع الكيانات القانونية من مجموعة من الوثائق

إضافة تعليق