--- title: Introduction to NLP localeTitle: مقدمة في البرمجة اللغوية العصبية --- ## الخطوط العريضة * التحفيز * استخدم حالات * نمذجة اللغة * قراءات أخرى ## التحفيز لطالما كان حلمنا هو جعل الآلات تفهم لغتنا. منذ أن توصل تشومسكي إلى القواعد النحوية لـ Context ، كان اللغويون يرغبون في التوصل إلى حلول لفهم القواعد النحوية المعتمدة على السياق. لذلك فمن الطبيعي أن يكون هناك تلميذ أكاديمي قد تطور حول هذا الموضوع. ## استخدم حالات استخدم الناس هذا المفهوم في الكثير من التطبيقات المثيرة للاهتمام. قليل من تلك المثيرة تتضمن اقتراحات الرد التلقائي من Google ، أو Siri ، أو Gmail. ومع ذلك ، يعمل الناس على طرق لتحسين هذه التوقعات ، ويتم إجراء أحدث الأبحاث حول كيفية جعل الآلات تجيب على الأسئلة بشكل أكثر موثوقية. ## كيف تعمل معالجة اللغات الطبيعية في وقت سابق ، اعتمدت البرمجة اللغوية العصبية نهج قائم على القواعد ، أي أن جميع القواعد كانت مشفرة بشكل صارم (على سبيل المثال كتابة قواعد اللغة). ومع ذلك لم يكن هذا عاطلاً عن الاختلافات في نماذج اللغة. حاليا ، تتم عمليات NLP على استخدام الذكاء الاصطناعي. وهي تعتمد بشكل أساسي على التعلم العميق ، وهو الذكاء الاصطناعي الذي يحدد الأنماط في البيانات ويستخدمه لتدريب النموذج. هذه الطريقة أفضل من الطرق السابقة المستخدمة لأنه عند التعلم من خلال البيانات الضخمة الحالية ، يمكن للآلة التركيز على معظم الحالات الشائعة ، وهو أمر ليس سهلاً مع القواعد المكتوبة بخط اليد لأنه ليس بالأمر البديهي فيما يتعلق بالمكان الذي يجب أن توضع فيه الجهود. . أيضا ، تصبح هذه النماذج أكثر موثوقية مع زيادة في البيانات ، ولكن في النهج السابقة لا يمكن أن تكون دقيقة إلا عن طريق زيادة تعقيد القواعد ، والتي هي مهمة أكثر صعوبة. يتعلم النموذج قواعد اللغة من خلال تحليل مجموعة كبيرة من الأمثلة النموذجية في العالم الحقيقي. تتطلب هذه الطريقة قدراً هائلاً من البيانات المسمى ، وهو ما يمثل عقبة كبيرة في البرمجة اللغوية العصبية. ## نمذجة اللغة لأولئك الذين يتطلعون إلى الدخول في هذا المجال ، أنوي أن أبدأكم بمفهومين. #### Tokenisation هنا تبدو المهمة بسيطة. بالنظر إلى مجموعة (مجموعة من الجمل) ، قم بتوليد رموز فردية (كلمات ذات معنى). نحن بحاجة لتزيين الكلمات والجمل. النهج الأول الذي يتبادر إلى الذهن هو التقسيم حسب الفترة والفضاء. هذا لا يعمل. النظر في السيد جون. هل الجمل "السيد" و "جون" 2؟ بالطبع لا. الآن فكر في واصلة الكلمات المنفصلة. هل تريد تقسيمها على أنها كلمتين أو كلمة واحدة؟ هذه الأسئلة الصعبة تجعل مهمة التقريب غير واضحة. المضي قدما واختيار جثة من nltk ، و buid regex الخاصة بك ل tokeniser الخاصة جدا! #### نماذج ن غرام المهمة التالية هي بناء نموذج لغوي. هنا نعتبر فرضية أن الكلمة n لا تعتمد إلا على الكلمات n-1 السابقة. يتم استخدام أكثر من 2 جرام و 3 جرام من النماذج الأكثر شيوعًا. لبناء نموذج 3 جرام ، فقط قم بتجميع الرموز الثلاث معًا واحسب مدى تكرارها في المجموعة. أنت الآن على استعداد للتنبؤ باحتمالية مجموعة من 3 كلمات! ## قراءات أخرى مجال البرمجة اللغوية العصبية هو ضخم. إذا كنت قد قرأت هذا الآن ونفذت ما سبق ، فقد أحببت هذا بالتأكيد. المضي قدما وقراءة كتاب Jurafsky لتعلم بعض المفاهيم الجديدة. تذكر أنه من المهم تنفيذها أيضًا.