freeCodeCamp/guide/arabic/machine-learning/reinforcement-learning/index.md

---
title: Reinforcement Learning
localeTitle: تعزيز التعلم
---
#### واقترح ريدينج:

*   http://incompleteideas.net/sutton/book/the-book-2nd.html

#### تعزيز التعلم

يشير التعلم التعزيزي إلى مجال التعلم الآلي الذي ينطبق على الوكلاء الذين تعززهم من خلال منحهم مكافأة وعقاب. فهو يمنح تعليمًا تدريجيًا رائعًا ويمكنه تبسيط تعلم العامل في المهام التي لا يمكنك فيها تحديد قيمة خطأ مناسبة.

مثال: يتم إعطاء برنامج bot مهمة للعب Space Invaders ، فإنه يحاول تعلم اللعب من خلال التفاعل مع اللعبة وفي مقابل الحصول على مكافأة للنقاط التي سجلها في نهاية اللعبة. أكبر مكافأة ، أكبر هي فرصه في القيام بطريقة مماثلة. بهذه الطريقة ، يتعلم كيفية لعب اللعبة وأداء بأفضل طريقة ممكنة.

في الصناعات ، يستخدم الروبوت تقنية التعزيز العميق لاختيار جهاز من صندوق واحد ووضعه في حاوية. سواء نجحت أو فشلت ، فهي تحافظ على الهدف وتكتسب المعرفة وتدرّب نفسها للقيام بهذه المهمة بسرعة كبيرة ودقة. التعلم بمفرده هو نوع من التعلم التعزيزي شريطة أن يكون التعلم في بعد إيجابي.

## قائمة الخوارزميات المشتركة

Q-التعلم الفرق الزمني (TD) شبكات أدفانسيد عميقة

## استخدم حالات:

بعض تطبيقات خوارزميات التعلم التعزيزية هي ألعاب لوحية لعبها الكمبيوتر (Chess، Go) ، وأيدي آلية ، وسيارات ذاتية القيادة.
feat: add portuguese chinese arabic to guide 2018-10-12 20:35:31 +00:00			`---`
			`title: Reinforcement Learning`
			`localeTitle: تعزيز التعلم`
			`---`
			`#### واقترح ريدينج:`

			`* http://incompleteideas.net/sutton/book/the-book-2nd.html`

			`#### تعزيز التعلم`

			`يشير التعلم التعزيزي إلى مجال التعلم الآلي الذي ينطبق على الوكلاء الذين تعززهم من خلال منحهم مكافأة وعقاب. فهو يمنح تعليمًا تدريجيًا رائعًا ويمكنه تبسيط تعلم العامل في المهام التي لا يمكنك فيها تحديد قيمة خطأ مناسبة.`

			`مثال: يتم إعطاء برنامج bot مهمة للعب Space Invaders ، فإنه يحاول تعلم اللعب من خلال التفاعل مع اللعبة وفي مقابل الحصول على مكافأة للنقاط التي سجلها في نهاية اللعبة. أكبر مكافأة ، أكبر هي فرصه في القيام بطريقة مماثلة. بهذه الطريقة ، يتعلم كيفية لعب اللعبة وأداء بأفضل طريقة ممكنة.`

			`في الصناعات ، يستخدم الروبوت تقنية التعزيز العميق لاختيار جهاز من صندوق واحد ووضعه في حاوية. سواء نجحت أو فشلت ، فهي تحافظ على الهدف وتكتسب المعرفة وتدرّب نفسها للقيام بهذه المهمة بسرعة كبيرة ودقة. التعلم بمفرده هو نوع من التعلم التعزيزي شريطة أن يكون التعلم في بعد إيجابي.`

			`## قائمة الخوارزميات المشتركة`

			`Q-التعلم الفرق الزمني (TD) شبكات أدفانسيد عميقة`

			`## استخدم حالات:`

			`بعض تطبيقات خوارزميات التعلم التعزيزية هي ألعاب لوحية لعبها الكمبيوتر (Chess، Go) ، وأيدي آلية ، وسيارات ذاتية القيادة.`