freeCodeCamp/guide/arabic/data-science-tools/pandas/index.md

69 lines
4.5 KiB
Markdown
Raw Normal View History

---
title: pandas
localeTitle: الباندا
---
![Everybody loves pandas!](https://pandas.pydata.org/_static/pandas_logo.png "الباندا")
## الباندا
[الباندا](http://pandas.pydata.org/) هي مكتبة بايثون لتحليل البيانات باستخدام إطارات البيانات. إطارات البيانات هي جداول بيانات ، والتي يمكن مقارنةها من الناحية المفاهيمية بجدول بيانات. سيشعر علماء البيانات المألوفون بـ R بأنهم في وطنهم هنا. الباندا غالبا ما تستخدم جنبا إلى جنب مع numpy ، pyplot ، و scikit - تعلم.
### استيراد الباندا
هو اصطلاح يستخدم على نطاق واسع لاستيراد مكتبة الباندا باستخدام الاسم المستعار `pd` :
`import pandas as pd
`
## إطارات البيانات
يتكون إطار البيانات من عدد من الصفوف والأعمدة. يمثل كل عمود ميزة من مجموعة البيانات ، وكذلك الاسم ونوع البيانات. يمثل كل صف نقطة بيانات من خلال قيم المعالم المرتبطة. تسمح لك مكتبة الباندا بمعالجة البيانات في إطار بيانات بطرق مختلفة. الباندا لديها الكثير من الاحتمالات ، لذلك ما يلي هو مجرد خدش السطح لإعطاء الشعور للمكتبة.
## سلسلة
السلسلة هي نوع البيانات الأساسي في الباندا. سلسلة تشبه إلى حد كبير صفيف (مصفوفة NumPy) (في الحقيقة إنها مبنية على قمة كائن مصفوفة NumPy). يمكن أن تحتوي السلسلة A على تسميات للمحور ، حيث يمكن فهرستها بواسطة تسمية بدون فهرسة أرقام لموقع البيانات. يمكنه الاحتفاظ بأي قائمة بايثون صحيحة مثل قائمة ، قاموس ، إلخ.
## تحميل البيانات من ملف csv
ملف `.csv` هو ملف _قيمة مفصولة بفواصل_ . طريقة شائعة جدا لتخزين البيانات. لتحميل هذه البيانات في إطار بيانات `read_csv` ، استخدم الطريقة `read_csv` :
`df = pd.read_csv(file_path)
`
هنا ، يمكن أن يكون `file_path` مسارًا محليًا لملف csv على جهاز الكمبيوتر الخاص بك ، أو عنوان url يشير إلى واحد. قد يتم تضمين أسماء الأعمدة في ملف csv ، أو قد يتم تمريرها كوسيطة. لمزيد من المعلومات حول هذا ، وأكثر من ذلك بكثير ، ألق نظرة على [الوثائق](http://pandas.pydata.org/pandas-docs/stable/generated/pandas.read_csv.html?highlight=read_csv#pandas.read_csv) .
## الحصول على لمحة عامة عن إطار البيانات
لإظهار الصفوف القليلة الأولى من إطار البيانات ، تكون طريقة `head` مفيدة (مرة أخرى يجب أن يبدو هذا مألوفًا لمبرمجي R):
`df.head()
`
سيظهر هذا الصفوف الخمسة الأولى من إطار البيانات.
لعرض أكثر من أول 5 صفوف ، قم ببساطة بوضع عدد الصفوف التي تريد طباعتها داخل طريقة `head` .
`df.head(10)
`
سيظهر هذا أول 10 صفوف من إطار البيانات.
لإظهار الصفوف القليلة الأخيرة من إطار البيانات ، تكون طريقة `tail` مفيدة (مرة أخرى يجب أن يبدو هذا مألوفًا لمبرمجي R):
`df.tail()
`
سيظهر هذا آخر 5 صفوف من إطار البيانات.
## Subsetting: الحصول على عمود بالاسم
يمكن أن يكون إطار البيانات جزئيًا بعدة طرق. واحد من أبسط هو الحصول على عمود واحد. على سبيل المثال ، إذا كان إطار البيانات `df` يحتوي على عمود اسمه `age` ، فيمكننا استخلاصه كما يلي:
`ages=df["age"]
`
#### معلومات اكثر:
1. [الباندا](http://pandas.pydata.org/)
2. [read\_csv](http://pandas.pydata.org/pandas-docs/stable/generated/pandas.read_csv.html?highlight=read_csv#pandas.read_csv)
3. [رئيس](http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.head.html?highlight=head#pandas.DataFrame.head)