69 lines
4.5 KiB
Markdown
69 lines
4.5 KiB
Markdown
---
|
||
title: pandas
|
||
localeTitle: الباندا
|
||
---
|
||
![Everybody loves pandas!](https://pandas.pydata.org/_static/pandas_logo.png "الباندا")
|
||
|
||
## الباندا
|
||
|
||
[الباندا](http://pandas.pydata.org/) هي مكتبة بايثون لتحليل البيانات باستخدام إطارات البيانات. إطارات البيانات هي جداول بيانات ، والتي يمكن مقارنةها من الناحية المفاهيمية بجدول بيانات. سيشعر علماء البيانات المألوفون بـ R بأنهم في وطنهم هنا. الباندا غالبا ما تستخدم جنبا إلى جنب مع numpy ، pyplot ، و scikit - تعلم.
|
||
|
||
### استيراد الباندا
|
||
|
||
هو اصطلاح يستخدم على نطاق واسع لاستيراد مكتبة الباندا باستخدام الاسم المستعار `pd` :
|
||
|
||
`import pandas as pd
|
||
`
|
||
|
||
## إطارات البيانات
|
||
|
||
يتكون إطار البيانات من عدد من الصفوف والأعمدة. يمثل كل عمود ميزة من مجموعة البيانات ، وكذلك الاسم ونوع البيانات. يمثل كل صف نقطة بيانات من خلال قيم المعالم المرتبطة. تسمح لك مكتبة الباندا بمعالجة البيانات في إطار بيانات بطرق مختلفة. الباندا لديها الكثير من الاحتمالات ، لذلك ما يلي هو مجرد خدش السطح لإعطاء الشعور للمكتبة.
|
||
|
||
## سلسلة
|
||
|
||
السلسلة هي نوع البيانات الأساسي في الباندا. سلسلة تشبه إلى حد كبير صفيف (مصفوفة NumPy) (في الحقيقة إنها مبنية على قمة كائن مصفوفة NumPy). يمكن أن تحتوي السلسلة A على تسميات للمحور ، حيث يمكن فهرستها بواسطة تسمية بدون فهرسة أرقام لموقع البيانات. يمكنه الاحتفاظ بأي قائمة بايثون صحيحة مثل قائمة ، قاموس ، إلخ.
|
||
|
||
## تحميل البيانات من ملف csv
|
||
|
||
ملف `.csv` هو ملف _قيمة مفصولة بفواصل_ . طريقة شائعة جدا لتخزين البيانات. لتحميل هذه البيانات في إطار بيانات `read_csv` ، استخدم الطريقة `read_csv` :
|
||
|
||
`df = pd.read_csv(file_path)
|
||
`
|
||
|
||
هنا ، يمكن أن يكون `file_path` مسارًا محليًا لملف csv على جهاز الكمبيوتر الخاص بك ، أو عنوان url يشير إلى واحد. قد يتم تضمين أسماء الأعمدة في ملف csv ، أو قد يتم تمريرها كوسيطة. لمزيد من المعلومات حول هذا ، وأكثر من ذلك بكثير ، ألق نظرة على [الوثائق](http://pandas.pydata.org/pandas-docs/stable/generated/pandas.read_csv.html?highlight=read_csv#pandas.read_csv) .
|
||
|
||
## الحصول على لمحة عامة عن إطار البيانات
|
||
|
||
لإظهار الصفوف القليلة الأولى من إطار البيانات ، تكون طريقة `head` مفيدة (مرة أخرى يجب أن يبدو هذا مألوفًا لمبرمجي R):
|
||
|
||
`df.head()
|
||
`
|
||
|
||
سيظهر هذا الصفوف الخمسة الأولى من إطار البيانات.
|
||
|
||
لعرض أكثر من أول 5 صفوف ، قم ببساطة بوضع عدد الصفوف التي تريد طباعتها داخل طريقة `head` .
|
||
|
||
`df.head(10)
|
||
`
|
||
|
||
سيظهر هذا أول 10 صفوف من إطار البيانات.
|
||
|
||
لإظهار الصفوف القليلة الأخيرة من إطار البيانات ، تكون طريقة `tail` مفيدة (مرة أخرى يجب أن يبدو هذا مألوفًا لمبرمجي R):
|
||
|
||
`df.tail()
|
||
`
|
||
|
||
سيظهر هذا آخر 5 صفوف من إطار البيانات.
|
||
|
||
## Subsetting: الحصول على عمود بالاسم
|
||
|
||
يمكن أن يكون إطار البيانات جزئيًا بعدة طرق. واحد من أبسط هو الحصول على عمود واحد. على سبيل المثال ، إذا كان إطار البيانات `df` يحتوي على عمود اسمه `age` ، فيمكننا استخلاصه كما يلي:
|
||
|
||
`ages=df["age"]
|
||
`
|
||
|
||
#### معلومات اكثر:
|
||
|
||
1. [الباندا](http://pandas.pydata.org/)
|
||
2. [read\_csv](http://pandas.pydata.org/pandas-docs/stable/generated/pandas.read_csv.html?highlight=read_csv#pandas.read_csv)
|
||
3. [رئيس](http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.head.html?highlight=head#pandas.DataFrame.head) |