freeCodeCamp/guide/arabic/data-science-tools/pandas/index.md

4.5 KiB

title localeTitle
pandas الباندا

Everybody loves pandas!

الباندا

الباندا هي مكتبة بايثون لتحليل البيانات باستخدام إطارات البيانات. إطارات البيانات هي جداول بيانات ، والتي يمكن مقارنةها من الناحية المفاهيمية بجدول بيانات. سيشعر علماء البيانات المألوفون بـ R بأنهم في وطنهم هنا. الباندا غالبا ما تستخدم جنبا إلى جنب مع numpy ، pyplot ، و scikit - تعلم.

استيراد الباندا

هو اصطلاح يستخدم على نطاق واسع لاستيراد مكتبة الباندا باستخدام الاسم المستعار pd :

import pandas as pd

إطارات البيانات

يتكون إطار البيانات من عدد من الصفوف والأعمدة. يمثل كل عمود ميزة من مجموعة البيانات ، وكذلك الاسم ونوع البيانات. يمثل كل صف نقطة بيانات من خلال قيم المعالم المرتبطة. تسمح لك مكتبة الباندا بمعالجة البيانات في إطار بيانات بطرق مختلفة. الباندا لديها الكثير من الاحتمالات ، لذلك ما يلي هو مجرد خدش السطح لإعطاء الشعور للمكتبة.

سلسلة

السلسلة هي نوع البيانات الأساسي في الباندا. سلسلة تشبه إلى حد كبير صفيف (مصفوفة NumPy) (في الحقيقة إنها مبنية على قمة كائن مصفوفة NumPy). يمكن أن تحتوي السلسلة A على تسميات للمحور ، حيث يمكن فهرستها بواسطة تسمية بدون فهرسة أرقام لموقع البيانات. يمكنه الاحتفاظ بأي قائمة بايثون صحيحة مثل قائمة ، قاموس ، إلخ.

تحميل البيانات من ملف csv

ملف .csv هو ملف قيمة مفصولة بفواصل . طريقة شائعة جدا لتخزين البيانات. لتحميل هذه البيانات في إطار بيانات read_csv ، استخدم الطريقة read_csv :

df = pd.read_csv(file_path)

هنا ، يمكن أن يكون file_path مسارًا محليًا لملف csv على جهاز الكمبيوتر الخاص بك ، أو عنوان url يشير إلى واحد. قد يتم تضمين أسماء الأعمدة في ملف csv ، أو قد يتم تمريرها كوسيطة. لمزيد من المعلومات حول هذا ، وأكثر من ذلك بكثير ، ألق نظرة على الوثائق .

الحصول على لمحة عامة عن إطار البيانات

لإظهار الصفوف القليلة الأولى من إطار البيانات ، تكون طريقة head مفيدة (مرة أخرى يجب أن يبدو هذا مألوفًا لمبرمجي R):

df.head()

سيظهر هذا الصفوف الخمسة الأولى من إطار البيانات.

لعرض أكثر من أول 5 صفوف ، قم ببساطة بوضع عدد الصفوف التي تريد طباعتها داخل طريقة head .

df.head(10)

سيظهر هذا أول 10 صفوف من إطار البيانات.

لإظهار الصفوف القليلة الأخيرة من إطار البيانات ، تكون طريقة tail مفيدة (مرة أخرى يجب أن يبدو هذا مألوفًا لمبرمجي R):

df.tail()

سيظهر هذا آخر 5 صفوف من إطار البيانات.

Subsetting: الحصول على عمود بالاسم

يمكن أن يكون إطار البيانات جزئيًا بعدة طرق. واحد من أبسط هو الحصول على عمود واحد. على سبيل المثال ، إذا كان إطار البيانات df يحتوي على عمود اسمه age ، فيمكننا استخلاصه كما يلي:

ages=df["age"]

معلومات اكثر:

  1. الباندا
  2. read_csv
  3. رئيس