Pandas DataFrame ساختار داده ای جداولی دارای ابعاد قابل تغییر و ابعاد دو بعدی و دارای محورهای برچسب خورده (ردیف ها و ستون ها) است.
فریم داده یک ساختار داده ای دو بعدی است ، یعنی داده ها به صورت جدول در سطرها و ستون ها تراز می شوند.
DataFrame از سه ملفه اصلی ، داده ها ، سطرها و ستون ها تشکیل شده است.
ما بینشی مختصر در مورد همه این عملیات اساسی خواهیم داشت که می تواند در Pandas DataFrame انجام شود:
برخورد با ردیف ها و ستون ها
نمایه سازی و انتخاب داده ها
کار با داده های از دست رفته
برخورد داده های تکرار روی سطرها و ستون ها
ایجاد Pandas DataFrame :
در دنیای واقعی ، با بارگذاری مجموعه داده ها از حافظه موجود ، یک Pandas DataFrame ایجاد می شود ، فضای ذخیره سازی می تواند پایگاه داده SQL، پرونده CSV و فایل اکسل باشد.
Pandas DataFrame را می توان از لیست ها ، فرهنگ لغت و از لیست فرهنگ لغت ها و غیره ایجاد کرد.
ایجاد یک لیست با استفاده از Pandas:
DataFrame را می توان با استفاده از یک لیست واحد یا لیستی از لیست ها ایجاد کرد.
به منظور انتخاب یک ردیف با استفاده از .loc [] ، یک برچسب ردیف واحد را در یک تابع .loc قرار می دهیم.
Output:
کتابخانه Pandas در پایتون
نمایه سازی DataFrame با استفاده از .iloc []:
این عملکرد به ما امکان می دهد ردیف ها و ستون ها را براساس موقعیت بازیابی کنیم.
برای انجام این کار ، باید موقعیت های ردیف مورد نظر و ستون هایی را که می خواهیم نیز مشخص کنیم.
نمایه کننده df.iloc شباهت زیادی به df.loc دارد اما فقط از مکانهای عدد صحیح برای انتخاب خود استفاده می کند.
انتخاب یک ردیف واحد
به منظور انتخاب یک ردیف واحد با استفاده از .iloc [] ، می توانیم یک عدد صحیح را به تابع .iloc [] منتقل کنیم.
Output:
کار با داده های از دست رفته
وقتی اطلاعاتی برای یک یا چند مورد یا برای یک واحد کامل ارائه نشود ، داده های گمشده ممکن است رخ دهد. Missing Data یک مشکل بسیار بزرگ در سناریوی زندگی واقعی است. Data Missing همچنین می تواند به عنوان مقادیر NA (موجود نیست) در Pandas باشد.
بررسی مقادیر از دست رفته با استفاده از isnull () و notnull ():
به منظور بررسی مقادیر از دست رفته در Pandas DataFrame ، از یک تابع isnull () و notnull () استفاده می کنیم.
هر دو عملکرد در بررسی اینکه Na یک مقدار است یا خیر کمک می کند.
این تابع همچنین می تواند در سری Pandas به منظور یافتن مقادیر صفر در یک سری استفاده شود.
Output:
پر کردن مقادیر از دست رفته با استفاده از fillna () ، change () و interplates ():
به منظور پر کردن مقادیر خالی در مجموعه داده ها ، ما از تابع fillna () ، () جایگزین () و interpolate () استفاده می کنیم که این تابع مقادیر NaN را با مقداری از ارزش خود تعویض می کنند.
همه این عملکردها به پر کردن مقادیر خالی در مجموعه داده های DataFrame کمک می کنند.
تابع () اینترپلات اساساً برای پر کردن مقادیر NA در چارچوب داده مورد استفاده قرار می گیرد اما از تکنیک مختلف درون یابی برای پر کردن مقادیر از دست رفته به جای رمزگذاری صحیح مقدار استفاده می کند.
Output:
کتابخانه Pandas در پایتون
حذف مقادیر از دست رفته با استفاده از dropna ():
به منظور انداختن مقادیر خالی از یک فریم داده ، ما از تابع dropna () به روشهای مختلف از ردیفها / ستونهای مجموعه داده با مقادیر Null استفاده می کنیم.
پیام بگذارید