معرفی رپیدماینر
رپیدماینر یکی از بهترین ابزارها برای ساخت مدل های یادگیری ماشینی از جمله مدل های یادگیری عمیق است.
بر اساس یک نظرسنجی KDnuggets 2018، RapidMiner در جایگاه دوم ایستاده است و R، Excel و بسیاری از بسته های نرم افزاری شناخته شده دیگر را در فراوانی استفاده در پروژه های واقعی شکست می دهد.
در این مقاله، یاد خواهید گرفت که چگونه اولین مدل رگرسیون و طبقه بندی خود را با استفاده از RapidMiner بسازید.
تنظیم داده ها
برای شروع، مجموعه داده آموزشی House Prices: Advanced Regression Techniques را از Kaggle دانلود کنید.
مجموعه داده دارای 81 ویژگی و 1460 رکورد است. برای تمرکز بر یادگیری ماشین و نه تمیز کردن داده ها، مجموعه داده ای ایجاد کنید که فقط از پنج ویژگی تشکیل شده است: OverallQual، LotArea، Street، GarageArea و SalePrice. این پنج ویژگی در ساخت هر دو مدل رگرسیون و طبقهبندی استفاده خواهد شد.
بارگیری داده ها در RapidMiner
RapidMiner Studio را دانلود کنید.
آن را روی دستگاه خود نصب کنید و ثبت نام کنید. پس از ثبت نام، نرم افزار را باز کنید که کادر محاوره ای زیر را برای شما نمایش می دهد:
مدل خودکار را انتخاب کنید، که شما را به صفحه زیر هدایت می کند:
روی دکمه IMPORT NEW DATA کلیک کنید، که یک کادر محاوره ای جدید باز می شود.
مکان مجموعه داده را انتخاب کنید و بدون تغییر داده، چند بار Next را کلیک کنید.
به عنوان آخرین مرحله، پوشه داده فعلی را انتخاب کنید یا یک پوشه جدید برای آپلود داده ها در رپیدماینر ایجاد کنید.
این شما را به مرحله اول ساخت یک مدل یادگیری ماشین میرساند:
برای خرید لایسنس نرم افزار Tableau کلیک کنید
اولین مدل رگرسیون خود را بسازید
برای ساخت مدل رگرسیون، با کلیک بر روی دکمه پیش بینی شروع کنید، که از شما می خواهد با نمایش پاپ آپ زیر یک ستون هدف را انتخاب کنید:
ستون SalePrice را به عنوان ستون هدف انتخاب کنید و روی Next کلیک کنید.
این شما را به صفحه بعدی، آماده کردن هدف، می برد:
این صفحه هیستوگرام ستون مورد نظر را در اختیار شما قرار می دهد.
روی Next کلیک کنید و در صفحه Select Input قرار خواهید گرفت.
این صفحه اطلاعات مهمی در مورد هر ویژگی مستقل مجموعه داده ارائه می دهد.
یادگیری ماشین در Rapidminer
در تصویر بالا، توجه کنید که RapidMiner قبلاً ویژگی Street را کنار گذاشته و برای ویژگیهای LotArea و GarageArea پاسخ مثبت و برای ویژگی OverQual یک پاسخ خنثی داده است.
میتوانید ویژگیهایی را که با یک نقطه زرد برجسته شدهاند نیز کنار بگذارید.
در این حالت هر سه ویژگی (که با نقاط سبز و زرد مشخص شده اند) ورودی در نظر گرفته می شوند.
روی Next کلیک کنید تا به صفحه بعدی یعنی انواع مدل ها برسید.
اگر از سایر ابزارهای یادگیری ماشین آگاه هستید، ممکن است در تصویر بالا متوجه شوید که رپیدماینر چگونه مدلهای یادگیری ماشینی را با ارائه گزینههایی برای ساخت همه مدلها به طور همزمان ساخته است.
تنها کاری که باید انجام دهید این است که موارد لازم برای پروژه خود را انتخاب کنید.
در این حالت تمام مدل ها انتخاب می شوند.
علاوه بر این، در همان صفحه، چند گزینه مرتبط با آماده سازی داده ها دارید.
در صورت نیاز می توانید آن توابع را اعمال کنید.
پس از تنظیم همه چیز، روی Run کلیک کنید.
پس از ساخت همه مدل ها، صفحه ای شبیه به این مشاهده خواهید کرد:
یادگیری ماشین در Rapidminer
این صفحه نمای کلی یک متریک انتخاب شده را ارائه می دهد (متریک های موجود عبارتند از: ریشه میانگین مربعات خطا، خطای مطلق، خطای نسبی، مربع خطا و همبستگی)، زمان اجرا بر حسب میلی ثانیه، و نشان می دهد که کدام مدل بهترین عملکرد را دارد (نشان نارنجی)، سریعترین کل زمان (شکل چوب دویدن به رنگ آبی)، و سریعترین زمان امتیاز دهی (شکل چوب دویدن به رنگ بنفش).
برای این مجموعه داده، مدل یادگیری عمیق بهترین عملکرد را ارائه کرد.
میتوانید جزئیات کامل مدل، پیشبینی دادهها و موارد دیگر را در منوی کشویی Deep Learning موجود در سمت چپ صفحه نمای کلی مرور کنید.
این دو شکل اهمیت ویژگی ها و نمودار پیش بینی را برای این مجموعه داده نشان می دهد:
در نهایت، می توانید مدل یادگیری عمیق را مستقر کرده و آن را برای استفاده در داده ها آماده کنید.
ساختن اولین مدل طبقه بندی
برای ساخت یک مدل طبقه بندی، اکثر مراحل مشابه ساخت یک مدل رگرسیونی خواهد بود.
برای شروع، همان مجموعه داده با پنج ویژگی را انتخاب کنید و روی Next کلیک کنید.
روی Predict کلیک کنید و ویژگی OverallQual را به عنوان ویژگی هدف خود انتخاب کنید.
در صفحه Prepare Target، متوجه خواهید شد که ویژگی OverQual فقط 10 کلاس دارد که در اعداد صحیح 1 تا 10 پخش شده اند. به طور پیش فرض، رپیدماینر یک مدل رگرسیون ایجاد می کند.
برای جابجایی به سمت طبقه بندی، دکمه زیر هیستوگرام Turn را به Classification تغییر دهید و تعداد کلاس ها را از 2 به 10 تغییر دهید.
پس از تکمیل تمام تغییرات بالا، روی Next کلیک کنید. در صفحه Select Inputs، شما سه ویژگی پشتیبانی و تنها یک ویژگی غیر پشتیبانی دارید.
روی Next کلیک کنید تا به صفحه انواع مدل برسید. از آنجایی که شما در حال ساخت یک مدل طبقه بندی هستید، لیست جدیدی از مدل ها را مطابق شکل زیر دریافت خواهید کرد:
یادگیری ماشین در Rapidminer
شما می توانید هر تعداد مدل را از این لیست انتخاب کنید.
در حال حاضر، همه مدل ها انتخاب شده اند.
شما همچنین یک ستون آماده سازی داده دارید، شبیه به سناریوی رگرسیون. روی Run کلیک کنید و زمانی که همه مدل ها ساخته شدند، این نمای کلی را مشاهده خواهید کرد.
برای این مجموعه داده، مدل یادگیری عمیق دوباره بهترین عملکرد را دارد و همچنین بهترین سود را ارائه میکند (نماد علامت دلار نارنجی). وزن های مرتبط با هر ویژگی در زیر نشان داده شده است:
میتوانید این یا مدلهای دیگر را در صورت نیاز بهینه کنید.
نتیجه
رپیدماینر به شما کمک میکند تا مدلهای پیشبینیکننده متعددی را تنها با چند کلیک بسازید و در نتیجه برتری بیشتری نسبت به سایر زبانهای یادگیری ماشینی مانند Python و R دارد.
میتوانید از RapidMiner برای آزمایش سریع مدلهای رایج در مجموعه دادههای خود استفاده کنید و بعداً بهترین مدل را سفارشی کنید.
دوره آموزشی هوش تجاری با Tableau »کلیک کنید« و هوش تجاری با Power BI »کلیک کنید« یک برنامه جامع است که بر توسعه مهارت در تجزیه و تحلیل دادهها، تجسم و گزارش سازی و گزارش دهی و دشبوردسازی با استفاده از این ابزارها تمرکز دارد.
سپاسگذاریم از وقتی که برای خواندن این مقاله گذاشتید
.
برای خرید لایسنس نرم افزار Power BI کلیک کنید
.
برای مشاهده ویدیوهای آموزشی داده کاوی و هوش تجاری ما را در شبکه های اجتماعی دنبال کنید
Youtube Chanel :VISTA Data Mining
Aparat Chanel: VISTA Data Mining
Instagram Chanel: VISTA Data Mining
Telegram Chanel: VISTA Data Mining