همه دسته بندی ها
Machine Learning in RapidMiner - VISTA

یادگیری ماشین در Rapidminer «رپیدماینر»

معرفی رپیدماینر

رپیدماینر یکی از بهترین ابزارها برای ساخت مدل های یادگیری ماشینی از جمله مدل های یادگیری عمیق است.

بر اساس یک نظرسنجی KDnuggets 2018، RapidMiner در جایگاه دوم ایستاده است و R، Excel و بسیاری از بسته های نرم افزاری شناخته شده دیگر را در فراوانی استفاده در پروژه های واقعی شکست می دهد.

در این مقاله، یاد خواهید گرفت که چگونه اولین مدل رگرسیون و طبقه بندی خود را با استفاده از RapidMiner بسازید.

 

تنظیم داده ها

برای شروع، مجموعه داده آموزشی House Prices: Advanced Regression Techniques را از Kaggle دانلود کنید.

مجموعه داده دارای 81 ویژگی و 1460 رکورد است. برای تمرکز بر یادگیری ماشین و نه تمیز کردن داده ها، مجموعه داده ای ایجاد کنید که فقط از پنج ویژگی تشکیل شده است: OverallQual، LotArea، Street، GarageArea و SalePrice. این پنج ویژگی در ساخت هر دو مدل رگرسیون و طبقه‌بندی استفاده خواهد شد.

 

بارگیری داده ها در RapidMiner

RapidMiner Studio را دانلود کنید.

آن را روی دستگاه خود نصب کنید و ثبت نام کنید. پس از ثبت نام، نرم افزار را باز کنید که کادر محاوره ای زیر را برای شما نمایش می دهد:

 

Machine Learning in RapidMiner - VISTA

 

مدل خودکار را انتخاب کنید، که شما را به صفحه زیر هدایت می کند:

 

Machine Learning in RapidMiner - VISTA

روی دکمه IMPORT NEW DATA کلیک کنید، که یک کادر محاوره ای جدید باز می شود.

مکان مجموعه داده را انتخاب کنید و بدون تغییر داده، چند بار Next را کلیک کنید.

به عنوان آخرین مرحله، پوشه داده فعلی را انتخاب کنید یا یک پوشه جدید برای آپلود داده ها در رپیدماینر ایجاد کنید.

این شما را به مرحله اول ساخت یک مدل یادگیری ماشین می‌رساند:

برای خرید لایسنس نرم افزار Tableau کلیک کنید

 

Machine Learning in RapidMiner - VISTA

 

اولین مدل رگرسیون خود را بسازید

برای ساخت مدل رگرسیون، با کلیک بر روی دکمه پیش بینی شروع کنید، که از شما می خواهد با نمایش پاپ آپ زیر یک ستون هدف را انتخاب کنید:

Machine Learning in RapidMiner - VISTA

 

ستون SalePrice را به عنوان ستون هدف انتخاب کنید و روی Next کلیک کنید.

این شما را به صفحه بعدی، آماده کردن هدف، می برد:

 

Machine Learning in RapidMiner - VISTA

این صفحه هیستوگرام ستون مورد نظر را در اختیار شما قرار می دهد.

روی Next کلیک کنید و در صفحه Select Input قرار خواهید گرفت.

این صفحه اطلاعات مهمی در مورد هر ویژگی مستقل مجموعه داده ارائه می دهد.

Machine Learning in RapidMiner - VISTA

یادگیری ماشین در Rapidminer

در تصویر بالا، توجه کنید که RapidMiner قبلاً ویژگی Street را کنار گذاشته و برای ویژگی‌های LotArea و GarageArea پاسخ مثبت و برای ویژگی OverQual یک پاسخ خنثی داده است.

می‌توانید ویژگی‌هایی را که با یک نقطه زرد برجسته شده‌اند نیز کنار بگذارید.

در این حالت هر سه ویژگی (که با نقاط سبز و زرد مشخص شده اند) ورودی در نظر گرفته می شوند.

روی Next کلیک کنید تا به صفحه بعدی یعنی انواع مدل ها برسید.

 

Machine Learning in RapidMiner - VISTA

اگر از سایر ابزارهای یادگیری ماشین آگاه هستید، ممکن است در تصویر بالا متوجه شوید که رپیدماینر چگونه مدل‌های یادگیری ماشینی را با ارائه گزینه‌هایی برای ساخت همه مدل‌ها به طور همزمان ساخته است.

تنها کاری که باید انجام دهید این است که موارد لازم برای پروژه خود را انتخاب کنید.

در این حالت تمام مدل ها انتخاب می شوند.

علاوه بر این، در همان صفحه، چند گزینه مرتبط با آماده سازی داده ها دارید.

در صورت نیاز می توانید آن توابع را اعمال کنید.

پس از تنظیم همه چیز، روی Run کلیک کنید.

پس از ساخت همه مدل ها، صفحه ای شبیه به این مشاهده خواهید کرد:

Machine Learning in RapidMiner - VISTA

یادگیری ماشین در Rapidminer

این صفحه نمای کلی یک متریک انتخاب شده را ارائه می دهد (متریک های موجود عبارتند از: ریشه میانگین مربعات خطا، خطای مطلق، خطای نسبی، مربع خطا و همبستگی)، زمان اجرا بر حسب میلی ثانیه، و نشان می دهد که کدام مدل بهترین عملکرد را دارد (نشان نارنجی)، سریعترین کل زمان (شکل چوب دویدن به رنگ آبی)، و سریعترین زمان امتیاز دهی (شکل چوب دویدن به رنگ بنفش).

برای این مجموعه داده، مدل یادگیری عمیق بهترین عملکرد را ارائه کرد.

می‌توانید جزئیات کامل مدل، پیش‌بینی داده‌ها و موارد دیگر را در منوی کشویی Deep Learning موجود در سمت چپ صفحه نمای کلی مرور کنید.

این دو شکل اهمیت ویژگی ها و نمودار پیش بینی را برای این مجموعه داده نشان می دهد:

Machine Learning in RapidMiner - VISTA

Machine Learning in RapidMiner - VISTA

 

در نهایت، می توانید مدل یادگیری عمیق را مستقر کرده و آن را برای استفاده در داده ها آماده کنید.

 

ساختن اولین مدل طبقه بندی

برای ساخت یک مدل طبقه بندی، اکثر مراحل مشابه ساخت یک مدل رگرسیونی خواهد بود.

برای شروع، همان مجموعه داده با پنج ویژگی را انتخاب کنید و روی Next کلیک کنید.

روی Predict کلیک کنید و ویژگی OverallQual را به عنوان ویژگی هدف خود انتخاب کنید.

در صفحه Prepare Target، متوجه خواهید شد که ویژگی OverQual فقط 10 کلاس دارد که در اعداد صحیح 1 تا 10 پخش شده اند. به طور پیش فرض، رپیدماینر یک مدل رگرسیون ایجاد می کند.

برای جابجایی به سمت طبقه بندی، دکمه زیر هیستوگرام Turn را به Classification تغییر دهید و تعداد کلاس ها را از 2 به 10 تغییر دهید.

Machine Learning in RapidMiner - VISTA

 

پس از تکمیل تمام تغییرات بالا، روی Next کلیک کنید. در صفحه Select Inputs، شما سه ویژگی پشتیبانی و تنها یک ویژگی غیر پشتیبانی دارید.

Machine Learning in RapidMiner - VISTA

 

روی Next کلیک کنید تا به صفحه انواع مدل برسید. از آنجایی که شما در حال ساخت یک مدل طبقه بندی هستید، لیست جدیدی از مدل ها را مطابق شکل زیر دریافت خواهید کرد:

Machine Learning in RapidMiner - VISTA

یادگیری ماشین در Rapidminer

شما می توانید هر تعداد مدل را از این لیست انتخاب کنید.

در حال حاضر، همه مدل ها انتخاب شده اند.

شما همچنین یک ستون آماده سازی داده دارید، شبیه به سناریوی رگرسیون. روی Run کلیک کنید و زمانی که همه مدل ها ساخته شدند، این نمای کلی را مشاهده خواهید کرد.

 

Machine Learning in RapidMiner - VISTA

برای این مجموعه داده، مدل یادگیری عمیق دوباره بهترین عملکرد را دارد و همچنین بهترین سود را ارائه می‌کند (نماد علامت دلار نارنجی). وزن های مرتبط با هر ویژگی در زیر نشان داده شده است:

Machine Learning in RapidMiner - VISTA

 

می‌توانید این یا مدل‌های دیگر را در صورت نیاز بهینه کنید.

 

نتیجه

رپیدماینر به شما کمک می‌کند تا مدل‌های پیش‌بینی‌کننده متعددی را تنها با چند کلیک بسازید و در نتیجه برتری بیشتری نسبت به سایر زبان‌های یادگیری ماشینی مانند Python و R دارد.

می‌توانید از RapidMiner برای آزمایش سریع مدل‌های رایج در مجموعه داده‌های خود استفاده کنید و بعداً بهترین مدل را سفارشی کنید.

 

دوره آموزشی هوش تجاری با Tableau »کلیک کنید« و  هوش تجاری با Power BI »کلیک کنید« یک برنامه جامع است که بر توسعه مهارت در تجزیه‌ و تحلیل داده‌ها، تجسم و گزارش سازی و گزارش دهی و دشبوردسازی با استفاده از این ابزارها  تمرکز دارد.

سپاسگذاریم از وقتی که برای خواندن این مقاله گذاشتید

.

برای خرید لایسنس نرم افزار Power BI کلیک کنید

.

برای مشاهده ویدیوهای آموزشی داده کاوی و هوش تجاری ما را در شبکه های اجتماعی دنبال کنید

Youtube Chanel :VISTA Data Mining کانال یوتیوب

Aparat Chanel: VISTA Data Mining کانال آپارات

Instagram Chanel: VISTA Data Mining کانال اینستاگرام

Telegram Chanel: VISTA Data Mining کانال تلگرام

Linkedin Chanel: VISTA Company کانال لینکدین

 

امتیاز دهید

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

سبد خرید
ورود

هنوز حساب کاربری ندارید؟

خانه
0 محصول سبد خرید
0 علاقه مندی
حساب کاربری من