فرایند داده کاوی در R

  • خانه
  • فرایند داده کاوی در R

[vc_row row_height_type=”fixed_height_screen” height=”100″ min_height=”500″ nav_skin=”light” consent_include=”include” el_design=”{“desktop“:{“padding-top“:“45“,“padding-bottom“:“45“}}” custom_bg_color=”{“solid“:{“id“:“Light background“,“color“:“#f7f8fd“}}”][vc_column el_design=”{“desktop“:{“padding-top“:“45“,“padding-right“:“15“,“padding-bottom“:“0“,“padding-left“:“15“}}” width=”1/2″ css_animation=””][vc_empty_space height=”120px”][vc_content_box style=”style_custom” shadow=”big_shadow” shadow_hover=”no_shadow” overflow=”” el_design=”{“desktop“:{“padding-top“:“45“,“padding-right“:“45“,“padding-bottom“:“45“,“padding-left“:“45“}}” border_hover=”default” width=”400″ equal_height=”” alignment=”align_right” vertical_align=”horizontal_align=” horizontal_align=”” css_animation=”wtbx-anim-bottom-to-top-small” css_animation_easing=”wtbx_easing-natural” css_animation_duration=”wtbx-duration-1000″ css_animation_delay=”” bg_color=”{“solid“:{“id“:“custom_color“,“color“:“rgba(255,255,255,1)“}}”][vc_icon size=”40px” cont_size=”1em” css_animation=”” icon=”{“font“:“fontawesome“,“icon“:“fa fa-quote-left“}” icon_color=”{“solid“:{“id“:“Main accent color“,“color“:“#8571ea“}}”][vc_text_element typography=”{“variants“:“400_italic“,“font_size“:“17px“}” css_animation=””]

  • مدت دوره: ۳۲ ساعت
  • مخاطب دوره: دانشجویان، پژوهشگران و متخصصان علاقه‌مند به حوزه داده
  • دوره های پیش نیاز: داده کاوی در SPSS Modeler ، تحلیل آماری در SPSS Statistics
  • مدرسین دوره: شبنم فیروز
  • مکان برگزاری کلاس: در شرکت همکار گروه داده کاوی دایکه

[/vc_text_element][vc_empty_space height=”15px”][vc_text_element typography=”{“variants“:“700“,“font_size“:“14px“}” css_animation=”” color=”{“id“:“Dark color“,“color“:“#151221“}”]- VstaCompany[/vc_text_element][/vc_content_box][/vc_column][vc_column el_design=”{“desktop“:{“padding-top“:“100“,“padding-right“:“15“,“padding-bottom“:“15“,“padding-left“:“15“}}” width=”1/2″ css_animation=””][vc_image_element image=”10671″ size_type=”fixed” alignment=”center” preloader=”” css_animation=””][/vc_column][/vc_row][vc_section nav_skin=”light”][vc_row nav_skin=”light” consent_include=”include”][vc_column css_animation=””][vc_list_item style=”style_2″ skin=”light” css_animation=””]

  • دستاورد دوره

    طی این دوره دانشجویان با اصول برنامه نویسی در R آشنا شده و قادر خواهند بود مراحل پاکسازی و آماده سازی داده ها به همراه ساخت مدل های پیش بینانه و اکتشافی را در این محیط اجرا نمایند. محتوای دوره بطور کلی دارای دو بخش اصلی می باشد. در بخش اول، ابتدا مفاهیم و استاندارد های اجرایی داده کاوی مورد بحث قرار گرفته و با ارائه مثال های موردی از برخی پروژه های اجرایی سعی در ایجاد درک درست از مراحل اجرا و نوع خروجی های حاصل از داده کاوی می گردد. در ادامه به آموزش برنامه نویسی در محیط R و نحوه نوشتن برنامه و تابع نویسی در آن پرداخته می شود تا توانایی نسبی جهت استفاده از این زبان برنامه نویسی در حوزه علوم داده کسب گردد. در بخش دوم نیز به صورت عملی و پرکتیکال، مفاهیم و تکنیک های داده کاوی و چگونگی استفاده از کتابخانه های مفید برای حل انواع مسائل داده کاوی ارائه می گردد.

    محتوای دوره

     بخش اول: مقدمات و برنامه نویسی به زبان R  

    این بخش از دوره برای آشنایی و کسب مهارت برنامه نویسی در محیط R و همینطور الزامات و پیش نیازهای لازم جهت ورود به بخش دوم (فرآیند داده کاوی در R) می باشد.

    آشنایی با داده کاوی

    • مروری بر وظایف داده کاوی
    • فرآیند داده کاوی DM-CRISP

    آشنایی با R و چگونگی برنامه نویسی با آن

    • مقدمه ای بر R
    • انواع داده ها در R
    • خواندن و نوشتن داده ها در R
    • نوشتن توابع
    • عیب یابی برنامه

    شناسایی و آماده سازی داده ها

    • تغییر، ساخت و تبدیل داده ها
    • انواع آزمون فرض
    • خلاصه سازی
    • Boot-Strapping
    • رسم انواع نمودار در R
    • کاهش ابعاد: انتخاب متغیرهای موثر، PCA

    بخش دوم: پیاده سازی  فرایند داده کاوی در R

    این بخش از دوره کاملا بصورت عملی و پرکتیکال بوده و توانایی نسبی در برنامه نویسی R و همچنین آشنایی با مفاهیم و الگوریتم های داده کاوی برای شرکت در آن ضروری می باشد.

    مدل سازی پیش بینانه و ارزیابی آنها

    • مدل های پیش بینانه
      • ​​درخت های تصمیم و رگرسیونی
      • شبکه های عصبی مصنوعی
      • الگوریتم K-NN
    • مدل پیش بینی سری زمانی ARIMA در R
    • ​مدل های تجمیعی
      • ​​روش های Bagging و Boosting و..
      • الگوریتم XGBoost
      • ارزیابی مدل ها (Cross Validation, Hold Out)

    مدل های بدون راهنما

    • ​خوشه بندی یا Clustering
      • ​خوشه بندی سلسله مراتبی
      • ​الگوریتم K-Means
      • ​روش های Anomaly Detection
    • قوانین پیوند
      • الگوریتم Appriori

    کاربردهای خاص داده کاوی در R

    • جمع آوری داده از وب (Data Crawling)
    • متن کاوی در R
    • آشنایی با نظرکاوی یا تحلیل احساس (Sentiment Analysis)

[/vc_list_item][/vc_column][/vc_row][/vc_section]