مقالات

معرفی و مقدمه ای بر نرم افزار R در علم داده

معرفی نرم افزار R

مقدمه ای بر نرم افزار (Introduction to R)

نرم افزار R یک زبان برنامه نویسی منبع باز و محیط نرم افزاری برای محاسبات آماری و گرافیکی است.

این نرم افزار یکی از زبانهای اصلی است که توسط دانشمندان داده و آمار شناسان به طور یکسان استفاده می شود. از آنجا که نرم افزار R از رابط خط فرمان استفاده کرده است ، برای برخی از افراد که عادت به استفاده از برنامه های متمرکز بر رابط کاربری گرافیکی مانند SPSS و SAS دارند ، یک منحنی یادگیری تند وجود دارد.

بنابراین پسوندهای «R» مانند RStudio می توانند بسیار سودمند باشند.

از آنجا که نرم افزار R یک برنامه منبع باز است و به صورت رایگان در دسترس است ، دانشگاهیانی که دسترسی آنها به برنامه های آماری از طریق ارتباط آنها با کالج ها یا دانشگاه های مختلف تنظیم می شود ، R می تواند جذابیت زیادی داشته باشد.

نرم افزار R

نصب و راه اندازی(Installation)

اولین کاری که برای شروع کار با نرم افزار R نیاز دارید این است که فایل نسبی آن را با توجه به سیستم عامل خود از سایت رسمی دریافت کنید.

نرم افزار R

ابزارها و بسته های محبوب R- (Popular R Tools and Packages)

 RStudio  یک محیط توسعه یکپارچه (IDE) برای نرم افزارR  است.

 این برنامه شامل یک کنسول ، ویرایشگر برجسته است که از اجرای مستقیم کد ، و همچنین ابزارهایی برای طراحی ، اشکال زدایی و مدیریت فضای کار پشتیبانی می کند.

شبکه آرشیو جامع R (CRAN) منبع اصلی ابزارها و منابع R است.

Tidyverse مجموعه ای منطقی از بسته های R است که برای علم داده مانند  ggplot2 ، dplyr ، readr ، tidyr ، purr ، tibble  طراحی شده است.

نرم افزار R

انواع داده ها در R (Data Types in R)

انواع داده ها در نرم افزار تعریف میشود که در پایین اشاره می شود:

نرم افزار R

ماتریس (Matrix)

این یک مجموعه داده دو بعدی است. اجزای موجود در یک ماتریس نیز باید از همان نوع داده باشند. مثلا:

> m = matrix( c(‘a’,’a’,’b’,’c’,’b’,’a’), nrow = 2, ncol = 3, byrow = TRUE)
> m
>[,1] [,2] [,3]
[۱,] “a” “a” “b”
[۲,] “c” “b” “a”

قاب داده (Data Frame)

عمومیت آن از ماتریس بیشتر است ، زیرا ستونهای مختلف می توانند انواع مختلفی از داده های اساسی را داشته باشند. مثلا:

> d <- c(1,2,3,4)
> e <- c(“red”, “white”, “red”, NA)
> f <- c(TRUE,TRUE,TRUE,FALSE)
> mydata <- data.frame(d,e,f)
> names(mydata) <- c(“ID”,”Color”,”Passed”)
> mydata

لیست ها (Lists)

این یک شی از R  است که می تواند انواع مختلفی از عناصر را مانند بردارها ، توابع و حتی لیست دیگری در داخل خود داشته باشد. مثلا:

> list1 <- list(c(2,5,3),21.3,sin)
> list1
[[۱]]
[۱] ۲ ۵ ۳
[[۲]]
[۱] ۲۱.۳
[[۳]]
function (x) .Primitive(“sin”)

 

توابع در R (Functions)

یک تابع به شما امکان می دهد یک کد قابل استفاده مجدد را تعریف کنید که می تواند بارها در برنامه شما اجرا شود.

توابع را می توان به طور مکرر نامگذاری و فراخوانی کرد یا می توان آنها را در محل خود اجرا کرد (شبیه توابع lambda در پایتون).

توسعه درک کامل توابع R مستلزم درک محیط است. محیط ها به سادگی روشی برای مدیریت اشیا هستند.

 یک مثال از محیط های عملیاتی این است که می توانید از یک نام متغیر اضافی در یک تابع استفاده کنید .

اگر یک تابع متغیری را تعریف کنید که در آن تابع  هیچ متغیری تعریف نشده باشد ، نرم فزارمحیط سطح بالاتر را برای آن متغیر بررسی می کند.

نحو (Syntax)

در R ، تعریف یک تابع دارای ویژگی های زیر است:

  • عملکرد کلمه کلیدی (The keyword function)
  • یک نام تابع (a function name)
  • پارامترهای ورودی (اختیاری) –(input parameters)
  • برخی از کد های برای اجرا (some block of code to execute)
  • بیانیه بازگشت (اختیاری)-( a return statement)

# a function with no parameters or returned values
sayHello() = function(){
“Hello!”
}

sayHello() # calls the function, ‘Hello!’ is printed to the console

# a function with a parameter
helloWithName = function(name){
paste0(“Hello, “, name, “!”)
}

helloWithName(“Ada”) # calls the function, ‘Hello, Ada!’ is printed to the console

# a function with multiple parameters with a return statement
multiply = function(val1, val2){
val1 * val2
}

multiply(3, 5) # prints 15 to the console

توابع بلوکی از کد هستند که به راحتی و با فراخوانی تابع قابل استفاده هستند.

 این امکان استفاده مجدد از کد ساده و ظریف را بدون نوشتن مجدد صریح بخشهای کد فراهم می کند.

این باعث می شود که کد هم خواناتر باشد ، هم اشکال زدایی راحت تر شود و هم خطاهای تایپ را محدود کند.

توابع در R با استفاده از کلمه کلیدی تابع ، همراه با یک نام تابع و پارامترهای عملکرد داخل پرانتز ایجاد می شوند.

تابع Return () می تواند توسط تابع برای بازگرداندن یک مقدار استفاده شود .

 به طور معمول برای خاتمه دادن زودهنگام یک تابع با مقدار برگشتی استفاده می شود.

متناوباً ، تابع مقدار نهایی را برمی گرداند.

# return a value explicitly or simply by printing
sum = function(a, b){
c = a + b
return(c)
}

sum = function(a, b){
a + b
}

result = sum(1, 2)
# result = 3

توابع داخلی در R (In-built functions in R)

R  دارای توابع بسیاری است که می توانید برای انجام کارهای پیچیده مانند نمونه گیری تصادفی از آنها استفاده کنید.

به عنوان مثال ، می توانید یک عدد را با گرد کنید ، یا فاکتوریل آن را با محاسبه کنید.

> round(4.147)
[۱] ۴
> factorial(3)
[۱] ۶
> round(mean(1:6))
[۱] ۴

داده هایی را که به تابع منتقل می کنید آرگومان تابع نامیده می شود.

شما می توانید یک رول از قالب را با عملکرد R () نمونه شبیه سازی کنید. تابع نمونه () دو آرگومان می گیرد: یک بردار به نام x و یک عدد به نام اندازه. مثلا:

> sample(x = 1:4, size = 2)
[] ۴ ۲
> sample(x = die, size = 1)
[] ۳
>dice <- sample(die, size = 2, replace = TRUE)
>dice
[۱] ۲ ۴
>sum(dice)
[۱] ۶

اشیا در R (Objects)

R اجازه می دهد تا داده ها را با ذخیره سازی آنها در داخل یک شی R ذخیره کند.

شی چیست (What’s an object) ؟

این فقط نامی است که می توانید برای فراخوانی داده های ذخیره شده استفاده کنید. به عنوان مثال ، می توانید داده ها را در یک شی مانند a یا b ذخیره کنید.

> a <- 5
> a
[۱] ۵

 

چگونه یک شی در R ایجاد کنیم؟

برای ایجاد یک شی در نرم افزار R ، یک نام انتخاب کنید و سپس از نماد کمتر از <، به دنبال آن علامت منهای ، – استفاده کنید تا داده ها را در آن ذخیره کنید.

 این ترکیب مانند یک پیکان به نظر می رسد ،  <-. R  یک شی make درست می کند ، نام خود را به آن می دهد و هر آنچه را که پیکان است در آن ذخیره می کند.

وقتی از R می پرسید چه چیزی در a است ، در سطر بعدی به شما می گوید. مثلا:

> die <- 1:6
> die
[۱] ۱ ۲ ۳ ۴ ۵ ۶

تقریباً هر چیزی که بخواهید می توانید یک شی را در نرم افزار R نامگذاری کنید ، اما چند قانون وجود دارد.

اول ، یک نام نمی تواند با یک عدد شروع شود.

 دوم ، یک نام نمی تواند از برخی نمادهای خاص مانند ^ ،! ، $ ، @ ، + ، – ، / یا * استفاده شود.

R همچنین به حروف حساس می باشد (یعنی به حروف کوچک و بزرگ حساس است) ، بنابراین name و Name به اشیا different مختلف اشاره می کند.

 

برای دانلود آموزش نرم افزارهای داده کاوی کلیک کنید.


پیام بگذارید

پشتیبانی 24 ساعته آنلاین