1 Bilgisayarımıza nasıl R kurarız?
- 1.1 1. Yöntem: RStudio ile R kullanımı
- 1.2 2. Yöntem: Anaconda üzerinden kurulum yaparak Jupyter Notebook ile kullanmak
2 Temel operasyonlar
3 Değişken tanımlama kuralları
4 Vektörler
- 4.1 Vektörlerin her bir elemanına isim verilebilir
- 4.2 Nümerik vektörler üzerinde çeşitli işlemler
5 Matrisler
6 Faktör (Factors)
- 6.1 Sıralı faktör
7 DataFrame
8 Lists (Listeler)

Temel R kullanımı¶

Evet, dataFLOYD olarak R programlama dilini de ihmal etmek istemiyoruz. Bu yazımızla bir başlangıç verelim gerisi gelir herhalde :) Lafı uzatmadan hemen konumuza başlayalım

# hemen başlıyoruz koda :)
# şaka şaka resmi html içine gömmek için yapıyoruz bunu
library("IRdisplay")
display_png(file="r_basicslogo.png")

Bilgisayarımıza nasıl R kurarız?¶

Başlamadan önce bilgisayarınıza ilk kez R kuracaksanız aşağıdaki yöntemleri kullanabilirsiniz.

1. Yöntem: RStudio ile `R` kullanımı¶

Öncelikle aşağıdaki bağlantıdan işletim sisteminize uygun olan R paketini indirin ve bilgisayarınıza kurulumu gerçekleştirin.

https://cran.r-project.org/

Rstudio Desktop programını indirin. "Open Source License" versiyonunu kullanın. Bilgisayarınıza kurulum yapın

https://www.rstudio.com/products/rstudio/download/

RStudio programını kullanarak R alemlerine akabilirsiniz artık tebrikler!

2. Yöntem: Anaconda üzerinden kurulum yaparak Jupyter Notebook ile kullanmak¶

Bilgisayarınızda Anaconda yoksa ilk önce bunu kurmalısınız. Python 3.x versiyonunu tercih etmenizi tavsiye ederim.

https://www.anaconda.com/distribution/#download-section

Anaconda kurulumu sonrası "Anaconda Prompt" uygulamasını açınız ve aşağıdaki komutu yazarak R için yeni bir ortam oluşturun

conda create -n mro_env r-essentials mro-base

Komut sonrası kurulum biraz vakit alabilir sabırlı olun:)

Herşey tamamlanınca yine "Anaconda Prompt" uygulamasında oluşturduğumuz ortama geçiş yapın.

conda activate mro_env

Sonrasında yine "Anaconda Prompt"ta aşağıdaki komutu giriyoruz ve "browser"da "Jupyter" açılıyor

jupyter notebook

Burada "New" kısmına basın, R seçin ve artık hazırsınız!

Temel operasyonlar¶

Temel operasyonlar her dilde hemen hemen aynıdır. 4 işleme bakalım

R dilinde "comment" ekleme # ile yapılır

# Toplama
42 + 42
# Çıkarma
42-12
# Çarpma
2 * 2
# Bölme
12 / 5
# Üs alma
5^3
# Mod alma
13 %% 3

Değişken tanımlama kuralları¶

Değişken tanımlanırken aşağıdaki kurallara dikkat edilir

Değişkenlerde harf, rakam ve ., _ bulunabilir.
- Örnek: elma, armut20, benim.degiskenim, bu_da_olur, Büyük.Harf
Değişkenler bir harf veya . le başlamalı. Eğer . ile başlarsa bunun ardından bir rakam gelemez
- Örnek: .degisken, r2d2
Bazı reserved kelimeler değişken ismi olarak kullanılamaz
- Örnek: TRUE, NULL, NaN değişken olarak kullanılamaz

Şimdi bu R dilinde bir değişkene değer atama (assignment) dediğimiz olay biraz değişiktir. Python gibi bir dil kullanıyorsanız genellikle değişkene değer atamak için = kullanılır biliyorsunuz.

Ama R dilinde genel kabul edilen kullanım <- şeklindedir. = operatörü de çalışır, fakat R kullanıyorsanız <- kullanın lütfen, daha havalı olur :)

a <- 3*3
a

# = operatörü de çalışır ama bunu kullanmayı tavsiye etmem
a = 3*3
a

a <- 3
b <- 2
c <- a +b
c

string¶

ilk_str <- "Merhaba dünya!"
ilk_str

logical¶

asd <- TRUE
qwe <- FALSE
asd
qwe

Değişkenlerin tiplerini öğrenmek¶

Bu amaçla class fonksiyonu kullanılır.

x <- 3.14
class(x)
y <- "pi"
class(y)
z <- FALSE
class(z)

Vektörler¶

R kullanacaksanız vektörleri mutlaka bilmeniz gerekir. c() fonksiyonu kullanılarak vektör oluşturulur. Vektörler sayı olabileceği gibi başka tiplerden de oluşabilirler

# Nümerik
a <- c(1,2,3)
a
# string
b <- c("bir","iki","üç")
b

Vektörlerin her bir elemanına isim verilebilir¶

names() fonksiyonu kullanılarak bu işlem gerçekleştirilebilir.

a <- c(10,20,30)
isimler <- c("Elma","Armut","Portakal")
names(a) <- isimler
a
# İsimlemdirilmiş alanlara erişim
a["Elma"]

Nümerik vektörler üzerinde çeşitli işlemler¶

İşlemler eleman bazında yapılmaktadır.

İki vektörü eleman bazında toplamak, çarpmak, çıkarmak vb..

a <- c(10,20,30)
b <- c(1,2,3)
a+b
a*b
a^b

# Boyutlar tutmazsa hata (error) vermez
# kısa olan vektörü ilk elemanından başlayarak 
# diğerinin boyutuna yetişecek şekilde tamamlar
a <- c(10,20,30)
b <- c(1,2,3,4)
a+b

Warning message in a + b:
"uzun olan nesne uzunluğu kısa olan nesne uzunluğunun bir katı değil "

Bir vektörün elemanlarının toplamı ve ortalaması

Toplama için sum() ve ortalama için mean() fonksiyonları kullanılır.

a <- c(1,1,2,3,5,8)
sum(a)
mean(a)

İki vektörü karşılaştırma

a <- c(1,1,2,3,5,8)
b <- c(3,3,3,0,0,0)
a<b
# a'nın b'den küçük elemanları için TRUE, 
# diğerleri için FALSE olan bir vektör döndürür

Vektörün elemanlarına erişim

R programlama dilinde indeksler 1'den başlar. İstediğimiz elemana erişmek için [] kullanılır

a <- c(1,2,3,4,5)
a[1]
a[5]

İndekslemeyi vektör olarak da yapabiliriz, bunun için bir vektör oluşturmamız gerekiyor. Yani bir serinin 1. ,3. ve 5. elemanına erişmek istersek bir vektör kullanmamız lazım

a <- c(1,2,3,4,5)
# a vektörünün 1,3,5 elemanlarına erişmek için
a[c(1,3,5)]

Kesit (Slice) alma

Mesela a değişkeninin 2. elemanından 4. elemanına erişmek istersek a[2:4] kullanılır

a <- c(1,2,3,4,5)
# a vektörünün 1,3,5 elemanlarına erişmek için
a[2:4]

Matrisler¶

Matrisler iki boyutlu vektörlerdir bildiğiniz gibi. Matris yaratmak için matrix() fonksiyonunu kullanırız.

# Bu fonksiyonu çağırdığınızda
# 1:9 1'den 9'a kadar bir vektör yaratır
# nrow: Bu vektörü 3 satıra böler 
matrix(1:9,nrow=3)

# Vektörün sıralamasını satır bazında yapmak istersek
# byrow=TRUE yapmamız gerekir
matrix(1:9,nrow=3,byrow=TRUE)

# Matrislerin satır ve sütunlarına isim verilebilir
a <- matrix(1:9,nrow=3,byrow=TRUE)
colnames(a) <- c("col1","col2","col3")
rownames(a) <- c("row1","row2","row3")
a

# isimlendirme yaparsak erişim için bunu da kullanabiliriz
a["row1","col2"]

Satır ve sütun toplamlarının alınması

a <- matrix(1:9,nrow=3,byrow=TRUE)
# satır bazında toplam
rowSums(a)
# Burada kafanız karışmasın sadece vektörü yatay olarak gösterdi 

# sütun bazında toplam
colSums(a)

Bir matrise vektör/matris ekleme cbind() ve rbind()

a <- matrix(1:9,nrow=3,byrow=TRUE)
a

cbind(a,c(10,11,12))

rbind(a,c(10,11,12))

# iki matrisi birbirine ekleme
b <- matrix(11:19,nrow=3,byrow=TRUE)
cbind(a,b)

Matrislerden kesit alma

a <- matrix(1:9,nrow=3,byrow=TRUE)
a
# a matrisinden kesit
a[2:3,2:3]

# a matrisinin ilk sütunu
a[,1]

# a matrisinin ilk satırı
a[1,]

Faktör (Factors)¶

Dikkatinizi istiyorum burada, eğer kategorik bir değişken yaratmak istiyorsanız (örneğin Kadın Erkek gibi) factors() fonksiyonunu kullanılırız.

a <- c("K","E","E","K","K")
class(a)
b <- factor(a)
class(b)

Peki neden yaptık bunu? Şimdi yukarıdaki örnekteki b değişkenini biraz daha inceleyelim. levels() fonksiyonunu kullanalım.

levels(b)

Gördüğünüz gibi iki adet seviye mevcut. İstersek bunların isimlerini de değiştirebiliriz.

levels(b) <- c("Kadın","Erkek")
b

Özet yapma kabiliyeti de var bu değişkenlerin. summary() kullanmamız lazım.

summary(b)

Sıralı faktör¶

Faktörleri sıralı halde yapabiliriz. summary() fonksiyonu ile özet yaparsak farkı anlayabiliriz.

hiz <- c("iki","üç","bir","bir","üç")
a <- factor(hiz,ordered=TRUE,levels=c("bir","iki","üç"))
summary(a)

Sıralı olmasının bir güzelliği de karşılaştırma yapabilmemizdir. Mesela a nın ilk elemanı ile ikinci elemanını karşılaştıralım.

a[1] > a [2]
# yukarıda sıralı faktörü bir, iki, üç olarak 
# tanımladığımız için ve a[1] = "iki" a[2] = "üç"
# olduğu için sonuç FALSE çıkacak

DataFrame¶

Geldik en önemli veri yapısı olan dataframe'e. dataframei bir "excel" tablosu olarak düşünebiliriz. Yani satırlar ve sütunlar mevcut. Her bir satır bir gözlemi her bir sütunda bir değişkeni belirtiyor.

R içerisinde gömülü olan örnek dataframe yapıları var. Bunlardan mtcars'a bakalım

mtcars

Bir verinin dataframe yapısında olmasının birçok avantajı var. Bunları tek tek anlatmak yerine örneklerle gidelim

head() ve str() (structure) fonksiyonları

# ilk örneklerini göstermek istersek
# n kaç tane örnek gösterileceğini belirtir
head(mtcars,n=3)

# Değişkenler hakkında bilgi verir
str(mtcars)

'data.frame':	32 obs. of  11 variables:
 $ mpg : num  21 21 22.8 21.4 18.7 18.1 14.3 24.4 22.8 19.2 ...
 $ cyl : num  6 6 4 6 8 6 8 4 4 6 ...
 $ disp: num  160 160 108 258 360 ...
 $ hp  : num  110 110 93 110 175 105 245 62 95 123 ...
 $ drat: num  3.9 3.9 3.85 3.08 3.15 2.76 3.21 3.69 3.92 3.92 ...
 $ wt  : num  2.62 2.88 2.32 3.21 3.44 ...
 $ qsec: num  16.5 17 18.6 19.4 17 ...
 $ vs  : num  0 0 1 1 0 1 0 1 1 1 ...
 $ am  : num  1 1 1 0 0 0 0 0 0 0 ...
 $ gear: num  4 4 4 3 3 3 3 4 4 4 ...
 $ carb: num  4 4 1 1 2 1 4 2 2 4 ...

datafame nasıl oluşturulur?

Hazır veri seti kullanmak kolay diyorsunuz sanırım :) Sıfırdan bir tane yapalım isterseniz. data.frame ile hazırlıyoruz.

isim <- c("Ali","Ahmet","Ayşe","Ayla")
boy <- c(183,172,165,190)
cinsiyet <- c("E","E","K","K")
kilo <- c(90.1,70.4,55.3,65.8)
kisiler <- data.frame(isim,boy,cinsiyet,kilo)
kisiler
str(kisiler)

'data.frame':	4 obs. of  4 variables:
 $ isim    : Factor w/ 4 levels "Ahmet","Ali",..: 2 1 4 3
 $ boy     : num  183 172 165 190
 $ cinsiyet: Factor w/ 2 levels "E","K": 1 1 2 2
 $ kilo    : num  90.1 70.4 55.3 65.8

Dikkat ederseniz bazı değişkenleri otomatik olarak factor haline çevrilmiştir.

dataframe yapısında matrislerde olduğu gibi kesit alma yapabiliriz

mtcars[1,]

mtcars[,1]

mtcars[3:5,4:6]

Doğrudan sütun isimlerini de yazarak erişim veriye gerçekleştirebiliriz. İkili sütun örneği yapalım.

kisiler[2:3,c("kilo","boy")]

Genellikle değişkenlere (sütunlara) erişim gerçekleştirmek için $ işareti kullanılır.

kisiler$boy

dataframe yapılarında koşullu seçim nasıl yapılır?

Örneğin hazırladığımız "kisiler" verisetinde boyu 175 altı olanları bulalım

# bu bir logical seri döndürür
kisiler$boy<175

# bu seriyi satır kısmına veriyoruz sütunların hepsini alıyoruz
# kisiler[--satırlar-- ,--sütunlar--]
kisiler[kisiler$boy<175,]

Boyu 175 altı ve kilosu 60 üstü olanları bulalım. Burada & (ve) operatörü kullanalım.

kisiler[kisiler$boy<175 & kisiler$kilo>60,]

Koşullu seçim yapmak için subset fonksiyonunu da kullanabiliriz.

subset(kisiler,boy<175)

order() fonksiyonu sıralama yapmak için kullanılabilir.

order(kisiler$boy)

# order() sonucunu yine satır kısmına 
# verirsek veri yapısını sıralayabiliriz.
kisiler[order(kisiler$boy),]

# Büyükten küçüğe sıralamak istersek
kisiler[order(kisiler$kilo,decreasing = TRUE),]

Lists (Listeler)¶

Listeler genel tanımları itibariyle içine her türlü nesneyi atabildiğimiz veri yapılarıdır. list() fonksiyonu ile oluşturulur.

a <- c(1,2,3,4)
b <- matrix(1:9,nrow=3)
c <- TRUE
d <- kisiler # R içine gömülü veri seti
liste <- list(a,b,c,d)
liste

Liste yapısına isim de verebiliriz.

names(liste) <- c("vektör","matris","logical","dataframe")
liste

Listeyi hazırlarken de isim verebiliriz. Burada dikkat edin isimleri "string" olarak vermiyoruz.

list(vektör=a,matris=b,logical=c,dataframe=d)

Listenin alt elemanlarını seçerken $ işaretini kullanabiliriz. Hatta bunu birden fazla kez yapabiliriz.

liste$dataframe$kilo

Listeye bir eleman daha eklemek istersek c() fonksiyonunu kullanırız.

liste <- c(liste,ekleme=42)
liste

	mpg	cyl	disp	hp	drat	wt	qsec	vs	am	gear	carb
Mazda RX4	21.0	6	160.0	110	3.90	2.620	16.46	0	1	4	4
Mazda RX4 Wag	21.0	6	160.0	110	3.90	2.875	17.02	0	1	4	4
Datsun 710	22.8	4	108.0	93	3.85	2.320	18.61	1	1	4	1
Hornet 4 Drive	21.4	6	258.0	110	3.08	3.215	19.44	1	0	3	1
Hornet Sportabout	18.7	8	360.0	175	3.15	3.440	17.02	0	0	3	2
Valiant	18.1	6	225.0	105	2.76	3.460	20.22	1	0	3	1
Duster 360	14.3	8	360.0	245	3.21	3.570	15.84	0	0	3	4
Merc 240D	24.4	4	146.7	62	3.69	3.190	20.00	1	0	4	2
Merc 230	22.8	4	140.8	95	3.92	3.150	22.90	1	0	4	2
Merc 280	19.2	6	167.6	123	3.92	3.440	18.30	1	0	4	4
Merc 280C	17.8	6	167.6	123	3.92	3.440	18.90	1	0	4	4
Merc 450SE	16.4	8	275.8	180	3.07	4.070	17.40	0	0	3	3
Merc 450SL	17.3	8	275.8	180	3.07	3.730	17.60	0	0	3	3
Merc 450SLC	15.2	8	275.8	180	3.07	3.780	18.00	0	0	3	3
Cadillac Fleetwood	10.4	8	472.0	205	2.93	5.250	17.98	0	0	3	4
Lincoln Continental	10.4	8	460.0	215	3.00	5.424	17.82	0	0	3	4
Chrysler Imperial	14.7	8	440.0	230	3.23	5.345	17.42	0	0	3	4
Fiat 128	32.4	4	78.7	66	4.08	2.200	19.47	1	1	4	1
Honda Civic	30.4	4	75.7	52	4.93	1.615	18.52	1	1	4	2
Toyota Corolla	33.9	4	71.1	65	4.22	1.835	19.90	1	1	4	1
Toyota Corona	21.5	4	120.1	97	3.70	2.465	20.01	1	0	3	1
Dodge Challenger	15.5	8	318.0	150	2.76	3.520	16.87	0	0	3	2
AMC Javelin	15.2	8	304.0	150	3.15	3.435	17.30	0	0	3	2
Camaro Z28	13.3	8	350.0	245	3.73	3.840	15.41	0	0	3	4
Pontiac Firebird	19.2	8	400.0	175	3.08	3.845	17.05	0	0	3	2
Fiat X1-9	27.3	4	79.0	66	4.08	1.935	18.90	1	1	4	1
Porsche 914-2	26.0	4	120.3	91	4.43	2.140	16.70	0	1	5	2
Lotus Europa	30.4	4	95.1	113	3.77	1.513	16.90	1	1	5	2
Ford Pantera L	15.8	8	351.0	264	4.22	3.170	14.50	0	1	5	4
Ferrari Dino	19.7	6	145.0	175	3.62	2.770	15.50	0	1	5	6
Maserati Bora	15.0	8	301.0	335	3.54	3.570	14.60	0	1	5	8
Volvo 142E	21.4	4	121.0	109	4.11	2.780	18.60	1	1	4	2

	col1	col2	col3
row1	1	2	3
row2	4	5	6
row3	7	8	9

Table of Contents