R, Veri Bilimi / 28 Mart 2021 / Miraç ÖZTÜRK
Merhaba, iyi günler.
Bugünkü yazımda; çok çeşitli alanlarda kullanılan güçlü, dinamik altyapısı, anlaşılır sade dili ile oldukça popüler olan R (birçok ek özelliğe sahip) diline yönelik oluşturulmuş kütüphane (library), çatı (framework) ve programlara göz atacağımız kısa notları aktarıyor olacağım.
Kısaca R’a yönelik derlenmiş bir ek paket-araç tanıtım fihristi olarak nitelendirilebilir.
Ağırlıklı olarak veri işlemesi ve raporlama alanı üzerinde faaliyet gösteren kurum-kuruluşlarda R vazgeçilmez olarak nitelendirilmektedir.(R Ek Bilgiler)
Raporlama ve Veri Görselleştirme hizmetleri üzerine Microsoft’un popüler iş zekası ve raporlama aracı Power BI üzerindeki kullanabilen veri konnektör ve derleyicileri arasında R oldukça fazla tercih edilmekte-kullanılmaktadır.
Kullanım seçenekleri-yöntemleri olarak; Power BI Desktop uygulaması içerisinden veri kaynağı erişimi ile R Script seçeneğini seçerek uygulamamıza işlenmiş-işlenecek veri aktarabilir,



ya da Visualizations (Görselleştirme) içerisinden R Visual öğesi ile mevcut verilerinizi baz alarak yüklü R kütüphaneleri desteği ile ilgili verilerinizi anlık işleyerek raporlarınızda kullanabilirsiniz.

Raporlamalarımızdan anlamlı sonuçlar çıkartabilmek ya da çeşitli aksiyonlar alabilmek için aralıklı olarak verilerimizi işlemek ya da çeşitli algoritmik süreçlerden geçirmemiz gerekebilir.
Çoğu zaman ilgili bu süreçler çok zorlayıcı (İstatiksel hesaplamalar vb. kompleks işlemler) ve hataya açık olabilir.Bu hatalardan kaçınmak ya da minimize etmek adına ağırlıklı olarak dış veri kaynaklarında-işleyicilerinde (Pyhton – R vb. dillerde) hazır algoritmalar içeren kütüphaneler kullanmak çözüm olarak gösterilebilir.
Bu yazı içeriğinde R üzerinde çokça kullandığım ve yazımı hazırlarken araştırarak öğrendiğim paket-program içeriklerini ele almaya çalıştım.
NOT: Kullanmayı amaçladığınız/hedeflediğiniz paketleri kullanmak için ilgili paket yükleyiciniz üzerinden;
install.packages(“x*“) x*=İlgili kullanacağınız paket.
paket/kütüphane yükleme işlemlerini gerçekleştirmeniz gerekmektedir.
Dilerseniz hızlıca göz atmaya başlayalım;
Makalede Neler Var ?
Tidyverse
Tidyverse: Dplyr,ggplot2,forcats,readr,purrr,tidyr,tibble,stringr… vb. veri bilimi için tasarlanmış temel R kütüphanelerini-paketlerini içeren özel olarak oluşturulmuş bir koleksiyondur.
*Kurucu-Geliştirici-Destekçi :
Hadley Wickham (Kurucu/Geliştirici-Tidyverse–RStudio)
Dplyr: Veri Bilimi çalışmaları için olmazsa olmaz olarak ifade edilen-gösterilen, veri manipülasyonu işlemlerini kolay, hızlı ve esnek bir şekilde gerçekleştirmemizi sağlayan R kütüphanesidir.
Ağırlıklı olarak Veri Madenciliği, Veri Analizi içeren araştırma yapılarında kullanılır.
*Kurucu-Geliştirici-Destekçi :
Hadley Wickham (Kurucu/Geliştirici-Tidyverse–RStudio)
ggplot2 (Graphic of Grammer Plot 2 – Gramer Grafiği/Çizmek 2): Veri Bilimi çalışmalarına yönelik kolay, hızlı ve esnek bir şekilde verilerinizi görselleştirmenizi sağlayan en popüler R veri görselleştirme kütüphanesidir. (Ek olarak Python)
Keşifçi Veri Analizi (Exploratory Data Analysis) ekosisteminde analiz gerçekleştiren kullanıcılar tarafından en kapsamlı kütüphane olarak ifade edilmektedir.
*Kurucu-Geliştirici-Destekçi :
Hadley Wickham (Kurucu/Geliştirici-Tidyverse–RStudio)
Winston Chang (Geliştirici-RStudio)
Lionel Henry (Geliştirici-RStudio)
readr (Read R): Veri Bilimi çalışmalarına yönelik csv,tsv,fwf gibi formattaki tablo yapısında veri içeren dosyaların okunmasını sağlayan R kütüphanesidir.
*Kurucu-Geliştirici-Destekçi :
Hadley Wickham (Kurucu/Geliştirici-Tidyverse–RStudio)
Jim Hester (Geliştirici-RStudio)
tidyr: Veri Bilimi çalışmalarına yönelik veri içeren yapılarınızdaki verilerinizi analizlere yönelik düzenlemenizi sağlayan R kütüphanesidir.
*Kurucu-Geliştirici-Destekçi :
Hadley Wickham (Kurucu/Geliştirici-Tidyverse–RStudio)
purrr: Veri Bilimi çalışmalarına yönelik veri yapılarınız için fonksiyonel programlama işlemleri gerçekleştirebileceğiniz R kütüphanesidir.
*Kurucu-Geliştirici-Destekçi :
Lionel Henry (Geliştirici-RStudio)
Hadley Wickham (Kurucu/Geliştirici-Tidyverse–RStudio)
tibble: Veri Bilimi çalışmalarına yönelik veri yapılarınız için modern bir veri çerçevesi oluşturma işlemleri gerçekleştirebileceğiniz R kütüphanesidir.
*Kurucu-Geliştirici-Destekçi :
Kirill Müller (Kurucu-CYKNRA)
Hadley Wickham (Kurucu/Geliştirici-Tidyverse–RStudio)
stringr: Veri Bilimi çalışmalarına yönelik karakter yapılı verileriniz için manipülasyon işlemleri gerçekleştirebileceğiniz R kütüphanesidir.
*Kurucu-Geliştirici-Destekçi :
Hadley Wickham (Kurucu/Geliştirici-Tidyverse–RStudio)
forcats: Veri Bilimi çalışmalarına yönelik detaylı bir şekilde factor-faktör* işlemlerini gerçekleştirebilmenizi sağlayan R kütüphanesidir.
*Kategorik yapılı değişkenlerin çeşitli seviye düzeylerinde depolanmasını sağlayan R nesnesidir.
*Kurucu-Geliştirici-Destekçi :
Hadley Wickham (Kurucu/Geliştirici-Tidyverse–RStudio)
shiny: Veri Bilimi çalışmalarına yönelik R üzerinde etkileşimli web uygulaması
oluşturabilmenizi-geliştirebilmenizi sağlayan R kütüphanesidir.
*Kurucu-Geliştirici-Destekçi :
Winston Chang (Geliştirici-RStudio)
esquisse: Veri Bilimi çalışmalarına yönelik görselleştirme işlemlerinizi sürükle-bırak kullanımı ile gerçekleştirebilmenizi sağlayan R kütüphanesidir.
*Kurucu-Geliştirici-Destekçi :
Fenny Meyer (Kurucu/Geliştirici-dreamRs)
Victor Perrier (Kurucu/Geliştirici-dreamRs)
İlgili dökümantasyon linki.
Cheat Sheets (Kopya Kağıdı):Bulunamadı.
EK
knitr: Veri Bilimi çalışmalarına yönelik dinamik rapor üretim işlemleri gerçekleştirebilmenizi sağlayan R kütüphanesidir.
LaTeX, LyX, HTML, Markdown, AsciiDoc ve metin belgelerine entegrasyon sağlamaktadır.
*Kurucu-Geliştirici-Destekçi :
Yihui Xie (Geliştirici-RStudio)
İlgili dökümantasyon linki.
Cheat Sheets (Kopya Kağıdı):Bulunamadı.
EK
bioconductor: Veri Bilimi çalışmalarına yönelik biyolojik araştırma ve analiz işlemleri gerçekleştirebilmenizi sağlayan R kütüphanesidir.
*Kurucu-Geliştirici-Destekçi :
Martin Morgan (Profesör-Rosewall Park Cancer Center)
İlgili dökümantasyon linki.
Cheat Sheets (Kopya Kağıdı) *1* *2*
EK
lubridate: Veri Bilimi çalışmalarına yönelik tarih aritmetiği analiz ve yapılandırma işlemleri gerçekleştirebilmenizi sağlayan R kütüphanesidir.
*Kurucu-Geliştirici-Destekçi :
Vitalie Spinu (Geliştirici-Smava)
mlr (Multiple Linear Regression – Çoklu Doğrusal Regresyon): Veri Bilimi çalışmalarına yönelik çoklu doğrusal regresyon problemlerine yönelik çözümler sağlayan R kütüphanesidir.
*Kurucu-Geliştirici-Destekçi :
Patrick Schratz (Geliştirici-CYKNRA)
İlgili dökümantasyon linki.
Cheat Sheets (Kopya Kağıdı) *1* *2*
EK
parsnip: Veri Bilimi çalışmalarında kullanılan paketler arasında model arayüzlerini genelleyen ve yeni işlemleri gerçekleştirebilmenizi sağlayan R kütüphanesidir.
*Kurucu-Geliştirici-Destekçi :
Max Kuhn (Geliştirici-RStudio)
İlgili dökümantasyon linki.
Cheat Sheets (Kopya Kağıdı):Bulunamadı.
EK
scales: Veri Bilimi çalışmalarında kullanılan grafiklere yönelik ölçeklendirme ve yapılandırma işlemleri gerçekleştirebilmenizi sağlayan R kütüphanesidir.
*Kurucu-Geliştirici-Destekçi :
Hadley Wickham (Kurucu/Geliştirici-Tidyverse–RStudio)
İlgili dökümantasyon linki.
Cheat Sheets (Kopya Kağıdı):Bulunamadı.
EK
devtools: Veri Bilimi çalışmalarında kullanılan paketleri geliştirmek için gerekli araçları sağlayan R koleksiyonudur. (Tool – Araç)
*Kurucu-Geliştirici-Destekçi :
Jim Hester (Geliştirici-RStudio)
rcpp: Veri Bilimi çalışmalarında kullanılan veri işleme işlemlerinin hızını arttırmak ya da optimum seviyeye çekmek için C++ dili yardımı ile işlem performansı sağlayan R
kütüphanesidir.
(C++)
*Kurucu-Geliştirici-Destekçi :
Dirk Eddelbuettel (Geliştirici-TileDB)
Romain François (Geliştirici-RStudio)
J.J. Allaire (Chief Executive Officer/CEO-RStudio)
Kevin Ushey (Geliştirici-RStudio) …EK
İlgili dökümantasyon linki.
Cheat Sheets (Kopya Kağıdı) *1* *2*
EK
reshape2: Veri Bilimi çalışmalarında kullanılan verilerinizi tekrardan formatlayabilmenizi sağlayan R kütüphanesidir.
*Kurucu-Geliştirici-Destekçi :
Hadley Wickham (Kurucu/Geliştirici-Tidyverse–RStudio)
flexdashboard: Veri Bilimi çalışmalarında kullanılan verilerinize yönelik etkileşimli panolar-öğeler oluşturmanızı sağlayan R kütüphanesidir.
*Kurucu-Geliştirici-Destekçi :
Richard Iannon (Geliştirici-RStudio)
İlgili dökümantasyon linki.
Cheat Sheets (Kopya Kağıdı):Bulunamadı.
EK
tensorflow: Veri Bilimi çalışmalarında kullanılan verilerinize yönelik kompleks sayısal analizler-hesaplamalar gerçekleştirmenizi sağlayan R kütüphanesidir.
Karmaşık analizler ve veri işleme işlemleri için geliştiriciler arasında vazgeçilmezler arasında yer almaktadır.
*Kurucu-Geliştirici-Destekçi :
Daniel Falbel (Geliştirici-RStudio)
J.J. Allaire (Chief Executive Officer/CEO-RStudio)
Yuan Tang (Geliştirici-Ant Group)
İlgili dökümantasyon linki.
Cheat Sheets (Kopya Kağıdı): *1* *2*
EK
sparklyr: Veri Bilimi çalışmalarında sıkça kullanılan Apache Spark veri kaynağı ile R arasında arayüz oluşturup, etkileşim gerçekleştirmenizi sağlayan R kütüphanesidir.
*Kurucu-Geliştirici-Destekçi :
Kevin Kuo (Director of Insurance Practice (DIP) / Geliştirici-RStudio)
J.J. Allaire (Chief Executive Officer/CEO-RStudio)
Yitao Li (Geliştirici)
İlgili dökümantasyon linki.
Cheat Sheets (Kopya Kağıdı): *1* *2*
EK
reticulate: Veri Bilimi çalışmalarında kullanılan sınıflar ve fonksiyonlara R arayüzü oluşturup kullanmanızı sağlayan R kütüphanesidir.
*Kurucu-Geliştirici-Destekçi :
Yuan Tang (Geliştirici-Ant Group)
Kevin Ushey (Geliştirici-RStudio)
İlgili dökümantasyon linki.
Cheat Sheets (Kopya Kağıdı): *1* *2*
EK
chorrrds/r-music: Veri Bilimi çalışmalarında ezgisel incelemeler, düzenlemeler ve kullanımlar gerçekleştirmenizi sağlayan R kütüphanesidir.
Altyapı olarak Cifra Club sitesi üzerinden erişim ve sağlayıcılık hizmeti gerçekleştirmektedir.
*Kurucu-Geliştirici-Destekçi :
Bruna Wundervald (Araştırmacı-Maynooth University)
Matthew Leonawicz (Geliştirici-E Source)
Luca Carbone (Geliştirici/Analist-MSCI)
İlgili dökümantasyon linki.
Cheat Sheets (Kopya Kağıdı):Bulunamadı.
EK
dbplot: Veri Bilimi çalışmalarında kullandığınız veritabanları üzerindeki değerleri işleyerek görselleştirme, hesaplama ve formülüzayson işlemleri gerçekleştirmenizi sağlayan R kütüphanesidir.
*Kurucu-Geliştirici-Destekçi :
Edgar Ruiz (Geliştirici-RStudio)
İlgili dökümantasyon linki.
Cheat Sheets (Kopya Kağıdı):Bulunamadı.
EK
roxygen2: Veri Bilimi çalışmalarındaki projeleriniz için kaynak yolu belirtme, yorum ve açıklama ekleme gibi ek işlemleri gerçekleştirmenizi sağlayan R kütüphanesidir.
*Kurucu-Geliştirici-Destekçi :
Hadley Wickham (Kurucu/Geliştirici-Tidyverse–RStudio)
Peter Danenberg (Geliştirici-Google)
İlgili dökümantasyon linki.
Cheat Sheets (Kopya Kağıdı):Bulunamadı.
EK
googledrive: Veri Bilimi çalışmalarında Google Drive dosya ve projelerinizi kullanabilmenizi sağlayan R kütüphanesidir.
*Kurucu-Geliştirici-Destekçi :
Jennifer Bryan (Profesör/Geliştirici-RStudio)
Lucy D’Agostino McGowan (Profesör-Wake Forest University)
İlgili dökümantasyon linki.
Cheat Sheets (Kopya Kağıdı):Bulunamadı.
EK
lobstr: Veri Bilimi çalışmalarında verilerinize ait oluşturmuş olduğunuz nesneleri anlamlandırabilmenizi ve kolay kullanabilmenizi sağlayan R kütüphanesidir.
*Kurucu-Geliştirici-Destekçi :
Hadley Wickham (Kurucu/Geliştirici-Tidyverse–RStudio)
İlgili dökümantasyon linki.
Cheat Sheets (Kopya Kağıdı):Bulunamadı.
EK
modeldb: Veri Bilimi çalışmalarında kullanmış olduğunuz veritabanları üzerinde istatiksel modelleme işlemlerini kurgulamanızı ve gerçekleştirmenizi sağlayan R kütüphanesidir.
*Kurucu-Geliştirici-Destekçi :
Max Kuhn (Geliştirici-RStudio)
İlgili dökümantasyon linki.
Cheat Sheets (Kopya Kağıdı):Bulunamadı.
EK
tidygeocoder: Veri Bilimi çalışmalarında kullanmış olduğunuz coğrafi altyapılı çalışmalar üzerinde bati ve bileşik yapılı modelleme işlemlerini kurgulamanızı ve gerçekleştirmenizi sağlayan R kütüphanesidir.
*Kurucu-Geliştirici-Destekçi :
Jesse Cambon (Geliştirici-Embedded Healthcare)
İlgili dökümantasyon linki.
Cheat Sheets (Kopya Kağıdı):Bulunamadı.
EK
matchit: Veri Bilimi çalışmalarında kullanmış veriler üzerinde gözlemsel analiz uygulamaları ile modelleme işlemlerini kurgulamanızı ve gerçekleştirmenizi sağlayan R kütüphanesidir.
*Kurucu-Geliştirici-Destekçi :
Noah Greifer (Araştırmacı-John Hopkins)
İlgili dökümantasyon linki.
Cheat Sheets (Kopya Kağıdı):Bulunamadı.
EK
galah: Veri Bilimi çalışmalarına yönelik Living Atlases grubu tarafından barındırılan biyoçeşitlilik tabanlı verilere ve kaynaklara doğrudan erişmesini sağlayan R kütüphanesidir.
*Kurucu-Geliştirici-Destekçi :
Martin Westgate (Araştırmacı-The Australian University)
İlgili dökümantasyon linki.
Cheat Sheets (Kopya Kağıdı):Bulunamadı.
EK
tsibble: Zaman serisi verilerini düzenlemek, dönüştürmek ve analiz etmek için bir dizi kolay ve tutarlı çözümler sağlayan R kütüphanesidir.
*Kurucu-Geliştirici-Destekçi :
Earo Wang, Dianne Helen (Di) Cook, Rob J. Hyndman, Mitchell O’Hara-Wild (Araştırmacılar – Geliştiriciler)
İlgili dökümantasyon linki.
Cheat Sheets (Kopya Kağıdı):Bulunamadı.
EK
fable: Zaman serisi modellemesi yapmak için modern zaman serisi tahmin yöntemlerini kullanarak doğru ve etkili tahminler oluşturmayı sağlayan R kütüphanesidir.
*Kurucu-Geliştirici-Destekçi :
Earo Wang, Dianne Helen (Di) Cook, Rob J. Hyndman, Mitchell O’Hara-Wild (Araştırmacılar – Geliştiriciler)
İlgili dökümantasyon linki.
Cheat Sheets (Kopya Kağıdı):Bulunamadı.
EK
feasts: Zaman serisi verilerinin özelliklerini ve yapılarını anlamak için çeşitli çözümler sağlayan R kütüphanesidir.
*Kurucu-Geliştirici-Destekçi :
Earo Wang, Dianne Helen (Di) Cook, Rob J. Hyndman, Mitchell O’Hara-Wild (Araştırmacılar – Geliştiriciler)
İlgili dökümantasyon linki.
Cheat Sheets (Kopya Kağıdı):Bulunamadı.
EK
tsibbledata: Kullanıcıların zaman serisi analizi konseptlerini öğrenirken veya bu paketlerin işlevlerini test ederken kullanabilecekleri gerçek dünya veri setleri sağlayan R kütüphanesidir.
*Kurucu-Geliştirici-Destekçi :
Earo Wang, Dianne Helen (Di) Cook, Rob J. Hyndman, Mitchell O’Hara-Wild (Araştırmacılar – Geliştiriciler)
İlgili dökümantasyon linki.
Cheat Sheets (Kopya Kağıdı):Bulunamadı.
EK
hts: Hiyerarşik ve gruplandırılmış zaman serileri için özel olarak tasarlanmış analiz çözümleri içeren R kütüphanesidir.
*Kurucu-Geliştirici-Destekçi :
Earo Wang, Alan Lee, Rob J. Hyndman, (Araştırmacılar – Geliştiriciler)
İlgili dökümantasyon linki.
Cheat Sheets (Kopya Kağıdı):Bulunamadı.
EK
Günümüzde popülerliği hızla yükselen ve toplulukların üzerindeki destekleri katlanarak artan
R ile ilgili kütüphanelerin-çatıların-araçların sayısı yüzleri geçebilir.
Kısaca bildiğim ve öğrendiğim kadarıyla aktarmaya çalıştım.
Gelecek yazılarda görüşmek üzere.
İyi çalışmalar…
ai, data science, ml, R, veri bilimi