microsoft power bi data science r metric data mining machine learning

Power BI ile R Analiz ve Görselleştirmeleri

Merhaba iyi günler.

Günümüzde karar mekanizmaları için basit tablolar, pivotlar ve görsel çözümlemeler yetersiz kalmaktadır.İstatistiksel analiz ve çözümlemeler kaçınılmazdır.

Bugün Power BI raporlarında R istatistiksel analiz programı üzerinden nasıl yararlanılır (faydalanılır) yüzeysel olarak incelemeye ve adım adım çözümlemelerini irdelemeye çalışacağım.

Şimdiden iyi okumalar.

R; Veri Analizi-Veri Bilimi alanında kullanılan istatistiksel hesaplama ve veri görselleştirmesi olanağı sağlayan bir dildir.

Açık kaynak kodlu olarak hizmet vermektedir.

Yeni Zelanda’daki Aucland Üniversitesi İstatistik Bölümü üyeleri Ross Ihaka ve Robert Gentleman tarafından yazılmış ve hayata geçirilmiş bir projedir.

Dili geliştrirken John Chambers ,Rick Becker ve Allan Wilks in geliştirdiği S dili ve Gerald Jay Sussman‘ın geliştirdiği Schema dilinden etkilenerek-ilham almışlardır.

Diğer İstatistiksel paket programları-araçları lisans ücretlerinin fazlalığı, çözümleme sağlayan kaynakların yetersizliği, öğrenmenin ve öğretmenin maaliyet içermesi nedenleri R projesini gerçekleştirmelerindeki faktörler olarak dile getirilmiştir.

R dili-yazılımı 29 Şubat 2000 tarihinde halka açık bir şekilde yayınlanmıştır.

R Linkihttps://cran.r-project.org/

R dili; R Core Team adı altında dünyanın değişik yerlerindeki insanlar ile geliştirilmesi desteklenmektedir.(R Dev Community)

  • Doğrusal ve Doğrusal Olmayan Modellemeler
  • Klasik İstatistik Testleri
  • Zaman Serileri Analizi
  • Sınflandırma Analizleri
  • Kümeleme ve Kümeleme Analizi gibi çözümlemler için ağırlıklı olarak kullanılmaktadır.

R Kaynakları olarak;

  1. https://www.datacamp.com/courses/free-introduction-to-r eğitim serisi 
  2. https://swirlstats.com/students.html eğitim serisi
  3. https://www.coursera.org/learn/r-programming eğitim serisi
  4. http://users.metu.edu.tr/ozancan/R%20Graphics%20Cookbook.pdf kitabından yararlanabilirsiniz.

2-Power BI & R

R istatistiksel analiz açısından oldukça güçlü bir dil olmasına rağmen sunduğu görselleştirme birçok kullanıcı tarafından yetersiz olarak görülmektedir.

Bu bağlamda kullanıcılar genellikle istatistiksel hesaplamaları ve analizleri R üzerinde gerçekleştirip görselleştirmeleri farklı araçlar üzerinde sağlamaktadır.

Power BI Microsoft desteği ile sürekli desteklenen iş zekası aracı olarak R üzerinde de esnek çözümlemeler sunmaktadır.

Power BI mevcut veri sağlayıcısı seçenekleri içerisinde R Data Connector (R Veri Bağlayıcısı) bulunmaktadır.

power-bi-microsoft-r-data-science-connector

Power BI-R ilişkisi iki şekilde kurulabilir.

  1. R üzerindeki hesaplama ve analizlerin dış ortama herhangi bir dosya türünde aktarılıp Power BI’ın bu dosya verilerine erişip kullanması. 
  2. Doğrudan Power BI üzerindeki verilerin R Script paneli yardımı ile çözümlenip-işlenip kullanılması.(R üzerinde test-kontrol işlemleri önerilmektedir.)

R Script bağlayıcısını kullanmadan önce hangi kaynak yolu ve IDE – Integrated Development Environment (Tümleşik Geliştirme Ortamı)’ı kullanacağını belirlememiz gerekmektedir.

*Bilgisayarımızda fraklı R IDE’leri mevcut olduğunda bu ayarlamaları yapmamız gerekebilir.

EK: R IDE önerileri;

  1. R Studio
  2. Microsoft R Application Network
  3. R Tools for Visual Studio
  4. Rattle
  5. StatET for R
  6. ESS

İlgili düzenleme için;

File (Dosya) / Options & Settings (Seçenekler ve Ayarlar) / Options (Seçenekler) içerisinde R Scripting (R Komut Dosyası) sekmesindeki işaretli olan alanları düzenlemeniz gerekmektedir.

power-bi-microsoft-r-data-science-settings

İlgili düzenlemelerimizin ardından R Script kullanarak veri kaynağımıza erişelim.

power-bi-microsoft-r-data-science-connector

Karşımıza gelen R Script panelinde dosya yolumuzu kontrol ettikten sonra data(Erişilecek_Dosya_Adı) belirterek OK diyerek işlemimize devam ettiğimizde Excel dosyası Import eder gibi veri kümemizi rapor içerisine alıyoruz. 

power-bi-microsoft-r-data-science-script-connector-step

Import ettiğimiz verilerimiz için R Script Editor yapımızı dilerseniz Querry Editor üzerinden, 

power-bi-microsoft-r-data-science-option-one

dilerseniz Visualizations (Görselleştirme) üzerinden erişebilirsiniz.

power-bi-microsoft-r-data-science-script-editor

Visualizations üzerinden R Script görselini seçerek, herhangi bir mevcut veri kümemizden (Fields) işlem gerçekleştirmeden harici olarak dışarıdan Excel dosyamız içerisindeki Kredi_Analiz verilerini kullanarak mini bir analiz gerçekleştirelim.

Aşağıdaki R kod bloğumuzdaki temel amaç, bazı parametreleri ele alarak oluşturduğumuz algoritma ile basitçe kredi onay durumu işlemi gerçekleştirmek.(Onay=1;Red=0)


1-library(readxl)
2-require(corrplot)
3-library(corrplot)
4-kredi_egitim_verisi = read_xlsx(file.choose())
5-kredi_verisi = read_xlsx(file.choose())
6-colnames(kredi_egitim_verisi) = c("tecrube","ikamet","borcgelirorani","kartborcu","risk")
7-colnames(kredi_verisi) = c("tecrube","ikamet","borcgelirorani","kartborcu")
8-formul = as.formula("risk~tecrube+ikamet+borcgelirorani+kartborcu")
9-iliski = glm(formula=formul, data=kredi_egitim_verisi, family = binomial())
10-tahmin = predict.glm(iliski,kredi_verisi)
11-tahmin = round(plogis(tahmin))
12-kredi_sonuc = data.frame(kredi_verisi,kredi_onay_red = tahmin)
13-M <- cor(kredi_sonuc)
14-corrplot(M, method = "circle", tl.cex=0.6, tl.srt = 45, tl.col = "black", type= "upper", order="hclust")

R Script üzerinde çalıştırılacak kod bloğu içerisinde görsel-method işlemleri için kütüphanelerimizin mevcut R IDE içerisinde yüklü olması gerekmektedir.

Örneğin; Excel dosyalarına erişebilmek ve kullanabilmek için readxl, herhangi bir görseli kullanabilmek için x kütüphanesi gibi (x=corrplot olarak kullanıldı)…

power-bi-microsoft-r-data-science-install-package

Kullanacağımız kod bloğunu lokalimizdeki yüklü olan IDE üzerinde test etmemiz her zaman tavsiye edilmektedir.(R Studio üzerinde test edildi.)

*Power BI içersindeki R Script üzerinden hataları düzeltmek ve kod adımlarını takip etmek zor gerçekleştirilmektedir.

power-bi-microsoft-r-data-science-script-test-data

Kurguladığımız R Script kod bloğunu Power BI üzerinde kullanalım.

Kod bloğumuz içerisinde ilk olarak R Script Editor bizden Eğitim Verisi dizinini talep edecek (Excel olarak belirledik), 

power-bi-microsoft-r-data-science-script-connector-step-1

ardından bizden Kredi Analiz Verisi dizinini talep edecek;

power-bi-microsoft-r-data-science-script-connector-step-2

sonrasında ise belirlediğimiz görsel öğesi üzerinde analizini gerçekleştirdiğimiz verilerimizi görselleştireceğiz.(Rastgele seçtiğim görsel-corrplot)

power-bi-microsoft-r-data-science-script-connector-step-3

Buradaki görsel seçimimiz opsiyonel olarak ihtiyacımıza göre belirlenebilir.

R üzerindeki kütüphanelere ait görseller ya da Power BI ek market görselleri değerlendirilebilir.

Power BI ek market görsellerine Visualizations içerisindeki Get More Visuals seçeneğinden;

power-bi-microsoft-r-data-science-market-visual

Advanced Analytics (Gelişmiş Analiz) öğe grubundan erişebilirsiniz.

power-bi-microsoft-r-data-science-market-advanced-analytics-visual

3-Mimari Yapı

Gerçekleştirdiğimiz işlemlerimiz dış veri kaynaklarının Power BI üzerindeki R Script içerisinde işlenmesine yönelikti.

Power BI içerisinde de istatistiksel modellerinizi çeşitli algoritmalar ile oluşturabiliriz.Fakat rapor içi performans dengesinin sağlanması kompleks çözümlemelerde çok zordur.

Tam bu noktada işlemler faaliyete alınmadan ayrık adımların test ve çözümlemesi tamamlandığında mimari yapının hassas bir şekilde kurgulanması gerekir.

Burada öncelik değişken olabilir.(Mimari Yapı Belirlenmesi~Sistemlerin Testi-Çalışılabilirliği )

Aşağıdaki mimari çözümleme Microsoft tarafından örnek adımlar içermektedir.Baz aldığı nokta Azure ML olsa da faaliyet yapısı-süreçler genel mimari adımlarımız için yeterlilik seviyesini karşılamaktadır.

power-bi-microsoft-r-data-science-architecture

Ek olarak Microsoft’un yayınlamış olduğu Power BI ile Gelişmiş Analiz dosyasına göz atmanızı öneririm.

Gelecek yazılarda görüşmek üzere.

İyi çalışmalar…

, , , , ,

İlgili Yazılar