Anasayfa / Genel bir bakış / Diskriminant Analizi Nedir? Nasıl Uygulanır?

Diskriminant Analizi Nedir? Nasıl Uygulanır?

Diskriminant Analizi Nedir? Nasıl Uygulanır?

Veri üretimi giderek ucuzlaşmakta ve dünyada ki herkes farkında olmadan dahi internet ortamına bir iz bırakmaktadır. Bu bir video, fotoğraf, yazı, bir beğeni butonuna basmak .. bunların hepsi kalıcı bir şekilde biriktirdiğimiz verilerimizdir. Şimdiye kadar birikmiş veri birinkintisinin %90’ı son iki yılda oluşturulmuştur. Bunun bir devrim niteliğinde olduğunu düşünüyorum.

Hızla gelişen teknoloji ile devrim niteliğinde büyüyen verinin, bize birşeyler anlatmaya çalıştığının farkında mısınız ? Verinin ne anlatmaya çalıştığını anlamamız için; teknolojiler yenilemeli, düzenlenmeli, verilerimizi ayıklamalı yani az önem taşıyan verilerden kurtarılmalıyız.

Şu an birçok sektörde ve bilim dalında istatistiki problemler boyut açısından artmıştır. Bir veriye ulaşmak denendiğinde, istenen istenmeyen bir çok veri ele geçirilmektedir.  İşletmeler ve bilim dalları ellerine geçen veri boyutunu beklemedikleri için bu boyutlu verilerin ayıklanması,sınıflandırılması, mümkün ise boyut indirgemesi gerekmektedir. Yukarıda da söylediğimiz gibi bu verilerin anlatmaya çalıştığı noktalar yakalanıp sorunlara ulaşılmalı daha sonra çözüme kavuşturulmalıdır.

Veriyi ilgi odağına koymak, kişinin kendisine özgü beceriler ve araçlar gerektirir. Bu araçlardan bir tanesi olan DİSKRİMİNANT ANALİZİ’nden bahsetmek istiyorum.

 

Diskriminant analizi, ayırıcı fonksiyon analizi olarak da adlandırılabilir. Veri setinde bulunan verilerin değişken gruplarına atanırken taşıdığı özelliklere göre ayrımını yapar. Diskriminant analizi bir kategorik bağımlı değişken ile sayısal değerler alan bağımsız değişkenler arasında yapılır. Diskriminant analizi bağımsız değişkenlerin bağımlı değişkenleri etkilemelerine göre ya aynı ya da farklı gruplara göre sınıflandırılmasını sağlar.

  Diskriminant analizinin amacı;

  • Sınıflanıp, sınıflanılmayacağını test etmek
  • Değişkenleri Sınıflamak
  • Gruplar arasındaki farklılıkların incelenmesi
  • Bağımlı değişkende, bağımsız değişkenlerce açıklanan varyansı göstermek
  • Bağımlı değişkene göre yapılan sınıflandırmada, bağımsız değişkenlerin öncelik sırasını irdelemek
  • Grupları ayırırken önemi düşük olan (önemsiz olan) değişkenleri elemek

 

 

DİSKRİMİNANT ANALİZİ NASIL UYGULANIR ?

Bir spor okulu sınavına giren 60 kişiden (30-30) başarılı olanlar ve başarılı olmayanlar olarak iki grup oluşturulmuştur. Ve bu 60 kişiden spor okuluna hazırlanırken hangi spor dalı ile hazırlandıkları sorulup, 3 farklı değişken elde edilmiştir. ( Koşmak – Yüzmek – Bisiklete Binmek). Amacımız başarılı olmayı etkileyen değişkenleri bulmak.

Veri setine buradan erişebilir ve birlikte uygulayarak ilerleyebilirsiniz.

 

Adım 1:  Variable View – Grup Values kısmı çift tıklanır – Value kısmına 1 : “Başarılı” – 2: “Başarısız” – Add – OK

 

Adım 2: Analyze – Classify – Discriminant Analysis

 

Adım 3: Grouping Variable’a Grup değişkenimizi, Independents kısmına da bağımsız değişkenlerimizi ( KOŞMAK-YÜZMEK-BİSİKLET) atıyoruz – Use stepwise method (adım adım ilerlemek için) işaretlenir

 

Adım 4:  Define Range – Minimum : 1 , Maximum : 2 (Grup sayı tanımlamaları yapılır) – Continue

 

Adım 5: Statistics  – Means – Univariate ANOVAs – Box’s M – Unstandardized – Within groups correlation – Continue

 

Adım 6: Method – Wilk’s lambda – Use F value(sabit) – Summary of steps – Continue

 

Adım  7: Classification – All groups equal – Casewise results – Summary table – Within groups – Continue

 

Adım 8: Save – Predicted group membership – Discriminant scores – Probabilities of group membership – Continue – OK

 

ÇIKTILARIMIZI YORUMLAYALIM

 

1 )

 

  • Yüksek korelasyon olması için 0.7 den büyük korelasyon sonuçları olmalıdır.
  • Değişkenler arasında yüksek korelasyon yoktur.
  • Çoklu doğrusal bağlantı yoktur.

2)

Ho: Kovaryans matrisleri eşittir.

H1: Kovaryans matrisleri eşit değildir.

  • P_value = .651 > 0.05 olduğundan dolayı Ho Hipotezi Kabul edilir.
  • Kovaryans Matrisleri Eşittir

3)

  • Function : 1 tane diskriminant fonksiyonu vardır
  • % of Variance : Açıklanan değişkenin varyansıdır
  • Canonical Correlation : Karesini aldığımız da (0.966)^2= 0.933 olur yani başarılı ve başarısız öğrencileri ayırma da %93 ünün açıklanabileceğini göstermektedir

4)

  • P_value = .000 < 0.05 olduğundan dolayı Grup ortalamaları arasında fark vardır.

5)

  • Bağımlı değişkeni tahmin ederken, bağımsız değişkenlerin önemini gösterir.
  • Burada KOŞMAK değişkeninin diğer değişkenlere göre önemi olmadığı için listede yoktur.

6)

  • KOŞMAK Structure Matrisinde olmasına rağmen Standardized Matrisinde olmadığı için önemli olmadığını anlıyoruz ve analize alınmadığını göreceğiz.

7)

  • Modelimiz de KOŞMAK yoktur. Constant sabit terimimizdir.
  • Z = –23.993 + 0.142YÜZMEK + 0.210BİSİKLET

8)

  • Her gruptaki diskriminant skorlarının ortalamasını göstermektedir.

9)

  • Yaptığımız sınıflamanın %100’ü doğrudur.

Hakkında Elif YILMAZ

GÖZ ATMAK İSTEYEBİLİRSİNİZ

Minitab Destekli İstatistiksel Analiz Eğitimleri – Ders 1/9 [Minitab Hakkında Genel Bilgi Giriş, Menüler ve Araç Çubukları]

Minitab Hakkında Kalite iyileştirme ve istatistik eğitimi konularında dünyanın lider yazılım ve hizmet sağlayıcısıdır. Merkezi …

Bir cevap yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir