Anasayfa / Ekrem Bayar

Ekrem Bayar

Ağustos, 2018

  • 25 Ağustos

    R ile Veri Manipülasyonu | Bölüm 3/3

    En önemli bölümümüz birinci bölümdü. Temel prensipleri anladığımız taktirde işlemleri bir şekilde yapabiliriz, geri kalan kısım ise bu prensipleri uygulayacağımız kısımlardır. Burada çok detaya girmeden metin manipülasyonu için bazı fonksiyonları anlatacağız. Ardından ise eksik gözlem, aykırı gözlem ve bazı bariz …

  • 25 Ağustos

    R ile Veri Manipülasyonu | Bölüm 2/3

    Veri Bilimi maceramızda bir önceki bölümde veri manipülasyonun öneminden ve prensiplerden bahsetmiştik. Bu bölümde ise dağınık veri setlerinden ve değişken dönüşümlerinden ve tarih formatından bahsedeceğiz. 3. Dağınık Verilerin Ortak Belirtileri Şuana kadar yaptıklarımızı kısaca örnekler üzerinde görelim. Sütun başlıkları birer …

  • 25 Ağustos

    R ile Veri Manipülasyonu | Bölüm 1/3

    Elimizde her zaman iyi bir veri seti olmayacaktır. Özellikle bazı veriler için uzun ve yorucu veri manipülasyonları yapıldıktan sonra analiz, modelleme ve görselleştirme aşamasına geçilecektir. Bu yüzden veri manipülasyonu ve tidy data (düzenli veri) formatının veri bilimci adayları tarafından iyi …

  • 25 Ağustos

    R ile Veri Manipülasyonu: Uygulama

    Elimizde tarihsel Boston hava durumu verisi var. 2014 Aralık’tan başlayarak 12 aylık bir veri, Dirty Data formatında, Sütun isimleri birer değer, Değişkenler yanlış kodlanmış, Eksik ve Aykırı gözlemlerimiz bulunmakta, ve daha nice problemler. AMACIMIZ: Veriyi analiz edebileceğimiz bir formata çevirmek. Veri …

  • 11 Ağustos

    R ile Metin Madenciliği | Bölüm 6/6

    Bölüm 5/6’da düzenli yapıda olmayan metin verilerini, çeşitli araçlarla nasıl düzenli hale getirebileceğimizi öğrendik. Bu bölümde bahsi geçen dönüştürme araçlarının konu modellemesi üzerinde metin analizine katkısı anlatılacaktır. 6. Bölüm – Konu Modellemesi – Topic Modelling Metin madenciliğinde , döküman topluluklarını …

  • 11 Ağustos

    R ile Metin Madenciliği | Bölüm 5/6

    5. Bölüm – Düzenli Olmayan Veri Formatını Dönüştürme Önceki bölümlerde, unnest_tokens işlevi tarafından düzenli metin formatına getirilmiş metinleri analiz ettik. Ayrıca metin verilerini keşfetmek ve görselleştirmek için dplyr, tidyr ve ggplot2 gibi araçlar ile analizlerimizi zenginleştirdik. [crayon-5c16cc2386608351752324/] Yukarıdaki şema tipik …

  • 11 Ağustos

    R ile Metin Madenciliği | Bölüm 4/6

    4. Bölüm – Kelimeler Arasındaki İlişkiler: n-gram ve Korelasyon Şuana kadar kelimeleri birer birim olarak ele aldık ve kelimelerin duygularını veya belgelerle olan ilişkilerine baktık. Bununla birlikte metin analizi aynı zamanda kelimeler arasındaki ilişkilere dayanır, hangi kelimelerin diğerlerini takip etme …

  • 11 Ağustos

    R ile Metin Madenciliği | Bölüm 3/6

    Önceki yazılarda metin madenciliği üzerine genel girişi yaptığımıza göre yavaş yavaş işi ilerletme zamanı geldi, ama önceki konuda neler yaptığımızı hatırlayalım. Duygu analizinin ve duygu sözlüklerinin ne olduğunu, karşılaştırmalar ve görselleştirmeler üzerinden anlattık. Şimdi ise, belge koleksiyonlarından nasıl bilgi çıkarımı …

  • 11 Ağustos

    R ile Metin Madenciliği | Bölüm 2/6

    Önceki yazımız, Bölüm 1/6’da metin yapılarının ve düzenli metin formatının ne olduğundan bahsettik. Temel amacımız, tidytext kütüphanesi ile metinleri parçalamak ve kelime frekanslarını elde etmek. Bu yazı serisinde, tidytext kütüphanesi ile birlikte bolca dplyr ve ggplot2 kütüphaneleri kullanılacaktır. Bölüm 2/6’da …

  • 11 Ağustos

    R ile Metin Madenciliği | Bölüm 1/6

    Bu uzun yazı serisi “Tidy Text Mining with R” kitabının derlenmesinden ortaya çıkmıştır. https://www.tidytextmining.com/ Her istatistiksel yöntem gibi temel amacımız, metin içerisinden anlamlı sonuçlar ortaya çıkarmaktır ve metin üzerinde yapılacak işlemlere de metin madenciliği adı verilir. Aşağıdaki kütüpaneler bu kitap …