Neyse efendim görüntü üzerine çalıştığımız malum. Görüntü bulmak nispeten kolay olsada, etiketlenmiş veri bulmak çok zor. Biz bu yazımızda Sosyal Medya kalallarından biri olan Instagram dan veri toplamadan bahsedeceğiz.
Instagram malumunuz genellikle resim paylaşma platformu. Öncelikle bir Instagram hesabı seçiyoruz. Biraz internet araştırması ile meşhurlarımızın Instagram adreslerini bulduk. Keza bir kaçını inceleyince hem popülerliği hemde kısalığı sebebiyle Cem Yılmaz'ın sayfasını seçiyoruz.
Python da hem doğrudan Instagrama yönelik hemde genel web den veri çekme amaçlı bir sürü kütüphane bulmanız mümkün. Bunları inceleyip kafanıza yatanı kullanmanızı öneririm.
Peki Cem Yılmazın Instagram sayfasından Biz ne gibi bilgiler çekebildik ;
- 340 adet resim yüklemiş
- 187 kişiyi takip ediyor
- 961205 kişi tarafından takip ediliyor
- Yayınladıkları için ortalama beğeni sayısı -like mı deseydim - : 15354.5
- Yayınladıkları içinortalma yorum sayısı : 240.4
Yorum sayısı dağılımı da şöyle
En Beğenilen 6 resim şunlar
En az Beğenilen 6 resim:
En çok yorum yapılan 6 resim şunlar
En az yorum yapılan 6 resim şunlar
En nihayetinde Instagram hesabında kaç resim var resimlerin beğeni sayıları yorum sayıları elimizde. Elbette resim adresleride -link- leride var.
Neler yapabiliriz
Resimleri kendi içinde görsel özelliklerine göre guruplara ayıra biliriz.
Keza Resimler ve beğeni sayılarını kullanarak beğeni hesabı yapan sistemler eğitmeyi deneyebiliriz.
...
Fırsat bulupda devam edebilirsek bu konuda yapılacak başka şeylerde var.
Hiç yorum yok:
Yorum Gönder