Beğeni ve yorum sayılarında zamanla bir değişim olmuşmudur diye bakalım. Cem yılmazın instagram hesabında çok sık paylaşım olmadığından doğrudan zamanı kullanmak aldatıcı olur. Bu yüzden her 20 gönderi başına ortalama beğeni ve yorum sayısını hesaplayıp grafiğe döktük. Bizim çalışmamız yapıldığında 340 gönderisi vardı cem yılmazın 340/20 -> 17 tane veri noktası hesaplıyoruz.
Zaman İçinden beğeni sayısının değişimi
Zaman içinde yorum sayısının değişimi
Grafiklerden de belli olduğu gibi sayfanın başlangıcında yorumda beğenide nispeten azmış.
zamanla bu büyük bir artış göstermiş. muhtemelen zaman içinde cem yılmazın instagram sayfasının bilinirliğinin artması ve takipçilerinin çoğalması ile olmuştur.
Toplamda gönderi sayısının azlığı ve zaman içindeki değişim büyüklüğü gibi olumsuzluklar var. Bu zaman içindeki büyük değişim tahmin sistemini olumsuz etkileyeceği aşıkardır. Yinede biz Görsel olarak az beğenilen çok beğenilen ayrımını yapabilen bir sınıflandırıcı eğitmeye çalıştık.
Resimleri beğeni sayısına göre sıralayıp, en beğenilen 120 ve en az beğenilen 120 resmi iki ayrı sınıf için eğitmek için alıyoruz. Caffe ile bir fine-tune işlemi ile eğitiyoruz ve test ediyoruz.
Sonuç :
Sınıflandırıcımız ı 46 adet eğitimde kullanmadığımız gönderi ile test ediyoruz. Bu gönderilerin 23 tanesi az, 23 taneside çok beğenil olarak seçildi
Sınıflandırıcımız
- 21 kez bu az beğenilir demiş 16 tanesi doğru sınıflandırılmış
- 25 kez çok beğenilir demiş 18 tanesi doğru sınıflandırılmış
Sınıflandırıcımız her iki sınıf içinde bir tahminde bulunur. her sınıfın ihtimalini verir. Toplamda 1 olan bu oranlardan yüksek olanını tahmin olarak kullanıyoruz.
Çok kaba bir beğeni sayısı tahmini yaparsak.
çok beğenilenlerin ortalama beğeni sayısı -> m_mean
az beğenilenlerin ortalma beğeni sayısı -> l_mean
resmin :
çok beğenilme ihtimali : m_prob
az beğenilme ihtimali : l_prob
beğeni tahmini = ( m_prob*m_mean ) + ( l_prob*l_mean )
Mesela :
gönderisi için sistemimiz 10 bin 127 beğeni alır demiş.
Tahmindeki sapmayı ise başta bahsettiğimiz olumsuzluklara, ilaveten de tahmin yöntemimizin çok kabalığına bağlıyorum. Siz nedersiniz bilmem ama bence yinde sonuç fena değil...
Daha çok gönderisi olan, takipçi durumu belli bir düzene girmiş hesaplar için daha başarılı çalışmalar yapılabilir.
Aslında görüntüler üzerinde kümelemelerde yapılıp onun üzeerinden de çıkarımlar yapılabilir. Şimdilik burda bitiriyoruz.
Her türlü görüş ve önerilerinizi bekleriz...