Uygulamalarımızda kullanmak için kütüphane arayışlarımız oluyor. Bu keşfettiğimiz kütüphaneleri inceliyoruz. Kullanma niyetinde olduklarımız içinde basit örnekler hazırlayıp nasıl kullanacağımızı anlamaya çalışıyoruz. Bu günkü yazımızda böyle bir örnek çalışmamızdan bahsedeceğiz.
Uygulamamızın adı Twitter Gözetleyici. Çalışması şöyle. Sizin vereceğiniz anahtar kelimenin geçtiği twitleri bulup ekranda kelime bulutu olarak göstermek. Belli zaman aralıkları ile bu işlemi tekrar etmek.
Kullandığımız kütüphanelerden bahsedelim.
pattern : http://www.cnts.ua.ac.be/pattern :
Antwerp üniversitesininin CLiPS (Computational Linguistics & Psycholinguistics) araştırma merkezinde geliştirilmiş bir yazılım. Biz Twitterdan bilgi çekebilmek için kullandık ama çok daha geniş amaçlı bir kütüphane. Web üzerinden , google, wikipedia, bing, facebook,... vb pek çok kaynakdan kolaylıkla bilgi çekebilmeniz sağlayan bir bölümü var. Keza doğal dil işleme kısmıda var.
Kaynak kod : github.com/clips/pattern
- Data Mining: web services (Google, Twitter, Wikipedia), web crawler, HTML DOM parser
- Natural Language Processing: part-of-speech taggers, n-gram search, sentiment analysis, WordNet
- Machine Learning: vector space model, clustering, classification (KNN, SVM, Perceptron)
- Network Analysis: graph centrality and visualization.
wordcloud : Kelime bulutu oluşturmak içi yazılmış bir kütüphane.
Kaynak kod : github.com/amueller/word_cloud
Bu kütüphaneler dışında
GUI için PySide kullandık. Birazda Unicode ile boğuştuk Python 2.x serisinde epey bir başınızı ağrıtıyor.
Pek çok eksiği var. Lakin üzerinde geliştirme yapma imkanınım olacağını sanmıyorum. Geliştimek isteyenlar yada kodu görmek isteyenler için;
Kodlar Burda : github.com/birolkuyumcu/twitterMonitor