Stata, verileri saklamanıza ve yönetmenize, verileriniz üzerinde istatistiksel analizler yapmanıza ve anlaşılır görselliğe sahip grafikler oluşturmanıza olanak sağlayan bir yazılımdır. Genel amaçlı bir yazılım programı olan Stata, StataCrop tarafından 1985 yılında geliştirilmiştir. Program, istatistiksel analiz, veri yönetimi, grafik, simülasyon ve özel programlama gibi alanlarda kullanılmaktadır. Günümüz dünyası artık çok daha hızlı veri üretir hale gelmiştir. Bu verilerin analiz edilmesi bireyler, şirketler ve ülkeler için stratejik kararlarını almak noktasında çok önemlidir. Panel veri zaman serileri ve kesit verilerinin kombinasyonundan oluşan veriyi ifade eder. Bu panel veri setlerinin stratejik kararlar açısından analiz edilmesi ve politika oluşturulması anlamlı sonuçlar vermektedir. Böylece panel veri analizi ile yalnızca yatay kesit veya zaman serisi analizi kullanılarak ele alınamayan dinamikleri ele almak mümkün hale gelmektedir. Panel veri analizi, farklı birimlerarası farklılıkları anlamak için bir yol gösterici olabilmektedir. Ekonometrik analizleri gerçekleştirmek için Stata,SPSS, SAS, Eviews, R, Matlab ve Gauss programları kullanılmaktadır. Bu durumda aklınıza gelen ilk soru neden Stata’yı tercih ediyoruz olacaktır. Stata’yı tercih etmemizin başlıca nedenleri arasında büyük veri setlerinin kullanımına ve düzenlenmesine izin vermesi ve panel ve zaman serisi regresyon analizleri için sürekli gelişme göstermesidir. Ayrıca Stata belirli bir ihtiyacı olan kullanıcılar tarafından sürekli olarak güncellenmekte veya geliştirilmektedir. Veri Girişi Stata xls, xlsx, csv, dta, txt ve bazı istatistik programlarının kendi uzantılı dosyalarında yer alan veri setlerini çekebilmektedir. Veri Setine Ait Tanımlayıcı İstatistikler: Ekonometrik analize başlamadan önce, elinizdeki veri setini tanımanız gereklidir. Ekonometrik analize başlamadan önce, her zaman tüm değişkenlerin frekanslarını, kategorik değişkenlerin nasıl kodlandığını, minimum, maksimum değerleri ve kayıp gözlem sayısını kontrol etmelisiniz. Bu, veri setindeki uç noktaları ve olası hataları ortaya çıkarmanın en iyi yoludur. Veri Seti ile Yapılan Temel İşlemler: Stata, veriyi numerik veya metin (string) olmak üzere iki şekilde saklar. Stata’nın metin olarak sakladığı veriler belirli bilgiler vermek için kullanılır. Stata’da eğer bir veri metin olarak saklanmıyorsa o veri mutlaka numerik olarak saklanmaktadır. Grafik Çizme: Değişkenler arasında nasıl bir ilişki olduğunu görmek için tercih edilen yollardan biri grafik çizmektir. Stata’da bar, nokta, kutu, pasta ve dağılım grafikleri çizilebilmektedir. Stata çizilen grafikler üzerinde değişiklik yapmak, not ve başlık eklemek açısından oldukça esnektir.
Zamana göre değişen veriler ile hayatımızın her noktasında karşılaşıyoruz. Firmaların, ülkelerin, hastanelerin; kısacası çok sayıda birimin farklı zamanlarına ait değişkenlerini analiz etmek istiyoruz. Panel veri analizi, zamana göre elde ettiğimiz değişkenler üzerinden analiz yapmamızı sağlayan ekonometrik yöntemler topluluğunu içeriyor. Yalnızca tek bir zaman periyoduna ait verilerimiz çapraz kesitsel verilerdir. Zamana göre çapraz kesitsel verilerin birleşiminden oluşan veri türlerine panel veri; bu tür verileri analiz etmek için kullandığımız ekonometrik-istatistiksel analiz tekniklerinin birleştiği alana da panel veri analizi diyoruz.
Ekonomi, finans, sağlık, endüstri, işletme gibi alanlarda da panel veri analizi karşımıza çıkıyor. Panel Veri Analizi ve Yazılımları: Panel veri analizini uygulamak için farklı ekonometrik analiz programlarından yararlanabiliriz. Yaygın olarak kullanılan yazılımdan söz edebiliriz: Stata yazılımı E-Views yazılımı R Programı Stata yazılımında çok sayıda farklı seçenek bulunuyor. Programda hem sayısal, hem de kategorik bağımlı değişkene sahip olan panel veriler için analiz seçenekleri bulunuyor. Kategorik bağımlı değişkenlerin yer aldığı panel veri analizi yaklaşımları için Stata’da Probit tahminci seçeneği mevcut olmaktadır. Stata programında ister kod yazarak, ister menüler üzerinden panel verilerimizi analiz edebiliyoruz. Stata’da kod yazarak alternatif modellere yönelik panel veri analizlerini uygulamak mümkün olmaktadır. E-Views programında da farklı analiz seçeneklerini kullanabiliyoruz. Sabit etki modeli, rassal etki modeli, birleştirilmiş (pooled) tahmin modeli gibi alternatif teknikleri kullanabiliriz. R Programında da panel verilerimizi analiz edebilmek için kullanacağımız onlarca farklı yaklaşım bulunuyor. Diğer programlarda olan tahmin teknikleri, varsayımsal sınamaları ve alternatif modelleri R programı sayesinde kolaylıkla uygulayabiliyoruz. R programında bağımlı değişkenin farklı dağılımları için Genelleştirilmiş Lineer Modeller kapsamında panel veri analizi yöntemleri bulunuyor. Bu tür farklı teknikler için tasarlanmış plm, pglm gibi muhteşem R paketlerini kullanabiliyoruz. Ancak R programı henüz yaygın olarak kullanılmadığı için araştırmacılar tarafından pek tanındığını söyleyemeyiz. Türkçe yayınlanan makalelerin büyük çoğunluğunda, panel veri analizi sonuçlarının Stata tarafından alındığını gözlemliyoruz. Stata ile panel veri analizi, özellikle akademik makalelerde dikkat çekiyor. Stata, E-Views ve R dışında Gauss gibi farklı yazılımları da kullanabiliriz. Stata ile panel veri analizi tekniklerinin uygulanması, en sık başvurulan yolların başında geliyor. Ancak Minitab, SPSS gibi klasik istatistiksel analiz programlarında panel verilere özgü yaklaşımlar mevcut değil. Bu tür klasik yazılımlar için sentaks kullanmak da faydasız… Panel veri analizi oldukça kapsamlı bir konu ve model seçiminden varsayımların test edilmesine değin uzanan farklı konu başlıkları bu analiz kapsamında yer alıyor. Panel veri analizine başlamadan önce durağanlık, otokorelasyon, değişen varyans gibi çeşitli varsayımların da test edilmesi gerekiyor. Söz konusu varsayımların sağlanmadığı durumlar için de ekonometri literatüründe özel dayanıklı (robust) tahmin teknikleri öneriliyor. Dayanıklı teknikler kapsamında Driscoll-Kraay gibi mükemmel sonuçlar verebilen tekniklere başvurabiliyoruz. Etki türünün seçimi de panel veri analizinde önemli bir yer tutuyor. Hausman testi, Lagrange Çapranı testi gibi farklı test isimleri bu noktada bilimsel yayınlar içerisinde görülebiliyor. Panel verilerin dengeli mi, dengesiz mi olduğu da analiz noktasında önem arz ediyor. Özetle zamana bağlı kesitsel veriler ile çalıştığımızda, dikkat etmemiz gereken çok nokta var. Bu yazımızda panel veri analizine ilişkin kısa bir giriş yapmak istedik ve bu analiz teknikleri ile ilgili başlıca ekonometrik analiz programlarını tanıtmaya çalıştık. Panel veri analizinin başlı başına bir analiz dünyasına sahip olduğunu söylesek, abartmış sayılmayız. Gelecek yazılarımızda Haussman testi, Breusch-Pagan testi, en uygun modelin seçimi ve modellerin yorumlanması üzerine farklı içerikleri paylaşmaya devam edeceğiz.
STATA analizi, zaman alıcı ve karmaşık bir süreç olabilir. Anka Danışmanlık olarak, uzman danışman kadromuzla size STATA analizi sürecinde profesyonel destek sunuyoruz. Anka Danışmanlık olarak, size güvenilir ve profesyonel akademik danışmanlık hizmeti sunarak akademik başarıya ulaşmanıza yardımcı oluyoruz. Detaylı bilgi ve fiyat teklifi almak için hemen bizimle (506) 694 04 39 numaralı hattan iletişime geçin.