http://www.akademikdestek.net

 

EN KUCUK KARELER YONTEMI (EKKY)


Tanım
En Küçük Kareler Yöntemi, basit doğrusal, çoklu regresyon modellerinin çözümlenmesinde kullanıldığı gibi, çok denklemli ekonometrik modellerin çözümünde de kullanılan tekniklerin temelidir.
Kurulan regresyon modellerinde gözlemler, anakütle gözlem değerlerinden herhangi şekilde alınmış gözlemler olduğunu düşünürsek, aldığımız gözlem değerlerinden başka aynı sayıda olan fakat farklı olasılıklarla çok daha fazla gözlem alınabilmektedir. Kurulan regresyon modeli ilgilenilen problemle ilgili örnek olarak alınmış gözlem değerleri kullanılarak hesaplanmaya çalışılır. Bu nedenle kurduğumuz modeldeki değerler tahmini değerler olacaktır. Tahmin edilmeye çalışılan sonuç değişkeni (Y) ve sebep değişkeni katsayıları (a ve b vs.) şapka olarak göstererek, tahmini regresyon denklemi yazılmaktadır. Sapka olarak gösterilen ve tahmin olarak adlandırılan katsayıların gerçek katsayılara en yakın şekilde hesaplanması için çeşitli yöntemler geliştirilmiştir. Bunlardan en iyisi "En Küçük Kareler Yöntemi" olarak isimlendirilen yöntemdir.


Kurulan regresyon modeli, Y = a + bX ise,
Regresyon tahmini modeli, olarak gösterilmektedir.

Tahmin modelindeki katsayıların hesaplanması ve katsayılarının problem kütleyi (anakütle) iyi yansıtıyor mu, yani güvenliliğinin sınanması işlemleri sırasıyla gerçekleştirilecektir.
Regresyon analizi uygulamalarında, kurulan matemetiksel modeldeki bağımsız değişken veya değişkenlerin bağımlı değişkeni ne oranda etkilediğine katsayılar dahilinde bakılır.
Regresyon analizi için kurulan modelde, bağımlı ve bağımsız değişkenin yanısıra hata terimi olarak isimlendirilen değişken yer almaktadır. Hata teriminin modele alınma nedenlerinden bahsedersek;


Modele alınan Y ve X değişkenleri yapılan araştırmalarda yanlış ölçülmüş olabilir,
Seçilen değişkenler Y ve X'ler hatalı sayıda alınmış örnekler olabilir,
İster basit regresyon, ister çoklu regresyon modeline bakılıyor olsun, kurulacak modelde bağımlı değişkene (sonuç değişkeni), etki eden model dışında da bağımsız değişkenler (sebep değişkenleri) olabilir. Hisse senedinin fiyatını bağımlı, faiz oranlarını bağımsız değişken olarak alır, basit doğrusal regresyon modeli kurarsak, hisse senedinin fiyatını etkileyen sermaye arttırımları ve temettü ödemeleri, ekonomi ile ilgili haberler vs. başka unsurlar da vardır.
Bu unsurlar genel olarak ei hata terimi olarak alınır, minimum olması beklenir.
Hata terimini minimum yapan yöntem en küçük kareler yöntemi olup, bu yöntem katsayı değerlerinin hesaplanmasında kullanılmaktadır.

İnceleme
Basit doğrusal regresyonda kullanımı

i=1, 2,..., n'e kadar gözlem içerdiğini düşünelim. Yukarıdaki tahmini regresyon modelinde yer alan ve katsayıları ile hata teriminin hesaplanması, i=1'den n'e kadar elimizde olan Y ve X gözlem değerleri kullanılarak aşağıda verilen birtakım matemetiksel hesaplamalar ile gerçekleşmektedir.


Katsayıların anlamı ve hesaplanışı
Katsayılardan (parametre olarak da ifade edilir) katsayısı; sabit değer olarak tanımlanır ve X değişkeninin değeri sıfır iken, değişkeninin alacağı değeri gösterir. Doğru üzerinde gösterimde doğrunun başlangıç noktası olarak adlandırılır.
Katsayılardan (parametre olarak da ifade edilir) katsayısı; eğim olarak tanımlanır ve X değişkeninin bir birim arttığında, değişkenin artış oranını gösterir. Doğru üzerinde gösterimde doğrunun eğimi olarak adlandırılır.
Hata terimi ei; minimum olması beklenen hata terimi'dir.
Hesaplamalarda kullanılan ve katsayılarının hesaplanması;
veya

Not 1: olarak da ifade edilmektedirler.
Not 2: olarak da ifade edilmektedirler. Katsayıların hesaplanmasından sonra, olarak gösterilen bir regresyon tahmini değerleri, regresyon denkleminde ve katsayıları yerine koyulmak suretiyle hata terimini gözardı ederek bulunan değerdir.
Hata terimi ei, Yi'nin gerçek değeri ile tahmini değeri arasındaki farktan oluşur.

Regresyon modeli kurulup, gerekli işlemler yapıldıktan sonra modelin uygunluğuna, parametrelerin anlamına bakmak gerekmektedir.

Basit Doğrusal Modelin Belirlilik Katsayısının Hesaplanması
Kurulan regresyon modelindeki gözlem değerlerinin modele uyumuna belirlilik katsayısı ile bakabiliriz.

Bulunan belirlilik katsayısı, bağımsız değişken değerlerindeki değişimlerin ne kadarının (%) kurulan regresyon modeli ile açıklandığını gösterir. Değer 0 ile 1 arasında değişmektedir. 1'e yaklaştıkça modelin uygunluğu artmaktadır.

Basit Doğrusal Modelin Güven Aralığının Bulunması ve Hipotez Testinin Hesaplanması
En Küçük Kareler Yöntemi ile hesaplanan (sabit değer) ile (eğim) katsayısının hesaplanmasını ve ne ifade ettiğini yukarıda anlatmıştık.
Kurulan regresyon modelindeki katsayıların anakütle değerlerine ne kadar yakın olduğu yani güvenirliliği, katsayıların standart hatalarına bakılarak ölçülmektedir.
Standart hata, anakütleden örnek olarak alınan gözlem değerleri için kullanılan terimdir. Standart hata, ilgilenilen bağımsız değişkenin gözlem değerleri toplamlarının karesi alınarak, gözlem sayısı ile çarpılmış olan ilgilenilen bağımsız değişkenin ortalamadan farkları toplamına bölünmesi ile hesaplanan değerdir. Hesaplanışı güven aralığı içerisinde gösterilecektir. Anakütleyi temsil edeni standart sapmadır.
Standart hatalar, katsayıların değerlerinden küçük olmalıdır, s ile gösterilir.

Basit Doğrusal regresyon modelinde standart hataların hesaplanışı:


formülleriyle hesaplanmaktadır.
Not: = bağımsız değişken gözlem değerlerinin karelerinin toplamı.
Not: bağımsız değişken gözlem değerlerinin ortalamadan farklarının karelerinin toplamı
().
Güvenirlikten emin olmak için aralık tahmini ve hipotez testleri uygulanmalıdır.

Güven Aralığının hesaplanması:
Güven aralıkları hesaplanırken örneklem sayısı dikkate alınarak test yapılmaktadır.
(n <30) ® t testi uygulanarak güven aralıkları hesaplanmaktadır.
(n >= 30) ® z testi uygulanarak güven aralıkları hesaplanmaktadır.
Testler t ve z testleri hesaplanışları, hipotez testinde kullanılıyor olup, aynı şekilde hesaplanmaktadırlar. Örnek alınan gözlem değerlerinin sayısı dikkate alınarak sadece t ve z hesap tablolarındaki değerleri farklıdır. İstatistik kitaplarında tablo değerleri yayınlanmaktadır. Güven aralıkları için t veya z tablo değerlerinden yararlanacağız.

için güven aralığı;

için güven aralığı;



n: Gözlem sayısı
k: modeldeki değişken sayısı
n-k: serbestlik derecesidir. Tablo değerine bakarken kullanılır.

Eşitliğin ilk kısmı güven aralığının alt sınırıdır. İkinci kısım ise üst sınır değeridir. Anakütleden çekilecek her örnek için seçilen anlamlılık seviyesinde (a = 0,05 ise her 100 örnekten 95'i) gerçek anakütle parametresi olan katsayıyı içerecektir.
Güven aralığı, bakılacak a veya b katsayıları için, hipotez testi kurularak, kurulan hipotezdeki değerin güven aralığına girip girmediği ile bakılarak anlamlandırılır. Aşağıda hipotez testi ile birlikte anlatılmaktadır.

Hipotez testi
Hipotez testi, her iki katsayı için de ayrı ayrı yapılmaktadır. Hipotez testinde temel hipotez H0 hipotezidir.
Katsayılardan b katsayısının, yani eğimi gösteren katsayının 1'e eşit olduğu gösterilirse; H0 : b = 1 hipotezi kurulur. Bu hipoteze karşıt olarak katsayı eğiminin 1'e eşit olmadığını gösteren bir hipotez kurarsak (H0 : b ¹ 1), çift yönlü bir hipotez testi yapmış oluruz.
Katsayı ile H0 hipotezinin uygunluğuna yukarıda anlatılan güven aralığı yaklaşımıyla bakılırsa;
Kurulan hipotezde kullandığımız katsayı değeri (b=1) yukarıdaki formül kullanılarak bulunmuş güven aralığı değerlerinin içinde kalıyorsa, H0 kabul edilir. Yani kullanılan tahmini katsayı değeri istatistiki olarak anlamsızdır. Güven aralığı dışında kalıyorsa, H0 reddedilir.
Bizim tahmini kullandığımız istatistiki olarak anlamlıdır ve 1 değerinden önemli ölçüde farklıdır denmektedir. Katsayılardan a katsayısı için de H0 : a = 0 ve H1 : a ¹ 0 şekilde hipotez testi kurulup aynı şekilde test edilebilir.
Güven aralıkları testi dışında; katsayıların 0'dan farklı yani anlamlılığı, H0 hipotezi H0 : b = 0 kurularak test edilebilir.
Kurulan hipotez her bir katsayı için ayrı ayrı olarak kurulmalıdır.
Seçilen örnekleme büyüklüğüne göre (n <30 ® t, n >=30 ® z testi) hesaplanır. Aşağıda formülü verilen hesap değerlerinde, hipoteze göre katsayı değeri yerine değer verilir. H0 : b = 0 hipotezi kurulmuşsa, formülde b=0 alınacaktır.
Test değerlerinde aynı formül kullanılmakta olup, sadece tablo değerleri değişmektedir.
t veya z tablolarından a = 0,05 veya a = 0,01 gibi seviyelerde ve n-k serbestlik derecelerinde (k=değişken katsayısı idi) tablo değerleri bulunur.
Örnek değeri dikkate alınarak yapılan t veya z testine göre;
thes > ttab H0 reddedilir.
Hipotez testi uygulanan katsayı sıfırdan farklı ve anlamlıdır sonucuna varılır. H0 kabul ise, katsayı anlamsızdır sonucuna varılır.
Aynı şekilde; zhes > ztab ise H0 yine reddedillir.

Çoklu regresyonda kullanımı:
Çoklu regresyon modelinde bağımsız değişkeni açıklayan birden fazla bağımlı değişken modelde yer almaktadır. Ekonomik modeller, genellikle birden fazla sebebin sonucu olarak gelişen olaylardır.
Çoklu regresyon modelleri en küçük kareler yöntemi kullanılarak çözümlenebilmektedir. Kurulan çoklu regresyon modeli genel olarak aşağıdaki gibi kurulmaktadır.

Y = a + b.X2 + c.X3+ .... + z.Xk + ei

İki bağımsız değişkeni içeren modelin en küçük kareler yöntemi ile çözümü,

Y = a + b.X2 + c.X3 + ei

Kurulan çoklu regresyon modeli de basit doğrusal regresyonda olduğu gibi tahmini denklem kurularak hesaplanmaktadır. , ei hata terimi olmadan aşağıdaki şekilde yazılabilir.
olmaktadır.
aşağıda yer alan denklemler yardımıyla katsayıların çözümlenmesi mümkündür.

Katsayıların anlamı ve hesaplanışı
Basit doğrusal regresyon modelinde anlatıldığı gibi çoklu regresyon modelinde de fonksiyonlarda gözlem değerlerinin ortalamalarından farkları alınan değerler kullanılacaktır.
Yani,


Regresyon modeli kurulup, gerekli işlemler yapıldıktan sonra modelin uygunluğuna, katsayıların anlamına bakmak gerekmektedir.
Modelin uygunluğu, belirlilik katsayısı olarak isimlendirilen ve çoklu modellerde de R2 olarak isimlendirilen istatistik terimi ile hesaplanabilir.

Çoklu Regresyon Modelinin Belirlilik Katsayısının Hesaplanması
Kurulan çoklu regresyon modelindeki gözlem değerlerinin modele uyumuna belirlilik katsayısı ile bakabiliriz.

R2 kullanımı çoklu modellerde uygun olmamaktadır. Çoklu modellerde, modele yeni bir değişken ilave edildiğinde R2 değeri her zaman artmaktadır. Payın değeri artarken payda aynı kalmaktadır.
Bu nedenle düzeltilmiş çoklu belirlilik katsayısı kullanılıp, aşağıdaki şekilde hesaplanmaktadır.



Düzeltilmiş çoklu belirlilik katsayısı
R2= Çoklu belirlilik katsayısı
n= Örnek olarak seçilen gözlem sayısını
k= Modeldeki değişken katsayısı

Hesaplanan belirlilik katsayısı, bağımlı değişkendeki değişimlerin ne kadarının bağımsız değişkenler tarafından açıklandığını (%) olarak göstermektedir.
0 £ R2 £ 1 arasında değerler alır. 1'e yakın değerler olması regresyon modelinin uygun olduğunu göstermektedir.

Çoklu Regresyon Modelinin Güven Aralığının Bulunması ve Hipotez Testi Hesaplanması
En Küçük Kareler Yöntemi ile hesaplanan bağımsız değişkenin katsayılarının güvenirliliğinin test edilmesi basit doğrusal regresyon modelindeki hesaplama yöntemine benzemektedir.
Basit doğrusal regresyondaki adımlar çoklu modelde her katsayı için ayrı ayrı yapılmaktadır.
Basit doğrusal regresyonda olduğu gibi çoklu modelde de katsayıların standart hataları güvenirlilikte ve hesaplamalarda kullanılacak olması nedeniyle hesaplanmaktadır.

Çoklu regresyon modelinde standart hataların hesaplanışı:
Standart hata katsayıların değerlerinden küçük olmalıdır.



Not: Büyük Xler, (X2, X3) bağımsız değişken gözlem değerleridir.
Not: Küçük xler, (x2, x3) bağımsız değişkenlerin ortalamalarından farklarının alınmış şeklidir.

n: örnek olarak seçilen gözlem sayısı
k: modeldeki değişken sayısı

Güvenirlikden emin olmak için aralık tahmini ve hipotez testleri uygulanmalıdır.
Hesaplamalarda kullandığımız , ve katsayıları anakütlenin a, b ve c katsayılarının birer tahminidir. Kullandığımız , ve katsayılarının ortalama ve beklenen değerleri a, b ve c katsayılarına eşit olsa da anakütle parametresine kesin eşitliği söylenemez. Tahmin değerlerinin güvenirliliğine standart hata ve varyansının küçüklüğüne bakarak anakütleye yakınlığı görülür.

Güven Aralığının ve hipotez testinin hesaplanması:
Çoklu regresyon modelinde katsayıların güven aralıkları, basit regresyon modelinde olduğu gibi her bir parametre için ayrıca hesaplanmaktadır.
Çoklu regresyon modelinde basit regresyonda olduğu gibi katsayıların anlamlılığı herbir katsayı için ayrıca hesaplanmak üzere H0 hipotezi katsayıları 0'a eşitlenerek örnekleme büyüklüğüne göre (n < 30) ® t, n >= 30 ® z testi) ile bakılmaktadır.
Çoklu modeldeki katsayıların ayrı olarak test edilmesi modeldeki anlamsız katsayıların tespiti için önemlidir.
Yine güven aralığı hesaplaması da her bir katsayı için basit regresyonda olduğu gibi ayrı ayrı olarak hesaplanmaktadır.
Çoklu regresyon modelinde en çok kullanılan test parametrelerin birlikte hipotez testi olan F testi'dir.
Kurulan hipotez H0 : b = c = ... z = 0 karşıt hipotezi H1 : b ¹ c ¹ ... z ¹ 0 şeklindedir.
Regresyon modelinin anlamlılığı bütünüyle test edilmiş olur.



n: örnek olarak seçilen gözlem sayısı
k: modeldeki değişken sayısı

F değeri hesaplandıktan sonra tablo değeri ile karşılaştırılmaktadır. F tablo değeri, a = 0,05 veya a = 0,01 gibi seviyelerde ve f1 = k - 1, f2 = n - k tablodaki serbestlik derecelerinde F dağılımı tablosundan bulunan değerdir.
Sonuç olarak; Fhes > Ftab ise H0 hipotezi reddedilir. Katsayılar 0'dan farklı ve anlamlı ve çoklu regresyon modelinin uygun olduğu söylenmektedir.

Sonuç
En Küçük Kareler yöntemi kullanılarak, basit doğrusal regresyon ve çoklu regresyon modellerinde regresyon denklemlerindeki katsayılar, anlamları ve test edilmeleri aşamaları anlatılmıştır.
Regresyon analizinde modele alınan katsayılar, hipotez testi sonucu anlamlı veya anlamsızdır sonucunu içermektedir. Fakat alınan örnek sayıları problemden probleme farklılık gösterebilmektedir. Çok büyük bir kütleden oluşan problemde az sayıda örnek sayısı alınması hipotez testi sonucunu yanıltabilir. Belirli örnek sayısında katsayılar anlamsız çıkmışken örnek sayısı daha çok arttırıldığında test, katsayı anlamlıdır sonucunu verebilir. Bu nedenle problem olan kütleden seçilen örnekleme sayısına dikkat edilmelidir.
Katsayıların değerleri regresyon analizinin uygunluğu hakkında sonuçlar vermektedir. Seçilen modeldeki herhangibir bağımsız değişkenin (sebep değişkeni) katsayısı yeterli örnekleme alındığı halde anlamsızdır sonucunu veriyorsa, modeldeki değişken modelden çıkarılmalıdır.
Regresyon modelindeki bağımsız değişken katsayıları modelin durumu, anlamlılığı, gücü hakkında bilgi verdiği halde bağımlı ve bağımsız değişkenler arasındaki ilişkinin yönünü ve kuvvetini göstermemektedir. Bu nedenle korelasyon analizi ile bağımlı ve bağımsız değişken veya değişkenler arasındaki ilişkiyi korelasyon analizi ile ölçeriz.


--------------------------------------------------------------------------------
Glossary
Olasılık Bir olayın aynı koşullar altında gerçekleşmek koşuluyla meydana gelecek tüm sonuçlarına olasılık denmektedir.
Anakütle Üzerinde araştırma yapılan yani problemi oluşturan topluluğun genelidir.


ALTERNATIF EKONOMETRIK METODOLOJILER

Geleleneksel ekonomik metodoloji, belirli bir ekonomik modeli ele alır ve veriler veri hacmi için uygun olup olmadığını görmeye çalışır. Böylece eğer model Keynesyen tüketim fonksiyonu (gözlenmiş tüketim gözlenmiş gelirin fonksiyonu) veya Friedman’ın tüketim fonksiyonu ise (sürekli tüketim sürekli gelirin fonksiyonu) araştırmacı, verilen bu tüketim fonksiyonlarından birini alacak ve eldeki veriler de desteklerse bulmaya çalışacaktır. Belirli tüketim fonksiyonuna dayanarak sonucu reddetmek veya reddetmemek için bilinen regresyon kriterlerine başvurulur: R2 ,t, F, Durbin-Watson d istatistiği gibi.

Ortalama Ekonomik Reegresyon (OER) kriterleri, geleneksel yaklaşımda deneysel olmayan yollarla toplanan veriler ile çok derinlemesine araştırmalar yapılması gerekir. Ancak, bu strateji kesinlikle kuşkuludur. Verilen bir modelin parametrelerini tahminleme ve hipotez testleri ile boşuna uğraşılır fakat, uygun modelin belirlenmesi oldukça zordur. Bundan sonraki başlık ‘SpesimetriklerLimmer’e göre:

Spesimetrik: Araştırmacıyı modelinin spesifikasyonlarından birini diğerine tercih etmek için rehberlik eden işlemleri tanımlar. Ayrıca veri belirleme mekanizması belirsiz ise veri setinden uygun şekilde veri seçer ve ortaya çıkan sonuçların kimliğini bulmaya çalışır.

Bu görüşün birçok taraftarı vardır. Bu konuda bir araştırmanın görüşü şu şekildedir: “Modelin test edilmesi düşüncesi kabul edilebilir hale gelmesi için genişçe bir kesim baz alınmalıdır.“

Alternatif metodolojiyi zaten söylediği gibi; OER metodolijiye başvurmadan önce, ilk olarak spesimetriklere çok fazla dikkat etmeleri gerekir ki bu da uygun modelin seçimidir.Öncelikle yapılması gereken bu aşamadır. Bu aşama yapıldıktan sonra bunu OER tahminleri izler. Şimdi spesimetriks başlığı altında Leamer ve Hendry yaklaşımlarını inceliyelim;

1.1 LEAMER’İN MODEL SEÇİM YAKLAŞIMI

Her ne kadar Leamer Ekonometriye kapsamlı olarak katkıda bulunsa da, burada iki araştırmasından bahsedeceğiz. İlk olarak tartışacagımız konu Ortalama Ekonomik Regresyon Metodolojisini spesifikasyon araştırmalarını nasıl idare eder (model seçimi gibi ) ve Bayes istatistikleri kullanılarak araştırma yöntemlerinin nasıl geliştirileceğidir. İkinci olarak ”Sınır bağlayıcı analizi” üstlenerek regresyon sonuçlarının raporlanmasının ne şekilde güçlendirdiğini tartışmıştır.Bu iki konuyu kısaca açıklayıp tartışacağız. Leamer’e göre model spesifikasyon araştırmalarının altı değişik nedeni vardır:

ARAŞTIRMA ÇEŞİDİ AMAÇ

1) Hipotezler-testler

Doğru bir model seçebilmek

2) Yorumlama

Veriyi yorumlamak değişkenler arasında birçok ilişki gerektiriyor.

3) Basitleştirme

“Verimli” bir model kurmak

4) Vekil

Ölçmek ve anlamlı olanı ölçümler arasından seçmek.

5) Veri seçimi

Tahminlerde ve tercihte uygun veriyi seçmek.

6) Veri modeli kurmak

Varolan modeli geliştirmek.

 

 

Bütün bunların ne anlama geldiğini görmek için üretim veya mal talep teorisinde, Leamer’in keşif amacıyla yaptığı araştırmayı sunuyoruz. En basit şekliyle talep teorisi; -ceteris paribus- bir malın (örneğin portakal) niceliği; tüketicinin gelirine ve malın fiyatına bağlıdır.

Bu teoriyi uygulamak için araştırmacının öncelikle 150 hanelik bir veri ile çalıştığı ve ilk olarak bir Logaritmik - Doğrusal (log-dog) model seçsin ve aşağıdaki sonuçları bulsun.

log Yi = 6,2 + 0,85 log Ii - 0,67 log Pi

s(bi ) =(1,1) (0,21) (0,13) R2 = 0,15 (1.1.1.)

Y = Satın alınan portakalın niceliği

I = Parasal gelir

P = Portakalın fiyatı

Log-Dog modelini savunmadan Leamer araştırma programını açıklıyor.

Hipotez-Test araştırmalarına bir örnek olması açısından varsayalım ki araştırmacı fiyat elastikiyetinin -1 olduğu yönündeki hipotezi test etmek istesin. Sınırlamaları empoze ettikten sonra araştırmacı aşağıdaki sınırlandırılmış modeli tahminliyor.

log Yi + log Pi = 7,2 + 0,96 log Ii

s(bi ) = (1,0) (0,20) R2=0,14 (1.1.2.)

F testini kullanarak araştırmacı fiyat elastikiyetinin -1 olduğu yönündeki hipotezi reddeder. Portakalın besinsel değeri belki de güneş ışığı alan yerlerde daha büyüktür. Bu nedenle araştırmacı kuzey ve güney olmak üzere iki ayrı regresyon tahminler ve aşağıdaki sonuçlara ulaşır.

Log YiN = 7,3 + 0,89 log IiN - 0,60 log PiN R2 = 0,18 (1.1.3.)

s(bi ) = (1,9) (0,41) (0,25)

log IiS = 7,0 + 0,82log IiS -1,10 log PiS R2 = 0,19 (1.1.4.)

s(bi ) = (2.2) (0.31) (0.26)

N ve S güney ve kuzeyi göstermektedir. Gelir ve fiyat katsayılarının farklı olduğu yönündeki hipotez % 5 anlamlılık seviyesinde red edilemedi. Bu çalışma veri seçim araştırmalarına bir örnekti. Aynı verileri (1.1.1) tekrar kullanırsak -150 hane halkı- ve kuzey ve güney olmak üzere iki ayrı veri setine bölersek yukarıdaki sonuçlara ulaşırız.

Araştırmacı toplam harcamaların, E gelirin I veya parasal gelirin ölçülmesinden daha iyi olduğuna inanıyorsa;I’nın yerine E koyarak aşağıdaki sonuçlara ulaşır:

logYi =5.2+0.83logEi - 0.45 logPi R2 =0.18 (1.1.5)

s(bi ) =(1.0) (0.18) (0.16)

Vekil değişken araştırmalarının bir sonucu olarak E’nin katsayısı ,gelir değişkeni daha anlamlı hale gelecek, R2 değeri artacaktır.

Dikkat edilirse (1.1.5) ‘ten (1.1.4) ‘teki R2 değerinin düşük olduğu görülür.Araştırmacı başka bir ürün fiyatının talep fonksiyonunu etkiledini düşünür.(mesala greyfurt). Bu koşullar altında araştırmacı talep fonksiyonunu yeniden tahminler ve aşağıdaki sonuçlara ulaşır.

log Yi = 3.1 + 0.83 log Ei + 0.01 log Pi - 0.56 log GPi R2=0.20 (1.1.6)

s(bi ) = (1.0) (0.83) (0.15) (0.60)

GP: Greyfurtun fiyatıdır. Bu eşitlik “ yeni veri modeli yapısı”na bir örnektir ki; güneş ışığı altındaki ilk sonuçların gözden geçirilip düzeltilmiş orjinal modelidir. Her ne kadar regresyonda (1.1.6.) R2 değeri artmış; iki fiyat katsayıları ayrı ayrı istatistiksel olarak anlamsız değilse de, katsayılar yanlış işaretlidir.

Araştırmacı homojenik Postulat teorisinde, para olmama hayali, satın alınan mal ve talep fonksiyonunu hatırlarsa ( eğer gelir ve fiyatlar aynı oranda artarsa, satın alınan ürün miktarı değişmez) ve bu koşullar altında tekrar tahminlenirse

log Yi = 4,2 + 0,52 log Ei - 0,61 log Pi + 0,09 log Gpi R2= 0,19 (1.1.7.)

s(bi ) = (0,9) (0.19) (0.14) (0.31)

Bu regresyon yorumsal araştırmanın bir sonucu (1.1.6.) ‘ karşılaştırılmasında kabul ettirmeye çalıştığı homojenik hipotezin “geliştirilmesinin” regresyon sonuçlarındaki fiyat değişkeni doğru işarete sahipti ayrıca hem gelir hem de kendi fiyat değişkeni ayrı ayrı istatistiksel olarak anlamlıdır.

Greyfurt fiyat değişkeninin istatistiksel olarak anlamsız olduğuna dikkat edilirse gelir ve kendi fiyat katsayıları sayısal olarak anlamsız olması çok zor değildir. Araştırmacı son olarak aşağıdaki modeli tahmin eder.

log Yi = 3,7 - 0,58 log (Ei / Pi ) R2= 0,18 (1.1.8.)

s(bi ) = ( 0,8 ) (0,18)

1.      Regresyonu basitleştirme araştırmalarına bir örnektir. Bu araştırmalar basit, ekonomik ve aynı zamanda kullanışlı bir model izlenimi verir.

Leamer’in bağlayıcı uç analizini ( extreme bound analysis); bir regresyon modelinde bazı açıklayıcıların olduğu araştırmacının anahtar açıklayıcılara dikkat ettiği ve bazı kuşkulu terimlerin anahtar ve ikinci derecede olduğunu Leamer varsayar. Regresyonun içsel ve dışsal tüm kombinasyonlarının kuşkulu ( ikinci dereceden ) önemli olduğundan bahseder. Bu uygulamada anahtar değişkenin katsayıları regresyondan regresyona değişecektir. Böylece her anahtar değişkenin katsayıları için pek çok tahminde bulunulabilir. Tahminlerin en düşük ve en yüksek değerleri bir bağ ya da alan meydana getireceklerdir. Eğer alan teoriye uygun bir şekilde dar ise verilerin sağlıklı bilgi verceğini söyleyebiliriz. Diğer taraftan şayet veriler çok kapsamlı ise;

verilerin sonuç verdiği alanı sorudaki katsayı tahminlemesini sonlandırırız. Bu durumda ilave olunan analiz bu isimle adlandırılır.

Örnek olarak eğitimin ( E ), yaşın ( A ), aile eğitiminin (PE), kalıtsal zekanın (PIQ) kazanç üstüne etkilerini araştıran bir çalışma yapalım.

Varsayalım ki E, A ve IQ’yu anahtar değişken ve PE, PIQ’ yu kuşkulu değişken olarak ele alalım. İlk önce kazancı E, A ve IQ üzerine regres edelim, sonra E, A, IQ ve PE’ye regres edelim sonra E, A, IQ ve PIQ ve en son E, A, IQ, PE ve PIQ üzerine regres edelim böylece her katsayı için ( E, A, IQ) dört tahminimiz olmuş oluyor. E’nin dört katsayı tahmininin çok sınırlı bağda olduğunu varsayalım.bu sonuçlar E’nin katsayılarının kuşkulu değişkenleri dahil etme veya çıkarmaya fazla duyarlı olmadığı iddia ediliyor ve bu sebeple verilerimizin E’nin katsayı tahminlerini sağlam ya da sağlıklı sağladığını söyleyebiliriz.

Her ne kadar hangi değişkenin anahtar değişken ve hangi değişkenin kuşkulu değişken olduğuna karar vermek bazen kolay olmuyor, Leamer’in EBA’ sı büyük değerlere sahip oluyor. Bu konuda Darnell ve Evans’ın EBA hakkındaki notu: araştırmacıları eşitlik spesifikasyonları hakkında açıkca kesin olmayan değişkenlerin farkına varmaya zorluyor ve bilgisayar ortamındaki çalışmalardaki beyanatlarında daha dürüst olmayı sağlamaya çalışıyor. Bu regresyon sonuçlarının değerlendirilmesinde akılda bulundurulabilecek bir tavsiyedir.

1.      HENDRY’NİN MODEL SEÇİM YAKLAŞIMI

Hendry ya da Londra ekonomi okulunun ekonomik modellemeye yaklaşımı genel belirleme yaklaşımıdır ki modele bir çok açıklayıcı değişken ile başlanır ve sonra modelde sadece önemli değişkenler bırakılır. Londra ekonomi okulu (LSE) başlama noktası; ekonomik teori postulatlarının uzun denge ekonomik değişkenlerle uzun süren denge ilişkileridir. Örneğin; Y (daimi tüketim) ve X ( daimi gelir) olmak üzere ilişki şu şekilde özetlenebilir.

Yt = a Xt

Hendry ve okulu göstergelerinde zaman serileri t testi ile inceleme yapmışlardır. Çünkü LSE metodolojisi ekonomik verilerin miktarını zaman serileri ile geliştirmişti.

Elbette uzun dönem ilişkilerini saptamak uzun süre alıyor. Bu yüzden LSE metodoloji prosesine ulaşmak için aşağıdaki dinamik prosedürü uygulamak gerekir.

Yt = ß 0Xt + ß 1Xt - 1 + ……+ ß mXt - m + d 1Yt-1 + d 2Yt-2 +……d mYt-m + ut (1.2.2.)

Bu t zamanındaki X değişkeninin değerlerini Y üstüne regres ederek t, (t-1) (t-2),……. (t-m) indeks olarak modele alınır. Bu otoregresif modellere bir örnektir çünkü değişkenlerin geciktirilmiş değerleri açıklayıcı değişken olarak ortaya çıkmaktadır.

Hendry’nin genel modeli olarak adlandırılan model (1.2.2.)’de değişkenlerin birçok geciktirilmiş değerlerini ( m ) içerir. Böyle bir model çok geneldir çünkü m değerleri kesinlik belirtir. Eğer X ve Y için elimizde yeterli verilerimiz varsa - örneğin 100 hane - model kaç tane geciktirilmiş değer içerebilir? Modele daha fazla açıklayıcı değişken eklemeye devam ettiğimizi varsayarsak her eklenen değişken için bir serbestlik derecesi kaybedeceğiz. Serbestlik derecesindeki yavaş yavaş azalışın istatistiki sonucu sarsıntılı bir yükseliştir.

O halde genel bir modelden spesifik ya da basitleştirilmiş modele nasıl gidilir? Bu, gecikmenin derecesini nasıl kararlaştıracağımız sorusunun cevabıdır. Hendry ve Richard’a göre basitleşmiş bir model aşağıdaki altı kriteri sağlamalıdır.

1-Kabul edilebilir veri, modelin mantıksal olanına yardımcı olur.

2-Teori ile tutarlı olmak, Bu modelin iyi ekonomik anlamlar çıkarmak zorunda olmasını ifade eder. Böylece, eğer sürekli gelir hipotezi içine alırsa; yani sürekli tüketim fonksiyonundaki değerler sürekli gelirde sıfır olmak zorundadır.

3-Açıklayıcı değişkenlerin hata terimiyle korelasyonsuz olmalıdır.

4-Parametre değerleri sabit olmalıdır, aksi halde tahminleme güç olur.

5-Modelden tahminlenen artıklar sadece tesadüfi olmalı, eğer aksi bir durum söz konusu olursa modelde spesifikasyon hatası bulunur.

6-Model tüm rakip modellerin fikirlerini kapsamalı yada içermelidir ki sonuçların açıklamasında geçerli olsun. Diğer bir deyişle;diğer modeller seçilen model üzerinde değişiklik yapamazlar.

Açıkça böylesi bir model seçmek için; doğru,son modele ulaşmadan önce birçok spesifikasyon denememiz gerekir.Bu yüzdendir ki Hendry metodolijisi TTT olarak bilinir ki bu da Test Test veTesttir.

1.      TANISAL TESTLERİN SEÇİMİ

GENEL AÇIKLAMALAR

Yeterli modeller içinden seçme işleminde, ekonometristler bir dizi testler geliştirmiştirler. Ayrıntılara girmeden bu testler iki katogoriye ayrılır;

1.      Yuvalanmış (nested) modellerin (hipotezlerin) testi

2.      Yuvalanmamış (nonnested) modellerin (hipotezlerin) testi

İkisi arasındaki farkı görmek için aşağıdaki iki modeli dikkate alalım.

Model A: Yi = ß 1 + ß 2X2i + ß 3X3i+ ß 4X4i + ui

Model B: Yi = ß 1 + ß 2X2i + ß 3X3i +ui

Model B, model A içinde “yuvalanmış” diyebiliriz çünkü model B; model A’nın özel bir durumudur. Eğer model A ‘ tahminleyerek Ho: ß 4 = 0 hipotezini test ederek red etmezsek model A model B’ ye indirgenir. Böylece model A içinde Y mal talebinin miktarını, X2 Malin birim fiyatını, X3 tüketicinin gelirini, X4 diğer malların fiyatını göstersin. ß 4 = 0 hipotezinin anlamı; diğer üretilen malların fiyatı üretim talep miktarına hiç bir katkısı yoktur şeklindedir. Bu hipotezi F testiyle veya tek tek t testiyle test edebiliriz. Şimdi aşağıdaki modelleri inceleyelim:

Model C : Yi = a 1+a 2X2i+ui

Model D: Yi = ß 1+ß 2Z2i +vi

X ve Z farklı değişken grubundandır. C ve D modelleri yuvalanmamış modellerdir çünkü biri diğerinin özel bir durumu haline gelemiyor. Ekonomide, diğer bilimlerde olduğu gibi, birden fazla farklı ( rekabet eden ) teori bir fenomeni açıklar. Bu durumda Maniteristler Gayri Safi Milli Hasıla’daki değişikliklerle paranın rolünü açıklamışlardır ki Keynesyenciler bu durumu devlet harcamalarındaki değişikliklerle açıklamışlardır. Yuvalanmış bir modeli nasıl test ederiz?

1.      YUVALANMAMIŞ HİPOTEZLERİN TESTİ

Harvey’e göre kısaca açıklamak gerekirse yuvalanmamış bir hipotezi test etmenin iki yaklaşımı vardır;

1 “ayırım yaklaşımı”: Bu yaklaşım, verilen iki ya da daha fazla rakip modelden iyi, uygun olanı bazı kriterlere göre seçmek şeklindedir.

2 “anlayışlı yaklaşım” (yazarın terimolojisi) burada bir modeli araştırırken diğer modellerin hesap bilgilerine de ulaşırız. Şimdi bu yaklaşımları açıklayalım.

1.      AYIRIM YAKLAŞIMI:

Yukarıda bahsettiğimiz model C ve model D’yi ele alalım. Her iki modeli de tahmin ettiğimizi varsayalım. Sonra bu iki model arasından (ya da daha fazla ) bazı kriterlere göre bir seçim yapabiliriz. Örneğin; iki modelin düzeltilmiş R2 lerini elde edebilir ve daha yüksek R2 değerini seçebiliriz. Elbette ki R2 değerini karşılaştırırken bağımlı değişken aynı formda olmalıdır. Literatürde iyi uyum sağlamayı ölçmek için R2 nin yanında Hocking’in Sp ölçümü, Mallow’un Cp ölçümü, Ammemiya’nın PC ölçümü ve Akaike’nin AIC ölçümüne artı olarak Schrwardz Kriteri, Hannan-Quinn Kriteri ve de Shibibata Kriteri gibi bazı kıstaslar vardır. Bu ölçümleri tartışmak bizi konumuzdan uzaklaştıracağı için bunları refernas olarak bırakalım. SHAZAM, ET ve TSP gibi bilgisayar paket programları yukarıda zikredilen bir ya da daha çok istatistiği ölçmektedir.

Kullanılan ölçme tekniğini gözardı ederek ayırım yaklaşımının bir sakıncası bu kriterlerden birinin temelleri üzerine modelleri basitçe sıraya koyar ve seçilen iyi uyum model ölçüsünün en yüksek değerini veren modelini seçer. Görünüşe göre eğer bir model diğerleri arasında ise (örneğin en yüksek R2 değeri) veriye en iyi uyum sağladığı ve en doğru model olduğu inancı vardır. Birçokları bunun en iyi strateji olmadığına inanır. Bununla beraber incelenmekte olan model tahmin edilirken, alternatif modellere dikkat eden bir test prosedürü geliştirmeye ihtiyacımız vardır. Bu fikir daha sonra görülecek olan sezgici yaklaşımın temellerini oluşturur.

1.4.2. SEZGİSEL YAKLAŞIM:

Yuvalanmış F testi: Bölüm 1.3.’deki C ve D modellerini tekrar ele alalım bu iki model arasından nasıl seçim yapabiliriz. Aşağıdaki hibrit ya da yuvalanmış modelleri tahmin ettiğimizi varsayalım.

Model E: Yi = ? 1 + ? 2 X2 i + ? 3Z2 i + u i

Model E’nin model C ve D’yi yuvaladığını ya da kapsadığına dikkat edelim. Fakat C’nin D içinde yuvalanmadığını ve D’nin C içinde yuvalanmadığını yani yuvalanmamış olduğuna dikkat edelim.

Eğer şimdi C modeli doğruysa ? 3 = 0 şayet model D doğruysa ? 2=0 olacaktır. Bununla beraber rekabet eden modellerin basit bir testi yuvalanmamış modeli çalıştırmalı, ? 2 ve ? 3 ün istatistiksel anlamlılığı için t testiyle test etmeli ya da daha genel olarak rekabet eden modellerden bir değişkenden daha fazlası çıkartıldığında Wald F testi kullanılmalıdır. Bu yüzden isim Yuvalanmış F Testidir. Herşeye rağmen bu test prosedürü ile ilgili problemler vardır;

1.      Eğer X2 ve Z2 yüksek oranda doğrusal ise ? 2 = ? 3 = 0 hipotezinin red edilmesine karşın ne ? 2 ne de ? 3 0’dan farklıdır. Bu durumda ne model C’nin ne de model D’nin doğru model olduğuna karar vermenin hiçbir yolu yoktur.

2- Başka bir problem daha vardır. Model C’yi referans hipotez ya da referans model seçtiğimizi ve bütün katsayıları anlamlı bulduğumuzu varsayalım. Modele Z’yi ekler ve Wald F testini uygulayarak açıklanan kareler toplamına artan katkının anlamsız olduğunu buluruz. Bu nedenle C modelini seçmeye karar veriririz. Fakat bunun yerine referans hipotezi olarak D modelini seçtiğimizi ve tüm katsayıları istatistiki olarak anlamlı olduğunu varsayalım. Ama bu modele X2 eklendiğinde yine F testini kullanarak ESS’ ye artış katkısı anlamsız olduğunu buluruz. Bu nedenle D modelini doğru model olarak seçmiştik. Dolayısıyla referans hipotezinin özellikle basit çoklu doğrusallığının rekabet halindeki değişkenler içindeki, sunumunda modelin seçimindeki sonucu belirleyebilmelidir.

Konuyla ilgili bir örnek St. Louis Modeli: Nominal GSMH’deki değişiklikler ya para arzındaki değişikliklerle (manitarizm) ya da devlet harcamalarındaki değişikliklerle (Keynezizim) belirlenir. Aşağıdaki modelleri inceleyelim.

Yt = a + ß 0Mt + ß 1Mt-1 + ß 2Mt-2 + ß 3Mt-3 + ß 4Mt-4 + u1t

4

= a + S ß iMt-1 + u1t (1.4.1.) i = 0

Yt = ? + ? 0Et + ? 1Et-1 + ? 2Et-2 + ? 3Et-3 + ? 4Et-4 + u2t

4

= ? + S ? iEt-i + u2t (1.4.2.)

i = 0

Yt = t zamanında GSMH’daki büyüme oranı

Mt = t zamanında para arzındaki büyüme oranı ( M1 versiyonu)

Et = t zamanında istihdam kamu harcamalarının büyüme oranı

(1.4.1.) ve (1.4.2.) dağıtılmış gecikmeli modellere bir örnektir. Basitçe anlatırsak; bir birim para arzındaki değişmenin ya da GSMH’daki devlet harcamalarının etkisi belli bir zaman aralığına dağıtılmıştır. Bir öncekinden beri iki model arasında karar vermek zor olabilir. Öyleyse iki modeli aşağıdaki gibi ifade edelim.

4 4

Yt = sabit + S ß iMt-1 + S ? i Et-I + u3t (1.4.3.)

i = 0 i = 0

Bu yuvalanmış model bilinen St. Louis modelinin bir formudur. Modelin sonuçları Birleşik Devletler Merkez Bankası 1953-I 1976-IV zaman periyodunu kapsamaktadır. t istatistikleri parentez içindedir.

Katsayılar Tahminler t İstatistikleri

ß 0

0,40

(2,96)

ß 1

0,41

(5,26)

ß 2

0,25

(2,14)

ß 3

0,06

(0,71)

ß 4

-0,05

(-0,37)

4

S ß i 1,06 ( 5,59)

i = 0

?

0,08

(2,26)

?

0,06

(2,52)

?

0,00

(0,02)

?

-0,06

(-2,20)

?

-0,07

(-1,83)

4

S ? i 0,03 (0,40)

i = 0

Bu sonuçlardan yola çıkarak iki modelden herhangi biri diğerine ne gibi üstünlükler sağlıyor? Eğer M, E ve Y’de birim değişimin kümülatif etkisini alırsak sırasıyla S ß i = 1,06 ve S ? i = 0,03’e ulaşırız ki ilkinin istatistiksel olarak anlamlı ikincisinin anlamsız olduğu sonucu ortaya çıkar. Bu karşılaştırma maniteristlerin iddalarını desteklemeye daha yatkındır. GSMH’daki değişikliği belirleyen para arzındaki değişikliktir.

Davidson - MacKinnon J testi: Yuvalanmış F testi prosedüründeki sıralanan problemlerden dolayı alternatif testler üretilmiştir. Bunlardan biri de Davidson - MacKinnon J testidir bu testi örneklemek için yine model C ve D’yi karşılaştıralım. J testi aşağıdaki adımları izler;model C ve model D’ yi yeniden yazalım

1.      Model D’yi tahminleriz ve buradan tahminlenmiş Y değerlerini buluruz YiD

2.      Birinci adımda önceden bulunmuş Y değerlerini model C’ye değişken olarak ilave ederiz ve aşağıdaki modeli tahmin ederiz.

Yt = a 1 + a 2 X2i + a 3 Yi D +ui (1.4.5)

Y değerleri birinci adımdan bulunmuştur. Bu model “ Hendry metodolojisinin kapsama prensibi ”ne bir örnektir.

1.      t testi kullanarak a 3 = 0 hipotezini test et.

1.      Eğer a 3 = 0 hipotezi red edilmezse model C’yi doğru model olarak kabul edebiliriz. Çünkü Y (1.4.5.) içinde yer almaktadır ki model C içinde yer almayan değişkenin etkisini göstermektedir. Model C nezdinde ek olarak hiçbir açıklayıcı gücü yoktur. Diğer bir deyişle; bir bakıma model C model D’yi kapsar ki sonraki model, model C’nin performansını yükseltecek hiçbir bilgi vermez. Aynı şekilde eğer Ho hipotezi red edilirse C modeli doğru model olmaz.

2.      Şimdi model C ve D’nin ya da hipotezlerinin yerlerini değiştirelim.İlk önce model C’yi tahminleyip bu modelden tahminlenmiş Y değerlerini değişken olarak (1.4.5.) de kullanalım ve dördüncü adımı tekrarlayalım. Model D’yi model C üzerinden kabul edip etmeyeceğimize karar verelim. Daha açık olarak aşağıdaki modeli tahminleyelim.

Yi = ß +ß 2Z2i +ß 3Yic (1.4.6)

Yic C modelindeki Y değerlerinden tahmin edilmiştir. Şimdi ß 3 = 0 hipotezini test edelim. Eğer hipotez red edilmezse model C aracılığıyla model D’yi seçeriz. Eğer ß 3 = 0 hipotezi red edilirse D aracılığıyla C’yi seçeriz ki ikinci model C’nin performansını geliştirmez.