Ekonometrický model

1 ÚVOD

19. augusta 2012

adminfr 1. Úvod Komentáre vypnuté na 1 ÚVOD

Cieľom tejto práce je odhadnúť ekonometrický model lúpeží v štáte South Dakota.

Úlohy:

1. Odhadnúť najlepší klasický model lineárnej regresie (t. j. v modeli sa vysporiadať s prípadnými problémami heteroskedasticity, autokorelácie, multikolinearity).

2. Pomocou RESET testu testovať, či navrhnutý model je vhodne špecifikovaný.

3. Vykonať intervalovú predpoveď vysvetľovanej premennej pre nasledujúce obdobie

Vysvetľovaná premenná: počet lúpeží na 100tis. Obyv (robbery)

Vysvetľujúce premenné: podiel černošskej populácie (afam)

počet ľudí (population)

reálny osobný dôchodok (income)

hustota obyvateľstva (density)

Štát: South Dakota

2 ODHADNUTIE NAJLEPŠIEHO MODELU

19. augusta 2012

adminfr 2. Odhadnutie najlepšieho modelu Komentáre vypnuté na 2 ODHADNUTIE NAJLEPŠIEHO MODELU

Za najlepší model príjmeme ten, ktorého premenné budú štatisticky významné a zároveň sa v tomto modeli nebude vyskytovať heteroskedasticita, autokorelácia, multikolinearita.

Pracujeme v programe R. Hladina významnosti α, na ktorej budeme testovať je 0,05.

Heteroskedasticitu zisťujeme funkciou bptest.Hypotézy : H₀: v modeli nieje heteroskedasticita , H₁: v modeli sa vyskytuje heteroskedasticita. H₀ potvrdzujeme ak nám bptestom výjde p hodnota vyššia ako α=0,05.H₀ zamietame ak nám bptestom výjde p hodnota nižšia ako α=0,05

Autokoreláciu zisťujeme funkciou dwtest.Hypotézy : H₀: v modeli nieje autokorelacia , H₁: v modeli sa vyskytuje autokorelácia. H₀ potvrdzujeme ak nám dwtestom výjde dw hodnota blízko hodnoty 2.H₀ zamietame ak nám dwtestom výjde dw hodnota veľmi odlišná od hodnoty 2.

Multikolinearitu zisťujeme funkciou dwtest.Hypotézy : H₀: v modeli nieje Multikolinearita , H₁: v modeli sa vyskytuje Multikolinearita. H₀ potvrdzujeme ak nám vif-testom výjdu hodnoty všetkých vysvetľovaných, štatisticky významných premenných, menšie ako 5.H₀ zamietame sú tieto hodnoty vyššie ako 5.

2.1 Modely s pôvodnými údajmi.

19. augusta 2012

adminfr 2.1. Modely s pôvodnými údajmi Komentáre vypnuté na 2.1 Modely s pôvodnými údajmi.

V týchto modeloch vystupujú iba pôvodné údaje v štáte South Dakota.

> u<-read.csv2(“udaje.csv”,row.names=”year”)

> u

Zdrojové údaje:

robbery afam population income density

1977 17.9 2.339211 0.688480 10441.040 0.0090643

1978 15.9 2.423829 0.688580 11226.220 0.0090656

1979 20.3 2.491668 0.688334 11192.780 0.0090624

1980 20.1 2.524423 0.690851 9843.678 0.0090959

1981 17.8 2.544488 0.689569 10358.300 0.0090790

1982 17.1 2.514136 0.690615 10232.280 0.0090928

1983 15.9 2.519391 0.692985 10195.000 0.0091240

1984 14.9 2.550775 0.697239 11142.620 0.0091800

1985 17.1 2.593929 0.698400 11058.290 0.0091953

1986 16.2 2.641168 0.695980 11349.770 0.0091634

1987 12.3 2.695240 0.696042 11591.310 0.0091642

1988 12.2 2.758011 0.698148 11625.490 0.0091920

1989 11.7 2.845020 0.696691 11857.900 0.0091728

1990 12.4 2.934257 0.696667 12373.360 0.0091790

1991 18.8 2.979279 0.701445 12398.490 0.0092419

1992 16.9 3.050100 0.708698 12755.860 0.0093375

1993 15.0 3.075289 0.716258 12791.290 0.0094371

1994 18.7 3.108550 0.723038 13175.900 0.0095264

1995 25.9 3.149601 0.728251 12980.590 0.0095951

1996 18.9 3.297938 0.730699 13802.360 0.0096274

1997 23.3 3.394381 0.730855 13839.610 0.0096294

1998 20.2 3.438749 0.730789 14536.910 0.0096286

1999 14.1 3.544923 0.733133 14974.520 0.0096595

2.1.1 Modely 1

19. augusta 2012

adminfr 2.1. Modely s pôvodnými údajmi Komentáre vypnuté na 2.1.1 Modely 1

> model1<-lm(robbery~afam+population+income+density,u)

> summary(model1)

Call:

lm(formula = robbery ~ afam + population + income + density,

data = u)

Residuals:

Min 1Q Median 3Q Max

-4.5562 -2.1474 -0.2624 1.7012 5.8267

Coefficients:

Estimate Std. Error t value Pr(>|t|)

(Intercept) -1.922e+02 6.634e+01 -2.898 0.0096 **

afam -1.129e+01 8.387e+00 -1.346 0.1949

population -8.171e+03 5.226e+03 -1.564 0.1353

income -2.130e-03 1.570e-03 -1.357 0.1916

density 6.492e+05 3.969e+05 1.635 0.1193

—

Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 2.819 on 18 degrees of freedom

Multiple R-squared: 0.4795, Adjusted R-squared: 0.3638

F-statistic: 4.145 on 4 and 18 DF, p-value: 0.01491

Všetky vysvetľujúce premenné sú málo významné, preto vyhadzujem afam, pretože má najvyššiu hodnotu p.

> model1.1<-lm(robbery~population+income+density,u)

> summary(model1.1)

Call:

lm(formula = robbery ~ population + income + density, data = u)

Residuals:

Min 1Q Median 3Q Max

-4.2666 -2.3038 -0.2116 1.9284 6.6482

Coefficients:

Estimate Std. Error t value Pr(>|t|)

(Intercept) -1.517e+02 6.038e+01 -2.513 0.02115 *

population -5.233e+03 4.849e+03 -1.079 0.29398

income -3.548e-03 1.189e-03 -2.984 0.00763 **

density 4.201e+05 3.662e+05 1.147 0.26554

—

Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 2.879 on 19 degrees of freedom

Multiple R-squared: 0.4271, Adjusted R-squared: 0.3366

F-statistic: 4.721 on 3 and 19 DF, p-value: 0.01261

Ešte vždy sa v modeli nachádzajú málo významné premenné, vyhadzujem population , pretože má navyššiu hodnotu p.

> model1.2<-lm(robbery~income+density,u)

> summary(model1.2)

Call:

lm(formula = robbery ~ income + density, data = u)

Residuals:

Min 1Q Median 3Q Max

-3.7428 -2.4569 -0.6081 1.7178 6.2749

Coefficients:

Estimate Std. Error t value Pr(>|t|)

(Intercept) -1.781e+02 5.543e+01 -3.213 0.00436 **

income -3.044e-03 1.098e-03 -2.772 0.01176 *

density 2.496e+04 7.251e+03 3.443 0.00258 **

—

Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 2.891 on 20 degrees of freedom

Multiple R-squared: 0.3919, Adjusted R-squared: 0.3311

F-statistic: 6.446 on 2 and 20 DF, p-value: 0.00691

V modeli 1.2 už máme významné premenné, preto tento model ideme ďalej testovať.

Testujeme heteroskedasticitu pomocou bptest :

H₀: nieje heteroskedasticita

H₁: je heteroskedasticita

> bptest(model1.2)

studentized Breusch-Pagan test

data: model1.2

BP = 1.3819, df = 2, p-value = 0.5011

P hodnota je väčšia ako α, H₀ nezamietame. Môžeme predpokladať, že v modeli 1.2 nieje heteroskedasticita.

Testujeme autokoreláciu pomocou dwtest :

H₀: nieje autokorelácia

H₁: je autokorelácia

> dwtest(model1.2,alternative=”two.sided”)

Durbin-Watson test

data: model1.2

DW = 1.4019, p-value = 0.05822

alternative hypothesis: true autocorelation is not 0

DW hodnota je ďaleko od hodnoty2 , model 1.2 je v tzv. “šedej zone”.

Záver: Model 1.2 zamietame, vytvárame nový model.

2.1.2 Modely 2

19. augusta 2012

adminfr 2.1. Modely s pôvodnými údajmi Komentáre vypnuté na 2.1.2 Modely 2

Logaritmická transformáacia, model 2.

model2<-lm(log(robbery)~log(afam)+log(population)+log(income)+log(density),u)

> summary(model2)

Call:

lm(formula = log(robbery) ~ log(afam) + log(population) + log(income) +

log(density), data = u)

Residuals:

Min 1Q Median 3Q Max

-0.24462 -0.12938 -0.01104 0.10066 0.33037

Coefficients:

Estimate Std. Error t value Pr(>|t|)

(Intercept) 1880.3363 914.0024 2.057 0.0544 .

log(afam) -2.3300 1.2376 -1.883 0.0760 .

log(population) -413.2077 210.7683 -1.960 0.0656 .

log(income) -1.3551 0.9589 -1.413 0.1747

log(density) 428.8655 210.8769 2.034 0.0570 .

—

Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.1593 on 18 degrees of freedom

Multiple R-squared: 0.509, Adjusted R-squared: 0.3999

F-statistic: 4.665 on 4 and 18 DF, p-value: 0.009254

Ešte vždy sa v modeli nachádzajú málo významné premenné, vyhadzujem income, pretože má najvyššiu hodnotu p.

> model2.1<-lm(log(robbery)~log(afam)+log(population)+log(density),u)

> summary(model2.1)

Call:

lm(formula = log(robbery) ~ log(afam) + log(population) + log(density),

data = u)

Residuals:

Min 1Q Median 3Q Max

-0.23296 -0.12386 -0.03878 0.14694 0.25830

Coefficients:

Estimate Std. Error t value Pr(>|t|)

(Intercept) 1829.261 936.940 1.952 0.06579 .

log(afam) -3.389 1.011 -3.353 0.00334 **

log(population) -405.048 216.146 -1.874 0.07640 .

log(density) 419.824 216.239 1.941 0.06718 .

—

Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.1634 on 19 degrees of freedom

Multiple R-squared: 0.4546, Adjusted R-squared: 0.3684

F-statistic: 5.278 on 3 and 19 DF, p-value: 0.008108

V modeli 2.1 už máme významné premenné, preto tento model idem ďalej testovať.

Testujeme heteroskedasticitu pomocou bptest :

H₀: nieje heteroskedasticita

H₁: je heteroskedasticita

> bptest(model2.1)

studentized Breusch-Pagan test

data: model2.1

BP = 1.2493, df = 3, p-value = 0.7412

P hodnota je väčšia ako α, H₀ nezamietame. Môžeme predpokladať, že v modeli 2.1 nieje heteroskedasticita.

Testujeme autokoreláciu pomocou dwtest :

H₀: nieje autokorelácia

H₁: je autokorelácia

> dwtest(model2.1,alternative=”two.sided”)

Durbin-Watson test

data: model2.1

DW = 1.6105, p-value = 0.1076

alternative hypothesis: true autocorelation is not 0

DW hodnota nieje najidealnejšia, ale rozhodli sme sa juakceptovať, H₀ nezamietame, v modeli 2.1 nie je autokorelácia.

Testujeme multikolinearitu pomocou vif.

H₀: nieje multikolinearita

H₁: je multikolinearita

> vif(model2.1)

log(afam) log(population) log(density)

12.86449 20328.06488 20891.66361

Hodnoty su vyššie ako 5,H₀ zamietame,H₁prijímame, v modeli 2.1 sa nachádza multikolinearita.

Záver: Model 2.1 zamietame, vytvárame nový model

2.1.3 Modely 3

19. augusta 2012

adminfr 2.1. Modely s pôvodnými údajmi Komentáre vypnuté na 2.1.3 Modely 3

V týchto modeloch využijeme diferenciálnu transformáciu.

>model3<-lm(diff(robbery)~diff(afam)+diff(population)+diff(income)+diff(density),u)

> summary(model3)

Call:

lm(formula = diff(robbery) ~ diff(afam) + diff(population) +

diff(income) + diff(density), data = u)

Residuals:

Min 1Q Median 3Q Max

-4.623 -2.230 0.070 1.518 5.615

Coefficients:

Estimate Std. Error t value Pr(>|t|)

(Intercept) 5.655e-01 1.562e+00 0.362 0.722

diff(afam) -1.238e+01 2.274e+01 -0.544 0.593

diff(population) -4.417e+03 7.694e+03 -0.574 0.573

diff(income) -2.699e-03 1.776e-03 -1.520 0.147

diff(density) 3.498e+05 5.864e+05 0.596 0.559

Residual standard error: 3.62 on 17 degrees of freedom

Multiple R-squared: 0.2085, Adjusted R-squared: 0.02222

F-statistic: 1.119 on 4 and 17 DF, p-value: 0.38

Všetky vysvetľujúce premenné sú málo významné, preto vyhadzujem afam, pretože má najvyššiu hodnotu p.

>model3.1<-lm(diff(robbery)~diff(population)+diff(income)+diff(density),u)

> summary(model3.1)

Call:

lm(formula = diff(robbery) ~ diff(population) + diff(income) +

diff(density), data = u)

Residuals:

Min 1Q Median 3Q Max

-5.2003 -2.1339 -0.0041 1.5906 5.5832

Coefficients:

Estimate Std. Error t value Pr(>|t|)

(Intercept) -6.051e-02 1.037e+00 -0.058 0.9541

diff(population) -3.741e+03 7.443e+03 -0.503 0.6214

diff(income) -3.038e-03 1.631e-03 -1.863 0.0789 .

diff(density) 2.996e+05 5.677e+05 0.528 0.6041

—

Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 3.549 on 18 degrees of freedom

Multiple R-squared: 0.1947, Adjusted R-squared: 0.06044

F-statistic: 1.45 on 3 and 18 DF, p-value: 0.2614

Ešte vždy sa v modeli nachádzajú málo významné premenné, vyhadzujem population , pretože má najvyššiu hodnotu p.

> model3.2<-lm(diff(robbery)~diff(income)+diff(density),u)

> summary(model3.2)

Call:

lm(formula = diff(robbery) ~ diff(income) + diff(density), data = u)

Residuals:

Min 1Q Median 3Q Max

-5.2981 -2.1578 -0.0934 1.9891 5.5808

Coefficients:

Estimate Std. Error t value Pr(>|t|)

(Intercept) 4.423e-02 9.959e-01 0.044 0.9650

diff(income) -2.958e-03 1.591e-03 -1.860 0.0785 .

diff(density) 1.451e+04 2.025e+04 0.717 0.4823

—

Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 3.478 on 19 degrees of freedom

Multiple R-squared: 0.1834, Adjusted R-squared: 0.0974

F-statistic: 2.133 on 2 and 19 DF, p-value: 0.1460

Ešte vždy sa v modeli nachádzajú málo významné premenné, vyhadzujem density , pretože má najvyššiu hodnotu p.

> model3.3<-lm(diff(robbery)~diff(income),u)

> summary(model3.3)

Call:

lm(formula = diff(robbery) ~ diff(income), data = u)

Residuals:

Min 1Q Median 3Q Max

-5.2171 -1.7167 -0.4599 1.7368 6.1416

Coefficients:

Estimate Std. Error t value Pr(>|t|)

(Intercept) 0.459348 0.800248 0.574 0.572

diff(income) -0.003067 0.001564 -1.961 0.064 .

—

Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 3.436 on 20 degrees of freedom

Multiple R-squared: 0.1613, Adjusted R-squared: 0.1193

F-statistic: 3.846 on 1 and 20 DF, p-value: 0.06394

V modeli 3.3 už máme významné premenné, preto tento model ideme ďalej testovať.

Testujeme heteroskedasticitu pomocou bptest :

H₀: nieje heteroskedasticita

H₁: je heteroskedasticita

> bptest(model3.3)

studentized Breusch-Pagan test

data: model3.3

BP = 2.0019, df = 1, p-value = 0.1571

P hodnota je väčšia ako α, H₀ nezamietame. Môžeme predpokladať, že v modeli 3.3 nieje heteroskedasticita.

Testujeme autokoreláciu pomocou dwtest :

H₀: nieje autokorelácia

H₁: je autokorelácia

> dwtest(model3.3,alternative=”two.sided”)

Durbin-Watson test

data: model3.3

DW = 2.1541, p-value = 0.6741

alternative hypothesis: true autocorelation is not 0

DW hodnota je blízko 2,H₀ nezamietame, v modeli nie je autokorelacia.

Nieje možné testovať multikolinearitu, pretože máme len jednu premennú.

Záver: Model 3.3 zamietame.

2.1.4 Záver modelov s pôvodnými údajmi

19. augusta 2012

adminfr 2.1. Modely s pôvodnými údajmi Komentáre vypnuté na 2.1.4 Záver modelov s pôvodnými údajmi

Rozhodol som sa rozšíriť model o ďalšie štáty (Tennessee, Texas), pretože všetky premenné nám vychádzajú málovýznamné, prípadne nám nevýchádzajú testy autokorelácie, multikolinearity, prípadne mi ostane len jedna premenná s malou významnosťou.

2.2 Modely rozšírené o ďalšie údaje.

19. augusta 2012

adminfr 2.2. Modely rozšírené o ďalšie údaje Komentáre vypnuté na 2.2 Modely rozšírené o ďalšie údaje.

Pôvodné údaje rozšírime o ďalšie štáty Tennessee a Texas. Pre potreby predikcie budeme tieto pridané údaje považovať za údaje štátu South Dakota z predchádzajúcich období.

> u<-read.csv2(“udaje2.csv”)

Nové údaje:

robberyafam population income density

1 17.9 2.339211 0.688480 10441.040 0.0090643

2 15.9 2.423829 0.688580 11226.220 0.0090656

3 20.3 2.491668 0.688334 11192.780 0.0090624

4 20.1 2.524423 0.690851 9843.678 0.0090959

5 17.8 2.544488 0.689569 10358.300 0.0090790

6 17.1 2.514136 0.690615 10232.280 0.0090928

7 15.9 2.519391 0.692985 10195.000 0.0091240

8 14.9 2.550775 0.697239 11142.620 0.0091800

9 17.1 2.593929 0.698400 11058.290 0.0091953

10 16.2 2.641168 0.695980 11349.770 0.0091634

11 12.3 2.695240 0.696042 11591.310 0.0091642

12 12.2 2.758011 0.698148 11625.490 0.0091920

13 11.7 2.845020 0.696691 11857.900 0.0091728

14 12.4 2.934257 0.696667 12373.360 0.0091790

15 18.8 2.979279 0.701445 12398.490 0.0092419

16 16.9 3.050100 0.708698 12755.860 0.0093375

17 15.0 3.075289 0.716258 12791.290 0.0094371

18 18.7 3.108550 0.723038 13175.900 0.0095264

19 25.9 3.149601 0.728251 12980.590 0.0095951

20 18.9 3.297938 0.730699 13802.360 0.0096274

21 23.3 3.394381 0.730855 13839.610 0.0096294

22 20.2 3.438749 0.730789 14536.910 0.0096286

23 14.1 3.544923 0.733133 14974.520 0.0096595

24 145.8 5.279520 4.422921 10041.550 0.1070200

25 152.4 5.289421 4.486313 10535.560 0.1085538

26 166.1 5.319052 4.560474 10451.900 0.1103483

27 180.6 5.422877 4.600252 10057.670 0.1117787

28 171.7 5.456529 4.627667 10078.820 0.1124448

29 175.7 5.478490 4.646043 10005.240 0.1128913

30 172.8 5.497006 4.659755 10276.000 0.1132245

31 166.8 5.512830 4.686740 10983.430 0.1138802

32 180.9 5.548528 4.715287 11340.720 0.1145739

33 207.7 5.570521 4.738713 11812.460 0.1151431

34 193.8 5.608800 4.782930 12198.190 0.1162175

35 173.6 5.648223 4.822437 12554.220 0.1171774

36 160.4 5.677438 4.854461 12754.050 0.1179556

37 191.2 5.716466 4.890626 12817.600 0.1186469

38 212.9 5.761827 4.946886 12794.690 0.1200118

39 218.2 5.822478 5.013999 13376.400 0.1216400

40 220.1 5.891873 5.085666 13601.550 0.1233786

41 207.4 5.952993 5.163016 13907.710 0.1252551

42 223.2 5.998587 5.241168 14257.200 0.1271511

43 223.7 6.064974 5.313576 14255.750 0.1289077

44 214.0 6.108415 5.378433 14485.450 0.1304812

45 178.0 6.169424 5.432679 15027.540 0.1317972

46 156.8 6.246919 5.483535 15277.700 0.1330309

47 152.4 4.556185 13.193060 11473.480 0.0503294

48 164.4 4.580187 13.500430 12089.540 0.0515020

49 191.8 4.601943 13.888370 12250.590 0.0529820

50 208.5 4.744435 14.338210 12038.010 0.0547224

51 193.3 4.805927 14.746310 12484.540 0.0562800

52 220.0 4.883739 15.331410 12343.750 0.0585130

53 189.3 4.936255 15.751680 12303.000 0.0601170

54 178.5 4.970795 16.007080 12846.760 0.0610918

55 193.5 5.008519 16.272740 13145.500 0.0621056

56 239.9 5.036673 16.561110 12875.990 0.0632062

57 226.7 5.067045 16.621800 12704.220 0.0634379

58 234.2 5.099752 16.667020 12902.810 0.0636105

59 223.1 5.170434 16.806730 13107.370 0.0641437

60 260.8 5.237154 17.044710 13303.000 0.0650775

61 286.5 5.293086 17.339900 13267.650 0.0662046

62 252.5 5.372058 17.650480 13593.660 0.0673904

63 224.4 5.464688 17.996760 13659.420 0.0687125

64 204.8 5.533391 18.338320 13836.480 0.0700166

65 179.8 5.657364 18.679710 14078.000 0.0713200

66 171.5 5.734717 19.006240 14323.700 0.0725667

67 157.0 5.807885 19.355430 15045.590 0.0738999

68 145.1 5.868867 19.712390 15759.520 0.0752628

69 146.7 5.940265 20.044140 16046.730 0.0765295

2.2.1 Modely 1

19. augusta 2012

adminfr 2.2. Modely rozšírené o ďalšie údaje Komentáre vypnuté na 2.2.1 Modely 1

> model1<-lm(robbery~afam+population+income+density,u)

>summary(model1)

Call:

lm(formula = robbery ~ afam + population + income + density,

data = u)

Residuals:

Min 1Q Median 3Q Max

-79.401 -12.141 -3.179 17.917 79.514

Coefficients:

Estimate Std. Error t value Pr(>|t|)

(Intercept) 6.499e+01 4.178e+01 1.556 0.1247

afam -2.095e+00 2.601e+01 -0.081 0.9361

population 7.464e+00 1.568e+00 4.759 1.15e-05 ***

income -4.793e-03 4.050e-03 -1.184 0.2409

density 1.318e+03 6.145e+02 2.145 0.0357 *

—

Signif.codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 28.81 on 64 degrees of freedom

Multiple R-squared: 0.8998, Adjusted R-squared: 0.8935

F-statistic: 143.6 on 4 and 64 DF, p-value: < 2.2e-16

Máme málo významné premenné, odstránime afam, lebo má najvyššiu hodnotu p.

> model1.1<-lm(robbery~population+income+density,u)

>summary(model1.1)

Call:

lm(formula = robbery ~ population + income + density, data = u)

Residuals:

Min 1Q Median 3Q Max

-79.25 -11.91 -3.20 18.13 79.48

Coefficients:

Estimate Std. Error t value Pr(>|t|)

(Intercept) 6.263e+01 2.961e+01 2.115 0.0382 *

population 7.346e+00 5.672e-01 12.952 <2e-16 ***

income -5.050e-03 2.474e-03 -2.041 0.0453 *

density 1.269e+03 7.930e+01 16.003 <2e-16 ***

—

Signif.codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 28.59 on 65 degrees of freedom

Multiple R-squared: 0.8998, Adjusted R-squared: 0.8951

F-statistic: 194.5 on 3 and 65 DF, p-value: < 2.2e-16

Všetky premenné už sú významné, model 1.1 ďalej testujeme.

Testujeme heteroskedasticitu pomocou bptest :

H₀: nieje heteroskedasticita

H₁: je heteroskedasticita

>bptest(model1.1)

studentizedBreusch-Pagan test

data: model1.1

BP = 28.1645, df = 3, p-value = 3.355e-06

P hodnota je menšia ako α, H₀zamietame, H₁prijímame. Môžeme predpokladať, že v modeli 1.1 je heteroskedasticita.

Záver: Model zamietame.

2.2.2 Modely 2

19. augusta 2012

adminfr 2.2. Modely rozšírené o ďalšie údaje Komentáre vypnuté na 2.2.2 Modely 2

Logaritmická transformácia, model 2.

>model2<-lm(log(robbery)~log(afam)+log(population)+log(income)+log(density),u)

>summary(model2)

Call:

lm(formula = log(robbery) ~ log(afam) + log(population) + log(income) +

log(density), data = u)

Residuals:

Min 1Q Median 3Q Max

-0.43683 -0.08424 0.00284 0.13841 0.41880

Coefficients:

Estimate Std. Error t value Pr(>|t|)

(Intercept) 8.99469 2.25607 3.987 0.000174 ***

log(afam) 0.07482 0.51092 0.146 0.884038

log(population) 0.40217 0.03236 12.429 < 2e-16 ***

log(income) -0.34305 0.32857 -1.044 0.300373

log(density) 0.61733 0.13584 4.545 2.5e-05 ***

—

Signif.codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.1866 on 64 degrees of freedom

Multiple R-squared: 0.9761, Adjusted R-squared: 0.9746

F-statistic: 652.8 on 4 and 64 DF, p-value: < 2.2e-16

V modeli odstránime najmenej významnú premennú afam, pretože má najvyššiu hodnotu p.

>model2.1<-lm(log(robbery)~log(population)+log(income)+log(density),u)

>summary(model2.1)

Call:

lm(formula = log(robbery) ~ log(population) + log(income) + log(density),

data = u)

Residuals:

Min 1Q Median 3Q Max

-0.43779 -0.08643 0.00150 0.13860 0.42296

Coefficients:

Estimate Std. Error t value Pr(>|t|)

(Intercept) 8.80037 1.81071 4.860 7.75e-06 ***

log(population) 0.40354 0.03075 13.122 < 2e-16 ***

log(income) -0.30445 0.19459 -1.565 0.123

log(density) 0.63653 0.03515 18.110 < 2e-16 ***

—

Signif.codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.1852 on 65 degrees of freedom

Multiple R-squared: 0.9761, Adjusted R-squared: 0.975

F-statistic: 883.8 on 3 and 65 DF, p-value: < 2.2e-16

V modeli odstránime najmenej významnú premennú income, pretože má najvyššiu hodnotu p.

> model2.2<-lm(log(robbery)~log(population)+log(density),u)

>summary(model2.2)

Call:

lm(formula = log(robbery) ~ log(population) + log(density), data = u)

Residuals:

Min 1Q Median 3Q Max

-0.49408 -0.06866 0.02820 0.13069 0.39445

Coefficients:

Estimate Std. Error t value Pr(>|t|)

(Intercept) 5.97667 0.14773 40.45 <2e-16 ***

log(population) 0.38754 0.02932 13.22 <2e-16 ***

log(density) 0.64435 0.03517 18.32 <2e-16 ***

—

Signif.codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.1872 on 66 degrees of freedom

Multiple R-squared: 0.9752, Adjusted R-squared: 0.9744

F-statistic: 1296 on 2 and 66 DF, p-value: < 2.2e-16

Všetky premenné už sú významné, model 2.2 ďalej testujeme.

Testujeme heteroskedasticitu pomocou bptest :

H₀: nieje heteroskedasticita

H₁: je heteroskedasticita

>bptest(model2.2)

studentizedBreusch-Pagan test

data: model2.2

BP = 6.5528, df = 2, p-value = 0.03776

P hodnota je menšia ako α, H₀zamietame, H₁prijímame. Môžeme predpokladať, že v modeli 2.2 je heteroskedasticita.

Záver: Model zamietame.

Ekonometrický model

1 ÚVOD

2 ODHADNUTIE NAJLEPŠIEHO MODELU

2.1 Modely s pôvodnými údajmi.

2.1.1 Modely 1

2.1.2 Modely 2

2.1.3 Modely 3

2.1.4 Záver modelov s pôvodnými údajmi

2.2 Modely rozšírené o ďalšie údaje.

2.2.1 Modely 1

2.2.2 Modely 2

Najnovšie články

Kategórie