Você está na página 1de 13

Applied Econometrics, Group Assignment: The Gravity Model of International Trade .

Due date for this assignment is May 30th, 2012


Mark Vancauteren April 22, 2012

1 Gravity Equation of International Trade


1. You will need to build your dataset. Include variables on exports, imports or total trade (exports + imports), GDP of the trading partners and the international distances. In an extended version you will also need to add data like population, and other geographic data (adjacency and language, colony, etc.). Since we are working with cross section data, choose one particular year. 2. Look at the data and try to understand the model. 3. Look at the correlation between variables, provide some summary statistics (mean values, tandard deviations and minimum and maximum values) and plot (i) Tij versus yi, (ii) Tij versus yj and (iii) Tij versus dij ;
Algemeen

Descriptive Statistics N logExport logDistance logGDP country i logGDP country j Valid N (listwise) 214 264 264 264 214 Minimum ,00 5,15 11,78 9,34 Maximum 20,72 9,88 16,49 16,49 Mean 13,3392 8,3593 13,9873 12,9669 Std. Deviation 3,50020 1,18089 1,36605 1,49220

Correlatie
Correlations logExport logExport Pearson Correlation Sig. (2-tailed) N logDistance Pearson Correlation Sig. (2-tailed) N logGDP country i Pearson Correlation Sig. (2-tailed) N logGDP country j Pearson Correlation Sig. (2-tailed) N 214 -,350
**

logDistance -,350
**

logGDP country i ,206


**

logGDP country j ,416


**

,000 214 1

,003 214 -,057 ,358

,000 214 ,094 ,126 264 -,028 ,654

,000 214 ,206


**

264 -,057 ,358 264 ,094 ,126 264

264 1

,003 214 ,416


**

264 -,028 ,654 264

264 1

,000 214

264

Correlations logExport logExport Pearson Correlation Sig. (2-tailed) N logDistance Pearson Correlation Sig. (2-tailed) N logGDP country i Pearson Correlation Sig. (2-tailed) N logGDP country j Pearson Correlation Sig. (2-tailed) N 214 -,350
**

logDistance -,350
**

logGDP country i ,206


**

logGDP country j ,416


**

,000 214 1

,003 214 -,057 ,358

,000 214 ,094 ,126 264 -,028 ,654

,000 214 ,206


**

264 -,057 ,358 264 ,094 ,126 264

264 1

,003 214 ,416


**

264 -,028 ,654 264

264 1

,000 214

264

**. Correlation is significant at the 0.01 level (2-tailed).

4. Which country-pairs are high traders, which country-pairs are low traders? Explain in your own words what possible factors are behind this trade heterogeneity?

Hoge traders: Mexico en USA zijn hoge traders. Dit is te verklaren door het tropische klimaat dat er heerst in deze landen. Een tropisch klimaat is immers ideaal voor de groei van de katoenplant. Veel productie betekent ook veel export, aangezien slechts een deel wordt gehouden voor binnenlands gebruik. Laag:
5. Based on you .ndings, explain (no more than two short paragraphs) what you conclude from your .ndings in (a), (b) ane (c)?Hoe groter de afstand, hoe lager de export, negatieve correlatie (-0,35).

Hoe groter het BBP van de exporteur, hoe hoger de export, positieve correlatie (0,260). Hoe groter het BBP van de importeur, hoe meer hij dus gaat importeren, en hoe meer het andere land dus gaat exporteren, positieve correlatie (0,416). Dit komt dus overeen met de verwachtingen. De cofficinten zijn significant, omdat de p-waarden telkens kleiner zijn dan 0,01. Mexico VS het meeste export. Mexico grote exporteur van katoen. Verschillende die nul waren, wegens geen export naar dat land.

II. Building the Model a. Run the regression, Tij = a + b1yi + b2yj + b3dij + eij , interpret the estimated slope coefficients (including the constant). Do the sign of these coefficients make sense? What about the overall fit of your model? Interpret your cofficients.
Model Summary Adjusted R Model 1 R ,675
a

Std. Error of the Estimate

R Square ,456

Square ,448

2,60058

a. Predictors: (Constant), logGDPreporter, logGDPpartner, logDistance

ANOVA Model 1 Regression Residual Total Sum of Squares 1189,325 1420,230 2609,555 df

Mean Square 3 210 213 396,442 6,763

F 58,619

Sig. ,000
a

a. Predictors: (Constant), logGDPreporter, logGDPpartner, logDistance b. Dependent Variable: logExport

Coefficients

Standardized Unstandardized Coefficients Model 1 (Constant) logDistance logGDPpartner logGDPreporter a. Dependent Variable: logExport B -4,027 -1,421 ,685 1,458 Std. Error 2,784 ,152 ,132 ,139 -,489 ,265 ,553 Coefficients Beta t -1,447 -9,323 5,172 10,517 Sig. ,150 ,000 ,000 ,000

Regressievergelijking: Xij = -4,027 + 0,685 Yi + 1,458 Yj 1,421 Dij


1% stijging in distance zorgt voor een daling van de export met 1,421% 1%stijging in GDP country i zorgt voor een stijging van de export met 0,685% 1% stijging in GDP country j zorgt voor een stijging van de export met 1,458% De constante is negatief en geeft het snijpunt met de y-as weer. Dit is de waarde van de export alles alle variabelen nul zijn. Aangezien dit negatief is heeft dit geen betekenis, want export kan niet negatief zijn. De cofficinten zijn zoals verwacht, een grotere afstand zorgt voor een daling van de export. Een toename van het BBP zorgt voor hogere export. Dit komt overeen met onze eerdere bevindingen op basis van de correlaties. De adjusted R is 0,448. Dit houdt in dat 44,8% van de variantie in de totale export verklaard kan worden door de regeressoren/variabelen.

b. Equation (1) can be augmented with other variables. For instance: Tij = a + b1yi + b2yj + b3dij + b4ADJij + b5LANGij + eij (2) where ADJij is a dummy variables and equal 1 when country i and country j share the same border and 0 otherwise; LANGij is dummy variable and equal 1 when country i and country j share the same language; and all other variables are defined previously. Estimate the following model in OLS and interpret the new results (with the new variables).
Model Summary Adjusted R Model 1 R ,675
a

Std. Error of the Estimate

R Square ,456

Square ,443

2,61202

a. Predictors: (Constant), logGDPreporter, Dummy Language, logGDPpartner, logDistance, Dummy Adjacency

ANOVA Model 1 Regression Residual Total Sum of Squares 1190,445 1419,110 2609,555 df

Mean Square 5 208 213 238,089 6,823

F 34,897

Sig. ,000
a

a. Predictors: (Constant), logGDPreporter, Dummy Language, logGDPpartner, logDistance, Dummy Adjacency b. Dependent Variable: logExport

Coefficients

Standardized Unstandardized Coefficients Model 1 (Constant) logDistance logGDPpartner Dummy Adjacency Dummy Language logGDPreporter a. Dependent Variable: logExport B -4,164 -1,388 ,680 ,272 ,007 1,452 Std. Error 2,823 ,173 ,134 ,738 ,614 ,140 -,478 ,262 ,023 ,001 ,551 Coefficients Beta t -1,475 -8,013 5,062 ,369 ,012 10,360 Sig. ,142 ,000 ,000 ,712 ,991 ,000

Regressievergelijking: Xij = -4,164 + 0,680 Yi + 1,452 Yj 1,388 Dij + 0,272ADJij + 0,007LANGij


1% stijging in distance zorgt voor een daling van de export met 1,388% 1%stijging in GDP country i zorgt voor een stijging van de export met 0,680% 1% stijging in GDP country j zorgt voor een stijging van de export met 1,452%
Als de dummy variabele ADJij de waarde 1 aanneemt, dit wil zeggen dat de landen aan elkaar grenzen, dan zal het totale exportvolume met 0,272 toenemen, alle andere cofficinten constant gehouden. Als de dummy variabele LANGij de waarde 1 aanneemt, dit wil zeggen dat er in beide landen dezelfde taal wordt gesproken, dan zal het totale exportvolume met 0,007 toenemen, alle andere cofficinten constant gehouden. De cofficinten distance, GDP country i en GDP country j zijn significant op 1%. De pwaarde bedraagt 0,000 wat dus kleiner is dan 0,01. De cofficinten adjacency en language zijn absoluut niet significant, de p-waarde bedragen 0,712 en 0,991. Dit is logisch omdat de export afhangt van de aanwezigheid van de katoenplant en niet van de gemeenschappelijke talen of grenzen. Puur de aanwezigheid van de katoenplant, bepaalt de export. De adjusted R is quasi constant gebleven, dit wijst er op dat de 2 nieuwe variabelen weinig tot geen relevantie hebben in dit model.

From chapter 7 we have seen the technicalities related to a F-test. Test unitary elasticities doing a joint test on the income variables that is, H0 : b1 = b2 = 1 versus Ha : b1 6= 1 either/or b2 6= 1 How would you interpret the implications of this test? Hint: in SPSS you will have to perform this test by rearranging equation (2). Alternatively, also test whether b1 = b2? Given the set of variables that you have, which equation would yield the best specification?

b)

H0: 1 + 2 2 = 0 H1: 1 + 2 2 0

Xij = -4,164 + 0,680 Yi + 1,452 Yj 1,388 Dij + 0,272ADJij + 0,007LANGij + eij Xij = -4,164 + 0,680 Yi + 1,452 Yi 2Yi + 1,452 Yj 1,452 Yi + 2 Yi - 1,388 Dij + 0,272ADJij + 0,007LANGij + eij Xij = -4,164 + (0,680 + 1,452 2) Yi + 1,452 (Yj - Yi) + 2 Yi - 1,388 Dij + 0,272ADJij + 0,007LANGij + eij Xij = -4,164 + 0,132 Yi + 1,452 (Yj - Yi) + 2 Yi - 1,388 Dij + 0,272ADJij + 0,007LANGij + eij Xij - 2 Yi = -4,164 + 0,132 Yi + 1,452 (Yj - Yi) - 1,388 Dij + 0,272ADJij + 0,007LANGij + eij

Model Summary Adjusted R Model 1 R ,758


a

Std. Error of the Estimate

R Square ,575

Square ,565

2,61202

a. Predictors: (Constant), logGDPpartner, logDistance, Dummy Language, Dummy Adjacency, YjminYi

ANOVA Model 1 Regression Residual Total Sum of Squares 1918,580 1419,110 3337,690 df

Mean Square 5 208 213 383,716 6,823

F 56,242

Sig. ,000
a

a. Predictors: (Constant), logGDPpartner, logDistance, Dummy Language, Dummy Adjacency, YjminYi b. Dependent Variable: Xij2Yi

Coefficients

Standardized Unstandardized Coefficients Model 1 (Constant) logDistance Dummy Adjacency Dummy Language YjminYi logGDPpartner B -4,164 -1,388 ,272 ,007 1,452 ,131 Std. Error 2,823 ,173 ,738 ,614 ,140 ,204 -,423 ,021 ,001 ,723 ,045 Coefficients Beta t -1,475 -8,013 ,369 ,012 10,360 ,644 Sig. ,142 ,000 ,712 ,991 ,000 ,520

Niet significant, want log GDP partner is 0,520 > 0,005. We kunnen dus H0 niet verwerpen, dus 1 + 2 2 = 0 .

1 en/of 2 zijn niet significant verschillend van 1.

H0: 1 - 2 = 0 H1: 1 - 2 0 Xij = -4,164 + 0,680 Yi + 1,452 Yj 1,388 Dij + 0,272ADJij + 0,007LANGij + eij Xij = -4,164 + (0,680 - 1,452) Yi + 1,452 (Yi + YJ) 1,388 Dij + 0,272ADJij + 0,007LANGij + eij Xij = -4,164 0,772 Yi + 1,452 (Yi + YJ) 1,388 Dij + 0,272ADJij + 0,007LANGij + eij

Model Summary Adjusted R Model 1 R ,675


a

Std. Error of the Estimate

R Square ,456

Square ,443

2,61202

a. Predictors: (Constant), YiplusYj, Dummy Adjacency, Dummy Language, logDistance, logGDPpartner

ANOVA Model 1 Regression Residual Total Sum of Squares 1190,445 1419,110 2609,555 df

Mean Square 5 208 213 238,089 6,823

F 34,897

Sig. ,000
a

a. Predictors: (Constant), YiplusYj, Dummy Adjacency, Dummy Language, logDistance, logGDPpartner b. Dependent Variable: logExport

Coefficients

Standardized Unstandardized Coefficients Model 1 (Constant) logDistance Dummy Adjacency Dummy Language logGDPpartner YiplusYj a. Dependent Variable: logExport B -4,164 -1,388 ,272 ,007 -,772 1,452 Std. Error 2,823 ,173 ,738 ,614 ,184 ,140 -,478 ,023 ,001 -,298 ,754 Coefficients Beta t -1,475 -8,013 ,369 ,012 -4,194 10,360 Sig. ,142 ,000 ,712 ,991 ,000 ,000

Log GDP partner is significant want 0 < 0,005 We kunnen dus HO verwerpen en stellen dat 1 - 2 0.

Do some analysis using the tabular approach explained in section 7.6. of SW by making, and commenting on, a table with your result similar to table 7.1 ? Conclude and explain your final model?

Regressor LogGDPpartner (Yi) LogGDPreporter (Yj) LogDistance (Dij) Dummy Adjacency (ADJij) Dummy Language (LANGij)

(1) 0,532** (0,174)

(2) 0,623** (0,157) 1,147** (0,160)

(3) 0,685** (0,132) 1,458** (0,139)

(4) 0,686** (0,133) 1,457** (0,139)

(5) 0,679** (0,133) 1,452** (0,140)

(6) 0,68** (0,134) 1,452** (0,140)

-1,421** -1,416** -1,388** -1,388** (0,152) (0,156) (0,173) (0,173) 0,276 (0,679) 0,095 (0,566) 5,833* (2,465) 3,4335 0,038 264 10,682** (3,192) 3,0849 0,223 264 -4,027 (2,784) 2,60058 0,448 264 -4,079 (2,808) 2,60662 0,445 264 -4,162 (2,809) 2,60576 0,446 264 0,272 (0,738) 0,007 (0,614) -4,164 (2,823) 2,61202 0,443 264

Intercept Summary Statistics SER Adjusted R n

De individuele cofficint is statistisch significant op een *5%-niveau of **1%-niveau, gebruikmakend van een tweezijdige hypothesetest

Interpretatie?

c. Consider model (2) again. A researcher might be interested in analyzing whether the income elasticities (b1 and/or b2) are dierent according to some criteria (size of the country, rich/poor, distant versus non-distant). Create a dummy variable that controls for such heterogeneity. HINT: To create a dummy! This can be done in "transform" menu and choosing "new variable". First, you generate a new variable "Size" =0. Then you choose the "transform" menu and choosing "new variable" and select the new variable that you just created. You let this variable be "1" if "using your own judgment". On the basis of table 8.4. (Key Concept 8.4.) there are three possibilities in which the created dummy "Size" can be used in the estimating model (2): same intercept/dierent slope; dierent intercept/same slope; dierent slope/dierent intercept). So there are a total of three regressions that needs be regressed. Based on your estimation, which model do you prefer, and why?

Model 1: Verschillende intercept, dezelfde helling:


Model Summary Adjusted R Model 1 R ,675
a

Std. Error of the Estimate

R Square ,456

Square ,446

2,60573

a. Predictors: (Constant), Size, logGDPreporter, logDistance, logGDPpartner

ANOVA Model 1 Regression Residual Total Sum of Squares 1190,479 1419,076 2609,555 df

Mean Square 4 209 213 297,620 6,790

F 43,833

Sig. ,000
a

a. Predictors: (Constant), Size, logGDPreporter, logDistance, logGDPpartner b. Dependent Variable: logExport

Coefficients

Standardized Unstandardized Coefficients Model 1 (Constant) logGDPpartner logGDPreporter logDistance Size a. Dependent Variable: logExport B -2,942 ,602 1,458 -1,433 ,283 Std. Error 3,835 ,241 ,139 ,156 ,685 ,232 ,554 -,493 ,039 Coefficients Beta t -,767 2,494 10,499 -9,208 ,412 Sig. ,444 ,013 ,000 ,000 ,681

Xij = -2,942 + 0,602 Yi + 1,458 Yj 1,433 Dij + 0,283 Si

Model 2: Verschillende intercept, verschillende helling:


Model Summary Adjusted R Model 1 R ,688
a

Std. Error of the Estimate

R Square ,474

Square ,461

2,56885

a. Predictors: (Constant), GDPpartnerXsize, logGDPreporter, logDistance, logGDPpartner, Size

ANOVA Model 1 Regression Residual Total Sum of Squares 1236,962 1372,594 2609,555 df

Mean Square 5 208 213 247,392 6,599

F 37,489

Sig. ,000
a

a. Predictors: (Constant), GDPpartnerXsize, logGDPreporter, logDistance, logGDPpartner, Size b. Dependent Variable: logExport

Coefficients

Standardized Unstandardized Coefficients Model 1 (Constant) logGDPpartner logGDPreporter logDistance Size GDPpartnerXsize a. Dependent Variable: logExport B 20,639 -1,150 1,475 -1,653 -25,375 1,998 Std. Error 9,656 ,702 ,137 ,174 9,691 ,753 -,444 ,560 -,569 -3,478 4,109 Coefficients Beta t 2,137 -1,639 10,761 -9,481 -2,618 2,654 Sig. ,034 ,103 ,000 ,000 ,009 ,009

Xij = 20,639 - 1,150 Yi + 1,475 Yj 1,653 Dij 25,375 Si + 0,032 (Yi * Si)

Model 3: Dezelfde intercept, dezelfde helling:


Model Summary Adjusted R Model 1 R ,676
a

Std. Error of the Estimate

R Square ,457

Square ,446

2,60459

a. Predictors: (Constant), GDPpartnerXsize, logGDPreporter, logDistance, logGDPpartner

ANOVA Model 1 Regression Residual Total Sum of Squares 1191,718 1417,837 2609,555 df

Mean Square 4 209 213 297,929 6,784

F 43,917

Sig. ,000
a

a. Predictors: (Constant), GDPpartnerXsize, logGDPreporter, logDistance, logGDPpartner b. Dependent Variable: logExport

Coefficients

Standardized Unstandardized Coefficients Model 1 (Constant) logGDPpartner logGDPreporter logDistance GDPpartnerXsize a. Dependent Variable: logExport B -2,095 ,538 1,459 -1,442 ,032 Std. Error 4,284 ,281 ,139 ,157 ,053 ,208 ,554 -,497 ,065 Coefficients Beta t -,489 1,915 10,506 -9,197 ,594 Sig. ,625 ,057 ,000 ,000 ,553

Xij = -2,095 + 0,538 Yi + 1,459 Yj 1,442 Dij + 0,032 (Yi * Si) Op basis van bovenstaande tabellen verkiezen we model omdat dit model de hoogste adjusted R (0.868) en een lagere SER (0.61) hebben. Bovendien zijn in beide modellen 4 van de 5 cofficinten significant op 1%-niveau, terwijl dit niet het geval is bij model 2.

Você também pode gostar