Você está na página 1de 34

Correlation and regression problems 

1. The following data represent the years of experience X and salary Y(in thousand dollars) of a random 
sample of professional engineers (n= 27) 

X  1  2  2  3  3  4  4  6  6  6  7  7  9  9  9  12  12 
Y  25  28  37  31  40  36  43  40  43  51  42  55  41  51  60  50  64 
 

13  14  18  18  20  21  22  22  25  25 
52  66  53  70  70  60  61  71  58  74 
 

a. Find the coefficient of correlation r.  
b. Is it sufficient sample evidence to indicate that there is linear correlation between the years of experience and 
salary? 
c. Test the hypothesis that  ρ = 0.6 against the alternative  ρ > 0.6 . Use  α = 0.01  
 
2. A chemical engineer is studying the effect of temperature on the yield of a certain product in chemical process. 
The process is run 10 times and the following data is observed for the temperature of each process X and 
corresponding yield Y. 
Temperature X (in  °C )  95  110  118  124  145 140 185 190  205  222 
Yield (in kgs)  108  126  102  121  118 155 158 178  159  184 
 
The following information is available:  ∑ x = 1534 ,  ∑ x 2
= 252, 684 ,  ∑ y = 1409  , ∑ y 2 = 206, 319  

∑ xy = 226,463  
a. Find the coefficient of correlation r.  
b. Is it sufficient sample evidence to indicate that there is linear correlation between temperature and yield of 
chemical product? 
c. Test the hypothesis that  ρ = 0.8 against the alternative  ρ ≠ 0.8 . Use  α = 0.05  


 
 
3. In the following data, X represents the number of years of formal education and  Y represents the salary in 
thousands of dollars of a random sample of adult males. 
X  13  17  9  18  16  18  13  16 
Y  21.6  25.8  15.9  48.3  38.2  56.4  28.4  43.3 
 
a. Plot the scatter diagram. 
b. Compute the coefficient of correlation and test the hypothesis  H 0 : ρ = 0  against  H1 : ρ ≠ 0 . 
c. Find the coefficients of the least –squares line and write the equation for estimated regression line. 
d. Compute mean square error. 
e. Find a 95% confidence interval  for  β1  and  β 0 . 
f. Test the hypothesis that  β 0 = 0  against the alternative  β 0 ≠ 0 . 
g. Test the hypothesis that  β1 = 0  against the alternative  β1 ≠ 0 . 
h. Estimate the true mean response  µY | x to x = 16 years of education. 
i. Predict the salary Y corresponding to 16 years of education. 
j. Find the coefficient of determination and explain its meaning. 
k. Construct ANOVA table for regression. 
 
 
4. The table below displays the mathematics achievement test scores for a random sample of n = 10 students, 
selected from the population of 12th graders, together with their final calculus grades. 
 
Math achievement  39  43  21  64  57  47  28  75  34  52 
 Test score 
Final calculus grade  65  78  52  82  92  89  73  98  56  75 
 
 
 
a. Find the coefficients of the least –squares line and write the equation for estimated regression line. 
b. B. Determine whether there is significant relationship between the calculus grades and test scores .  
Use  α = 0.05  
c. Find a 95% confidence interval for the slope of regression line. 
d. Estimate the average calculus grade for the students whose achievement score is 50 with a 95% CI. 
e. A student took the achievement test, but has not yet taken the calculus test. Predict the calculus grade for 
this student with a 95% prediction interval. 
f. Find a 95% confidence interval for the intercept of regression line. 
g. Calculate the coefficient of determination and explain its meaning. 
h. Construct ANOVA table for regression. 
 
 
 


 
5. You are given data set with 6 pairs of x‐ values and y –values. We assume that x is independent variable and y is 
dependent variable. 
x   ‐2  ‐1  0  1  2 
y  1  1  3  5  5 
 
a. Find the least –squares line for the data. 
b. Do the data present sufficient evidence to indicate that y and x are linearly related? 
MSR
c. Construct thee ANOVA table for linear regression and use to calculate F =   . Verify that the square of test 
MSE
statistic used in part b. coincides with critical value for F at  α = 0.05 . 
d. Find 90% confidence interval for the slope of the line. 
e. Estimate the average value of y when x =1, using 90% confidence interval. 
f. Find a 90% prediction  interval for future value of y when x =1. 
 
6. The data, together with a portion of Minitab printout, is given below. Certain information in Minitab printout is 
missed.  
x   1  2  3  4  5  6 
y  5.6  4.6  4.5  3.7  3.2  3.7 
 
a. Find the least –squares line for the data. 
b. Fill in the missing entries in the MINITAB analysis of variance table. 
c. Do the data present sufficient evidence to indicate that y and x are linearly related? 
Use the information in the MINITAB printout to answer this question at the 1% level of significance. 
d. Find the coefficient of determination. 
e. Find 90% confidence interval for the slope of the line. 
f. Estimate the average value of y when x =2, using 90% confidence interval. 
g. Find a 95% prediction  interval for the future value of y when x =2. 
 
Predictor                   Coef                               St. dev                                t                                       P 
Constant                  6.0000                          0.1759                             34.10                              0.000 
   X                          ‐ 0.55714                        0.04518                          ‐12.33                              0.000 
S = 0.1890                      R –sq =97.4% 
Analysis of variance 
Source                             DF                             SS                           MS 
 
Regression                       *                               *                            5.4221 
Residual error                 *                         0.1429                          * 
Total                                 *                         5.5750                              


 

Você também pode gostar