Você está na página 1de 9

INSTITUTO SUPERIOR DE CONTABILIDADE E AUDITORIA DE MOÇAMBIQUE

Disciplina: Estatistica II Data: 21.06.2023


Curso: LCA, LCFin, LCPA e LCF Duração: 2 horas
Ano/Semestre: 2º Ano/ 1 º Semestre Docente: O Grupo de disciplina
Exame Normal-Variante I
GUIÃO DE CORRECÇÃO

A inferência estatística tem por objectivo fazer generalizações sobre uma população com base em valores
amostrais. A inferência pode ser feita estimando os parâmetros por ponto e por intervalo.

1. Das afirmações que seguem, assinale com V as afirmações verdadeiras e F as Falsas: (3.0 val)
a) O Teorema do Limite Central, só pode ser aplicado para populações com distribuíção não normal e
amostras grande; Falso
b) Para populações infinitas, a variança populacional é igual a variança amostral; Falso
c) Quanto maior o p-valor, maior a credibilidade da hipótese alternativa. Falso
d) Uma vez definida a região de confiança para um determinado parâmetro da população, várias hipóteses
nulas podem ser testadas utilizando-se este intervalo de confiança. Verdade
e) A aceitação de determinada hipótese nula implica que esta hipótese seja verdadeira. Verdade
f) O erro tipo I é a probabilidade de rejeitar a hipótese nula quando ela é de facto verdadeira. Falso

2. Um auditor dum cersto banco, declara que as contas de cartões de crédito são normalmente distribuídas com
média de 2870, 00 Mt e um desvio padrão de 900, 00 Mt. Se selecciona 25 titulares de cartões de crédito de
forma aleatória:
a) Qual é a probabilidade de que a média da conta deles seja menor que 2500,00 Mt? (1.5 val)
Resolução
Do problema temos:
𝜇 = 2870; 𝜎 = 900; 𝑛 = 25; 𝑥̅ = 2500 (0.2 val)
Pede-se 𝑃(𝑥̅ < 2500)
𝜎2 𝑥̅ − 𝜇
𝑥̅ ~𝑁 (𝜇; ) → 𝑍~𝑁(0; 1) 𝑂𝑛𝑑𝑒 𝑍 = 𝜎 (𝟎. 𝟏 𝐯𝐚𝐥)
𝑛
√𝑛
Então:

2500 − 2870
𝑃(𝑥̅ < 2500) = 𝑃 (𝑍 < ) (𝟎. 𝟗 𝐯𝐚𝐥)
900
√25

1
𝑃(𝑍 < −2.06) = 0.5 − 𝑃(−2.06 ≤ 𝑍 ≤ 0) = 0.0197 (𝟎. 𝟐 𝐯𝐚𝐥)
A probabilidade de que a média da conta deles seja menor que 2500,00 Mt é de 1.97%. (0.1 val)

b) Desconfiando da informação do auditor, o gestor do banco contratou um analista de dados para fornecer
uma amostra representativa, com uma probabilidade de de 96% e precisão máxima de 4%. Sabendo que
existem 8946 clientes com contas de cartões de crédito, qual deve ser o tamanho de amostra ideal? (1.0
val)
Resolução
Dos dados temos:
𝜎 = 900; 𝜀 ≤ 0.04; 1 − 𝛼 = 0.96; 𝑁 = 8946; 𝑃𝑒𝑑𝑒 − 𝑠𝑒 𝑜 𝑛? (0.1 val)
Pela fórmula temos:

𝑧2𝛼 ∗ 𝜎 2 ∗ 𝑁
2
𝑛= (𝟎. 𝟐 𝐯𝐚𝐥)
𝜀2 ∗ (𝑁 − 1) + 𝑧 2 𝛼 ∗ 𝜎 2
2

𝑃𝑎𝑟𝑎 1 − 𝛼 = 0.96; 𝑍𝛼 = 𝑍0.02 = 2.06 (𝟎. 𝟏 𝐯𝐚𝐥)


2

Logo:
2.062 ∗ 9002 ∗ 8946
𝑛= (𝟎. 𝟒 𝐯𝐚𝐥) ≥ 2046 (𝟎. 𝟏 𝐯𝐚𝐥)
0.042 ∗ (8946 − 1) + 2.062 ∗ 9002
Resposta: O tamanho da amostra ideal a um nível de confiança de 96%, deve ser de pelo menos 2046
clientes. (0.1 val)

c) Seleccionada a amostra com o tamanho obtido na alínea b), obteve-se uma média de 2065 Mt. Construa
um intervalo de confiança a 95%, para o verdadeiro valor médio das contas de cartões de crédito. (1.5
val)
Resolução
Dos dados temos:

𝑥̅ = 2065; 𝜎 = 900; 1 − 𝛼 = 0.95; 𝑁 = 8946; 𝑛 = 2046 𝑃𝑒𝑑𝑒 − 𝑠𝑒 𝐼𝐶 (𝜇, 95%)? (𝟎. 𝟏 𝐯𝐚𝐥)

A fórmula geral do intervalo de confiança para a média, quando a população é conhecida é:

𝜎 𝑁−𝑛 𝜎 𝑁−𝑛
𝑥̅ − 𝑍𝛼 ∗ ∗√ ≤ 𝜇 ≤ 𝑥̅ + 𝑍𝛼 ∗ ∗√ (𝟎. 𝟐 𝐯𝐚𝐥)
2 √𝑛 𝑁−1 2 √𝑛 𝑁−1

𝑃𝑎𝑟𝑎 1 − 𝛼 = 0.95; 𝑍𝛼 = 𝑍0.025 = 1.96 (𝟎. 𝟏 𝐯𝐚𝐥)


2
Substituindo os dados pela fórmula temos:

900 8946 − 2046 900 8946 − 2046


2065 − 1.96 ∗ ∗√ ≤ 𝜇 ≤ 2065 − 1.96 ∗ ∗√ (𝟎. 𝟖 𝐯𝐚𝐥)
√2046 8946 − 1 √2046 8946 − 1

2030.7 ≤ 𝜇 ≤ 2099.3 (𝟎. 𝟐 𝐯𝐚𝐥)


2
Interpretação: A um nível de confiança de 95% pode se afirmar que o intervalo [2030.7; 2099.3] contêm o
verdadeiro saldo médio das contas dos cartões de crédito. (0.1 val)

3. Para avaliar o nível de satisfação quanto a política de nomeação de gestores de uma empresa nos últimos 10
anos, entrevistou-se 500 funcionários, tendo-se encontrado os seguintes resultados:
 dos 300 funcionários do sexo feminino, 130 estão satisfeitos; e
 200 funcionários do sexo masculino, 90 estão insatisfeitos.
a) Usando um nível de significância de 2%, verifique se existe uma diferença estatisticamente significativa
entre as taxas de satisfação dos dois grupos. (1.5 val)

Resolução

Do problema temos:
𝑆𝑒𝑗𝑎 𝑛1 = 𝑓𝑢𝑛𝑐𝑖𝑜𝑛á𝑟𝑖𝑜𝑠 𝑑𝑜 𝑠𝑒𝑥𝑜 𝑓𝑒𝑚𝑖𝑛𝑖𝑛𝑜 𝑒 𝑛2 = 𝑓𝑢𝑛𝑐𝑖𝑜𝑛á𝑟𝑖𝑜𝑠 𝑑𝑜 𝑠𝑒𝑥𝑜 𝑚𝑎𝑠𝑐𝑢𝑙𝑖𝑛𝑜
130 110
𝑛1 = 300; 𝑃1 = = 0.433; 𝑛2 = 200; 𝑃2 = = 0.55; 𝛼 = 0.02 (𝟎. 𝟏 𝐯𝐚𝐥)
300 200
1º passo: Formular hipóteses
𝐻0 : 𝜋1 = 𝜋2 (𝐴 𝑡𝑎𝑥𝑎 𝑑𝑒 𝑠𝑎𝑡𝑖𝑠𝑓𝑎çã𝑜 𝑒𝑛𝑡𝑟𝑒 𝑜𝑠 𝑔𝑟𝑢𝑝𝑜𝑠 𝑛ã𝑜 𝑠𝑒 𝑑𝑖𝑓𝑒𝑟𝑒𝑚) (𝟎. 𝟏 𝐯𝐚𝐥)
{
𝐻1 : 𝜋1 ≠ 𝜋2 (𝐻á 𝑑𝑖𝑓𝑒𝑟𝑒𝑛ç𝑎𝑠 𝑑𝑎𝑠 𝑡𝑎𝑥𝑎𝑠 𝑑𝑒 𝑠𝑎𝑡𝑖𝑠𝑓𝑎çã𝑜 𝑒𝑛𝑡𝑟𝑒 𝑜𝑠 𝑔𝑟𝑢𝑝𝑜𝑠) (𝟎. 𝟏 𝐯𝐚𝐥)
2º passo: Fixar o limite de erro 𝛼, e identificar a variável de teste
𝑃1 ∗(1−𝑃1 ) 𝑃 ∗(1−𝑃2 )
Para 𝛼 = 0.05; (𝑃1 − 𝑃2 ) ≈ 𝑁 (𝜋1 − 𝜋2 ; + 2 ) (𝟎. 𝟏 𝐯𝐚𝐥)
𝑛1 𝑛2

Z: variável normal padrão


3º passo: Com os elementos amostrais, calcular o valor da variável do teste

(𝑝1 − 𝑝2 ) − (𝜋1 − 𝜋2 ) (0.433 − 0.55)


𝑍𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 = (𝟎. 𝟏 𝐯𝐚𝐥) = (𝟎. 𝟓 𝐯𝐚𝐥)
𝑝 ∗ (1 − 𝑝1 ) 𝑝2 ∗ (1 − 𝑝2 )
√ 1 + √0.433 ∗ 0.567 + 0.55 ∗ 45
𝑛1 𝑛2 300 200
𝑍𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 = −2.58 (𝟎. 𝟏 𝐯𝐚𝐥)
4º passo: Com o auxílio da tabela de distribuíção normal padrão, determinar a RC (região crítica) e RA (região de
aceitação) para 𝐻0
Trata-se de um teste bicaudal, onde 𝑍𝑐𝑟í𝑡𝑖𝑐𝑜 = 𝑍𝛼 = 𝑍0.01 = ±2.33 (𝟎. 𝟏 𝐯𝐚𝐥)
2
(𝟎. 𝟏 𝐯𝐚𝐥)

3
5º passo: Tomada de decisão
𝐶𝑜𝑚𝑜, 𝑍𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 = −2.58 ∈ 𝑅𝑅, logo rejeita-se a 𝐻0 (𝟎. 𝟏 𝐯𝐚𝐥)
6º passo: Conclusão
A um nível de significância de 5%, há evidências suficientes para concluír que há diferenças significativas entre as taxas de
satisfação dos funcionários do sexo masculino e feminino. (𝟎. 𝟏 𝐯𝐚𝐥)

b) Há evidências suficientes a um nível de significância de 5%, para afirmar que o nível de satisfação quanto
a política de nomeação dos gestores é independente do sexo dos funcionários? (2.0 val)

Resolução

1º passo: Formular hipóteses


𝐻0 : 𝐴 𝑠𝑎𝑡𝑖𝑠𝑓𝑎çã𝑜 é 𝑖𝑛𝑑𝑒𝑝𝑒𝑛𝑑𝑒𝑛𝑡𝑒 𝑑𝑜 𝑠𝑒𝑥𝑜 (𝟎. 𝟏 𝐯𝐚𝐥)
{
𝐻1 : 𝐴 𝑠𝑎𝑡𝑖𝑠𝑓𝑎çã𝑜 é 𝑑𝑒𝑝𝑒𝑛𝑑𝑒𝑛𝑡𝑒 𝑑𝑜 𝑠𝑒𝑥𝑜 (𝟎. 𝟏 𝐯𝐚𝐥)
2º passo: Fixar o limite de erro 𝛼, e identificar a variável de teste
Para 𝛼 = 0.05; 𝜒 2 ~𝜒 2 (𝑙−1)∗(𝑐−1) (𝟎. 𝟏 𝐯𝐚𝐥)

3º passo: Com os elementos amostrais, calcular o valor da variável do teste


Com o auxilio da tabela de contingência, apresentar as frequências observadas e esperadas (0.4 val) :

Satisfação
Sexo Total
Satisfeitos Insatisfeitos
Feminino 130 (144) 170 (156) 300
Masculino 110 (96) 90 (104) 200
Total 240 260 500
𝑙 𝑐 2
2
(𝑂𝑖𝑗 − 𝐸𝑖𝑗 )
𝜒 𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜
= ∑∑ (𝟎. 𝟏 𝐯𝐚𝐥)
𝐸𝑖𝑗
𝑖=1 𝑗=1

(130 − 144)2 (110 − 96)2 (170 − 156)2 (90 − 104)2


𝜒 2 𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 = + + + (𝟎. 𝟕 𝐯𝐚𝐥)
144 96 156 104
= 6.544 (𝟎. 𝟏 𝐯𝐚𝐥)

4º passo: Com o auxílio da tabela de distribuíção Qui-Quadrado, determinar a RC (região crítica) e RA (região de
aceitação) para 𝐻0
𝜒 2 (𝑙−1)∗(𝑐−1);1−𝛼 = 𝜒 2 (2−1)∗(2−1);0.05 = 𝜒 21;0.05 = 3.841 (𝟎. 𝟏 𝒗𝒂𝒍)

(𝟎. 𝟏 𝐯𝐚𝐥)

4
5º passo: Tomada de decisão
, 𝐶𝑜𝑚𝑜 𝑜 𝑣𝑎𝑙𝑜𝑟 𝑑𝑎 𝑒𝑠𝑡𝑎𝑡í𝑠𝑡𝑖𝑐𝑎 𝑑𝑒 𝑡𝑒𝑠𝑡𝑒 𝜒2 𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 = 6.544 > 𝜒2 1;0.05 = 3.841, 𝑟𝑒𝑗𝑒𝑖𝑡𝑎 −

𝑠𝑒 𝑎 ℎ𝑖𝑝ó𝑡𝑒𝑠𝑒 𝑛𝑢𝑙𝑎 (𝟎. 𝟏 𝐯𝐚𝐥)


6º passo: Conclusão
A um nível de significância de 5%, há evidências suficientes para concluír que a satisfação quanto a política de nomeação
dos gestores depende do sexo dos funcionários. (0.1 val)

4. A Empresa M de telefonia móvel, afirma que os serviços oferecidos de banda larga fixa aos seus clientes é melhor
quando comparado com a Empresa V. Para reforçar a sua afirmação, a Empresa M contratou um consultor
estatístico afim de realizar uma pesquisa de satisfação e qualidade percebida da banda larga fixa nas principais
zonas urbanas numa escala de 0-10 pontos. Da Empresa M, foram seleccionados aleatoriamente 15 clientes, tendo
se obtido uma média 7.64 e desvio padrão de 3.57. Já na Empresa V dos 12 clientes escolhidos aleatoriamente,
obteve-se uma média de 6.26 com um desvio padrão de 2.84. Supondo que o consultor nada sabe sobre as
variânças populacionais das duas empresas, e e tenha escolhido o nível de significância 0.05, o que pode-se concluir
sobre a afirmação da Empresa M? (4.5 val)
Resolução
Pelos dados temos:
𝑆𝑒𝑗𝑎 𝑛1 = 𝐸𝑚𝑝𝑟𝑒𝑠𝑎 𝑀 𝑒 𝑛2 = 𝐸𝑚𝑝𝑟𝑒𝑠𝑎 𝑉
𝑛1 = 15; 𝑥̅1 = 7.64; 𝑆1 = 3.57; 𝑛2 = 12; 𝑥̅2 = 6.26; 𝑆2 = 2.84 (𝟎. 𝟏 𝐯𝐚𝐥)
Nota que nada sab-see sobre a homogeidade das população, então primeiros temos que testar a hipótese para a
igualdade das varianças.
1º Passo: Formulação de hipóteses:
𝐻0 : 𝜎 21 = 𝜎 2 2 (𝐴𝑠 𝑝𝑜𝑝𝑢𝑙𝑎çõ𝑒𝑠 𝑠ã𝑜 ℎ𝑜𝑚𝑜𝑔ê𝑛𝑒𝑎𝑠) (𝟎. 𝟏 𝐯𝐚𝐥)
{
𝐻1 : 𝜎 21 ≠ 𝜎 2 2 (𝐴𝑠 𝑝𝑜𝑝𝑢𝑙𝑎çõ𝑒𝑠 𝑠ã𝑜 ℎ𝑒𝑡𝑒𝑟𝑟𝑜𝑔ê𝑛𝑒𝑎𝑠) (𝟎. 𝟏 𝐯𝐚𝐥)
2º Passo: Identificação da distribuição amostral
𝑃𝑎𝑟𝑎 = 0.05; 𝐹~𝐹𝑛1 −1;𝑛1 −1 (𝟎. 𝟏 𝐯𝐚𝐥)
3º Passo: Determinação da estatística do teste
𝑆 21 3.57 2
𝐹𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 = (𝟎. 𝟏 𝐯𝐚𝐥) = ( ) (𝟎. 𝟑 𝐯𝐚𝐥) = 1.5625 (𝟎. 𝟏 𝐯𝐚𝐥)
𝑆22 2.84
4º Passo: Determinação dos valores críticos e região de aceitação ou rejeição da Hipótese nula
Sabe-se que o nível de significância é de 5% e o teste é bi-caudal, pela tabela de distribuição F temos:
5
𝐹𝛼; 𝑛 = 𝐹0.025; 14;11 = 3.36 (𝟎. 𝟏 𝐯𝐚𝐥)
2 1 −1;𝑛2 −1

1 1 1 1 1 1
𝐹1−𝛼; 𝑛 = = = ∗( + )=
2 1 −1;𝑛2 −1 𝐹𝛼; 𝑛 𝐹0.025; 11;14 2 𝐹0.025; 10;14 𝐹0.025; 12;14 3.1
2 2 −1;𝑛1 −1;

= 0.3226 (𝟎. 𝟐 𝐯𝐚𝐥)


(𝟎. 𝟏 𝐯𝐚𝐥)

5º Passo: Decisão
Como 𝐹𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 = 1.5625 ∈ 𝑅𝑒𝑔𝑖ã𝑜 𝑑𝑒 𝑅𝐴𝑐𝑒𝑖𝑡𝑎çã𝑜, logo, rejeita-se a hipótese nula. (𝟎. 𝟏 𝐯𝐚𝐥)
6ª Passo: Conclusões
A um nível de significância de 5%, pode se afirmar que as varianças são desconhecidas e iguais, isto é, as
populações são homogêneas. (𝟎. 𝟏 𝐯𝐚𝐥)
Em seguida o teste de igualdade das médias:
1º Passo: Formulação de hipóteses:
𝐻0 : 𝜇1 = 𝜇2 (𝟎. 𝟏 𝐯𝐚𝐥)
{
𝐻1 : 𝜇1 > 𝜇2 (𝟎. 𝟐 𝐯𝐚𝐥)
2º Passo: Identificação da distribuição amostral
𝑁𝑜𝑡𝑎 𝑞𝑢𝑒 (𝑛1 ∩ 𝑛2 ) < 30, 𝐿𝑜𝑔𝑜 𝑝𝑎𝑟𝑎 𝛼 = 0.05, 𝑡~𝑡𝐺𝑙 (𝟎. 𝟏 𝐯𝐚𝐥)
3º Passo: Determinação da estatística do teste
Coo as populações são homogêneas, então:
𝑥̅̅1 − 𝑥̅̅2
𝑡𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 = (𝟎. 𝟐 𝐯𝐚𝐥)
𝑆2 𝑝 𝑆2 𝑝

𝑛1 + 𝑛2
e
(𝑛1 − 1)𝑆1 + (𝑛2 − 1)𝑆2 2 2
𝑆𝑝 2 = (𝟎. 𝟏 𝐯𝐚𝐥)
𝑛1 + 𝑛2 − 2
(15 − 1) ∗ 3.572 + (12 − 1) ∗ 2.842
𝑆𝑝 2 = (𝟎. 𝟓 𝐯𝐚𝐥) = 10.7 (𝟎. 𝟏 𝐯𝐚𝐥)
25
7.64 − 6.26
𝑡𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 = (𝟏. 𝟎 𝐯𝐚𝐥) = 1.089 (𝟎. 𝟏 𝐯𝐚𝐥)
√ 10.7 10.7
+
15 12
4º Passo: Determinação dos valores críticos e região de aceitação ou rejeição da Hipótese nula
Sabe-se que o nível de significância é de 5% e o teste é unilateral direito com varianças desconhecidas e iguais,
então:
𝐺𝑙 = 𝑛1 + 𝑛2 − 2 = 15 + 12 − 2 = 25 (𝟎. 𝟏 𝐯𝐚𝐥)
6
𝑡𝛼; 𝐺𝑙 = 𝑡0.05;25 = 1.708 (𝟎. 𝟏 𝐯𝐚𝐥)
(𝟎. 𝟏 𝐯𝐚𝐥)

5º Passo: Decisão
Como 𝑡𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 = 1.089 ∈ 𝑅𝐴, Logo aceita-se a hipótese nula. (𝟎. 𝟏 𝐯𝐚𝐥)
6ª Passo: Conclusões
A um nível de significância de 5%, não há evidências suficientes de que Empresa M os serviços oferecidos de
banda larga fixa aos clientes da Empresa M é melhor quando comparado com a Empresa V. (𝟎. 𝟐 𝐯𝐚𝐥)

5. Miranda et al (2017), realizou uma pesquisa numa Instituíção Pública brasileira intitulada “ Absenteísmo académico
e suas consequências mais óbvias”, tendo concluído que a primeira consequência do absenteísmo é a queda no
desempenho académico. Com o objectivo de aferir a relevância de participar ou não nas aulas de Estatística II, foi
seleccionada de forma aleatória uma amostra de 12 estudantes do ISCAM, tendo-se obtido os seguintes dados:

N. ⁰ de Faltas 10 8 6 8 10 12 6 4 6 4 2 12
Nota de frequência 8 10 14 8 7 4 12 13 13 14 16 6

a) Identifica a variável dependente e variável independente (0.5 val);


Resposta
X=variável independente: Nº de faltas
Y=variável dependente: Nota de frequência
b) Poderia se afirmar com 98% de certeza, que o número de faltas está linearmente relacionado a nota de
frequência? (1.5 val)
Resolução
Pelos dados amostrais, determina-se 1ª o valor do r:

𝑠𝑥𝑦 123.04
𝑟= (𝟎. 𝟏 𝐯𝐚𝐥) = − (𝟎. 𝟑 𝐯𝐚𝐥) = −0.883 (𝟎. 𝟏 𝐯𝐚𝐥)
√𝑠𝑥𝑥 ∗ 𝑠𝑦𝑦 √120.52 ∗ 161.08

Através do teste de significância para R, temos:


1º passo: Formular hipóteses
7
𝐻0 : 𝜌 = 0 (Não existe relação linear entre o número de faltas e a nota de frequência) (𝟎. 𝟏 𝐯𝐚𝐥)
{
𝐻1 : 𝜌 ≠ 0 (Existe relação linear entre o número de faltas e a nota de frequência) (𝟎. 𝟏 𝐯𝐚𝐥)
2º passo: Fixar o limite de erro 𝛼, e identificar a variável de teste
𝑃𝑎𝑟𝑎 𝛼 = 0.05, 𝑡~𝑡𝑛−2

3º passo: Com os elementos amostrais, calcular o valor da variável do teste

𝑛−2 12 − 2
𝑡𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 = 𝑟 ∗ √ ( 𝟎. 𝟏 𝐯𝐚𝐥) = −0.883 ∗ √ (𝟎. 𝟑 𝐯𝐚𝐥) = −5.949 (𝟎. 𝟏 𝒗𝒂𝒍)
1 − 𝑟2 1 − (−0.883)2

4º passo: Com o auxílio da tabela t de student, determinar a RC (região crítica) e RA (região de aceitação) para 𝐻0
Trata-se de um teste bilateral, onde 𝑡0.01;10 = ±2.764 (𝟎. 𝟎𝟓 𝐯𝐚𝐥)
(𝟎. 𝟎𝟓𝐯𝐚𝐥)

5º Passo: Decisão
Como 𝑡𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 = −5.949 ∈ 𝑅𝐴, Logo rejeita-se a hipótese nula. (𝟎. 𝟏 𝐯𝐚𝐥)
6ª Passo: Conclusões
Conclui-se que o valor de r=-0.883 obtido pela amostra é significante, logo existe uma relação linear entre o
número de faltas e a nota de frequência, isto é, quanto maior for o nº de ausências, menor é o aproveitamento
(0.1 val)

c) Estime a recta da regressão linear e interprete os coeficientes 𝛽0 e 𝛽1 (1.0 val)


Resolução
Determinação dos coeficientes

𝑠𝑥𝑦 −123.04
𝛽̂1 = = = −1.02 (𝟎. 𝟐 𝒗𝒂𝒍) 𝑒 𝛽̂0 = 𝑦̅ − 𝛽̂1 𝑥̅ = 10.4 + 1.02 ∗ 7.3 = 17.8 (𝟎. 𝟐 𝒗𝒂𝒍)
𝑠𝑥𝑥 120.52

A equação da recra de regressão é:

𝑌̂ = 𝛽̂0 + 𝛽̂1 𝑋 (𝟎. 𝟏 𝒗𝒂𝒍)

𝑌̂ = 17.8 − 1.02𝑋 (𝟎. 𝟑 𝒗𝒂𝒍)

8
Interpretação do modelo:

𝛽0 = 17.8

Se o nº de faltas (X) for igual a zero, a nota de frequência será de 11.34. Nota que esta interpretação é apenas
estatística e a mesma não tem nenhum significado prático. (0.1 val)

𝛽1 = -1.02

A cada ausência adicional nas aulas de Estatística II, a nota de frequância diminui em 1.02 valores. (0.1 val)

d) Através de análise de variância (ANOVA) teste a 5%, a significância geral do modelo e tire conclusões.
(2.0 val)
Resolução
Hipóteses do Modelo:
H0 : Y = β0 + ε (𝟎. 𝟏 𝐯𝐚𝐥)
{
H1 : Y = β0 + β1 X + ε (𝟎. 𝟏 𝐯𝐚𝐥)

Tabela ANOVA (Análise de Variança)

n
̂1 ∗ Sxy = −1.02 ∗ (−123.04) = 125.5 (𝟎. 𝟒 𝐯𝐚𝐥)
SQ Reg = ∑(ŷi − y̅)2 = β
i=1

n
̂1 2 ∗ Sxx = 161.08 − 125.5 = 35.58 (𝟎. 𝟒 𝐯𝐚𝐥)
SQ Res = ∑(yi − ŷi )2 = Syy − β
i=1

SQ total = ∑(yi − y̅)2 = SQ Reg + SQ Res = Syy = 161.08


i=1

SQ Reg
QMReg = = 125.5 (𝟎. 𝟐 𝐯𝐚𝐥)
p−1

SQ Res 35.58
QMRes = = = 3.558 (𝟎. 𝟐 𝐯𝐚𝐥)
n−p 10

Substituíndo teremos: (0.3 val)

ANOVA
Fonte de
variação df SQ MQ F
Regressão 1 125.5 125.5 32.3
Residual 10 35.58 3.558
Total 11 161.08

Fα;p−1;n−2 = F0.05;1;10 = F0.05;1;10 = 4.96 (𝟎. 𝟏 𝐯𝐚𝐥)


Como F0.05;1;10 = 4.96 < Fcalculado = 32.3, confirma-se a significância do modelo, isto é, o modelo completo (o que
contém a variável X) é melhor do que o modelo reduzido (o que não contém a variável X). (0.2 val)
9

Você também pode gostar