Aula 08

Este é o mesmo problema que encontramos quando estudamos a variância, pois a soma dos
desvios deve igualar zero. Assim, vamos adotar uma estratégia semelhante para resolver o
problema, elevando os desvios ao quadrado e dividindo tal resultado pelo valor esperado da célula:
Curso\Sexo Masculino Feminino
Física (16)²/84 (-16)²/36
Ciências Sociais (-16)²/56 (16)²/24
Pode-se provar que a soma de todos estes elementos gera uma

estatística de teste qui-quadrado ( ). Não cabe demonstrar isso aqui, portanto, decore!
Assim, a estatística de teste para análise de associação entre estas variáveis é dada por:
Este é um valor significantemente maior do que zero, portanto, pode-se inferir que as variáveis
estão associadas. Quanto maior este valor, maior é a associação entre as variáveis. Viu como
se faz? Portanto, guarde a fórmula:
Sendo que esta expressão está te dizendo para somar, para todas as células ( ), o quadrado das
diferenças entre o valor real ( ) e o valor esperado em cada célula ( ), caso as variáveis não
fossem associadas, divido pelo seu respectivo valor esperado.
“Tá bom professor, mas devo comparar este valor com a tabela qui-quadrado”?
Olha, não precisamos entrar nisso. Esta parte fica um pouco mais complicadinha e nunca cai em
concursos que não sejam específicos para estatísticos. Assim, só saiba calcular a estatística de
teste e o coeficiente de Pearson que já basta.
WWW.RATEIOS.ORG WhatsApp (41) 99111-5296

Com base neste valor qui-quadrado, pode-se calcular o coeficiente de contingência de Pearson,
dado por:
Sendo o tamanho da amostra. Surge uma pergunta natural:
-“Qual o tamanho ideal de minha amostra”?
Essa é uma pergunta sem uma única resposta! Isso muda de autor para autor. Mas, é importante
que vocês conheçam uma “regrinha de bolso” para determinação do valor ideal de uma amostra
com base no erro amostral tolerável ( ).
Nós já estudamos o que é um erro amostral: a margem de erro da aula

anterior. Existe uma fórmula que nos dá a amostra mínima com base no máximo de erro que
estamos dispostos a cometer:
Isso é, para um erro amostral da ordem de 4%, devemos ter uma amostra de, no mínimo:
Ou seja, nossa amostra deve ter, no mínimo, 625 elementos.
Vamos fazer um exercício para que você veja como isso cai?

1 - CESPE – TRE/PE – 2017) Assinale a opção que apresenta procedimento ou teste estatístico
utilizado no tratamento de dados nominais.
a) qui-quadrado
b) comparação entre médias
c) verificação de média, mediana e moda
d) verificação de desvio padrão
e) análise de variância
RESOLUÇÃO:
A alternativa A cita qui-quadrado e de fato o teste estatístico qui-quadrado é utilizado no

tratamento de dados nominais, a fim de verificar a associação entre duas variáveis nominais
(qualitativas), o que de cara já nos dá a alternativa A como gabarito da questão. Ainda assim, para
não restar dúvidas, vamos avaliar as demais alternativas:
A alternativa B cita comparação entre médias, porém médias são medidas utilizadas no
tratamento de dados quantitativos.
A alternativa C cita verificação de média, mediana e moda, que são medidas utilizadas
também no tratamento de dados quantitativos.
A alternativa D cita verificação de desvio padrão, sendo o desvio padrão também uma
medida utilizada no tratamento de dados quantitativos.
Finalmente, a alternativa E cita análise de variância, também conhecida como ANOVA, que
também é um teste estatístico utilizado no tratamento de dados quantitativos. Logo, concluímos que
as demais alternativas estão incorretas porque contêm procedimentos utilizados no tratamento de
dados quantitativos, e não nominais, e nota-se mesmo que não se saiba o que é qui-quadrado seria
possível chegar ao gabarito apenas eliminando as demais alternativas.
Resposta: A

Um valor próximo de 1 indica associação positiva, enquanto que outro
próximo de -1 indica associação negativa. Um valor próximo de zero indica não associação entre
variáveis.
Outra forma de explicitar o coeficiente de correlação é por meio da covariância.
Covariância ( ) é uma medida da “variância conjunta” entre duas variáveis. Para uma amostra
de tamanho ( ), a covariância entre duas variáveis quaisquer, e , é dada por:
Entendeu? Antes de passarmos para o próximo tópico, vocês precisam saber uma coisa importante
demais sobre a covariância!
A covariância entre duas variáveis é influenciada pela associação que

uma variável tem sobre a outra. Assim, se duas variáveis são independentes, a covariância
entre ambas é igual à zero. Porém, o fato de a covariância entre duas variáveis ser igual à
zero não quer dizer que elas sejam independentes. Atenção a isso!

Assim, podemos quantificar o grau de associação entre duas variáveis como o “ganho
relativo na variância” obtido pela introdução da variável qualitativa. Isso é feito por meio do
R² (nós a estudaremos com mais detalhes logo mais).
Para quantificarmos o R² precisamos definir ( ), a média das variâncias dentro dos subgrupos,
que chamaremos de variância média. Ao definirmos como o produto da variância do
subgrupo pelo tamanho da amostra no mesmo, a variância média será dada por:
Assim, com base na variância total da amostra ( ), podemos definir R² como:
Então se aplicarmos esta fórmula a nosso exemplo acima:
Isso quer dizer que 41,5% da variabilidade dos salários é explicada pela variável “grau de
instrução”.
Beleza, terminamos a parte de correlação, vamos à regressão!

Exercício
Só para vocês ficarem contentes em ver uma aplicação prática, vamos fazer um exemplo.
Vamos lá! Dada a seguinte série de dados, estime a regressão linear Y = f(X), ou
costumeiramente chamada de “Y contra X”.
Variáveis X Y
103 160
123 167
145 207
126 173
189 256
211 290
178 237
155 209
141 193
156 219
166 235
179 234
197 273
204 272
125 181
112 166
107 161
135 195
144 201
188 255
Soma 3084 4284
Média 154,2 214,2

Resolução:
Bom, primeiramente, vamos encontrar alguns dados necessários para a resolução.
Variáveis X Y X centrado Y centrado X(centrado)*Y(centrado) (X centrado)² (Y centrado)²
103 160 -51,2 -54,2 2775,04 2621,44 2937,64
123 167 -31,2 -47,2 1472,64 973,44 2227,84
145 207 -9,2 -7,2 66,24 84,64 51,84
126 173 -28,2 -41,2 1161,84 795,24 1697,44
189 256 34,8 41,8 1454,64 1211,04 1747,24
211 290 56,8 75,8 4305,44 3226,24 5745,64
178 237 23,8 22,8 542,64 566,44 519,84
155 209 0,8 -5,2 -4,16 0,64 27,04
141 193 -13,2 -21,2 279,84 174,24 449,44
156 219 1,8 4,8 8,64 3,24 23,04
166 235 11,8 20,8 245,44 139,24 432,64
179 234 24,8 19,8 491,04 615,04 392,04
197 273 42,8 58,8 2516,64 1831,84 3457,44
204 272 49,8 57,8 2878,44 2480,04 3340,84
125 181 -29,2 -33,2 969,44 852,64 1102,24
112 166 -42,2 -48,2 2034,04 1780,84 2323,24
107 161 -47,2 -53,2 2511,04 2227,84 2830,24
135 195 -19,2 -19,2 368,64 368,64 368,64
144 201 -10,2 -13,2 134,64 104,04 174,24
188 255 33,8 40,8 1379,04 1142,44 1664,64
Soma 3084 4284 21199,2 31513,2
Média 154,2 214,2 1059,96 1575,66
Vamos aplicar a fórmula:

Cabe destacar a diferença entre erros e resíduos. Os erros são decorrentes dos aspectos que
relatamos acima, já os resíduos são os erros de ajuste após a estimação da reta original (1), ou
seja, na regressão feita com base na amostra e não mais na população. Assim, a versão estimada
de (1) é dada por:
(2)
Então, estes parâmetros são a versão estimada dos parâmetros na equação (1). Portanto, são
os resíduos da regressão com base em uma amostra n da população N.
Meus amigos, vocês conseguem enxergar que este resíduo tem mais um problema além dos já
citados para os erros? Lembra do gerente comercial eficiente que pediu demissão? Então, este é
um desvio natural de se interpretar um comportamento econômico, derivado de influências de
infinitas variáveis, a partir de uma reta. Agora, há outro fator em cena, há um “erro” decorrente de
se inferir uma estimativa da reta (1) a partir de (2). Ou seja, o fato de nós só termos uma amostra
leva a desvios com relação à estimativa dos parâmetros. Dado que, com base na nossa regressão
estimada, o valor esperado de y ( ) é:
Assim, os resíduos são:
Bom pessoal, nós já temos uma estimativa de uma regressão, agora vocês podem estar se
perguntando: “Será que isso está bom? Será que esta reta representa bem a situação ocorrida no
mundo real?” Nós vamos estudar isso a seguir.
Veja um exercício!

3 - FCC - ANALISTA BACEN 2005) Uma empresa com a finalidade de determinar a relação entre
os gastos anuais com propaganda (X), em R$ 1000,00, e o lucro bruto anual (Y), em 1000,00, optou
por utilizar o modelo linear simples Y(i) = a + bX(i) + e(i), em que Y(i) é o valor do lucro bruto auferido
no ano (i), X(i) é o valor do gasto com propaganda no ano (i) e e(i) o erro aleatório com as
respectivas hipóteses consideradas para a regressão linear simples.
Considerou, para o estudo, as seguintes informações referentes às observações dos últimos 10

anos da empresa:
Utilizando a equação da reta obtida pelo método dos mínimos quadrados, tem-se que, caso haja
um gasto anual com propaganda de 80 mil reais, a previsão do lucro bruto anual, em mil reais, será
de:
a) 158
b) 128,4
c) 121
d) 102,5
e) 84
Resolução:
Bom, primeiramente, não caia na armadilha! Estes valores que o exercício te deu não estão
centrados na média. Portanto, com base em propriedades estatísticas, pode-se demonstrar que:

Esta tabela é chamada de ANOVA e tem o seguinte formato:
Soma dos Quadrados Graus de Liberdade Quadrados Médios Teste F
SQE K
SQR N–k–1
SQT N–1
Sendo N o número de observações da amostra e k o número de variáveis explicativas na regressão,

assim, no caso da regressão simples, k = 1. Novamente pessoal, vamos nos lembrar das aulas de
Estatística. Sendo SQR a soma dos quadrados dos resíduos e sua média igual a zero, se nós
dividirmos tal expressão pelos seus graus de liberdade, o que teríamos?
O que é isso? Não é a variância? Exatamente! Trata-se de uma medida não tendenciosa da
variância dos erros. Portanto, o quadrado médio dos resíduos iguala a variância dos erros. O
mesmo pode ser dito com relação ao coeficiente SQE/k, haja vista o mesmo medir também uma
variância, mas a variância explicada.
Bom, nós já temos a variância dos erros e a variância explicada pela regressão, dada por ,
portanto cabe questionar: será que a esta regressão faz sentido?
Não entendeu? Vamos lá. Nós poderíamos encontrar uma regressão na qual os quadrados médios
dos resíduos (variância dos erros) representam a maior parte da variabilidade da regressão,
invalidando a representatividade da regressão como um processo que poderia ter gerado aquelas

variáveis explicadas. Assim, a parte que se constitui como uma reta (bx) só explicou alguma parte
da variável explicada “por coincidência”, isto é, sem significância estatística.
Como nós podemos verificar isso? Por meio do teste F. O teste F é um teste estatístico que visa
comparar variâncias e se a diferença entre ambas é estatisticamente significante. Analiticamente,
sob a hipótese nula, o quociente entre dois quadrados médios, isso é, entre duas variâncias, segue
uma distribuição F.
A título de ilustração vamos nos utilizar da tabela ANOVA que nós construímos. Portanto:
Sob a hipótese nula de que estas duas variâncias são iguais, a estatística de teste segue uma
distribuição F com k graus de liberdade no numerador e N - k – 1 graus de liberdade no
denominador.
O que você está buscando? Bom, quando você estima uma regressão, você busca encontrar uma
relação estatisticamente significante que explique o fenômeno que está em estudo. Assim, se você
concluir que não há como rejeitar a hipótese nula de que a variância explicada pela sua regressão
é igual à variância dos resíduos, na verdade, você não encontrou nada! Isso deriva do fato de que,
se isso aconteceu, é muito provável que toda parcela que você conseguiu explicar da variável
dependente foi por acaso, o que deve ter acontecido somente em virtude da variação dos erros e
não de uma especificação correta de uma reta. Ou seja, toda sua regressão não tem grande
validade em termos de explicar a dinâmica da variável dependente em estudo.
Portanto, o teste F aplicado ao estudo de regressão é equivalente a um teste de hipóteses conjunto

de que todos, ou parte de todos, os coeficientes têm valor igual a zero.


anos da empresa:
Montando o quadro de análise de variância (ANOVA), tem-se que:
a) a variação total apresenta um valor de 62,5.
b) a variação explicada, fonte de variação devido à regressão, apresenta um valor igual a 80.
c) Dividindo a variação residual pela variação total, obtemos o coeficiente de determinação (R²).
d) o valor da estatística F necessária para o teste da existência da regressão é igual ao quociente

da divisão da variação explicada pela variação residual.
e) a variação residual apresenta um valor igual a 17,5.
Resolução:
Vamos começar definindo SQT, SQE e SQR:

amostra dos dados que compõem esta relação, nós iremos estimar esta reta por meio de MQO, tal
como na seção anterior, o que nos levará à seguinte relação:
Perceba que e são as estimativas de e para uma dada amostra de dados da população.
Algo intuitivo, mas que é importante destacar é que b mede a alteração em y para uma dada
variação em x, mantido tudo mais constante, ou como os economistas chamam coeteris
paribus.
Agora, a pergunta é: será que, na média, estes estimadores se aproximam do valor real do
parâmetro? Pronto, agora você vai entender o que é viés de um estimador.
Meus amigos, será não viesado se:
Isto quer dizer, a “esperança do estimador é igual ao seu correspondente parâmetro populacional”.
Só para lembrá-los das aulas de Estatística, quando você falar em esperança de uma variável, tire
a sua média e pronto! Vocês não precisam saber mais do que isso para sua prova.
Bom, falamos um monte para chegarmos à seguinte pergunta: quais as condições necessárias para
que o estimador de MQO seja não viesado? A resposta para esta pergunta depende de uma
demonstração matemática que se utiliza do operador esperança.
-“Professor, esta demonstração cai na prova?”
Quem pensou assim é um verdadeiro concurseiro, com meio caminho andado para sua aprovação.
Você tem que ser objetivo e focar em resultados e não em perfumarias. Se você gostar muito de
Estatística e quiser aprender isso, passe no concurso e vá fazer um Mestrado ou Doutorado depois,
agora, pense no concurso. Mas, quem quiser dar uma olhada na demonstração, dê uma olhada no
livro do meu orientador de doutorado, Rodolfo Hoffmann, “Análise de Regressão: uma
introdução à Econometria”.

Só para explicar melhor, no caso da 4ª hipótese, o que se quer é garantir que os erros tem variância
constante ao longo da amostra. Por exemplo, pode-se encontrar um erro que se comporte de tal
forma que:
Se isso ocorrer, você concorda que a variância será função do valor da variável explicativa e,
portanto, não constante? Se isso ocorrer, surgirão problemas na análise de regressão, conforme
será discutido mais adiante. Quando a variância dos erros não é constante, chamamos a este
problema de heterocedasticidade.
Quanto à 5ª hipótese, espera-se que os erros do período presente não guardem relação com os
erros do período passado. Com efeito, os erros observados nas estimativas MQO no período t não
podem influenciar os erros de estimativa no período t+1. Para entender melhor, substitua t por um
determinado ano, 2010, por exemplo, e pense sobre isso. Caso isso não ocorra, dizemos que o
modelo possui autocorrelação.
Vocês lembram de que eu disse que, por enquanto, estamos trabalhando com dados em cortes
transversais, ou seja, com observações para diferentes unidades no mesmo período de tempo
(como no caso dos gastos com propaganda, que avaliamos diferentes empresas em um único ponto
do tempo, um ano, por exemplo)? Então, a hipótese 5ª, na maior parte dos casos, só é violada
quando estamos trabalhando com séries de tempo, ou seja, observações para uma mesma
unidade em diferentes períodos do tempo (seria o equivalente a avaliar a questão dos gastos com
propaganda em uma única empresa, mas ao longo do tempo).
Então, se estas hipóteses estiverem valendo, você pode dizer que sua Regressão Linear Simples
é BLUE.
Ufa! Falamos para burro ao longo deste curso, portanto chega de conversa e vamos fazer
exercícios.

A alternativa verdadeira é a (d), que, na verdade, expressa uma importante propriedade do método
de regressão. A demonstração desta propriedade está fora do escopo deste curso, portanto, vamos
analisar intuitivamente. Não tenho intenção de ser formal, ok? É para ser intuitivo mesmo!
Dada uma regressão:
Suponha que esta relação seja verdade:
Ou seja, que a regressão passe por estes pontos médios. Diminua a primeira equação da segunda:
O chapéu demonstra o desvio com relação à média. Rearranjando:
Multiplicando o numerador e o denominador por � , o que deixa o total inalterado, e somando esta
expressão para todas as unidades seccionais:
Que é o próprio estimador de MQO. Ou seja, o ponto médio é compatível com esta fórmula.Ou seja,
a regressão irá passar pelo ponto � y .
Alternativa correta.

a) o último Decil está na penúltima classe;
b) a mediana da distribuição está na 2ª classe;
c) a média da distribuição está na 3ª classe;
d) a moda exata da distribuição está na 1ª classe;
e) a distribuição é assimétrica à esquerda.
RESOLUÇÃO:
Vamos avaliar as alternativas:
a) O último decil corresponde ao 9º decil, é a observação que divide os dados de forma que 90%
dos dados sejam menores que ele e 10% sejam maiores. Vamos acrescentar a coluna da frequência
acumulada na tabela a fim de verificar a que classe o 9º decil pertence:
Intervalo Frequência
Frequências
de Classe Acumulada
0 |-- 10 47 47
10 |-- 20 29 76
20 |-- 30 13 89
30 |-- 40 7 96
40 |-- 50 3 99
Mais de
50 1 100
Ao observar a tabela acima, verificamos que há um total de 100 observações, portanto o 9º decil se
encontra na classe em que a observação 90 (pois 90% de 100 observações = 90) se encontra. Da
tabela, temos que até a terceira classe estão acumuladas 89 das observações, portanto a
observação 90 (9º decil) pertence à classe seguinte (30 |-- 40), que é a antepenúltima classe, e não
a penúltima. Portanto a alternativa A está incorreta.

b) A mediana corresponde à observação de posição 100/2 = 50. Ao observar a tabela, verificamos
que na primeira classe estão as 47 primeiras observações. E na segunda classe estão as 29
observações seguintes, totalizando 76 observações. Portanto, a observação 50, mediana,
encontra-se na segunda classe de fato. Logo, concluímos que a alternativa B está correta e é o
gabarito da questão.
Para não restar dúvidas, vamos avaliar as demais alternativas:
c) Como os dados estão organizados em classes, a fim de calcular a média precisamos calcular o
ponto médio de cada um dos intervalos. Assim, temos:
Ponto Médio
Frequências
Intervalo
5 47
15 29
25 13
35 7
45 3
55 1
A média é dada pela soma dos pontos médios dos intervalos multiplicados pelas respectivas
frequências, dividida pela frequência total (soma das frequências). Assim:
Méd�a
Méd�a
Logo, a média pertence à 2ª classe, e não à 3ª, pois 14,3 é um valor entre 10 e 20. Assim,
concluímos que a alternativa C também está incorreta.
d) Sabemos que a classe modal (classe de maior frequência) é a 1ª classe, entretanto isso não nos
permite afirmar que a moda exata pertença a essa classe, só a análise dos dados brutos (não
organizados em classes) nos permitiria verificar qual a moda exata e a que classe ela pertence.
Logo, a alternativa D está incorreta.

e) Ao observar a tabela, notamos claramente que há uma concentração de apreensões nas
primeiras classes, portanto há uma concentração de valores pequenos na distribuição, o que
caracteriza uma distribuição assimétrica à direita, e não à esquerda. Portanto, a alternativa E é
incorreta.
Resposta: B
15 - FGV – MPE/BA – 2017) Em uma amostra desconfia-se de que três valores sejam, na verdade,
“outliers” e que deveriam ser descartados. Para tal avaliação o estatístico dispõe apenas dos
valores dos 1º e 3º quartil da distribuição. Os números são os seguintes:
Q1(X) = 21, Q3(X) = 33, X1 = 58, X2 = 2 e X3 = 43
Onde Qis são os quartis e os Xis os valores em análise.
Assim, é correto afirmar que:
a) todos os valores são “outliers” ;
b) os valores X1 e X3 são “outliers”;
c) nenhum dos valores é “outliers”;
d) apenas o valor X2 é “outlier”;
e) os valores X1 e X2 são “outliers”.
RESOLUÇÃO:
Com os valores dos 1º e 3º quartil fornecidos pelo enunciado devemos calcular os limites
inferior e superior, e compará-los com X1, X2 e X3. Valores menores que o limite inferior ou maiores
que o limite superior são outliers, já valores maiores ou iguais ao limite inferior e menores ou iguais
ao limite superior não são outliers.
A fórmula para cálculo do limite inferior (LI) é:
LI = Q1(X) – 1,5∙(Q3(X) - Q1(X))
LI = 21 – 1,5∙(33 – 21) = 21 - 1,5∙12 = 21 – 18 = 3

18 - AFRFB – ESAF/2013) Um modelo de regressão linear múltipla foi estimado pelo método de
Mínimos Quadrados, obtendo-se, com um nível de confiança de 95%, os seguintes resultados:
I. = 10 + 2,5*x1 + 0,3*x2 + 2*x3
II. o coeficiente de determinação R2 é igual a 0,9532
III. o valor-p = 0,003
Desse modo, pode-se afirmar que:
a) se a variável x1 for acrescida de uma unidade, então Y terá um acréscimo de 2,5 %.
b) 0,003 é o mais baixo nível de significância ao qual a hipótese nula pode ser rejeitada.
c) x3 explica 95,32% das variações de Y em torno de sua média.
d) as probabilidades de se cometer o Erro Tipo I e o Erro Tipo II são, respectivamente, iguais a 5%

e 95%.
e) se no teste de hipóteses individual para 2 se rejeitar a hipótese nula (H0), então tem-se fortes
razões para acreditar que x2 não explica Y.
Resolução:
Vamos analisar uma a uma:
A – se a variável x1 for acrescida em uma unidade Y aumentará em 2,5, não em percentual.
B – Perfeito, esta é a definição de p-valor.
C – O R² não é ó para x3, mas para a regressão toda.
D – Alternativa sem sentido
E – Errado, a rejeição da hipótese nula indica a significância do respectivo coeficiente.
Alternativa b

19 - FCC – TRT/11 – 2017) Instruções: Considere as informações abaixo para responder à
questão. Se Z tem distribuição normal padrão, então:
P(Z < 0,4) = 0,655; P(Z < 0,67) = 0,75; P(Z < 1,4) = 0,919; P(Z < 1,6) = 0,945;
P(Z < 1,64) = 0,95; P(Z < 1,75) = 0,96; P(Z < 2) = 0,977; P(Z < 2,05) = 0,98
A porcentagem do orçamento gasto com educação nos municípios de certo estado é uma
variável aleatória X com distribuição normal com média (%) e variância 4(%)².
Um gasto em educação superior a 10% tem probabilidade de 4%. Nessas condições, o valor
de é igual a
a) 5,50%
b) 6,20%
c) 7,35%
d) 6,50%
e) 7,85%
RESOLUÇÃO:
é a variância da variável aleatória X, o enunciado nos diz que é 4(%)², que é o mesmo que 4/100²
= 4/10000 = 0,0004. Logo, o desvio padrão é dado por . Assim, temos que:
P X P X P Z
Se P(Z < 1,75) = 0,96 (dado pelo enunciado), P(Z > 1,75) = 1 – 0,96 = 0,04. Logo, chegamos
a:
Resposta: D

21 - FGV – MPE/BA – 2017) Suponha que um sorteio seja realizado entre duas turmas de
desembargadores, uma com 7 e outra com 9 membros, para saber qual delas examinará a questão
da redução da maioridade penal. Na menor turma 4 juízes são contrários, enquanto na maior
apenas 2 acham que a maioridade não deve ser reduzida. Depois de sorteada a turma, um juiz é
escolhido, de forma aleatória, para atuar como o relator. Ele é a favor da redução.
Então, a probabilidade de que a turma menor tenha sido a escolhida é:
a) 49/76;
b) 9/15;
c) 2/9;
d) 27/76;
e) 6/15.
RESOLUÇÃO:
Para a resolução dessa questão faremos uso da probabilidade condicional.

O que a questão nos pede é a probabilidade de a turma menor ter sido a sorteada, dado que o juiz
escolhido é a favor da redução da maioridade penal:
P �u�ma m�no� �u�z a �a�o�

P �u�ma m�no� �u�z a �a�o�
P �u�z a �a�o�
A questão nos diz que temos 2 turmas de desembargadores (logo cada uma pode ser sorteada
com a mesma probabilidade), e que na turma menor (7 juízes) há 4 juízes contra a redução da
maioridade penal, logo 7 – 4 = 3 juízes dessa turma são a favor da redução. Há ainda a informação
de que na turma maior (9 juízes) há 2 juízes contra a redução da maioridade penal, assim 9 – 2 =
7 juízes dessa turma são a favor da redução. Portanto, temos que:
P �u�ma m�no� P �u�ma ma�o�
P �u�z a �a�o� �u�ma m�no�
P �u�z a �a�o� �u�ma ma�o�

Foi usada a técnica de minimizar a soma dos erros quadráticos para ajustar a reta de regressão, a
qual
a) passa por ( ), onde e são as médias de X e de Y.
b) passa pela origem (0, 0).
c) não é a única reta que minimiza a soma dos erros quadráticos.
d) tem variância esperada nula.
e) tem coeficiente angular necessariamente negativo.
Resolução:
Vamos analisar cada uma das alternativas:
A – Deveria estar certa! Vamos discutir isso abaixo.
B – Correto. Devido ao fato de o modelo ser dado por , não há intercepto, portanto,
quando , será igual à zero também.
C – Errado, estamos estudando o caso em que só há uma reta que minimiza a soma dos quadrados
dos erros.
D – Nada garante isso.
E – O coeficiente angular tem o mesmo sinal da associação entre as variáveis, então, no presente
caso, o mesmo é positivo. Olhe no gráfico!
Pessoal, uma das propriedades da regressão linear é que ela passa pelo ponto composto pelos
valores médios de X e Y, no caso de uma regressão de Y contra X. Ou seja, essa é uma propriedade
verdadeira, o que torna a alternativa correta! Mas, a banca não considerou!
Alternativa b

24 - FGV – MPE/BA – 2017) Um criminoso está avaliando se vale a pena ou não recorrer ao instituto
da colaboração premiada. Caso não recorra, a sua probabilidade de ser condenado é igual a p,
com 12 anos de reclusão. Se resolver delatar, pode pegar 6 anos de prisão, com probabilidade de
0,4, ou 10 anos, com a probabilidade complementar.
Supondo que a decisão será tomada com base na esperança matemática da pena, o criminoso
deve:
a) não delatar se o valor de p for inferior a 0,75;
b) delatar se o valor de p for superior a 0,55;
c) não delatar caso o valor de p seja superior a 0,80;
d) mostrar-se indiferente caso o valor de p seja 0,70;
e) delatar caso o valor de p seja inferior a 0,60.
RESOLUÇÃO:
Chamando de X o número de anos de reclusão do criminoso e de E(X) a esperança de X,

ou seja, o número médio de anos de reclusão do criminoso, temos o seguinte cenário:
1) Se o criminoso não recorre ao instituto da colaboração premiada, E(X) é dada por:
E(X) = 12p
2) Se o criminoso recorre ao instituto da colaboração premiada (resolve delatar), E(X) é dada por:
E(X) = 6∙0,4 + 10∙(1 – 0,4) = 2,4 + 6 = 8,4 anos
Ao igualar a E(X) caso o criminoso delate e caso não delate chegamos ao seguinte valor
para p:
12p = 8,4
p = 8,4/12 = 0,7
Portanto, para p = 0,7, tomando como base na esperança matemática da pena, é indiferente
para o criminoso delatar ou não, pois em ambos os casos a média de anos de reclusão esperada
é a mesma (8,4 anos). Para valores de p menores que 0,7 o criminoso não deve recorrer ao instituto
da colaboração premiada, pois a média de anos de reclusão caso não delate será menor que 8,4
anos (média esperada caso resolva delatar). Já para valores de p maiores que 0,7, o criminoso

deve recorrer ao instituto de colaboração premiada, pois a média de anos de reclusão caso não
delate será maior que 8,4 anos. Portanto, a alternativa D é o gabarito da questão.
Resposta: D
25 - TRT 19ª região – FCC\2014 - modificada) Sejam duas variáveis X e Y representando os

salários dos empregados nas empresas Alfa e Beta, respectivamente, com 100 empregados cada
uma. Em um censo realizado nas duas empresas apurou-se que a média, em milhares de reais, de
X foi igual a 2,5 e a média de Y foi igual a 3,2. A soma dos valores dos quadrados, em (R$
1.000,00)², de todos os valores de X foi igual a 650 e de todos os valores de Y foi igual a 1.047,04.
Assim, o coeficiente de variação de:
a) X é igual a 10% e o de Y igual a 20%.
b) X é igual a 20% e o de Y igual a 15%.
c) X é igual ao coeficiente de variação de Y.
d) Y é igual à metade do coeficiente de variação de X.
e) Y não é menor que o coeficiente de variação de X.
Resolução:
Bom, o coeficiente de variação (cv) tem a seguinte fórmula:
ã
é
A média nós já temos, portanto temos que calcular a variância com base na seguinte fórmula:
� é é
Vamos encontrar a variância para X e Y:

a) I.
b) II.
c) III.
d) I e IV.
e) IV.
Resolução
Vamos analisar cada item:
I.O conceito está incorreto, o conceito de coeficiente de variação é uma medida de dispersão
relativa, que decorre da divisão do desvio padrão pela média e não o contrário.
II.Essa utilização gráfica não é adequada para encontrar correlação linear, há vários métodos,
conforme descritos na aula de correlação e regressão.
III.O coeficiente de variação permite uma comparação mais adequada entre as dispersões de duas
variáveis diferentes, essa é sua principal utilidade!
IV.Definição perfeita.
Alternativa (e).

30 - TRT 12ª – FCC\2013) Um modelo de regressão linear múltipla, com intercepto, consiste de
uma variável dependente, 3 variáveis explicativas e com base em 12 observações. As estimativas
dos parâmetros do modelo foram obtidas pelo método dos mínimos quadrados e o valor encontrado
da estatística F (F calculado) utilizado para testar a existência da regressão foi igual a 14. O
coeficiente de explicação (R2), definido como sendo o resultado da divisão da variação explicada
pela variação total, é, em %, igual a
a) 80,0.
b) 76,8.
c) 78,0.
d) 72,0.
e) 84,0.
Resolução:
Vamos inverter um raciocínio que já fizemos a fim de encontrar o R²! Veja a fórmula que já usamos:
Agora, a nossa incógnita é o R²! A quantidade de observações é 12, há 3 variáveis explicativas e o

F calculado é de 14. Assim:
Vamos multiplicar invertido:
Multiplicando invertido novamente:
Alternativa (e).

31 - FGV – MPE/BA – 2017) Um indivíduo tem sua prisão temporária decretada, por um prazo de
uma semana. É possível que, durante ou mesmo ao final desse prazo, a prisão seja convertida em
preventiva. Se assim for, o tempo de detenção torna-se uma variável aleatória com a seguinte
função de probabilidades:
ƒT(t)= 0,02e-0,02t , para t > 0 e ZERO caso contrário
O indivíduo preso temporariamente pode, findo o prazo, ter sua prisão convertida em preventiva
com probabilidade de 40%.
a) supondo ele já cumpriu todo o período de prisão temporária, a probabilidade de que permaneça
preso por mais 3 semanas é de 0,12;
b) a probabilidade de que ele fique preso menos do que 2 semanas é 1 - (0,6). e-0,02 ;
c) a probabilidade que ele fique detido por mais do que 100 semanas é igual a (0,6) . e -1;
d) se ele passar à prisão preventiva, a probabilidade de ficar preso por mais 10 semanas é igual a
1 - e-0,2;
e) em média ele permanecerá detido por um período de 21 semanas.
RESOLUÇÃO:
T tem distribuição exponencial de parâmetro = 0,02. Portanto, a média de T (E(T)) é dada

por:
E T
Como a probabilidade de o indivíduo preso temporariamente ter sua prisão convertida em

preventiva é 40% = 0,4, temos que o período médio em que o indivíduo ficará preso é, em semanas,
dado por:
Tempo médio = 1(semana da prisão temporária) + E(0,4T)
Tempo médio = 1 + 0,4∙E(T) = 1 + 0,4∙50 = 1 + 20 = 21 semanas.
Resposta: E

32 - FGV – MPE/BA – 2017) A probabilidade de que uma decisão de 1ª instância da Justiça Federal
do Paraná seja reformada pelo Tribunal Superior da 4ª Região é de 0,20. No momento 100 recursos
aguardam por uma decisão dos Srs. Desembargadores daquele Tribunal.
São informados alguns valores da distribuição acumulada da normal-padrão:
Ø(1 ) = 0,87 , Ø(1,28)=0,90 e Ø(2) = 98
Sem usar o ajuste de continuidade, a probabilidade de que mais de 24 decisões sejam reformadas
é:
a) 13%;
b) 10%;
c) 8%;
d) 5%;
e) 2%.
RESOLUÇÃO:
Seja p a probabilidade de que uma decisão de 1ª instância da Justiça Federal do Paraná

seja reformada. Sabemos que p = 20% = 0,2.
Para calcular a probabilidade de que em um total de 100 recursos, mais de 24 sejam reformados,
queremos calcular a probabilidade de
p , ou seja, a probabilidade de mais de 24% dos recursos serem reformados.
p tem distribuição normal de média p = 0,20 e variância
Assim, temos que:
P p
– dado fornecido pelo enunciado.

Por fim, temos que:
Logo, a alternativa A é o gabarito da questão.
Resposta: A
33 - Analista de Controle Interno – FGV/2014) A seguinte amostra de idades foi obtida:
19; 25; 39; 20; 16; 27; 40; 38; 28; 32; 30.
Assinale a opção que indica a mediana dessas idades.
(A) 27
(B) 28
(C) 29
(D) 30
(E) 31
Resolução:
Ordene:
16;19;20;25;27;28;30;32;38;39;40
Dado que há um número ímpar de elementos, a mediana será o elemento que coincide com o
seguinte:
O sexto elemento é o 28.
Alternativa (b).

34 - Analista de Controle Interno – FGV/2014) Uma variável aleatória X é normalmente distribuída
com média 12 e variância 4. A probabilidade de que X seja maior do que 10 é igual a
(A) 0,3085.
(B) 0,3587.
(C) 0,6915.
(D) 0,8413.
(E) 0,9772.
Resolução:
Basta padronizar a variável. Chamando a média amostral de X, a média populacional de e o

desvio padrão de , tem-se que:
Procure “1,00” na tabela da banca. Este é o z que faz com 84,13% das observações sejam menores
do que este valor z. Como a distribuição normal é simétrica, esta também é a probabilidade de que
os valore encontrados na amostra sejam maiores do que -1, ou seja, 10.
Alternativa (d).
35 - Analista de Controle Interno – FGV/2014) Numa regressão linear simples, obteve-se um

coeficiente de correlação igual a 0,78. O coeficiente de determinação é aproximadamente
igual a
(A) 0,36.
(B) 0,48.
(C) 0,50.
(D) 0,61.
(E) 0,69.

Resolução:
Para resolver esta questão precisamos encontrar a estimativa para o parâmetro do modelo de
regressão. Isso será feito por:
Assim, o estimador será dado por:
Assim, a soma dos quadrados explicados:
E a soma dos quadrados totais:
Portanto, a soma dos quadrados dos resíduos é:
Alternativa (d).

37 - ICMS-RJ – FCC\2013) Sabe-se que:
I . X é uma variável aleatória com distribuição binomial com média 2p e variância (2p-2p2).
II . Y é uma variável aleatória com distribuição binomial com média 5p e variância (5p-5p2).
III . A probabilidade de X ser inferior a 2 é igual a 15/16.
Nessas condições, a probabilidade de Y ser superior a 3 é igual a
a) 3/1024
b) 1/64
c) 5/512
d) 15/1024
e) 7/512
Resolução
Eu optei pela resolução mais fácil e rápida desta questão, já que dá para ser mais formal, mas não
é o que um concurseiro precisa! Vamos começar com a variável X, nós sabemos que a esperança
e a variância de uma distribuição binomial são dadas por:
Ora, olhe o que o exercício deu:
Portanto, fica fácil ver que:
O exercício fala que a probabilidade do valor de X ser inferior a 2 é de 15/16. No caso, ,

pois trata-se de uma distribuição binomial com parâmetro . Assim:

Com base nisso, podemos achar o valor pedido para Y.
Então:
A probabilidade de sucesso é a mesma, pois ambas as variáveis referem-se a “ ”. Agora, basta

realizarmos nosso usual exercício de distribuição binomial para resolvermos a questão. Como
e o exercício quer saber qual a probabilidade de que Y assuma valores maiores do que 3, temos
que encontrar a probabilidade de que Y seja igual à 4 e 5. Assim:
Portanto:
Alternativa (b).
38 - BNDES – CESGRANRIO/2011) Para estudar o consumo de refrigerante em função do

preço, da temperatura e da renda familiar, ajustou-se o seguinte modelo de regressão linear
múltipla y = 0 + 1x1 + 2x2 + 3x3 + , onde y representa o consumo de refrigerante em
litros, por semana, x1, o preço do refrigerante em reais, x2, a temperatura em ºC e, x3, a renda
familiar em reais, por semana. Os resultados obtidos considerando três casas decimais
foram:

Analisando-se os resultados acima, conclui-se que
(A) rejeitam-se as hipóteses H0 : 0 = 0 e H0 : 1 = 0 ao nível de 5%
(B) rejeitam-se as hipóteses H0 : 0 = 0 , H0 : 1 = 0 e H0 : 2 = 0 ao nível de 1%
(C) não se rejeitam as hipóteses H0 : 0 = 0 , H0 : 1 = 0 e H0 : 3 = 0 ao nível de 5%
(D) não se rejeitam as hipóteses H0 : 1 = 0 , H0 : 2 = 0 e H0 : 3 = 0 ao nível de 5%
(E) os coeficientes estimados são todos significativos ao nível de 10%
Resolução:
Pessoal, hora de lembrar o que é o p-valor!
O p-valor é o menor nível de significância ao qual a hipótese nula pode ser rejeitada.
Vejamos, se você obtém um valor de 0,04 para seu p-valor, isso significa que a hipótese nula pode
ser rejeitada a 4% de significância. Mas, se você escolheu 5% como seu nível de significância, ou
seja, você definiu que 5% é muita coincidência, você deve rejeitar a hipótese nula.
Qual é a hipótese nula que estamos testando com os coeficientes? Que o mesmo é igual a zero!
Vamos pensar.
No caso do coeficiente da temperatura, , o p-valor associado a hipótese de que o mesmo é igual

a zero é de 0,011. Isso quer dizer que não é possível rejeitar esta hipótese nula a 1%! Isso porque
o p-valor é maior do que 1% (0,01). Todos os outros coeficientes tem um p-valor que nos
permite inferir que não é possível rejeitar a hipótese nula a 10%! Assim, pode-se perceber que
a única alternativa que se adequa a isso é a (c).
Alternativa (c).

Utilizando a equação da reta obtida pelo método dos mínimos quadrados, tem-se que, caso haja
um gasto anual com propaganda de 80 mil reais, a previsão do lucro bruto anual, em mil reais, será
de:
a) 158
b) 128,4
c) 121
d) 102,5
e) 84

anos da empresa:
Montando o quadro de análise de variância (ANOVA), tem-se que:
a) a variação total apresenta um valor de 62,5.
b) a variação explicada, fonte de variação devido à regressão, apresenta um valor igual a 80.
c) Dividindo a variação residual pela variação total, obtemos o coeficiente de determinação (R²).

18 - AFRFB – ESAF/2013) Um modelo de regressão linear múltipla foi estimado pelo método de
Mínimos Quadrados, obtendo-se, com um nível de confiança de 95%, os seguintes resultados:
I. = 10 + 2,5*x1 + 0,3*x2 + 2*x3
II. o coeficiente de determinação R2 é igual a 0,9532
III. o valor-p = 0,003
Desse modo, pode-se afirmar que:
a) se a variável x1 for acrescida de uma unidade, então Y terá um acréscimo de 2,5 %.
b) 0,003 é o mais baixo nível de significância ao qual a hipótese nula pode ser rejeitada.
c) x3 explica 95,32% das variações de Y em torno de sua média.
d) as probabilidades de se cometer o Erro Tipo I e o Erro Tipo II são, respectivamente, iguais a 5%

e 95%.
e) se no teste de hipóteses individual para 2 se rejeitar a hipótese nula (H0), então tem-se fortes
razões para acreditar que x2 não explica Y.
19 - FCC – TRT/11 – 2017) Instruções: Considere as informações abaixo para responder à

questão. Se Z tem distribuição normal padrão, então:
P(Z < 0,4) = 0,655; P(Z < 0,67) = 0,75; P(Z < 1,4) = 0,919; P(Z < 1,6) = 0,945;
P(Z < 1,64) = 0,95; P(Z < 1,75) = 0,96; P(Z < 2) = 0,977; P(Z < 2,05) = 0,98
A porcentagem do orçamento gasto com educação nos municípios de certo estado é uma
variável aleatória X com distribuição normal com média (%) e variância 4(%)².
Um gasto em educação superior a 10% tem probabilidade de 4%. Nessas condições, o valor
de é igual a
a) 5,50%
b) 6,20%
c) 7,35%
d) 6,50%
e) 7,85%

Foi usada a técnica de minimizar a soma dos erros quadráticos para ajustar a reta de regressão, a
qual
a) passa por ( ), onde e são as médias de X e de Y.
b) passa pela origem (0, 0).
c) não é a única reta que minimiza a soma dos erros quadráticos.
d) tem variância esperada nula.
e) tem coeficiente angular necessariamente negativo.
24 - FGV – MPE/BA – 2017) Um criminoso está avaliando se vale a pena ou não recorrer ao instituto
da colaboração premiada. Caso não recorra, a sua probabilidade de ser condenado é igual a p,
com 12 anos de reclusão. Se resolver delatar, pode pegar 6 anos de prisão, com probabilidade de
0,4, ou 10 anos, com a probabilidade complementar.
Supondo que a decisão será tomada com base na esperança matemática da pena, o criminoso
deve:
a) não delatar se o valor de p for inferior a 0,75;
b) delatar se o valor de p for superior a 0,55;
c) não delatar caso o valor de p seja superior a 0,80;
d) mostrar-se indiferente caso o valor de p seja 0,70;
e) delatar caso o valor de p seja inferior a 0,60.

29 - SEFAZ-SP – 2013/FCC) Considere:
I. O coeficiente de variação de uma variável é uma medida de dispersão absoluta que é o

resultado da divisão entre a média e o desvio padrão da variável em questão.
II. Um dispositivo útil quando se deseja verificar se existe correlação linear entre duas
variáveis é o gráfico de colunas justapostas.
III. O desvio padrão é mais apropriado do que o coeficiente de variação quando se deseja
comparar a variabilidade de duas variáveis.
IV. Na amostragem aleatória estratificada, a população é dividida em estratos, usualmente,

de acordo com os valores ou categorias de uma variável, e, depois, uma amostragem
aleatória simples é utilizada na seleção de uma amostra de cada estrato. Está correto o que
se afirma APENAS em
a) I.
b) II.
c) III.
d) I e IV.
e) IV.
30 - TRT 12ª – FCC\2013) Um modelo de regressão linear múltipla, com intercepto, consiste de
uma variável dependente, 3 variáveis explicativas e com base em 12 observações. As estimativas
dos parâmetros do modelo foram obtidas pelo método dos mínimos quadrados e o valor encontrado
da estatística F (F calculado) utilizado para testar a existência da regressão foi igual a 14. O
coeficiente de explicação (R2), definido como sendo o resultado da divisão da variação explicada
pela variação total, é, em %, igual a
a) 80,0.
b) 76,8.
c) 78,0.
d) 72,0.
e) 84,0.

31 - FGV – MPE/BA – 2017) Um indivíduo tem sua prisão temporária decretada, por um prazo de
uma semana. É possível que, durante ou mesmo ao final desse prazo, a prisão seja convertida em
preventiva. Se assim for, o tempo de detenção torna-se uma variável aleatória com a seguinte
função de probabilidades:
ƒT(t)= 0,02e-0,02t , para t > 0 e ZERO caso contrário
O indivíduo preso temporariamente pode, findo o prazo, ter sua prisão convertida em preventiva
com probabilidade de 40%.
a) supondo ele já cumpriu todo o período de prisão temporária, a probabilidade de que permaneça
preso por mais 3 semanas é de 0,12;
b) a probabilidade de que ele fique preso menos do que 2 semanas é 1 - (0,6). e-0,02 ;
c) a probabilidade que ele fique detido por mais do que 100 semanas é igual a (0,6) . e -1;
d) se ele passar à prisão preventiva, a probabilidade de ficar preso por mais 10 semanas é igual a
1 - e-0,2;
e) em média ele permanecerá detido por um período de 21 semanas.
32 - FGV – MPE/BA – 2017) A probabilidade de que uma decisão de 1ª instância da Justiça Federal
do Paraná seja reformada pelo Tribunal Superior da 4ª Região é de 0,20. No momento 100 recursos
aguardam por uma decisão dos Srs. Desembargadores daquele Tribunal.
São informados alguns valores da distribuição acumulada da normal-padrão:
Ø(1 ) = 0,87 , Ø(1,28)=0,90 e Ø(2) = 98

Sem usar o ajuste de continuidade, a probabilidade de que mais de 24 decisões sejam reformadas
é:
a) 13%;
b) 10%;
c) 8%;
d) 5%;
e) 2%.
33 - Analista de Controle Interno – FGV/2014) A seguinte amostra de idades foi obtida:
19; 25; 39; 20; 16; 27; 40; 38; 28; 32; 30.
Assinale a opção que indica a mediana dessas idades.
(A) 27
(B) 28
(C) 29
(D) 30
(E) 31
34 - Analista de Controle Interno – FGV/2014) Uma variável aleatória X é normalmente distribuída

com média 12 e variância 4. A probabilidade de que X seja maior do que 10 é igual a
(A) 0,3085.
(B) 0,3587.
(C) 0,6915.
(D) 0,8413.
(E) 0,9772.

Aula 08

Enviado por

Dados do documento

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Aula 08

Enviado por

Direitos autorais:

Formatos disponíveis

Este é o mesmo problema que encontramos quando estudamos a variância, pois a soma dos

Curso\Sexo Masculino Feminino

Física (16)²/84 (-16)²/36

Ciências Sociais (-16)²/56 (16)²/24

Pode-se provar que a soma de todos estes elementos gera uma

WWW.RATEIOS.ORG WhatsApp (41) 99111-5296

Sendo o tamanho da amostra. Surge uma pergunta natural:

-“Qual o tamanho ideal de minha amostra”?

Nós já estudamos o que é um erro amostral: a margem de erro da aula

Ou seja, nossa amostra deve ter, no mínimo, 625 elementos.

WWW.RATEIOS.ORG WhatsApp (41) 99111-5296

b) comparação entre médias

c) verificação de média, mediana e moda

d) verificação de desvio padrão

A alternativa A cita qui-quadrado e de fato o teste estatístico qui-quadrado é utilizado no

WWW.RATEIOS.ORG WhatsApp (41) 99111-5296

Outra forma de explicitar o coeficiente de correlação é por meio da covariância.

A covariância entre duas variáveis é influenciada pela associação que

WWW.RATEIOS.ORG WhatsApp (41) 99111-5296

Assim, com base na variância total da amostra ( ), podemos definir R² como:

Então se aplicarmos esta fórmula a nosso exemplo acima:

Beleza, terminamos a parte de correlação, vamos à regressão!

WWW.RATEIOS.ORG WhatsApp (41) 99111-5296

Soma 3084 4284

Média 154,2 214,2

WWW.RATEIOS.ORG WhatsApp (41) 99111-5296

Variáveis X Y X centrado Y centrado X(centrado)*Y(centrado) (X centrado)² (Y centrado)²

103 160 -51,2 -54,2 2775,04 2621,44 2937,64

123 167 -31,2 -47,2 1472,64 973,44 2227,84

145 207 -9,2 -7,2 66,24 84,64 51,84

126 173 -28,2 -41,2 1161,84 795,24 1697,44

189 256 34,8 41,8 1454,64 1211,04 1747,24

211 290 56,8 75,8 4305,44 3226,24 5745,64

178 237 23,8 22,8 542,64 566,44 519,84

155 209 0,8 -5,2 -4,16 0,64 27,04

141 193 -13,2 -21,2 279,84 174,24 449,44

156 219 1,8 4,8 8,64 3,24 23,04

166 235 11,8 20,8 245,44 139,24 432,64

179 234 24,8 19,8 491,04 615,04 392,04

197 273 42,8 58,8 2516,64 1831,84 3457,44

204 272 49,8 57,8 2878,44 2480,04 3340,84

125 181 -29,2 -33,2 969,44 852,64 1102,24

112 166 -42,2 -48,2 2034,04 1780,84 2323,24

107 161 -47,2 -53,2 2511,04 2227,84 2830,24

135 195 -19,2 -19,2 368,64 368,64 368,64

144 201 -10,2 -13,2 134,64 104,04 174,24

188 255 33,8 40,8 1379,04 1142,44 1664,64

Soma 3084 4284 21199,2 31513,2

Média 154,2 214,2 1059,96 1575,66

Vamos aplicar a fórmula:

WWW.RATEIOS.ORG WhatsApp (41) 99111-5296

Assim, os resíduos são:

WWW.RATEIOS.ORG WhatsApp (41) 99111-5296

Considerou, para o estudo, as seguintes informações referentes às observações dos últimos 10

WWW.RATEIOS.ORG WhatsApp (41) 99111-5296

Soma dos Quadrados Graus de Liberdade Quadrados Médios Teste F

Sendo N o número de observações da amostra e k o número de variáveis explicativas na regressão,

portanto cabe questionar: será que a esta regressão faz sentido?

WWW.RATEIOS.ORG WhatsApp (41) 99111-5296

Portanto, o teste F aplicado ao estudo de regressão é equivalente a um teste de hipóteses conjunto

WWW.RATEIOS.ORG WhatsApp (41) 99111-5296

Considerou, para o estudo, as seguintes informações referentes às observações dos últimos 10

Montando o quadro de análise de variância (ANOVA), tem-se que:

a) a variação total apresenta um valor de 62,5.

I. = 10 + 2,5x1 + 0,3x2 + 2*x3