Você está na página 1de 27

UNIDADE CURRICULAR:

PROBABILIDADES E ESTATÍSTICA

II SEMESTRE
ANO LECTIVO: 2022/2023

O DOCENTE:
ALFREDO QUINDAI (MSc.)
Valor
padronizado ou escore 𝒛

Teorema de Tchebyshev
Introdução
Além das medidas de posição, de variabilidade e
de forma (assimetria e curtose), também estamos
interessados na posição relativa dos valores
contidos num conjunto de dados.
As medidas de posição relativa nos ajudam a
determinar quão afastado um valor, em particular,
está da média.
Usando tanto a média como o desvio-padrão,
podemos determinar a posição relativa de
qualquer observação. Aliás, suponha que a média,
𝑥, e o desvio-padrão, 𝑠, amostrais já tenham sido
calculados.
Cálculo de escore-𝒛

A cada valor 𝑥𝑖 há outro valor associado


denominado escore-𝒛, que se calcula mediante a
seguinte fórmula:
𝒙𝒊 − 𝒙
𝒛𝒊 =
𝒔
onde

𝑧𝑖 = escore-𝑧 para 𝑥𝑖
𝑥 = média amostral
𝑠 = desvio-padrão amostral.
Exemplo de escore-𝒛
Número de Desvio em 𝒙𝒊 − 𝒙
estudantes na torno da média 𝒛𝒊 =
𝒔
classe 𝒙𝒊 𝒙𝒊 − 𝒙
46 2 0,25
54 10 1,25
42 −2 −0,25
46 2 0,25
32 −12 −1,50
Interpretação: 𝑧5 = −1,5 mostra que o valor
𝑥 = 44 de 32 é o mais afastado da média com 1,5
𝑠=8 desvios-padrão abaixo da média amostral.
Interpretação de escore-𝒛

O escore-𝒛, 𝑧𝑖 , pode ser interpretado como o


número de desvios-padrão que 𝑥𝑖 está afastado
da média 𝑥.

De modo similar, 𝑧2 = 1,25 indicaria que 𝑥2 = 54


é 1,25 desvios-padrão maior que a média
amostral.

Por exemplo, 𝑧3 = −0,25 indica que 𝑥3 = 42


encontra-se afastado da média com 0,25 desvios-
padrão abaixo da média amostral.
Teorema de Tchebyshev

O Teorema de Tchebyshev nos possibilita


fazer afirmações sobre a proporção dos dados
que devem estar contidos num número
específico de desvios-padrão da média, 𝑥.
𝟏
Teorema de Tchebyshev: Pelo menos 𝟏 −
𝒌𝟐
dos valores de dados devem estar contidos em
𝑘 desvios-padrão da média, 𝑥 , em que 𝑘 é
qualquer valor maior do que 1.
Implicações do Teorema de Tchebyshev

Algumas das implicações desse teorema, com


𝑘 = 2, 3 𝑒 4 desvios-padrão, são as seguintes:
 Pelo menos 0,75, ou 75%, dos valores de
dados devem estar contidos em 𝑘 = 2
desvios-padrão da média.
 Pelo menos 0,89, ou 89%, dos valores de
dados devem estar contidos em 𝑘 = 3
desvios-padrão da média.
 Pelo menos 0,94, ou 94%, dos valores de
dados devem estar contidos em 𝑘 = 4
desvios-padrão da média.
Exemplo do uso do teorema

Suponha que as notas dos exames semestrais de


100 estudantes de um curso de engenharia da
UMA tenham uma média de 70 e um desvio-
padrão igual a 5.

a) Quantos estudantes tiveram notas de exame


entre 60 e 80?

b) Quantos estudantes tiveram notas de exame


entre 58 e 82?
Respostas

a) Resposta:
Em relação às notas entre 60 e 80, observamos
que 60 está dois desvios-padrão abaixo da
média e que 80 está dois desvios-padrão acima
da média.
Utilizando o teorema de Tchebyshev, vemos
que pelo menos 0,75, ou 75%, das notas dos
estudantes devem estar contidas dentro de dois
desvios-padrão da média. Dessa forma, pelo
menos 75 , dos estudantes devem ter obtido
notas entre 60 e 80.
Respostas

b) Resposta:
Em relação às notas entre 58 e 82, vemos que
58−70
= −2,4 indica que 58 está 2,4 desvios-
5
82−70
padrão abaixo da média e que = 2,4
5
indica que 82 está 2,4 desvios-padrão acima da
média.
Utilizando o teorema de Tchebyshev, vemos
que pelo menos 0,826, ou 82,6% dos estudantes
devem ter notas de exame entre 58 e 82.
Medidas
de associação entre duas variáveis
 Covariância
 Coeficiente de correlação
Introdução

Até aqui, examinamos os métodos numéricos


utilizados para sintetizar dados correspondentes
a uma variável a cada vez. Mas, na prática, para
quem toma decisão está interessado na relação
entre duas variáveis.

A covariância e o coeficiente de correlação são


medidas descritivas da relação entre duas
variáveis.
Covariância

Para uma amostra de tamanho 𝑛 com as


observações 𝑥1 , 𝑦1 , 𝑥2 , 𝑦2 , … , 𝑥𝑛 , 𝑦𝑛 , a
covariância amostral é definida como:
𝑥𝑖 − 𝑥 𝑦𝑖 − 𝑦
𝑠𝑥𝑦 =
𝑛−1
A covariância populacional é definida como:
𝑥𝑖 − 𝜇𝑥 𝑦𝑖 − 𝜇𝑦
𝜎𝑥𝑦 =
𝑁
A covariância é uma medida da associação linear
entre duas variáveis.
Interpretação da covariância
Um valor positivo para a covariância, 𝑠𝑥𝑦 , indica
uma associação linear positiva entre 𝑥 e 𝑦; ou seja,
à medida que o valor de 𝑥 aumenta, o valor de 𝑦
também aumenta (relação linear positiva forte).
Um valor negativo para a covariância, 𝑠𝑥𝑦 , indica
uma associação linear negativa entre 𝑥 e 𝑦; ou
seja, à medida que o valor de 𝑥 aumenta, o valor
de 𝑦 diminui (relação linear negativa forte).
Um problema quando se usa a covariância é que o
seu valor depende das unidades de medida para
𝑥 e 𝑦.
Coeficiente de correlação

Uma medida da relação entre duas variáveis que


não é afectada pelas unidades de medida para 𝑥 e
𝑦 é o coeficiente de correlação.
Para os dados amostrais, o coeficiente de
correlação (produto-momento de Pearson) é o
seguinte:
𝑠𝑥𝑦
𝑟𝑥𝑦 =
𝑠𝑥 𝑠𝑦
onde
𝑠𝑥 = desvio padrão amostral de 𝑥.
𝑠𝑦 = desvio padrão amostral de y.
Interpretação
do coeficiente de correlação
O coeficiente de correlação varia de −1 a +1.
Valores que se aproximam de −1 a +1 indicam
uma relação linear forte.
Quanto mais próxima a correlação estiver de zero,
mais fraca será a relação.
Um coeficiente de correlação amostral igual a +1
corresponde a uma relação linear positiva perfeita
entre 𝑥 e 𝑦.
Um coeficiente de correlação amostral igual a −1
corresponde a uma relação linear negativa perfeita
entre 𝑥 e 𝑦.
Exemplo

Considere os dados da tabela seguinte:

𝒙𝒊 𝒚𝒊
5 10
10 30
15 50

Calcule:
a) A covariância
b) O coeficiente de correlação
Respostas

𝒙𝒊 𝒚𝒊 𝒙𝒊 − 𝒙 𝒙𝒊 − 𝒙 𝟐 𝒚𝒊 − 𝒚 𝒚𝒊 − 𝒚 𝟐 𝒙𝒊 − 𝒙 𝒚𝒊 − 𝒚
5 10 −5 25 −20 400 100
10 30 0 0 0 0 0
15 50 5 25 20 400 100
∑ 30 90 0 50 0 800 200

𝒙 = 𝟏𝟎 𝒚 = 𝟑𝟎
Respostas

A partir dos dados da tabela anterior, podemos


calcular a covariância

𝑥𝑖 − 𝑥 𝑦𝑖 − 𝑦 200
𝑠𝑥𝑦 = = = 100
𝑛−1 2

𝑥𝑖 − 𝑥 2 50
𝑠𝑥 = = =5
𝑛−1 2

𝑦𝑖 − 𝑦 2 800
𝑠𝑦 = = = 20
𝑛−1 2
Cálculo do coeficiente de correlação
De igual modo, a partir dos dados anteriores,
podemos calcular o coeficiente de correlação.
𝑠𝑥𝑦 100
𝑟𝑥𝑦 = = =1
𝑠𝑥 𝑠𝑦 5 ∙ 20

Como o coeficiente de correlação é igual a 1,


podemos concluir que existe uma relação
linear positiva perfeita entre as variáveis 𝑥 e 𝑦.
Exercícios
Cinco observações feitas de duas variáveis
são apresentadas a seguir:

𝑥𝑖 4 6 10 3 16
𝑦𝑖 50 50 40 60 30

Pedido:
Pretende-se que

a) Construa um diagrama de dispersão com 𝑥


no eixo horizontal.
b) O que o diagrama de dispersão construído
em (a) indica a respeito da relação entre as
duas variáveis ?
c) Calcule e interprete a covariância amostral.
d) Calcule e interprete o coeficiente de
correlação amostral.
Exercícios
As temperaturas diárias máxima e mínima (g.c.) de
14 cidades ao redor do mundo são apresentadas a
seguir ( The weather Channel, April, 22, 2009):
Cidade Máx. Min. Cidade Máx. Min.
Atenas 68 50 Londres 67 45
Beijing 70 49 Moscovo 44 29
Berlim 65 44 Paris 69 44
Cairo 96 64 Rio de janeiro 76 69
Dublin 57 46 Roma 69 51
Genebra 70 45 Tóquio 70 58
Hong Kong 80 73 Toronto 44 39
Exercícios

a) Qual é a média de temperatura máxima da


amostra ?
b) Qual é a média de temperatura mínima da
amostra ?
c) Qual é a correlação entre as temperaturas
máxima e mínima ? Discuta.
FIM

CAPÍTULO 1 – ESTATÍSTICA DESCRITIVA


Próximo
Capítulo 2 - Probabilidade

Tópicos: Métodos de contagem. Definição


frequencista de Probabilidade. Definição
clássica de Probabilidade (Laplace). Definição
axiomática de Probabilidade. Probabilidade
condicionada. Acontecimentos independentes.
Teorema da Probabilidade Total. Teorema de
Bayes.

Você também pode gostar