Você está na página 1de 17

Escola secundaria de Lousada Ano lectivo 2010/2011

Estatística Matemática A

animais resultados experimentais. que se pretende analisar). a variação de um dos caracteres influencia a variação do outro. que podem ser entre outras. com uma ou mais características em com um. com o intuito de verificar se existe algum tipo de relação entre eles ou se.    EXEMPLOS: Idade e estatura Estatura e peso Ordenado e gastos . Em muitas situações. sobre dois caracteres da mesma população(colecção de unidades individuais. pessoas.São estudos estatísticos. pelo contrário. são independentes.

Variáveis: A. Cada metro quadrado custa 200 €.preço a pagar Então p = 200a  . dependendo da área ocupada.2500 2000 1500 P(€) 1000 500 0 0 5 10 A(m2) 15 p = 200a Num centro comercial o preço a pagar por cada loja é variável.área ocupada P.

y). respectivamente. Estes pares ordenados podem ser representados a partir de um sistema de eixos coordenados (diagrama de dispersão). . Homem (X) 21 24 24 26 28 25 32 38 29 28 Mulher (Y) 19 21 23 24 24 25 27 35 26 29 Num casamento de Santo António. A variável ( x. Neste estudo. a população é formada por um conjunto de pares ordenados(x .Nem sempre a existência de uma relação entre duas variáveis é do tipo funcional. em que x e y representam os homens e as mulheres. y). designa-se por variável estatística bidimensional. retirou-se a idade de alguns casais presentes.

y). escolha as escalas de tal maneira que a figura pareça quadrada. correspondentes aos homens e mulheres. Este diagrama permite concluir que há uma tendência para a idade das mulheres aumentar à medida que a idade dos homens. 40 Idade de casais presentes num casamento de S. Esse cuidado ajuda a obter melhor visão da associação das variáveis. 35 30 Mulher (y) 25 20 15 10 5 António A este tipo de representação gráfica dá-se o nome de diagrama de dispersão ou nuvem de pontos.Considera-se um sistema de eixos ordenados e marcam-se os pontos de coordenadas ( x. 0 0 10 20 Homem (x) 30 40 Nota: Para desenhar o diagrama de dispersão. .

em que x representa a média da idade dos homens e y a média da idade das mulheres. 25.7 y ≈ 25.3 (x . y) = (26. y) . António 24 24 26 28 25 32 38 21 28 21 23 24 24 25 27 35 26 29 O ponto médio é: x ≈ 26.3) Mulher (y) 25 20 15 10 5 0 0 10 20 26. 25.Chama-se ponto médio ou centro de gravidade da nuvem de pontos ao ponto de coordenadas (x. Assim: 40 x 21 y 19 35 30 Idade de casais presentes num casamento de S.7.7.3 30 40 Homem (x) .

carros 1 2 3 4 5 6 7 8 9 10 11 12 Quilómetros (milhares) 20 30 200 45 50 150 100 130 40 80 180 90 Preço (milhares de euros) 30 28 1 19 15 8 10 9 20 14 7 13 . Considere a seguinte tabela que mostra os quilómetros que um carro apresenta e a sua valorização ao longo dos anos de uso. Construa um diagrama de dispersão e descubra o ponto médio.

correlação negativa e correlação nula. as variáveis dizem-se independentes. A análise de correlação é o instrumento estatístico que permite estudar relações quantitativas. ou seja. a variação de uma não influencia a outra. Existem 3 tipos de correlação: correlação positiva.Indica a força e a direcção do relacionamento linear entre duas variáveis aleatórias. . Correlação negativa: Existe uma tendência para uma das grandezas aumentar à medida que a outra diminui. Correlação positiva: Existe uma tendência para uma das grandezas aumentar à medida que a outra aumenta. Correlação nula: Não há correlação .

IV. II. No diagrama de dispersão . ou nos quadrantes II e IV. y) dividem o plano em quatro quadrantes : I.  Nos casos em que não existe uma maior predominância de pontos nos quadrantes I e III. Assim: Seja ( x.  Se houver uma maior concentração de pontos nos quadrantes I e III.  Se houver uma maior concentração de pontos nos quadrantes II e IV .é uma correlação é nula. y II y (X . a correlação é positiva. diz-se que não há correlação . a correlação é negativa.as rectas paralelas aos eixos e que se intersectam no centro de gravidade ( x.Y ) I III IV x x . III. y) uma distribuição bivariada.Quando a correlação é um pouco difícil de encontrar podemos encontra-la de uma maneira bastante simples.

intuitivamente. Se r = 0. a correlação é positiva. Uma das medidas estatísticas que permite estabelecer o grau de correlação existente entre as variáveis é denominada de coeficiente de correlação. 1]. é possível quantificar a correlação e concluir se é mais ou menos forte. a correlação é nula. que se representa por r e toma valores pertencentes ao intervalo [-1. verificar se há correlação e se esta é positiva ou negativa. Essa recta tem declive positivo se r =1 e tem declive negativo se r = -1. os pontos do diagrama de dispersão estão sobre uma recta. . Se r ˂ 0. Se r ˃ 0.Através do diagrama de dispersão é possível. a correlação é negativa. Quando r =1 ou r = -1. No entanto.

 Na correlação positiva. r = 0. quanto mais próximo de -1 for o valor de r mais forte é a correlação. quanto mais próximo de 1 for o valor de r mais forte é a correlação. y y y x Correlação fraca  Correlação forte x x Correlação forte perfeita Na correlação nula. y y y x x x Correlação fraca  Correlação forte Correlação forte perfeita Na correlação negativa. y x Correlação nula .

Pode-se utilizar a seguinte escala. para avaliar a intensidade da correlação: .

1º ETAPA 2nd calc stat enter 2º ETAPA 2nd Y= enter 3º ETAPA .

estudam-se as relações existentes entre fenómenos. O processo que vamos utilizar consiste em traçar uma recta que se aproxime aos pontos do diagrama de dispersão.Quando existe correlação entre variáveis. y = mx + b Declive Ordenada na origem . muitas vezes interessa prever o valor de uma das variáveis quando se conhece o valor correspondente a outra variável. quando são feitas observações de duas ou mais variáveis. através das suas distribuições. Existem processos matemáticos para a determinação da equação dessa recta . chamada recta de regressão. Quando se observam somente duas variáveis. Prova-se que essa recta passa pelo ponto médio da nuvem de pontos e o declive é igual ao do coeficiente de correlação. a distribuição diz-se bidimensional. Ao fazer uma análise de regressão.

E a equação da recta de regressão é: y=1.0483x .0818 R² = 0. assim prevêse que haja 3 leitores. Qual é o numero de leitores que se prevê que sejam entrevistados por um voluntário que levem 7 livros? 8 7 6 Nº de leitores 5 4 y = 1.0483x-4.2 (x .9 y ≈4.8798 Nº de livros (x) 5 6 6 8 8 8 9 9 10 10 Nº de leitores (y) 1 2 3 3 4 5 5 6 6 7 O ponto médio é: x ≈7. 4.9. e elaborou-se a seguinte tabela .2.2) 3 2 1 0 0 2 4 6 8 10 12 Nº de livros Por observação do gráfico conclui-se que a ordenada do ponto da recta de regressão que tem de abcissa 7 é aproximadamente 3.4. y) = (7.Na biblioteca municipal de Lousada 10 voluntários registou-se o numero de leitores e o numero de livros que requisitaram .0818 .

1º ETAPA 2nd calc stat enter 2º ETAPA 2nd Y= enter 3º ETAPA 4º ETAPA stat calc 4:LinReg( ax+b) 5º ETAPA escrever L1. L2. L3 L2 6º ETAPA a equação da recta . .

y). junto dos nossos colegas. o conjunto de pontos ( x.Decidimos averiguar. num sistema de eixos. Alunos 1 2 3 4 Numero de faltas 10 0 2 3 Nº de horas de estudo semanais 4 10 9 10 5 6 7 8 9 10 11 12 6 12 8 1 1 7 5 12 3 1 7 6 5 2 6 14 . Determine a recta de regressão . Elaborou-se o quadro ao lado: Represente. qual a relação entre o número de faltas às aulas e o número de horas semanais de estudo. nº de horas semanais de estudo) Indique o tipo de correlação e justifique. correspondente a: (número de faltas.