Você está na página 1de 11

0

INSTITUTO DE CIÊNCIAS E EDUCAÇÃO A DISTANCIA


Faculdade de Ciências Sociais e Humanas
Curso de Licenciatura em Ciência Politica e Relações Internacionais

Tema: Distribuições bidimensionais (correlação e regressão) noções intuitiva e


frequencista das probabilidades (Leis dos Grande números e Axiomas de
probabilidades)

Nome: Ramujú Armando Alifa


Nampula
2022
INSTITUTO DE CIÊNCIAS E EDUCAÇÃO A DISTANCIA
1

Faculdade de Ciências Sociais e Humanas

Curso de Licenciatura em Ciência Politica e Relações Internacionais

Tema: Distribuições bidimensionais (correlação e regressão) noções intuitiva e


frequencista das probabilidades (Leis dos Grande números e Axiomas de
probabilidades)

Trabalho de campo a ser submetido na coordenação do


Curso de Licenciatura em Ciência Politica e Relações
Internacionais, na cadeira de Estatística Aplicada,
leccionada pelo:

Tutor: Joaquim Júlio Motechone Gano

Nome: Ramujú Armando Alifa

Nampula

2022

Índice
2

Introdução...................................................................................................................................3

1. Objectivo Geral....................................................................................................................3

1.1. Objectivos Específicos.....................................................................................................3

2. Distribuições Bidimensionais..............................................................................................4

2.1. Coeficiente de correlação.................................................................................................5

2.2. Rectas de regressão..........................................................................................................6

2.3. Interpretação frequencista de probabilidade....................................................................7

3. Lei dos grandes números.....................................................................................................7

Conclusão....................................................................................................................................9

Referencias Bibliográficas........................................................................................................10
3

Introdução
O presente da disciplina de Estatística, tem como tema, as probabilidades (noções de
distribuição Bidimensional, noções intuitiva e frequencista das probabilidades. Neste caso irei
definir e caracterizar e colocar os respectivos exemplos para cada parte que compõe o
trabalho. Tem como objectivo:

1. Objectivo Geral
 Analisar as noções de distribuição bidimensional intuitiva e frequencista das
probabilidades.

1.1. Objectivos Específicos


 Definir cada elemento do tema em estudo;
 Explicar como como acontece a relação entre as variáveis;
4

2. Distribuições Bidimensionais
Em alguns estudos estatísticos há a incidência sobre dois caracteres da mesma
população, análises bivariadas, com a intenção de os comparar e ver se há ou não algum tipo
de relações entre eles, ou se pelo contrário, são independentes. Em situações normais a
variação de um dos caracteres influência a variação do outro.

Exemplo: No boletim de saúde infantil e juvenil encontras pares de variáveis que são
analisadas conjuntamente, tais como:

 Idade  (em meses) e a massa corporal  (em kg), dos 0 aos 24 meses;
 Idade  (em meses) e o perímetro cefálico  (em cm), dos 0 aos 36 meses;
 Idade  (em anos) e a estatura  (em cm), dos 2 aos 20 anos.
 O número de trabalhadores a executar uma obra e o tempo de execução.
 O rendimento mensal do agregado familiar e os gastos em lazer.

A relação entre duas variáveis está perfeitamente definida através de uma função - relação
funcional. Conhecido o valor de uma das variáveis, é possível conhecer o valor exacto da
outra variável.

Mas nem sempre a existência de uma relação entre duas variáveis é do tipo funcional,
assumindo a estatística, nestes casos, um papel fundamental ao permitir determinar valores
aproximados de uma das grandezas conhecida a outra grandeza.

Na tabela que se segue estão representadas as temperaturas máximas e as mínimas registadas


em algumas cidades portuguesas num determinado dia.

Cidade Temperatura mínima x (° C Temperatura máxima y(° C


) )
Aviera 5 16
Beja 7 18
Castelo branco 6 18
Coimbra 5 17
Faro 9 20
Funchal 10 18
Lisboa 6 16
Ponto Delgada 12 20
Portalegre 4 15
Porto 4 18
Santarém 8 19
Viana do Castelo 2 13
5

Viseu 1 14
Neste estudo, a população é formada por um conjunto de pares ordenados (x , y) , em que x e
y representam as temperaturas mínima e máxima, respectivamente.

A variável (x,y) designa-se por variável estatística bidimensional.

Repara que qualquer relação que possa existir entre as temperaturas mínimas e máximas não é
do tipo funcional. Basta observar que à temperatura mínima de 5 °C corresponde mais do que
um valor de temperatura máxima (16 °C e 17 °C).

Os elementos da população podem ser representados por: ( x 1 , y 1 ) , ( x 2 , y 2 ) , …(x 13 , y 13).

2.1. Coeficiente de correlação


Quando X e Y são ambas variáveis aleatórias, pode ser útil o conhecimento de uma medida
que relacione as duas variáveis quando elas mantêm entre si uma relação dada por uma linha
recta. Tal medida é dada pelo coeficiente de correlação (). Assim, correlação é definida
como a quantificação do grau em que duas variáveis aleatórias estão relacionadas, desde que a
relação seja linear. Na análise de correlação se procura, então, determinar o grau de
relacionamento entre as duas variáveis, ou seja, se procura medir a covariabilidade entre elas.

Na análise de regressão é necessário distinguir a variável dependente e a variável


independente; na de correlação, tal distinção não é necessária. No que segue, os dados são
supostos normalmente distribuídos. Definição: Sejam x 1 , x 2 , ... , x n ; y 1 , y 2 ,... , y n os valores
observados de X e Y, respectivamente. Chama-se coeficiente de correlação (amostral) entre X
e Y, o número dado por:

( y i− y )(x i−x)
Cov (x , y )
∑ n−1 ∑ ( y i− y )(x i−x )
r= = =
√ Var (x )∙ Var ( y)
√ ∑ (x i−x) ∙ ∑ ( y i− y) √ ∑ (x i− x)2 ∑ ( y i− y )2
2 2

n−1 n−1

Uma fórmula equivalente de cálculo de r, de fácil manuseio, é:

∑ x i ∑ yi
∑ x i y i− n ∑ x i y i −n x y
r= =


2 2 √¿ ¿¿
∑ xi2 −(∑ x i) ∙ ∑ y i2−(∑ y i)
n n
6

Através do diagrama de dispersão é possível, intuitivamente, verificar se há correlação e se


esta é positiva ou negativa. No entanto, é possível quantificar a correlação e concluir se é mais
ou menos forte.

Uma das medidas estatísticas que permite estabelecer o grau de correlação existente entre as
variáveis é denominada coeficiente de correlação, que se representa por r e toma valores
pertencentes ao intervalo [−1,1].

 Se r <0 , a correlação é negativa. A variação das variáveis é feita em sentidos opostos,


isto é, uma aumenta quando a outra diminui.

 Se r >0 , a correlação é positiva. A variação das variáveis é feita no mesmo sentido,


isto é, uma aumenta quando a outra também aumenta.

 Se r =0, a correlação é nula.

Quando r =1 our =−1, os pontos no diagrama de dispersão estão sobre uma recta.  Essa recta
tem declive positivo se r=1 e tem declive negativo se r =−1.

Na correlação positiva, quanto mais próximo de 1 for o valor de r e mais forte é a correlação.

Na correlação negativa, quanto mais próximo de -1 for o valor de r mais forte é a correlação.

2.2. Rectas de regressão


A equação da recta Y^ =a1 +b1 X ou a recta de regressão de Y em X, como visto, pode ser
escrita sob a forma:

Y^ =Y + b1 ( X− X ) ou Y^ −Y =b 1 ( X −X )
7

Sy
Como b 1=b yx =r
Sx

Sy Sy
Y^ −Y =r ( X −X ) ou y=r ∙ x
Sx Sx

De modo semelhante, a recta de regressão de X em Y, ^


X =a1 +b 1 Y pode ser escrita como:

Sx S S
^
X −X =r (Y −Y ) , onde b 2=b xy=r x ou x=r x ∙ y
Sy Sy Sy

2.3. Interpretação frequencista de probabilidade

Se em muitos lançamentos de uma moeda a frequência de caras observadas se aproxima de


1/2, então dizemos que a probabilidade da saída de cara num próximo lançamento será de 1/2.

Define-se  probabilidade - definição frequencista -  de  um acontecimento  A e representa-se


por  P(A), como sendo o valor obtido para a frequência relativa com que se observou A, num
grande número de realizações da experiência aleatória.

O conceito frequencista de probabilidade, em que interpretamos a probabilidade de um


acontecimento da forma anteriormente considerada, não nos permite obter valores exactos
para a probabilidade. No caso da moeda, poderíamos continuar a lançar indefinidamente a
moeda, que nunca obteríamos o valor exacto para a probabilidade da saída de cara.

Podemos, no entanto, idealizar o seguinte modelo probabilístico, para a experiência aleatória


que consiste em lançar uma moeda e observar a face que fica voltada para cima:

Face Cara Coroa

Probabilidade 1/2 1/2

Sugere-se este modelo na presunção de que seria este o comportamento da frequência relativa
dos acontecimentos elementares associados à realização do fenómeno aleatório em estudo.

3. Lei dos grandes números


Na teoria da probabilidade, a lei dos grandes números ( LLN ) é um teorema que descreve o
resultado de realizar o mesmo experimento um grande número de vezes. De acordo com a lei,
a média dos resultados obtidos em um grande número de tentativas deve ser próxima ao valor
8

esperado e tenderá a se aproximar do valor esperado à medida que mais tentativas são
realizadas.

O LLN é importante porque garante resultados estáveis de longo prazo para as médias de
alguns eventos aleatórios. Por exemplo, embora um cassino possa perder dinheiro em uma
única rodada da roleta , seus ganhos tenderão a uma percentagem previsível ao longo de um
grande número de rodadas. Qualquer sequência de vitórias de um jogador acabará sendo
superada pelos parâmetros do jogo. É importante lembrar que a lei só se aplica (como o nome
indica) quando um grande número de observações é considerado. Não existe um princípio de
que um pequeno número de observações irá coincidir com o valor esperado ou que uma
sequência de um valor será imediatamente "equilibrada" pelos outros.

Exemplos

Por exemplo, um único lançamento de um dado justo de seis lados produz um dos números 1,
2, 3, 4, 5 ou 6, dividindo por 6, cada um com a mesma probabilidade. Portanto, o valor
esperado da média dos rolos é: 3,5.

De acordo com a lei dos grandes números, se um grande número de dados de seis lados for
lançado, a média de seus valores (às vezes chamada de média amostral ) provavelmente será
próxima a 3,5, com a precisão aumentando à medida que mais dados são lançados.

Segue-se da lei dos grandes números que a probabilidade empírica de sucesso em uma série
de tentativas de Bernoulli convergirá para a probabilidade teórica. Para uma variável aleatória
de Bernoulli , o valor esperado é a probabilidade teórica de sucesso, e a média de n tais
variáveis (assumindo que sejam independentes e distribuídas de forma idêntica (iid) ) é
precisamente a frequência relativa.
9

Conclusão
Depois da leitura feita às matérias encontrados na internet, e manuais para a realização do
presente trabalho conclui que quando se fala de distribuição bidimensional refere-se ao
estudos que visa saber da existência ou não de relação entre duas variáveis.
10

Referencias Bibliográficas
Farias, Ana Maria. Variáveis Aleatórias Bidimensionais. Sd.

Noções de estatística. Disponível em: site www.alea.pt . Acesso em 24 de Março de 2022.

Universidade Estadual Paulista. (2019) Estatística e Bioestatística.

Você também pode gostar