Você está na página 1de 18

Vice-Reitoria da Área Académica

Faculdade de Ciências Sociais e Humanas


Curso de Licenciatura em Administração Pública

Cadeira: Estatística Aplicada

Probabilidades (Noções)

Discente: Tutor:
Edna da Conceição Carlos Mualeve dr.

Chimoio, Março de 2022


Vice-Reitoria da Área Académica
Faculdade de Ciências Sociais e Humanas
Curso de Licenciatura em Administração Pública

Probabilidades (Noções)

Trabalho de Campo da cadeira de Estatística


Aplicada a ser submetido na Coordenação do
Curso de Licenciatura em Administração
Pública no ISCED, 1° ano.

Tutor:

Chimoio, Março de 2022


Índice
1. Introdução...............................................................................................................................1
1.1. Objectivos do Trabalho........................................................................................................2
1.1.1. Objectivo Geral.................................................................................................................2
1.1.2. Objectivos Específicos......................................................................................................2
1.2. Metodologia do Trabalho.....................................................................................................2
2. Distribuições Bidimensionais (correlação e regressão)..........................................................3
2.1. Tipos de correlação ente duas variáveis...............................................................................3
2.2. Representação gráfica de distribuições Bidimensionais......................................................3
2.3. Coeficiente de correlação de Pearson..................................................................................4
2.4. Modelo de regressão linear simples.....................................................................................6
3. Noção intuitiva e frequencista das probabilidades..................................................................9
3.1. Noção intuitiva das probabilidades......................................................................................9
3.2. Noção frequencista de probabilidades...............................................................................10
3.3. Definição clássicas de probabilidade (ou lei de LAPLACE).............................................11
4. Conclusão..............................................................................................................................13
5. Referências bibliográficas.....................................................................................................14
1. Introdução

Etimologicamente a Estatística foi definida como a Ciência das coisas que pertencem ao
Estado. Nos nossos dias, a sua utilização passou a ser mais vasta e imprescindível em todos
ramos da ciência e a nível de empresas, assim como a nível individual, procurando estudar
situações e elaborar planos que permitem a tomada das decisões mais adequadas aos
problemas apresentados. Entretanto, o presente trabalho da cadeira de Estatística Aplicada vai
abordar acerca dos seguintes conteúdos: distribuições bidimensionais (correlação e regressão) e
noção intuitiva e frequencista das probabilidades (lei dos grandes números e axiomas de
probabilidade).

1
1.1. Objectivos do Trabalho

1.1.1. Objectivo Geral


 Adquirir conhecimentos sobre distribuições bidimensionais (correlação e regressão) e
teoria de probabilidades.

1.1.2. Objectivos Específicos


 Identificar os tipos de correlação existentes;
 Desenhar a nuvem de pontos e a recta regressão;
 Calcular o coeficiente de correlação de Pearson;
 Determinar a equação de regressão linear simples;
 Definir o conceito de probabilidades;
 Definir os conceitos de espaço amostral e evento de um espaço amostral;
 Determinar o espaço amostral de um experimento aleatório;
 Calcular a probabilidade de um acontecimento equiprovável;
 Calcular a probabilidade de um acontecimento contrario;

1.2. Metodologia do Trabalho


A metodologia é o conjunto de métodos e técnicas utilizadas para a execução de uma
pesquisa. Entretanto para a execução deste trabalho recorreu-se ao método bibliográfico. No
âmbito deste método, fez-se a leitura de vários manuais que tratam sobre distribuições
bidimensionais e teoria de probabilidades.

2
2. Distribuições Bidimensionais (correlação e regressão)

De acordo com Sande (s/d), distribuições bidimensionais são distribuições estatísticas


envolvendo o estudo da relação entre duas variáveis.
Exemplos de situações em que ocorrem distribuição bidimensional:
1. Os gastos em publicidade e o volume de venda.
2. Altura média de um casal e a altura dos filhos.
3. Altura de um local e a respectiva pressão atmosférica.

Há caracteres entre os quais é impossível descobrir qualquer relação, como por exemplo, o
peso dos alunos e a respectiva nota em filosofia. Diz-se que estes são caracteres
independentes, ou seja, há influência de um carácter neutro.

2.1. Tipos de correlação ente duas variáveis

Correlação positiva – as variáveis evoluem em geral no mesmo sentido.

Exemplo: altura e o peso das pessoas.

Correlação negativa – as variáveis evoluem em sentido contrário quando uma aumenta a


outra tende a diminuir.

Exemplo: intensidade da chuva e a temperatura do ar.

Correlação nula – não há influência de uma variável na outra, as variáveis são independentes.

Exemplo: a idade do pai e a nota de desenho de cada aluno.

2.2. Representação gráfica de distribuições Bidimensionais


De uma distribuição bidimensional de variáveis xi e yi pode-se fazer uma representação
gráfica dos pontos (xi, yi) no Sistema Cartesiano Ortogonal. A essa representação chama-se
nuvem de pontos ou diagrama de dispersão. Se todos os pontos desse diagrama se situar
nas proximidades de uma recta (recta de regressão), a correlação diz-se linear.

Por sua vez a correlação linear pode ser de três tipos, a saber:

 Correlação linear positiva: se xi aumenta, também yi tende a aumentar;

3
 Correlação liner negativa: se xi aumenta, yi tende a diminuir.
 Correlação nula: não há qualquer relação entre as duas variáveis.

2.3. Coeficiente de correlação de Pearson

Intuitivamente pode-se prever a existência de correlação entre duas variáveis. Entretanto, para
quantificar a relação usa - se o coeficiente de correlação linear de Pearson que se representa
por ℘,

Cx ,y
℘= onde :
Sx ∙ S y
n

∑ fi ∙ xi ∙ yi
i=1
C x , y= −x ∙ y é a ( Co-variância ou variância conjunta das variáveis x e y)
N

S x −é o desvio padrão da variável x


S y −é o desvio padrão da variável y

O coeficiente de correlação ℘ é um número do intervalo [-1;1]. Deste modo, em função do valor de ℘


, temos a seguinte classificação:
 ℘>0 :correlação linear positiva
 ℘<0 :correlação linear negativa
 ℘=0: não há qualquer relação entre as duas variáveis

Exemplo 1: Numa turma do 12º ano, as classificações internas e as obtidas no exame


nacional, na disciplina de matemática, tiveram a seguinte distribuição:
Número do aluno Classificação interna Exame Nacional
1 12 11
2 10 9
3 13 14
4 12 12
5 11 10
6 10 11
7 15 16
8 16 15
1.1. Organize a informação da tabela através de um diagrama de dispersão ou nuvem de
pontos.

4
1.2. À medida que a classificação interna aumenta (valores de x), o que acontece à
classificação de exame (valores de y)?
1.3. Determine as médias da classificação interna e da classificação de exame e designe-as,
respectivamente, por ( x , y ). Represente o ponto (centro de gravidade) no referencial.
1.4. Trace duas rectas paralelas aos eixos coordenados e que passem pelo centro de gravidade.
Em que quadrantes se situam os pontos desta distribuição?
1.5. Trace uma recta que passe pelo centro de gravidade e se aproxime o mais possível dos
pontos representados no referencial.

Resolução:

1.1. Organização da informação da tabela através de um diagrama de dispersão.

Resolução:

Diagrama de dispersão
18
16
14
Exame Nacional (y)

12
10
8
6
4
2
0
9 10 11 12 13 14 15 16 17

Classificação interna (x)

12. Resposta: À medida que a classificação interna aumenta (valores de x), a classificação de
exame (valores de y) também aumenta.

1.3. Resolução:

x=
∑ x = 12+10+13+12+11+10+15+ 16 = 99 =12,375
N 8 8

y=
∑ y = 11+9+14+ 12+ 10+ 11+ 16+15 = 98 =12,25
N 8 8

5
1.4. Os pontos desta distribuição se encontram no primeiro e terceiro quadrante.

O diagrama abaixo ilustra a resolução dos exercícios 5.3; 5.4 e 5.5

No referencial abaixo, temos a representação do ponto centro de gravidade, P (12,375; 12,25).


Ainda no mesmo referencial temos o traçado de duas rectas paralelas aos eixos coordenados e
que passam pelo centro de gravidade. Estas duas rectas permitiram concluir que os pontos
desta distribuição se encontram no primeiro e terceiro quadrante.
Por outro lado, neste diagrama, encontra-se o traçado de uma recta que passa pelo centro de
gravidade e que se aproxima o mais possível dos pontos representados no referencial. A recta
assim obtida chama-se recta de regressão.

Centro de gravidade (12,375; 12,25)


18
E xame N acional (y)

16
14
12 recta
10
2
8
6
4
2
0
9 10 11 12 13 14 15 16 17
recta1
Classificação interna (x)

2.4. Modelo de regressão linear simples


Quando o diagrama de dispersão e o coeficiente de correlação sugere a existência de uma
correlação significativa, o passo seguinte é encontrar a equação da recta de regressão que
melhor ajusta os dados observados.
De acordo com Fazenda (2006), a correlação linear entre duas variáveis quantitativas X e Y
pode ser descrita analiticamente pela seguinte recta de regressão:
Y =b 0 +b1 X +ε

Onde:Y= variável dependente/explicada/de resposta

6
X= variável independente/explicativa/predictor

b0 ;b1 = Parâmetros (constantes) com o seguinte significado:

 O intercepto ou ordenada na origem da recta de regressão


b0 indica a variação média
ou esperada da variável explicada quando o efeito da variável explicativa é nulo.

 O declive da recta de regressão b1 indica a variação média ou esperada da variável


explicada por unidade da variável explicativa.
ε = erro de estimação ou resíduos devido à factores explicativos de Y não incluídos em X ou

devido a erros de medição.

Considerem-se os valores ( x i ; y i ) . O valor de Y correspondente ao valor x i dado pela recta

de regressão séra:
^y i=b0 +b1 x i , denominado valor ajustado pela recta de regressão:

y i=b0 + b1 x i +ε i ↔ y i= ^yi + ε i
Para um modelo com um bom ajuste, o valor médio do erro deve tender para zero e com uma

variância constante ( ε→0 ; Var( ε)=k ).

Para um dado valor de X temos dois valores de Y: um valor observado


y i e um valor ajustado

^y i ; ver o gráfico seguinte:

Y ^y i=b0 +b1 x i

yj 

yi
^  

εj  

^y j 
εi

yi  


xj 
xi X

7
A diferença entre o valor observado e o valor ajustado corresponde ao efeito do erro ou
resíduo:
ε i = y i − ^y i= y i −( b 0 +b 1 xi )= y i −b 0−b1 x i i=1,2 ,...,n
Para um modelo com um bom ajuste, a média dos resíduos de deve tender para zero:
n
∑ ei
i =1
ε̄= →0
n .
A recta de regressão terá melhor ajuste dos dados quanto menor forem os resíduos ou erros. O
objectivo de regressão é encontrar os valores dos parâmetros bo,b1 que minimizam os
resíduos.

Para conseguir esse objectivo pode-se utilizar o Método dos Mínimos Quadrados (MMQ).

O MMQ consiste encontrar os valores dos parâmetros que torna mínimo a soma dos

quadrados dos resíduos:


n n n
Min ∑ ε 2 =Min ∑ ( y i− ^yi ) =Min ∑ ( y i−b 0 −b1 x i )2
2

i=1 i i=1 i =1

Derivando a expressão anterior em relação aos parâmetros e igualando a zero temos e

resolvendo o sistema de equações em relação a


b0 e b1 , obtêm-se:
b0 = ȳ −b1 x̄
n
∑ ( x i − x̄ )( y i− ȳ )
b1 = i =1
n
∑ ( x i − x̄ )2
i =1

Exemplo 2: Como resultado do aumento dos centros comerciais suburbanos, muitos armazéns
do centro da cidade estão sofrendo financeiramente. O sector de propaganda de um destes
armazéns acha que o aumento da publicidade poderia ajudar a atrair mais compradores. Para
estudar o efeito das publicidades nas vendas obtiveram-se registos para meses meados do ano
durante os quais o armazém diversificou os gastos na publicidade. Esses registos encontram-se na
tabela:
Despesas publicitárias (milhares de dólares) 9 11 8 12 7
Vendas (milhares de dólares) 30 34 32 37 31

a) Estime o coeficiente de correlação entre as vendas e os gastos publicitários.

8
b) Determine a equação de regressão linear simples para estes dados e interprete o resultado de
cada um dos coeficientes obtidos.

Resolução
a)

i xi yi x i−x y i− y ( x i−x ) ( y i− y ) ( x i−x )


2
( y i− y )
2

1 9 30 -0,4 -2,8 1,12 0,16 7,84


2 11 34 1,6 1,2 1,92 2,56 1,44
3 8 32 -1,4 -0,8 1,12 1,96 0,64
4 12 37 2,6 4,2 10,92 6,76 17,64
5 7 31 -2,4 -1,8 4,32 5,76 3,24
Total 47 164 19,4 17,2 30,8

x=
∑ x i = 47 =9,4 y = ∑ yi = 164 =32,8
n 5 n 5

℘=
∑ ( x i−x ) ( y i− y ) = 19,4 = 19,4 = 19,4 =0,84
√∑ ( x i−x )2 ∙ ∑ ( y i − y )2 √17,2 ∙30,8 √ 529,76 23,0165

Há uma forte correlação linear positiva entre as vendas e os gastos publicitários

b ¿ b 1=
∑ ( xi −x ) ( y i − y ) = 19,4 ≅1,13 b = y −b x =32,8−1,13 ∙ 9,4=22,178
∑ ( x i−x )2
0 1
17,2

Y =b0 +b1 X ⟹ Y =22,178+1,13 X é a equação de regressão linear

 O intercepto ou ordenada na origem da recta de regressão (b 0=22,178) indica a


variação média ou esperada da variável explicada quando o efeito da variável
explicativa é nulo.
 O declive da recta de regressão (b¿ ¿1=1,13)¿ indica a variação média ou esperada da
variável explicada por unidade da variável explicativa. Por outro lado, refira-se que
esta inclinação por ser positiva indica que a correlação é positiva.

3. Noção intuitiva e frequencista das probabilidades

3.1. Noção intuitiva das probabilidades


Os jogos de azar que se praticam há milhares de anos, estão na origem das primeiras obras
escritas sobre probabilidades e que começaram a surgir no século XVIII.

9
O dado é um instrumento dos jogos de azar por excelência, a tal ponto que duas das palavras
mais usadas para lidar com o que é casual são: azar e aleatório.

Uma experiência diz-se aleatória se pode ter vários resultados cujo aparecimento, em cada
prova da experiência, é impossível prever (Vunga, 2019). Deste modo, diz-se que o resultado
depende do “acaso” ou da “sorte” ou do “azar”. Acaso significa ausência de causa conhecida.

Os fenómenos aleatórios são o objecto de estudo da teoria das probabilidades. São aleatórias
todas as experiências que se fazem nos jogos: tirar uma carta no baralho; atirar um dado;
comprar uma rifa; rodar a roleta; jogar no totoloto, etc.

Mas há muitos outras como: abrir um livro e ver o número de página, perguntar a um aluno
qualquer quantos irmãos tem, etc.

As experiências do laboratório que se fazem na escola, cujo resultado já é conhecido e é


sempre o mesmo, não são experiências aleatórias.

Para compreender melhor o conceito de probabilidade, há experiências aleatórias muito


simples que podemos realizar com um grupo de trabalho, porque devem ser repetidas muitas
vezes e em condições análogas; só assim é possível tirar conclusões significativas.

Vamos descrever algumas experiências e atribuir a probabilidade aos vários resultados que
podem dar, introduzindo a terminologia adequada.

Experiência do Lançamento de dado

Lançamento de um dado sobre uma superfície lisa, plana e horizontal.


Qualquer das 6 faces pode ficar voltada para cima. Diz-se que esta experiência tem 6
resultados possíveis ou 6 casos possíveis.
O conjunto E = {1, 2, 3, 4, 5, 6} é de todos os resultados possíveis, é o espaço amostral desta
experiência aleatória.

Qualquer elemento de E, é então um caso possível. 3∈E logo 3 é um caso possível.


A saída de 3 é um acontecimento elementar que se designa por {3}.
A saída de um número par também é um acontecimento mas não é elementar porque sair par
equivale a sair 2, ou sair 4, ou sair 6. Tratando os acontecimentos em termos de conjunto de
resultados termos:

10
Acontecimento sair número par = {2} ¿ {4} ¿ {6}; logo é uma reunião de acontecimentos
elementares.
Acontecimento é qualquer subconjunto de E, incluindo A numa prova, significa que o
resultado dessa prova é um elemento de A.
Nota: Diz-se que A se realizou quando o resultado é elemento A.

A ∪ B verifica-se quando ou se realiza A ou B.


A ∩ B verifica-se quando A e B se realizam simultaneamente.

3.2. Noção frequencista de probabilidades


Suponhamos que o dado é perfeito, ou seja, rigorosamente simétrico, sem faces privilegiadas,
então, é natural esperar que jogando o dado muitas vezes, o resultado de cada face seja
aproximadamente o mesmo, visto que todas tem a mesma possibilidade de ficar para cima.

Se o número de provas for por exemplo 300, veremos que as frequências relativas estarão
1
=16 , 666 .. . %
6
próximas de que é o resultado esperado a priori visto que são 6
acontecimentos com a mesma probabilidade de sair. No entanto, há desvios bastante
sensíveis.

É neste contexto que a Lei dos Grandes Números (Lei de Bernoulli) sobre a definição
frequencista de probabilidade diz que “quando o número de provas aumenta muito,
frequências relativa de um acontecimento tende a estabilizar num determinado valor que se
adopta como probabilidade teórica desse acontecimento”.
Podemos, então, dizer que a probabilidade de um acontecimento associado a certa experiência
é a frequência relativa esperada desse acontecimento quando o número de provas for muito
elevado.
A probabilidade de um acontecimento é um número de 0 a 1 (em percentagem: de 0% a
100%)
0 ≤ P(A )≤ 1

Entretanto, se a probabilidade = 1: o acontecimento diz-se certo nessa experiência.


Exemplo: «sair menos de sete» = {1, 2, 3, 4, 5, 6}, no lançamento de um dado
E se a probabilidade = 0: o acontecimento nunca se dá na experiência, e é designado
acontecimento impossível.
Exemplo: «sair zero» no lançamento de um dado.

11
Teorema da soma
Sejam dois acontecimentos A e B resultantes de uma mesma experiência aleatória. Então
P ( A ∪ B ) =P ( A )+ P ( B ) – P ( A ∩ B ) Se A ∩ B ≠ ∅ acontecimentos compativeis
P ( A ∪ B ) =P ( A )+ P ( B ) Se A∩B = ∅ diz-se que os acontecimentos são incompatíveis

Acontecimentos contrários
A probabilidade do acontecimento contrário a A é dada por P ( A ) = 1 – P (A)

Acontecimentos equiprováveis

Dado um espaço amostral E, dois ou mais acontecimentos são ditos equiprováveis se


apresentam a mesma probabilidade de ocorrência.
Por exemplo no lancamento de um dado se P(1) = P(2) = P(3) = P(4) = P(5) = P(6)=1/6,
dizemos, entao, que os acontecimentos elementares {1}, {2},{3}, {4}, {5}, {6} são
equiprováveis.

3.3. Definição clássicas de probabilidade (ou lei de LAPLACE)


Se uma experiência aleatória tem n resultados possíveis incompatíveis e equiprováveis, a
probabilidade dum acontecimento A é dada por:

nº de casos favoraveis a A ¿ A ¿ A
P ( A )= = =
nº de casos possíveis n ¿E

Exemplo3: Se em uma turma é formada por 8 alunos do sexo feminino e 7 do sexo masculino
e a professora escolher aleatoriamente um estudante para ir ao quadro resolver um exercício,
qual a probabilidade de ser seleccionada uma aluna?

Resolução:
S = \{todos alunos da turma\} → n ( S )=7+ 8=15
F = \{alunos do sexo feminino\} → n (F)=8
M = \{alunos do sexo masculino\} →n ( M )=7

n (F ) 8
P ( F )= =
n(S ) 15

Exemplo4: Três moedas são lançadas ao mesmo tempo. Qual é a probabilidade de as três
moedas caírem com a mesma face para baixo.

Resolução:

12
Seja S: lançamento de três moedas ao mesmo tempo
A: Três moedas caírem com a mesma face para baixo

S= \{(K, K, K); (K, K, C); (K, C, K); (K, C, C); (C, K, K); (C, K, C); (C, C, K); (C, C, C)\} ⇒ n(S ) =8

A= \{(K, K, K); (C, C, C)\} ⇒ n(A ) =2

Onde : K=cara e C=coroa

n(A ) 2 1
P ( A )= = = =0,25=25 %
n(S ) 8 4

13
4. Conclusão
Com base neste trabalho, foi possível desenvolver habilidades suficientes para a resolução de
exercícios relacionados com distribuições bidimensionais e teoria de probabilidades.
Assim, distribuições bidimensionais são distribuições estatísticas envolvendo o estudo da
relação entre duas variáveis.
Por outro lado, refira-se que o conhecimento sobre o conceito de probabilidade de um
acontecimento nos permite resolver várias situações problemáticas do quotidiano. Usamos
este conceito quando lidamos com incertezas. Assim, a probabilidade de um evento A é o
quociente entre o número de casos favoráveis ao evento A pelo número de casos possíveis do
espaço amostral (S).

14
5. Referências bibliográficas
 Fazenda, R. (2006). Manual de Estatística Descritiva, Probabilidade e Inferência
Estatística. Maputo: UEM.
 Reis, E. (1998). Estatística descritiva. 4ªed. Lisboa: Silabo.
 Sande, L. (s/d). Estatística: Manual de Tronco Comum, Beira: UCM-CEAD
 Vunga, H. M. (2019). Estatística Aplicada, Beira: ISCED-CED.

15

Você também pode gostar