Você está na página 1de 159

Estatística

Índice:

Capítulo I – Estatística Descritiva ................................................................................. 5


1. Introdução. Breve nota histórica ........................................................................ 5
1.1. Nota Histórica ............................................................................................. 5
1.2. Objecto da Estatística .................................................................................. 6

2. Estatística Descritiva ......................................................................................... 6


2.1. As Etapas do Método Estatístico ................................................................. 7
2.1.1. Identificação do Problema ....................................................................... 7
2.1.2. Recolha de Dados .................................................................................... 7
2.1.3. Crítica dos dados ..................................................................................... 9
2.1.4. Apresentação dos Dados .......................................................................... 9
2.1.5. Análise e Interpretação dos Resultados .................................................... 9

3. Apresentação dos Dados: Quadros e Gráficos .................................................. 10


3.1. Quadros..................................................................................................... 10
3.2. Gráficos .................................................................................................... 10
3.2.1. Gráfico de Linhas .................................................................................. 11
3.2.2. Gráfico de Barras ................................................................................... 11
3.2.3. Gráfico de Sectores ................................................................................ 12
3.2.4. Gráfico Polar ......................................................................................... 12

4. Distribuição de Frequências ............................................................................. 13


4.1. Alguns Conceitos Fundamentais ................................................................ 13
4.1.1. População ou Universo ......................................................................... 13
4.1.2. Amostra ................................................................................................ 13
4.1.3. Atributos ou características de uma população ...................................... 13
4.1.4. Dados Discretos e Contínuos ................................................................ 14
4.1.5. Variável ................................................................................................. 14

5. Distribuição de Frequências de Variáveis Discretas ......................................... 15

6. Distribuição de Frequências de Variáveis Contínuas ........................................ 17

7. Representação Gráfica das Distribuições de Frequências ................................. 18


1
Estatística
7.1. Variáveis Discretas .................................................................................... 19
7.2. Variáveis Contínuas .................................................................................. 20
7.3. Diagrama “Stem and Leaf” ........................................................................ 21

8. Medidas de Estatística Descritiva: Medidas de Localização ............................. 22


8.1. Medidas de Tendência Central................................................................... 22
8.1.1 Média Aritmética .................................................................................... 22
8.1.2 Média Geométrica .................................................................................. 26
8.1.3 Média Harmónica ................................................................................... 27
8.1.4 Mediana .................................................................................................. 27
8.1.5 Moda ...................................................................................................... 29
8.2. Medidas de Tendência Não Central ........................................................... 30

9. Medidas de Estatística Descritiva: Medidas de Dispersão ................................ 31


9.1. Medidas de Dispersão................................................................................ 31
9.1.1. Intervalo de Variação ......................................................................... 31
9.1.2. Intervalo Interquartis .......................................................................... 31
9.1.3. Intervalo Absoluto Médio ................................................................... 32
9.1.4. Variância e Desvio Padrão.................................................................. 32
9.1.5. Coeficiente de Variação ..................................................................... 33
10. Medidas de Estatística Descritiva: Medidas de Assimetria e Curtose ............. 34
10.1. Medidas de Assimetria ........................................................................... 34
10.2. Medidas de Achatamento ou Curtose ..................................................... 35

Exercícios .................................................................................................................. 37

Capítulo II - Teoria das Probabilidades ....................................................................... 46


1. Análise Combinatória ...................................................................................... 46
1.1. Cardinal do Produto cartesiano e arranjos com repetição ........................... 46
1.2. Arranjos sem repetição e permutações ....................................................... 48
1.3. Combinações ............................................................................................. 51

2. Probabilidades. Conceitos Fundamentais. ........................................................ 53


2.1. Experiência Aleatória ................................................................................ 53
2.2. Espaço de Resultados Possíveis ................................................................. 54
2.3. Acontecimentos ......................................................................................... 55
2.4. Probabilidade................................................................................................ 59
2
Estatística
2.4.1. Conceito clássico ou de Laplace de Probabilidade .................................. 59
2.4.2. Conceito Frequencista de Probabilidade ................................................ 60
2.4.3. Axiomatização da Teoria de Probabilidade ........................................... 61
2.5. Probabilidade Condicionada ......................................................................... 62

Exercícios I ................................................................................................................. 65
Exercícios II................................................................................................................ 68

Capítulo III – Variáveis Aleatórias .............................................................................. 73


1. Variáveis Aleatórias Unidimensionais ............................................................. 74
1.1. Variáveis Aleatórias Discretas ................................................................... 74
1.2. Varáveis Aleatórias contínuas.................................................................... 77

2. Variáveis Aleatórias Bidimensionais ............................................................... 80


2.1. Variáveis Aleatórias Discretas ................................................................... 80
2.2. Variáveis Aleatórias Contínuas .................................................................. 82

3. Parâmetros de Variáveis Aleatórias ................................................................. 84


3.1. Média Aritmética ...................................................................................... 85
3.1.1. Propriedades da média ou valor esperado ........................................... 86
3.2. Variância e Desvio Padrão ......................................................................... 86
3.2.1. Propriedades da Variância .................................................................. 88

4. Covariância e Coeficiente de Correlação Linear .............................................. 88

Exercícios ................................................................................................................... 92

Capítulo IV – Distribuições Teóricas Discretas ........................................................... 95


1. Distribuição Uniforme ..................................................................................... 95
2. Prova de Bernoulli ........................................................................................... 97
3. Distribuição de Bernoulli ................................................................................. 98
4. Distribuição Binomial ..................................................................................... 99
5. Distribuição Hipergeométrica ........................................................................ 102
6. Distribuição de Poisson ................................................................................. 105

Exercícios ................................................................................................................. 108

3
Estatística
Capítulo V – Distribuições Teóricas Contínuas ......................................................... 110
1. Distribuição Uniforme ................................................................................... 110
2. Distribuição Normal ou de Laplace-Gauss ..................................................... 112
2.1. Características da Distribuição Normal .................................................... 113
2.2. Cálculo das Probabilidades na Distribuição Normal................................. 113
3. Distribuição Exponencial............................................................................... 116

Exercícios ................................................................................................................. 118

Capítulo VI - Aproximação de Leis Teóricas............................................................. 120


1. Aproximação da distribuição hipergeométrica à distribuição binomial ........... 120
2. Aproximação da distribuição binomial à distribuição de Poisson ................... 120
3. Aproximação da distribuição binomial à distribuição normal ......................... 121
4. Aproximação da distribuição de Poisson à distribuição normal ...................... 123
5. Teorema do limite central .............................................................................. 124

Exercícios ................................................................................................................. 126

Capítulo VII – Inferência Estatística.......................................................................... 129


1. Amostra casual ou aleatória ........................................................................... 129

2. Estimação ...................................................................................................... 129


2.1. Estimação Pontual ................................................................................... 129
2.2. Estimação por intervalos ......................................................................... 131

3. Testes de Hipóteses Paramétricos .................................................................. 133


3.1. Ensaio para a média duma população normal com variância conhecida ... 135
3.2. Ensaio para a média  duma população de distribuição desconhecida (para
amostras grandes) .............................................................................................. 137
3.3. Ensaio para a proporção p duma população de Bernoulli ......................... 137
3.4. Ensaio para a diferença de duas médias de populações normais com
variâncias  12 e  22 conhecidas.......................................................................... 138
3.5. Ensaio para a diferença de duas médias de populações de distribuições
desconhecidas (para amostras grandes) ............................................................ 138
Exercícios ................................................................................................................. 139
Tabelas de Distribuição ............................................................................................. 142
Soluções dos Exercícios da Sebenta .......................................................................... 156

4
Estatística
Capítulo I – Estatística Descritiva

1. Introdução. Breve nota histórica

1.1. Nota Histórica

As origens da estatística remontam a cerca de 2 000 anos antes de Cristo. Por volta do

séc. XXII A.C. já os chineses realizavam inventários mais ou menos regulares da população.

Até ao séc. XV, a Estatística tratava quase exclusivamente de assuntos de estado. Tornou-

-se autónoma por volta do séc. XVII com a chamada escola alemã. Foram os alemães que lhe

deram o nome STAATENKUNDE (Achemel, séc. XVIII) que significa “assuntos de estado”.

Mais ou menos na mesma época é a “Escola dos Aritméticos Políticos” (John Graunt. William

Petty e outros) que, em Inglaterra estudou algumas aplicações à Demografia, Saúde

Pública, Comércio, etc. Simultaneamente começaram a aplicar-se à estatística

conhecimentos de matemática.

Uma nova fase de grande desenvolvimento surgiu com a sua aplicação aos jogos de azar

(Cavaleirode Méré, Pascal, Fermat, etc). É nesta fase que também se verifica um grande

desenvolvimento o Cálculo das Probabilidades.

A aplicação aos fenómenos sociais marcou o arranque definitivo do seu desenvolvimento e

importância. Isto em meados do séc. XIX. Foi Chuetelet quem, pela primeira vez definiu

Homem Médio. Simultaneamente chamou a atenção para a notável consistência de alguns

fenómenos sociais. Mostrou, por exemplo, que a criminalidade está, em geral ligada com a

origem social do criminoso. Pearson estudou aplicações à Biometria. Student dedicou-se ao

estudo de pequenas amostras seguidas de generalizações (inferência estatística). Mas

houve muitos mais: Fisher, Edgeworth, Tchebychev, Wald.

5
Estatística
1.2. Objecto da Estatística

Duma forma mais geral pode dizer-se que a estatística é um conjunto de métodos e

técnicas destinadas ao estudo de populações, tendo em vista por um lado a interpretação

da realidade e por outro a previsão com base nessa realidade.

É costume dividir-se a estatística em duas partes:

 Estatística Descritiva – recolha, ordenação, classificação e análise de dados;

 Estatística Indutiva (inferência estatística) – generalizações e previsões para

populações a partir de dados das amostras.

Mais modernamente costuma considerar-se uma outra área da Estatística, a Análise

exploratória de dados, em que se procura identificar características ou aspectos especiais

dos dados com recurso às técnicas da Estatística Descritiva.

2. Estatística Descritiva

A estatística descritiva consiste na recolha, apresentação, análise e interpretação de

dados numéricos através da criação de instrumentos adequados: quadros, gráficos e

indicadores numéricos.

Os métodos para recolher, classificar, sintetizar, apresentar e interpretar informação

quantitativa constituem uma parte importante da teoria estatística.

Convém referir que o termo “estatística” é utilizado para referir dois conceitos

diferentes, conforme se utiliza no singular ou no plural. Quando utilizado no plural, é

sinónimo de factos ou dados numéricos, enquanto que no singular constitui um objecto de

estudo, uma ciência e compreende, como referido anteriormente, um conjunto de princípios

e métodos de recolha, classificação, síntese e apresentação de dados numéricos.

6
Estatística
A utilidade da estatística pode ser resumida do seguinte modo:

 Permite descrever e compreender relações entre variáveis;

 Permite a tomada de melhores e mais rápidas decisões;

 Facilita a tomada de decisões para fazer face à mudança.

O método estatístico de resolução de problemas é constituído pelas seguintes etapas:

Identificação Recolha Crítica Apresentação Análise


do de dos dos e
Problema Dados Dados Dados Interpretação

2.1. As Etapas do Método Estatístico

2.1.1. Identificação do Problema

É necessário, desde o início do estudo, estar claro qual o problema a analisar e, uma vez

conhecido, qual o tipo de decisões que se pretendem tomar. Esta etapa já requer algum

conhecimento estatístico uma vez que os métodos a aplicar, não são de modo algum,

independentes da informação que se pretende recolher. Uma identificação incorrecta do

problema torna todas as etapas seguintes inúteis. Para identificar melhor o problema

poderá ser usada alguma informação quantitativa já existente.

2.1.2. Recolha de Dados

A recolha de toda a informação necessária pode ser feita directamente quando os dados

são obtidos de fonte originária (possível encontrar em ficheiros ou registos)-dados

primários, ou de forma indirecta quando os dados provêm já de uma recolha directa-dados


secundários.

7
Estatística

Exemplo

Dados Primários: todos os dados resultantes da inquéritos feitos directamente a uma


população ou a um grupo dessa população; todos os dados disponíveis nas estatísticas do

INE.

Dados secundários: Uma estimativa da esperança de vida à nascença para a população


portuguesa no ano 2000 com base nos valores observados nos últimos dez anos; a taxa de

inflação para o ano de 1995.

As fontes de dados podem ainda ser classificadas como internas (por exemplo, os serviços

de contabilidade, produção ou de marketing de uma empresas constituem fontes internas

de informação económica e comercial) e externas (provenientes dos organismos públicos,

como o Governo, o Instituto Nacional de Estatística , ou privados como os semanários

económicos e revistas de especialidade).

Relativamente à periodicidade, a recolha de dados pode ser classificada como contínua-

quando realizada permanentemente; periódica-quando efectuada em intervalos de tempo e

ocasional-quando realizada de modo esporádico.

Quando a informação não está toda disponível, é necessário recolher nova informação, o

que poderá ter vantagens e desvantagens. Vantagens porque permite uma definição precisa

da informação, desvantagens porque poderá tornar o estudo e a obtenção de resultados

demasiado morosos e caros.

8
Estatística
2.1.3. Crítica dos dados

Feita a recolha dos dados, procede-se a uma revisão crítica de modo a suprimir valores

estranhos ou eliminar erros capazes de provocar futuros enganos de apresentação e análise

ou até mesmo enviesar as conclusões obtidas.

2.1.4. Apresentação dos Dados

Uma vez recolhidos os dados e feita a revisão crítica, convém organizar os dados de uma

forma prática e racional, para um melhor entendimento do fenómeno que se pretende

estudar. O principal objectivo da Estatística Descritiva é então criar os instrumentos

necessários para classificar e apresentar conjuntos de dados numéricos de tal modo que a

informação neles contida seja apreendida mais fácil e rapidamente.

2.1.5. Análise e Interpretação dos Resultados

A última etapa consiste em interpretar os resultados encontrados. Esta interpretação está

tanto mais facilitada quanto se tiverem escolhido, em etapas anteriores, os instrumentos

mais apropriados à representação e análise do tipo de dados recolhidos.

Conclusões enviesadas podem ser propositadas ou não e ter diferentes causas. O exemplo

de entidades que, para situações idênticas, retiram conclusões bastante divergentes: as

taxas de inflação e desemprego estimadas pelos órgãos governamentais e pelos sindicatos

raramente coincidem. São exemplos de enviesamento propositado para servir fins políticos

em que se torna difícil demonstrar, com rigor, qual delas está errada. No entanto, muitas

vezes o enviesamento não é propositado. Pode começar por ser o resultado da utilização de

dados pouco adequados, pode ser explicado pela utilização de medidas de estatística

descritiva pouco adequadas ao problema em causa, por diferentes escalas de medida ou

ainda por bases de comparação pouco adequadas.

9
Estatística
3. Apresentação dos Dados: Quadros e Gráficos

3.1. Quadros

O sucesso na utilização de dados estatísticos depende, em grande parte, do modo como

estes são apresentados e podem ser utilizados.

Quando nos deparamos com grandes massas de dados não classificados torna-se muito

difícil tirar conclusões. É pois necessário proceder a um trabalho prévio de ordenação e

apresentação adequada desses valores. Essa representação pode ser feita através de

quadros ou gráficos.

Por exemplo, o Quadro 1 apresenta 40 tiragens de 6 bolas cada, de uma urna com bolas de

várias cores, e que, em cada tiragem se anotou o número de bolas azuis. O resultado das

observações foi o seguinte:

3 1 3 5 0 1 2 6 6 6

2 4 0 3 0 4 1 2 2 6

0 5 2 5 1 5 2 4 1 4

1 5 6 2 3 5 0 3 4 1

Quadro 1-Número de bolas azuis em 40 tiragens de 6 bolas

3.2. Gráficos

A representação gráfica dos dados estatísticos tem por finalidade, dar uma ideia, a mais

imediata possível dos resultados obtidos permitindo chegar-se a conclusões rápidas sobre a

evolução do fenómeno em estudo ou sobre a relação entre os diferentes valores

apresentados. Para que tal seja conseguido, quando se constrói um gráfico deverá ter-se

em conta os elementos simplicidade, clareza e veracidade.

10
Estatística
3.2.1. Gráfico de Linhas

É porventura o mais utilizado de entre todos os tipos de gráficos devido à sua facilidade de

execução e de interpretação. Não é tão preciso como um quadro mas tem a vantagem de

clarificar as relações existentes entre as variáveis em análise.

O Gráfico 1 é um

400 exemplo de um gráfico


00
de linhas e mostra-nos
350 as vendas da empresa

300 X durante o período

1991/98 sendo o valor


250
de 1998 uma previsão
200
com base nos valores

do primeiro semestre.

1991 1993 1995 1997


1995 1996 1997 1998
Gráfico 1-Vendas da Empresa X (milhares de contos); 1998 estimativa

3.2.2. Gráfico de Barras

O gráfico de barras constrói-se colocando os valores da variável em observação num dos

eixos (horizontal)

e as respectivas

9.9 frequências no

9.8 outro eixo


9.7 (vertical).
9.6

9.5

Gráfico 2-Estimativas da
1985 1990 1995 2000 2005 2010 2015
população portuguesa
1985-2015 (milhões)

11
Estatística
O Gráfico 2 é um exemplo de um gráfico de barras onde se apresentam as estimativas da

população portuguesa até ao ano 2015 sendo, desde logo, visível que a população total

crescerá até ao ano 2000, data a partir da qual diminuirá de forma constante.

Tal como os gráficos de linhas, também os gráficos de barras nos permitem fazer a

comparação simultânea de duas ou mais variáveis.

3.2.3. Gráfico de Sectores

Consiste na representação gráfica dos resultados num círculo, por meio de sectores. Para o

construir, divide-se o círculo em sectores, cujas as áreas serão proporcionais aos valores

individuais. Como exemplo,

Sector

Primário

Secundário

Terciário
Gráfico 3-Distribuição da população activa
portuguesa pelos três sectores da actividade

3.2.4. Gráfico Polar

Este tipo de gráfico representa os dados estatísticos por meio de um polígono. Para o
construir, divide-se uma circunferência em
Janeiro
20
Dezembro Fevereiro tantos arcos quantos forem os dados a
15

Novembro Março
representar. Por esses pontos de divisão
10

5 traçam-se os raios da circunferência. Em


Outubro 0 Abril
cada raio é representado um valor da série,
marcando-se um ponto cuja distância ao
Setembro Maio

centro é directamente proporcional a esse


Agosto Junho

Julho valor. Em seguida unem-se todos os


pontos.
Gráfico 4-Vendas na Empresa ALFA durante o ano de 1996

12
Estatística
4. Distribuição de Frequências

4.1. Alguns Conceitos Fundamentais

4.1.1. População ou Universo

A distribuição de frequências é a forma mais importante de apresentação dos dados em

Estatística Descritiva. Esta, pretende medir ou contar os dados obtidos na tomada de

observações de determinada fonte. Por exemplo, para conhecer a opinião pública sobre

determinada medida governamental, uma pequena percentagem da população é seleccionada

e inquirida a respeito da medida. Neste caso, a fonte de informação é a população a quem

se destina a medida governamental.

A fonte de observação constitui a população ou universo, um conjunto de indivíduos que

apresentam uma ou mais características em comum. A população pode ser finita ou infinita,

dependendo do número de elementos que a compõe ser finito ou infinito.

Ao número de elementos da população chamamos efectivo. É usual chamar indivíduos aos

elementos da população.

4.1.2. Amostra

Na maioria das vezes, é impossível conhecer as características de todos os elementos da

população e torna-se necessário retirar uma amostra ou subconjunto (que se supõe ser

representativo) dessa população, para a qual serão estudadas as características (a amostra

só é representativa se for muito elevada a probabilidade de nela se verificarem as

características da população).

4.1.3. Atributos ou características de uma população

Ao estudar uma população ou uma amostra dessa população o que se pretende é conhecer as

suas características ou atributos para que, posteriormente, seja possível tomar decisões

13
Estatística
com base nesse conhecimento: fazer comparações com outras populações, fazer previsões

para o futuro, etc. As características ou atributos dos elementos podem ser qualitativos ou

quantitativos. Qualitativa, se as suas diferentes modalidades não são mensuráveis, isto é,


não podem ser expressos através de números. Caso contrário, trata-se de um atributo

quantitativo, ou seja, esse atributo varia de intensidade de elemento para elemento da

população e essa intensidade pode ser expressa através de unidades físicas.

4.1.4. Dados Discretos e Contínuos

Os dados quantitativos referentes a determinada característica podem também ser

classificados como discretos ou contínuos. São discretos aqueles que tomam um número

finito ou infinito numerável de valores. Dados contínuos podem tomar um número infinito

não numerável de valores.

4.1.5. Variável

Variável é um símbolo que representa determinada característica de uma população ou


amostra de uma população. Tal como uma característica, uma variável pode ser qualitativa

ou quantitativa, discreta ou contínua.

Na prática, a distinção entre variáveis discretas e contínuas é por vezes artificial. A

precisão de uma medida é sempre limitada e os resultados são apresentados muitas vezes

sob a forma discreta. Inversamente, desde que uma variável estatística possa tomar um

grande número de valores, os valores vizinhos aparecem, relativamente, muito próximos, e a

variável é considerada e tratada como sendo uma variável contínua.

Assim, a distinção entre variáveis estatísticas assenta essencialmente nos valores serem

ou não apresentados agrupados em classes.

14
Estatística
Exemplo

Variáveis discretas: número de crianças a cargo de uma família, número de acidentes de


trabalho num determinado estabelecimento, número de vendas de um determinado

aparelho, etc.

Variáveis contínuas: a altura, o peso e a idade de um indivíduo, a distância entre dois


pontos, o débito duma canalização, etc.

5. Distribuição de Frequências de Variáveis Discretas

Considere-se uma população (N) ou amostra (n) de indivíduos com a característica que

apresenta p modalidades observadas x1 , x 2 ,  , x p . Dá-se o nome de distribuição de

frequências ao conjunto de todos os valores ou modalidades de uma variável e das

frequências ou número de ocorrências correspondentes.

O quadro da distribuição de frequências é construído da seguinte forma:

Numa coluna colocam-se todos os valores que a variável apresenta e na segunda coluna o

número de ocorrências correspondente a cada valor da variável.

Frequências
xi
Absolutas

x1 n1

x2 n2

 
xp np

Quando se trata de uma variável discreta, a construção de um quadro de distribuição de

frequências é imediata: a cada valor da variável faz-se corresponder o número de

ocorrências.

15
Estatística
A frequência absoluta ni  é o número de vezes que cada modalidade da variável se repete

na amostra ou população.

A frequência relativa  fi  de um valor da variável é dada por f i 


ni
, isto é, o número de
n

vezes que esse valor ocorre ni  relativamente ao total da amostra (n) ou população (N).

As frequências acumuladas são a soma do número de ocorrências para os valores da variável

inferiores ou iguais ao valor dado. Representam assim, o número ou proporção de elementos

observados que possuem o valor da característica igual ou inferior à modalidade em causa.

Assim, cum ni é a frequência absoluta acumulada, cum f i é a frequência relativa acumulada.


p p
Verifica-se também que  ni  n e  fi  1 .
i 1 i 1

Exemplo

O número de erros cometidos por uma dactilógrafa em 100 páginas nunca foi superior a

quatro e distribui-se da seguinte maneira:

xi ni fi cum ni cum f i
0 10 0,10 10 0,10

1 15 0,15 25 0,25

2 25 0,25 50 0,50

3 40 0,40 90 0,90

4 10 0,10 100 1,00

Total   100 1,00

As frequências absolutas mostram-nos, por exemplo, que apenas 10 páginas não tinham

qualquer erro e que em 40 páginas foram encontrados três erros. As frequências relativas

permitem-nos concluir que 25% das páginas tinham dois erros enquanto que as frequências

16
Estatística
acumuladas nos dão a informação de que 50 páginas, correspondendo a 50% do total das

páginas dactilografadas, tinham no máximo dois erros.

6. Distribuição de Frequências de Variáveis Contínuas

As variáveis contínuas, por poderem tomar um número infinito não numerável de valores,

obrigam-nos à definição de classes de valores, que passam a ser as modalidades da

característica em estudo. Para definir estas classes é necessário introduzir alguns novos

conceitos: o número de classes, a amplitude, limite e ponto médio ou centro das classes.

Não há uma fórmula exacta para determinar o número de classes. Não deverá ser um

número muito grande para introduzir irregularidades que poderão não existir na população,

mas também não deverá ser muito pequeno para que não haja perda de informação. É

também de evitar um número muito pequeno ou muito elevado de intervalos.

Existem algumas regras básicas que deverão ser seguidas na construção dos intervalos:

1. O número de classes (k) deverá estar compreendido entre quatro e catorze;

2. Nenhuma das classes deverá ter frequência nula;

3. As classes deverão ter, sempre que possível amplitudes iguais;

4. Os pontos médios das classes deverão ser números de cálculo fácil;

5. Classes abertas deverão ser evitadas embora nem sempre seja possível fazê-lo;

6. Os limites das classes são definidos de modo a que cada valor da variável é incluído num

e só num intervalo;

Tendo em conta estas regras, por vezes é adoptada uma das seguintes soluções:

I) Número de classes k=5 para n < 25 e k  n para n  25

II) Fórmula de Sturges: k  1 3,22 log n

17
Estatística
A amplitude das classes a i  poderá ser calculada, se pretendermos todas as classes com a

R
mesma amplitude, da seguinte maneira: ai  em que R é a diferença entre os valores
k

máximo e mínimo da variável e k o número de classes.

Exemplo

Considere-se a distribuição dos salários (em euros) dos empregados da empresa ALFA.

Número de
Classes de rendimentos
empregados fi cum ni cum f i
mensais (10€) xi
ni
Menos de 40 5 0,083 5 0,083

40-60 23 0,383 28 0,467

60-80 17 0,283 45 0,750

80-100 8 0,133 53 0,883

Mais de 100 7 0,117 60 1,000

Total   60 1,00

Neste exemplo, duas classes extremas têm amplitude indeterminada e as restantes classes

têm amplitude 20. O centro de cada classe é o seu ponto médio, sendo, por exemplo, para a

segunda igual a 50. No que diz respeito aos limites da cada classe, estabelece-se que o

limite superior não lhe pertence o que significa que, por exemplo, a segunda classe integra o

valor 40 mas não integra o 60.

7. Representação Gráfica das Distribuições de Frequências

A leitura dos quadros de frequências, a síntese de informação que eles contêm é por vezes

difícil.

18
Estatística
Uma distribuição estatística pode ser descrita de uma forma bastante mais clara

graficamente. Uma representação gráfica aparece como um meio de síntese e de estudo

extremamente eficaz.

A representação gráfica utilizada vai depender do tipo de variável (discreta ou contínua) e

de se tratar de uma frequência simples ou acumulada.

7.1. Variáveis Discretas

Para representar a distribuição de frequências relativas de uma variável discreta utiliza-se

o gráfico de barras ou diagrama diferencial.

fi Diagrama
Diferencial

No exemplo dado do número 0.4


de erros cometidos por página 0.3
dactilografada, a
0.2
representação gráfica seria a
0.1
representada ao lado.

0 1 2 3 4 xi

Diagrama
Integral
Como as variáveis discretas
Cum fi
assumem valores separados
1.0 uns dos outros, a

0.75 representação gráfica das

frequências acumuladas vai


0.50
ter o aspecto de uma série
0.25 de degraus: é o chamado

diagrama integral.
0 1 2 3 4 xi
19
Estatística
7.2. Variáveis Contínuas

A representação gráfica adequada para as frequências simples deste tipo de variáveis é o

histograma: diagrama de áreas em que a área de cada rectângulo é proporcional à


frequência observada. No eixo horizontal colocam-se as classes e no eixo vertical as

frequências absolutas ou relativas. Quando a amplitude das classes extremas não está

definida, convenciona-se que estas classes têm a amplitude das classes adjacentes.

Para o exemplo anteriormente apresentado, da distribuição dos salários dos trabalhadores

da empresa ALFA, pressupondo que a primeira e a última classes têm amplitude igual às

classes adjacentes, ou seja 20, o histograma será o apresentado no gráfico seguinte:

fi

0.4
Polígono de frequências

0.3

0.2

0.1

0 Rendimentos
20 40 60 80 100 120 140 Mensais

A partir do histograma é usual construir-se o polígono de frequências, uma forma visual

alternativa ao histograma, que se obtém unindo os pontos médios dos topos de rectângulos

com segmentos de recta. Para fechar o polígono é necessário criar uma classe adicional em

cada um dos extremos do histograma, com amplitude idêntica à das classes adjacentes e

com frequência nula.

Uma outra maneira útil de apresentação gráfica é a que utiliza as frequências acumuladas.

Para estas, pode traçar-se um polígono de frequências acumuladas pressupondo que a

distribuição dos elementos dentro da classe se faz de uma forma uniforme o que origina, no

intervalo de valores de uma mesma classe, uma representação de tipo linear.

20
Estatística

Cum fi

1.0

0.8
0.750
0.6

0.4

0.2

0 Rendimentos
20 40 60 80 100 120 140
Mensais

Deste polígono de frequências acumuladas retiramos, por exemplo, que 75% dos

empregados da empresa recebem salários inferiores a 80 contos.

7.3. Diagrama “Stem and Leaf”

Este diagrama utiliza algumas características do histograma mas sem se perder a

informação contida nos dados individuais. O diagrama dá-nos as idades de 72 dos

compradores de habitações em Telheiras. Podemos observar a partir dos dados que as

idades variam entre 20 e 84 anos. Formam-se classes com amplitude, por exemplo, de 10

anos, cujos valores extremos (20, 30, 40, …) se colocam na vertical de um diagrama de stem

and leaf. Na horizontal e opostos a cada extremo da classe, escrevem-se os dígitos


referentes às unidades das idades de cada comprador.

20 11599

30 0011245578

40 000112344556678899

50 012222334445556677888

60 0044589

70 1355

80 4

21
Estatística
Se rodássemos o diagrama para a esquerda ele assemelhar-se-ia a um histograma sem que,

no entanto, se perdesse a informação original. Por exemplo, neste caso é ainda possível

saber quais as idades exactas dos dezanove compradores que têm entre 40 e 50 anos.

8. Medidas de Estatística Descritiva: Medidas de Localização

Do exame visual da representação gráfica duma distribuição estatística, destacam-se:

 A ordem de grandeza da variável estatística, caracterizada pelos valores da variável

situados no centro da distribuição: tendência central da variável;

 A maior ou menor flutuação à volta da tendência central: dispersão da variável.

Yule definiu alguns critérios que as medidas de estatística descritiva deverão satisfazer:

1. Objectividade;

2. Dependência de todas as observações;

3. Significado bem preciso para a sua interpretação;

4. Facilidade de cálculo;

5. Pouca variabilidade às flutuações de amostragem;

6. Facilidade de manejo no cálculo algébrico.

Neste ponto o estudo recai sobre as medidas de localização, medidas estas que localizam os

valores observados da variável no eixo dos números reais. As mais importantes são as

medidas de tendência central pois representam os fenómenos pelos seus valores médios,

em torno dos quais tendem a concentrar-se os valores observados.

8.1. Medidas de Tendência Central

8.1.1 Média Aritmética

A média aritmética é a soma de todos os valores observados dividida pelo número de

observações.

22
Estatística

x  x2    x N
 xi
 1  i 1
Média da População
N N

(dados desagregados)

x1  x 2    x n
 xi
x  i 1
Média de uma amostra da população
n n

(dados desagregados)

onde:

x i valores individuais observados;

N tamanho da população;

n tamanho da amostra.

Exemplo 1

Considere-se o preço de algumas t-shirts numa determinada loja.

Modelo Preço (€)

1. Simples 3

2. Madonna 8,5

3. Julio Iglesias 3,75

4. Springsteen 4,6

5. David Bowie 6

6. Maradona 5,5

Quadro 2-Preço das T-shirts

Utilizando a fórmula da média aritmética, o preço médio dos vários modelos de T-shirts

vendidas nesta loja é

23
Estatística
3  8,5  3,75  4,6  6  5,5
  5,23 €.
6

É de salientar que este não será o preço médio das t-shirts vendidas na loja se as

quantidades vendidas de cada modelo forem diferentes. Neste caso, é necessário ponderar

os preços pelas respectivas quantidades vendidas, ou seja, o número de ocorrências

(quantidade vendida) de cada valor da variável (preço de cada modelo de t-shirt).

Preço do modelo Quantidade vendida Preço x Quantidade


Modelo
xi ni xi  ni
1. Simples 3 15 45

2. Madonna 8,5 5 42,5

3. Julio Iglesias 3,75 10 37,5

4. Springsteen 4,6 8 36,8

5. David Bowie 6 6 36

6. Maradona 5,5 6 33

  50   230,8

Agora, a fórmula a utilizar será:


 xi ni   xi f i Média da população (dados agregados)
N

ni
sendo f i  a frequência relativa de cada valor da variável.
N

Podemos também definir o conceito de média aritmética para uma amostra de indivíduos

cujos os dados nos são apresentados de modo agregado:

x
x i ni
 x fi i Média de uma mostra (dados agregados)
n

24
Estatística
No caso de variáveis contínuas, para efectuar o cálculo da média aritmética, é necessário

considerar as várias classes ou intervalos em que a variável se encontra dividida.

Exemplo 2

Calcule-se o preço médio das vendas de 112 vendidas em Telheiras.

Centro da classe Frequências


Preço ( 100 €) c i  ni
ci ni
De 13 600 a 14 800 14 200 7 99 400

De 14 800 a 16 000 15 400 15 231 000

De 16 000 a 17 200 16 600 24 398 400

De 17 200 a 18 400 17 800 27 480 600

De 18 400 a 19 600 19 000 17 323 000

De 19 600 a 20 800 20 200 10 202 000

De 20 800 a 22 000 21 400 8 171 200

De 22 000 a 23 200 22 600 4 90 400

  112   1 996 000

A média calcula-se substituindo os valores da variável pelo centro da classe.

 ci ni

N
  ci fi Média da população (dados agregados em classes)

Então, o preço médio das habitações vendidas é

1 996 000
  17 821,4 ( 100 €).
112

Nota

Para os atributos qualitativos (variáveis nominais) não faz sentido calcular a média pois os

valores da variável não são numéricos e se o forem funcionam como meros índices.

25
Estatística
Propriedades da média aritmética

1. A média dos desvios dos valores da variável em relação à média é nula:

 f i  xi     0

2. A média do quadrado dos desvios dos valores da variável em relação à média é

mínima:

 f i xi   2 é mínimo

Vantagens da média aritmética

 Facilidade de interpretação e cálculo;

 Utiliza toda a informação disponível e pode ser calculada com precisão matemática.

Desvantagens da média aritmética

 É influenciada por valores extremos que tomam um peso significativo no cálculo da

média;

 Pode não corresponder a um valor concreto da variável.

8.1.2 Média Geométrica

Quando estamos perante fenómenos cujas as variáveis são proporcionais a um valor inicial é

mais aconselhável utilizar a média geométrica Mg  que se define da seguinte maneira:

N
Mg  N
 xi Média Geométrica (dados desagregados)
i 1

26
Estatística
N
Mg  N  xi Média Geométrica (dados agregados)
ni

i 1

8.1.3 Média Harmónica

Em situações onde a proporcionalidade esteja presente é aconselhável o cálculo da média

harmónica. Por exemplo, quando estudamos fenómenos como a velocidade média, o custo

médio de bens comprados com uma quantia fixa.

Desta forma, a média harmónica é dada por

1
Mh  N
.

1
fi
i 1 xi

8.1.4 Mediana

A mediana é o valor central médio depois de ordenar os dados por ordem crescente ou

decrescente de tamanho ou importância. Ou seja, é definida como o valor da variável que

ocupa a posição central na sucessão de observações ou na distribuição de frequências, isto

é, o número de observações para valores que lhe são inferiores deverá ser igual ao número

de observações para valores que lhe são superiores, depois de se colocarem os dados quer

por ordem crescente, quer decrescente de valores.

Cálculo da mediana no caso de uma variável discreta

N 1
 Se N for ímpar, a mediana será o elemento central de ordem ;
2
N
 Se N for par, a mediana será a média entre os elementos centrais de ordem e
2
N 2
.
2

27
Estatística
Cálculo da mediana no caso de uma variável contínua

No caso de uma variável contínua agrupada em classes, o cálculo da mediana pode ser assim

sumariado:

N
 Calcula-se a ordem . Como a variável é contínua não é necessário diferenciar entre
2

N par e ímpar;

 Pelas frequências acumuladas identifica-se a classe que contém a mediana e que será a

classe mediana;

 Calcula-se o valor exacto da mediana através da seguinte fórmula

N  cum nMe  1
Me  li Me   2 a Me  Mediana
n Me 

(frequências absolutas)

em que,

li Me  é o limite inferior da classe mediana; cum n Me  1 são as frequências

acumuladas anteriores à classe mediana;

n Me  é a frequência absoluta da classe mediana;

a Me  é a amplitude da classe mediana.

Quando trabalhamos com frequências relativas a mediana é dada por

0 ,5  cum f Me  1
Me  li Me   a Me  Mediana
f Me 

(frequências relativas)

28
Estatística
8.1.5 Moda

A moda é o valor mais frequente da distribuição ou ainda o valor que mais observações

apresenta no conjunto dos dados. Tal como a mediana, a moda é também uma medida de

posição e torna-se mais fácil de calcular se os dados estiverem ordenados. No caso de

variáveis discretas, o cálculo da moda não tem qualquer dificuldades, enquanto que para as

variáveis contínuas é necessário definir primeiro a classe modal e depois aplicar a seguinte

fórmula:

n Mo  1
Mo  li Mo   aMo  Moda
n Mo  1  n Mo  1

(frequências absolutas)

f Mo  1
Mo  li Mo   aMo  Moda
f Mo  1  f Mo  1

(frequências relativas)

onde,

li Mo  é o limite inferior da classe modal;

n Mo  1, f Mo  1 são as frequências absoluta e relativa, respectivamente, da

classe anterior à classe modal;

n Mo  1, f Mo  1 são as frequências absoluta e relativa, respectivamente, da

classe a seguir à classe modal;

a Mo  é a amplitude da classe modal.

A moda pode ser determinada graficamente após a construção do histograma da

distribuição e da identificação da classe modal. Após isto, faz-se a seguinte construção:

29
Estatística

ni

5 10 15 20 25 30 xi

Moda

Como vantagens a moda é fácil de calcular e interpretar e não é afectada por valores

extremos, no entanto, não pode ser definida com rigor e o seu valor exacto é muitas vezes

incerto.

Uma distribuição de frequências poderá ter mais do que uma moda e, nesse caso, diz-se

bimodal, trimodal, etc.

8.2. Medidas de Tendência Não Central

Existem outras medidas que nos dão a localização dos valores da variável, que em termos

gerais são chamadas quantis e podem ser:

- quartis;

- decis;

- percentis.

Os quartis são os valores da variável que dividem a distribuição em quatro partes iguais.

Os decis são os valores da variável que dividem a distribuição em dez partes iguais e os

percentis em 100 partes iguais.

30
Estatística
9. Medidas de Estatística Descritiva: Medidas de Dispersão

9.1. Medidas de Dispersão

As medidas de localização não são por si só, suficientes para caracterizar de forma

adequada a distribuição de frequências de uma variável e, por esta razão devem ser sempre

acompanhadas de uma medida que dê uma indicação da dispersão dos valores da variável. As

medidas de dispersão servem para verificarmos a representatividade das medidas de

localização, pois é comum encontrarmos variáveis que, apesar de terem a mesma média, são

compostas de valores bem distintos.

9.1.1. Intervalo de Variação

O intervalo de variação R  é a medida de dispersão mais simples. É a diferença entre os

valores máximo e mínimo da variável

R  xmax  xmin

A desvantagem que esta medida apresenta é o facto de ter apenas em conta os dois valores

extremos que a variável toma e, portanto, não ser sensível aos valores intermédios.

9.1.2. Intervalo Interquartis

É definido como sendo a diferença entre o terceiro e o primeiro quartis e corresponde a

um intervalo que engloba 50% das observações centrais.

IQ  Q3  Q1

Tem como desvantagem o facto de não ser influenciado por metade dos valores observados

e que são valores extremos.

31
Estatística

9.1.3. Intervalo Absoluto Médio

Quando os dados estão desagregados o desvio absoluto médio DM  é igual à soma das

diferenças, em valor absoluto, entre os valores observados da variável e a sua média,

divididas pelo número total de observações:

DM 
 xi  
N

Para dados já agregados, o desvio absoluto médio é a média aritmética dos desvios

absolutos dos valores da variável relativamente à sua média:

DM   f i xi  

Quanto maior for a concentração dos dados ao redor da média, menor é o desvio médio. O

principal inconveniente desta medida é a utilização de módulos no seu cálculo. Dado que a

sua utilização e tratamento não são fáceis, utiliza-se pouco.

9.1.4. Variância e Desvio Padrão

Para dados desagregados, a variância é a soma do quadrado das diferenças entre os valores

da variável e a média, dividida pelo número total de observações:

N
 x i   2
i 1
2 
N

Para dados agregados, a variância é a média aritmética do quadrado dos desvios dos valores

da variável relativamente à sua média:

32
Estatística
N
 n i  x i   2
2  i 1
  f i x i   
2
N

A grande vantagem da variância relativamente ao desvio médio é a facilidade de cálculo

algébrico. O principal inconveniente é que vem expressa em quadrados. Se por exemplo, os

dados forem expressos em metros a variância é expressa em metros quadrados.

Por essa razão, é mais utilizado como medida de dispersão, o desvio padrão   que se

define como sendo a raiz quadrada positiva da variância:

  2

Esta é a medida de dispersão mais utilizada e mais importante.

9.1.5. Coeficiente de Variação

O coeficiente de variação Cv é uma medida relativa da dispersão, útil para a compreensão

em termos relativos do grau de concentração em torno das médias, de distribuição de

frequências distintas. É dado pela relação, em termos percentuais, entre o desvio padrão e

a média de distribuição.

 
Cv    . 100


Em termos práticos, é usual considerar-se que um coeficiente da variação superior a 50%

indica alto grau de dispersão relativa e, consequentemente, uma pequena

representatividade da média como medida estatística. Para valores do coeficiente de

variação inferiores a 50%, a média será tento mais representativa quanto menor o valor

desse coeficiente.

33
Estatística
10. Medidas de Estatística Descritiva: Medidas de Assimetria e Curtose

10.1. Medidas de Assimetria

O método mais simples para se medir o grau de assimetria de uma distribuição consiste na

comparação de três medidas de tendência central: a média, a mediana e a moda.

Numa distribuição simétrica verifica-se que a média, a mediana e a moda são iguais. Quando

a média  mediana  moda a distribuição é assimétrica positiva ou enviesada à esquerda.

No caso inverso, média  mediana  moda, a distribuição é assimétrica negativa ou

enviesada à direita.

Fig.1 x  Me  Mo Fig.2 Mo  Me  x Fig.3 Mo  Me  x

O grau de assimetria pode ser medido da seguinte maneira:

3 média  mediana 
G , a divisão pelo desvio padrão permite-nos obter um resultado que
desvio padrão

não é influenciado pela dispersão dos dados, mas apenas pelo grau de assimetria.

3   Me 
G Grau de Assimetria (para uma população)

3 x  Me 
G Grau de Assimetria (para uma amostra)
S

34
Estatística
Existem ainda outros indicadores quantitativos que nos permitem estimar, com maior

precisão, o grau de assimetria de uma distribuição. Um deles é o coeficiente de Pearson que

mede o grau de assimetria através da comparação da média e da moda:

  Mo
G1 

Se G1  0 a distribuição é simétrica,

Se G1  0 a distribuição é assimétrica positiva, e

Se G1  0 a distribuição é assimétrica negativa.

Pearson definiu um segundo coeficiente que nos permite calcular o grau de assimetria de

uma distribuição quando não dispomos da média e do desvio padrão, utilizando apenas os

quartis da distribuição.

Q3  Q1  2Me
G2  .
Q3  Q1

10.2. Medidas de Achatamento ou Curtose

Entende-se por curtose o grau de achatamento de uma distribuição. As medidas de

achatamento dão-nos, assim, uma indicação da intensidade das frequências na vizinhança

dos valores centrais. Como referência ao grau de achatamento podemos ter:

Fig.4 Distribuição Leptocúrtica Fig.5 Distribuição Platicúrtica Fig.6 Distribuição Mesocúrtica

Para medir o grau de achatamento pode ser utilizada a seguinte medida:


35
Estatística

Q3  Q1
K
2 P90  P10 

sendo

Q1 e Q3 , respectivamente, o primeiro e terceiro quartis;

P90 e P10 , o 90º e 10º percentis, respectivamente:

Se K  0,263 a distribuição de frequências é mesocúrtica;

Se K  0,263 a distribuição diz-se platicúrtica;

Se K  0,263 a distribuição diz-se leptocúrtica.

36
Estatística
Exercícios I

1. Uma urna contém bolas de várias cores. Suponha que fizeram 40 tiragens de 6 bolas

cada e que, em cada tiragem se anotou o n.º de bolas azuis. O resultado das

observações foi o seguinte

3 1 3 5 0 1 2 6 6 6

2 4 0 3 0 4 1 2 2 6

0 5 2 5 1 5 2 4 1 4

1 5 6 2 3 5 0 3 4 1

a) Defina a variável estatística em estudo.

b) Obtenha:

b1) a função de frequências relativas da amostra e o respectivo diagrama diferencial.

b2) a função de frequências relativas acumuladas e o respectivo diagrama integral.

c) Indique a percentagem de tirar:

c1) no máximo uma bola azul.

c2) quanto muito, 2 bolas azuis.

2. Complete o seguinte quadro estatístico:

xi ni fi cum fi
cum ni
0 8

1 0,15

2 20

3 0,9

4 4

3. Foi feito um inquérito a um grupo de compradores de 40 carros novos para determinar

quantas reparações ou substituições de peças foram feitas durante o primeiro ano de

utilização dos carros. Obtiveram-se os seguintes resultados:

37
Estatística
1 4 1 2 2 3 3 2

1 2 3 2 3 1 0 1

2 7 4 3 5 1 2 4

2 1 3 1 0 1 2 1

1 3 1 0 4 2 3 5

a) Construa um quadro de distribuição de frequências absolutas.

b) Calcule as frequências relativas.

c) Construa um diagrama integral e outro diferencial.

4. Considere a seguinte distribuição de frequências:

xi ni
2 30

3 30

4 20

5 18

>5 2

Total 100

a) Construa um quadro de distribuição de frequências acumuladas absolutas e relativas.

b) Elabore um diagrama diferencial e um diagrama integral.

5. Numa sondagem a 40 pessoas, sobre quantos anos achavam que eram necessários para

que a população mundial duplicasse, se aumentasse na mesma proporção registaram-se

os seguintes dados:

5 50 30 15 40 75 100 65 10 10

20 20 65 30 25 5 15 20 50 45

100 70 80 25 20 40 35 10 80 70

90 20 30 35 30 50 40 100 80 100

Desenhe um histograma agrupando os dados nas classes: 1 a 20, 21 a 40, 41 a 60, etc.

6. Numa fábrica fez-se um teste a 150 lâmpadas e registou-se a seguinte informação:

38
Estatística

Nª de lâmpadas 5 10 42 75 18

Duração da vida (horas) [ 0, 300 [ [ 300, 600 [ [ 600, 900 [ [ 900, 1200 [ [ 1200, 1500[

a) Utilize um histograma e um polígono de frequências para representar esta informação.

b) Construa uma tabela de frequências acumuladas.

c) Qual a percentagem de lâmpadas com duração de vida inferior a 900 horas?

7. O tempo gasto, em segundos, em 100 chamadas telefónicas está indicado na tabela

seguinte:
Tempo (segundos) Nº de chamadas

[0, 20[ 1

[20, 40[ 2

[40, 60[ 3

[60, 80[ 6

[80, 100[ 11

[100, 120[ 27

[120, 140[ 23

[140, 160[ 17

[160, 180[ 10

a) Desenhe o polígono de frequências correspondente à distribuição dada.

b) Construa a tabela de frequências relativas e frequências absolutas acumuladas.

c) Qual o número de chamadas de duração inferior a 1 minuto?

d) Qual a percentagem de chamadas de duração superior ou igual a 100s?

8. Calcule a média aritmética, a mediana e a moda para cada um dos seguintes conjuntos

de dados:

a) 20, 22, 20, 18, 25, 23, 27, 24, 24, 28, 20;

b) 20, 22, 20, 18, 25, 23, 27, 24, 24, 200, 20;

c) 5, 4, 5, 7, 2, 1, 8, 4, 9, 5, 4, 1, 1, 4, 5, 1;

d) 113, 105, 108, 107, 110, 105, 113, 109.

e) Que conclusões retira da comparação dos resultados de a) e b)?

39
Estatística
9. Perguntou-se a vinte e nove rapazes de 12 anos qual era a sua semanada. Obtiveram-se

as seguintes respostas:

0 0 0 50 50 50 100 100 100 100

100 100 150 150 200 200 200 200 200 200

200 200 250 250 500 500 750 1000 2000

a) Calcule a média, a moda e a mediana.

b) O João, elemento desse grupo, foi pedir um aumento ao pai, baseado nos cálculos

anteriores. Qual foi, em sua opinião, a medida em que o João baseou a sua

argumentação?

10. Numa Associação Desportiva, a altura média dos seus 200 atletas é de 1,65 m. As

atletas femininas são 110 e têm uma altura média igual a 1,60 m. Determine a altura

média dos homens.

11. A tabela seguinte indica a distância em Km, percorrida em 6 anos, por 100 carros.

Distâncias Frequências acumuladas

(em milhares de Km) absolutas

menos de 110 1

[ 110, 115 [ 2

[ 115, 120 [ 8

[ 120, 125 [ 25

[ 125, 130 [ 47

[ 130, 135 [ 79

[ 135, 140 [ 94

[ 140, 145 [ 97

mais de 145 100

Considere para as classes extremas a mesma amplitude das outras classes.

a) Quantos carros percorreram menos de 130 Km?

40
Estatística
b) Quantos carros percorreram 135 Km ou mais, mas menos de 140 Km?

c) Construa o histograma das frequências absolutas e localize, geometricamente, a moda.

d) Determine a distância média percorrida pelos 100 carros.

12. Um professor de Matemática perguntou aos alunos das suas 4 turmas quanto dinheiro

tinham trazido nesse dia. Registou os dados como se indica na tabela:

Classes Frequências

Acumuladas

[0, 5[ 6

[5, 10[ 38

[10, 15[ 82

[15, 20[ 108

[20, 25[ 118

a) Quantos alunos tem o professor?

b) Quantos alunos trouxeram 10 euros ou menos?

c) Quantos alunos trouxeram mais de 15 mas menos de 20 euros?

d) Desenhe o polígono de frequências acumuladas.

e) Calcule a média e a classe modal.

13. É a seguinte a distribuição de frequências do rendimento mensal per capita das 22 007

famílias de um concelho nortenho:

Rendimento (10€) Nº de famílias

[15, 20[ 635

[20, 25[ 1 470

[25, 30[ 1 410

[30, 35[ 1 670

[35, 40[ 1 670

[40, 45[ 1 530

[45, 50[ 1 490

[50, 55[ 1 280

[55, 60[ 1 170

[60, 65[ 2 110

41
Estatística
[65, 70[ 1 760

[70, 75[ 2 560

[75, 80[ 1 400

[80, 85[ 956

[85, 90[ 616

 90 280

Total 22 007

a) Qual o rendimento médio mensal das famílias deste concelho?

b) Qual a mediana e a moda do rendimento familiar?

c) Que conclusões retiraria quanto ao grau de assimetria da distribuição do rendimento, a

partir das medidas anteriormente calculadas?

d) Quais os valores do primeiro e terceiro quartis da distribuição do rendimento?

e) E qual o valor do nono decil?

14. Para a análise da estrutura salarial da indústria têxtil em Portugal, inquiriram-se 500

indivíduos sobre a remuneração mensal que auferem, tendo-se obtido informação, que

depois de classificada, deu origem ao seguinte quadro:

Classes Salariais (10€) Número de Trabalhadores

15 – 20 80

20 – 25 150

25 – 30 230

30 – 35 30

35 - 40 10

a) Construa um histograma e um polígono de frequências.

b) Calcule as medidas de tendência central.

c) Calcule o desvio padrão e a variância.

15. Foi feita uma experiência para medir o tempo gasto na execução da determinada tarefa

num circuito de construção, por operários de ambos os sexos. Os resultados foram os

seguintes:

42
Estatística

Tempo (minutos) Número de Operários Número de Operárias

menos de 10 1 2

10 – 15 2 1

15 – 20 3 5

20 – 25 19 16

25 – 30 60 30

30 – 35 40 10

35 ou mais 5 2

Pressuponha que os limites de tempo mínimo e máximo são, respectivamente 8 e 120

minutos.

Calcule as seguintes medidas estatísticas

 Média aritmética

 Mediana

 Desvio-padrão

 Coeficiente de Variação

 Coeficiente de Assimetria

para os seguintes grupos:

 Grupo de Operários

 Grupo de Operárias

 Grupo de todos os trabalhadores

16. Construa uma curva de Lorenz para o seguinte conjunto de dados referentes à

distribuição da população de um distrito segundo o seu grau de riqueza:


Grupo Populacional Percentagem da População Percentagem de Riqueza

1 Muito Pobre 20 1

2 25 7

3 20 8

4 20 14

5 10 40

6 Muito Rico 5 30

43
Estatística
17. Os resultados obtidos num inquérito aos trabalhadores da construção civil, com o

objectivo de conhecer a concentração salarial neste sector industrial, foram os

seguintes:

Classes Salariais (contos) Nº de trabalhadores Salários pagos (103 contos)

< 40 22 453 750

40 – 50 24 005 1 161

50 – 60 39 477 2 142

60 – 80 24 093 1 571

80 – 100 10 443 933

100 – 150 2 125 264

150 - 200 1 012 191

 200 514 59

a) Construa a respectiva curva de Lorenz.

b) Comente os resultados obtidos.

18. Considere o seguinte quadro relativo à distribuição do número de explorações agrícolas

por classes de produto agrícola bruto (PAB), para os distritos de Viana do Castelo e

Setúbal:

Classes de PAB Número de explorações agrícolas Produto agrícola bruto (PAB) (contos)

(contos) Viana do Castelo Setúbal Viana do Castelo Setúbal

0 – 10 16 978 6 289 124 940 29 576

10 – 20 10 573 4 435 135 804 61 839

20 – 40 11 682 3 101 317 782 88 729

40 – 80 3 716 1 724 196 463 97 466

80 – 160 724 858 68 898 97 466

160 – 360 160 494 37 120 106 204

360 – 600 26 147 10 683 63 454

+ 600 11 277 13 671 799 625

Total 43 870 17 325 905 325 1 344 359

Estude o grau de concentração do produto agrícola bruto através da curva de Lorenz e

compare os resultados dos dois distritos.

44
Estatística
19. O gerente de um supermercado decidiu registar as chegadas de clientes ocorridas

numa terça-feira entre as 14 h. e as 16 h.

Para tal procedeu ao registo das chegadas em cada 100 períodos de um minuto,

seleccionados aleatoriamente, obtendo o quadro seguinte:

xi ni

0 1

1 8

2 19

3 23

4 17

5 15

6 8

7 3

8 3

9 2

10 1

Total 100

Calcule as medidas de tendência central e analise a distribuição quanto à simetria.

20. O departamento comercial de uma Empresa Importadora de vinhos que tem duas

lojas, A e B, abertas ao público, resolveu estudar o número de unidades vendidas

diariamente, durante seis semanas consecutivas. Os resultados obtidos foram os

seguintes:
Nº de unidades vendidas Loja A Loja B

0 – 10 10 6

10 – 20 15 18

20 – 30 3 4

30 – 50 2 1

50 - 70 0 1

a) Em qual das lojas é mais elevado o nível médio de vendas diárias?

b) Utilizando as medidas de tendência central, compare as vendas das duas lojas quanto à

simetria.

Como interpreta estes resultados em termos das vendas das duas lojas.

45
Estatística

Capítulo II - Teoria das Probabilidades

1. Análise Combinatória

1.1. Cardinal do Produto cartesiano e arranjos com repetição

 Cardinal do Produto Cartesiano

Sendo os conjuntos

A  1,2,3,4 e B  a , b, c

o produto cartesiano de A por B, que se representa por A B , é o conjunto

A  B   x , y  : x  A e y  B.

Observando que cada elemento de A pode combinar-se com cada um dos três elementos de

B, conclui-se que o conjunto A B tem ao todo 12 elementos, ou seja, o seu número cardinal

é 12.

  A  B   A  B=4  3 =12

Analogamente se conclui que

 B  A  B  A=3  4 =12

Em geral, se A=m e B=n, tem-se

  A  B   A  B= m  n.

No caso de termos mais do que dois conjuntos, isto também é válido,

se  A=m e B=n e  C=p

 (ABC)=A  B  C= mnp

46
Estatística

Exemplo

Participaram numa reunião 40 franceses e 60 ingleses. Dos franceses, 15 falavam francês e

inglês e dos ingleses, 18 falavam inglês e francês. Formaram-se pares constituídos por um

francês e por um inglês.

Supondo que não havia intérpretes,

a) quantos destes pares se podiam entender?

Os 15 franceses que falavam inglês podiam entender-se com qualquer dos 60 ingleses e os

restantes 25 franceses que só falavam francês apenas se podiam entender com os 18

ingleses que falavam francês.

Logo, podiam formar-se 15  60  25 18  1350 pares.

b) quantos destes pares não se podiam entender?

Ao todo podiam formar-se 40  60  2400 pares.

Como destes 2400 pares, 1350 podiam entender-se, vem 2400-1350=1050.

Logo, 1050 não se podiam entender.

 Arranjos com Repetição

No caso de B  A , o produto cartesiano A B vem A  B  A  A  A 2 que se chama o

quadrado cartesiano de A .

Sendo  A=n , tem-se  A 2 =   A A = n  n = n 2 , ou seja,  A 2 = n 2 .

Analogamente,

# A3  n 3

47
Estatística
# A n
4 4


# Ap  np

O número de arranjos com repetição de n elementos p a p, que se representa por n


A' p  n p

, é dado por n p , isto é,

n
A' p  n p .

Sendo A   a1 , a 2 ,  , a n , qualquer arranjo com repetição de n elementos de A p a p é

uma sequência de p elementos de A, em que:

 Pode haver elementos repetidos;

 A ordem dos elementos distingue a sequência de outras sequências.

Exemplo
Quantos resultados diferentes é possível obter com três lançamentos de uma moeda?

Como num lançamento de uma moeda há dois resultados possíveis, sair cara ou sair escudo,

tem-se
2
A' 3  2 3  8 .

Ao todo, têm-se 8 resultados diferentes.

1.2. Arranjos sem repetição e permutações

 Arranjos sem Repetição

Com os elementos do conjunto A   a , b, c , d  , quantas sequências de três elementos

podemos formar sem que os elementos se repitam?

Podemos pensar da seguinte maneira:

 O 1º elemento da sequência pode ser uma das quatro letras;

 O 2º elemento da sequência só pode ser uma das três letras restantes, pois

uma letra já foi escolhida;

48
Estatística
 O 3º elemento da sequência só pode ser uma das duas letras restantes, pois

duas letras já foram escolhidas.

Em esquema, tem-se:

1ª letra 2ª letra 3ª letra


  
____ ____ ____

4 3 2

Ao todo temos 4  3  2  24 sequências. A este número dá-se o nome de arranjos sem

repetição de 4 elementos 3 a 3, e representa-se por 4 A3 .

Em geral, conclui-se que


n
A p  n n  1n  2  n  p  1 com n  p

Considerando que

n!  n  n 1 n  2 n  p 1 n  p!

tem-se

n  n  1 n  2  n  p  1 n  p !


 n  n  1 n  2  n  p  1 n A p
n!

n  p ! n  p !

logo vem,

n!
n
Ap  com n  p
n  p  !

Sendo A   a1 , a 2 ,  , a n , qualquer arranjo sem repetição de n elementos de A p a p é uma

sequência de p elementos de A, em que:

 Não pode haver elementos repetidos;

 A ordem dos elementos distingue a sequência de outras sequências.

49
Estatística
Exemplo
Um saco contém 5 bolas numeradas de 1 a 5. De quantas maneiras podemos extrair:

a) Três bolas com reposição?

Havendo reposição da bola, significa que há sequência com elementos repetidos.

5
A' 3  5 3  125

Portanto, há 125 maneiras diferentes de extrair as três bolas com reposição.

b) Quatro bolas sem reposição?

Não havendo reposição da bola, significa que não há elementos repetidos nas sequências.

5! 5  4  3  2 1 !
5
A4    120
5  4 ! 1!

Portanto, há 120 maneiras diferentes de extrair as quatro bolas sem reposição.

 Permutações

As permutações de n elementos são todas as sequências de elementos diferentes que é

possível formar com os n elementos.

Representando por Pn o número de permutações de n elementos, tem-se

Pn  n An .

n! n! n!
Como, n An     n ! , então,
n  n ! 0 ! 1

Pn  n !

50
Estatística

Sendo A   a1 , a 2 ,  , a n , qualquer permutação de n elementos de A é uma sequência de n

elementos de A, em que:

 Não pode haver elementos repetidos;

 A ordem dos elementos da sequência distingue a sequência de outras sequências.

Exemplo
De quantas maneiras diferentes se podem sentar 5 pessoas:

a) numa fila?

Como em qualquer sequência formada pelas 5 pessoas não há elementos repetidos e

interessa a ordem desses elementos, tem-se:

P5  5 !  5  4  3  2 1  120

Logo, ao todo há 120 maneiras diferentes de as 5 pessoas se sentarem numa fila.

b) à volta de uma mesa?

Como uma das pessoas pode sentar-se em qualquer lugar, as restantes 4 pessoas podem

sentar-se de P4 maneiras diferentes.

P4  4 !  4  3  2 1  24

Logo, ao todo há 24 maneiras diferentes de as 5 pessoas se sentarem à volta de uma mesa.

1.3. Combinações

Com os elementos do conjunto A   a , b, c , d  , quantos subconjuntos de dois elementos é

possível definir?

51
Estatística
Verificamos anteriormente que 4
A2 dá-nos o número de sequências de dois elementos

possíveis que é possível formar num conjunto de quatro elementos. Observando que numa

sequência consideramos a ordem dos seus elementos e num conjunto não, e que com os

mesmos 2 elementos têm-se 2 ! sequências diferentes, vem

4!
4
A2 4  2 ! 4!
  6
2! 2! 2! 2!

Assim, ao todo podemos definir 6 subconjuntos de 2 elementos. A este número chama-se

 4
combinações de quatro elementos dois a dois e representa-se por 4 C 2 ou   .
 2

n 
O número de combinações de n elementos p a p, que se representa por n
C p ou   , é
 p

dada por

n n
Ap n  Ap
n
Cp  ou    , n p
p!  p p!

Sendo A   a1 , a 2 ,  , a n , qualquer combinação de n elementos p a p é um subconjunto de

A, em que:

 Não há elementos repetidos;

 Não interessa a ordem dos elementos.

Exemplo
Numa aula de Matemática estão presentes 18 raparigas e 12 rapazes. Quantos grupos de

alunos se podem formar, considerando que:

a) cada grupo tem 5 alunos?

Como ao todo há 30 alunos, tem-se

52
Estatística
30 !
30
C5   142506
5 ! 25 !

logo, ao todo podem formar-se 142 506 grupos diferentes de 5 alunos.

b) Cada grupo é formado por 3 raparigas e 2 rapazes?

As 3 raparigas podem ser escolhidas de 18


C 3 modos diferentes e os 2 rapazes podem ser

escolhidos de 12
C 2 modos diferentes. Ao todo tem-se

18 ! 12 !
C 3 12 C 2 
18
  53856
3 ! 15 ! 2 ! 10 !

Portanto, podem formar-se 53 856 grupos diferentes constituídos por 3 raparigas e 2

rapazes.

2. Probabilidades. Conceitos Fundamentais.

A teoria das probabilidades é um ramo da Matemática extremamente útil para o estudo e

investigação das regularidades dos chamados fenómenos aleatórios.

2.1. Experiência Aleatória

Definição: Experiência aleatória é qualquer processo sujeito à influência de factores

causais e que conduz a resultados incertos que têm as seguintes características

fundamentais:

a) Ela pode ser repetida um número grande de vezes nas mesmas condições ou pelo menos

em condições análogas;

b) Mesmo mantendo sob controlo as circunstâncias relevantes que envolvem uma

experiência aleatória, os seus resultados individuais não são previstos com exactidão;

53
Estatística
c) Os resultados obtidos ao cabo de uma longa repetição da experiência apresentam

regularidade estatística se tomados em conjunto (enquanto que os resultados das

experiências se apresentam irregulares no sentido de iludir o intento de previsão

exacta).

Obs: A experiência aleatória contrapõe-se à experiência não aleatória ou determinística,

aquela cujo resultado pode ser conhecido antes da sua realização. Por exemplo, o

valor da propagação do som (340 m/s) é conhecido mesmo antes de realizada a

experiência. Já não sucede o mesmo quando lançamos ao ar um dado ou extraímos

uma carta de um baralho.

2.2. Espaço de Resultados Possíveis

Definição: Espaço de resultados possíveis ou espaço amostra (que se designa por  ) é o

conjunto formado por todos os resultados possíveis que são obtidos quando se efectua uma

experiência aleatória.

O espaço de resultados  pode ser:

 Discreto - tem um número finito ou infinito numerável de elementos;

Exemplo: Considere-se a experiência aleatória que consiste no lançamento de um dado e


observação do número inscrito na face voltada para cima.

O espaço de resultados é    1, 2, 3, 4, 5, 6 .

 Contínuo - tem um número infinito não numerável de elementos.

Exemplo: Uma loja abre às 9 horas e encerra às 19. Um cliente, tomado ao acaso, entra
na loja no momento  e sai no momento  . Pretende-se observar os momentos de

entrada e de saída do cliente.

54
Estatística
Como a chegada e a saída de um cliente se processa ao acaso, logicamente que poderá

ocorrer em qualquer momento no tempo, entre as 9 e as 19 horas, pelos que  e  são

variáveis contínuas com    . Portanto o espaço de resultados  é infinito não

numerável, pode-se então escrever  da seguinte forma


   ,   : 9      19  .

2.3. Acontecimentos

Definição: Um acontecimento é um conjunto de resultados possíveis de uma experiência

aleatória. Desse modo, trata-se de um subconjunto do espaço de resultados  , donde

se poder utilizar todos os instrumentos da teoria dos conjuntos para representar os

acontecimentos e as operações que se definem sobre estes. Se o subconjunto for

constituído só por um elemento chamamos acontecimento elementar.

A importância do espaço de amostra  advém especialmente de ser muito útil na definição

de acontecimentos. Em regra geral, há maior interesse nos acontecimentos e nas famílias

de acontecimentos do que propriamente nos elementos do espaço  .

Exemplo

Considere-se o lançamento de um dado:    1,2,3,4,5,6  onde w  1,2,3,4,5,6 .

Temos seis resultados possíveis (acontecimentos):


1, 2, 3, 4, 5, 6

Podemos também considerar, por exemplo:

A  1,3,5 saída de número ímpar;

B  2,4 saída dos dois números pares menores.

Obs:

 Acontecimento é um subconjunto de  .

 Como  é subconjunto de  então  é acontecimento.

  é acontecimento certo (pois qualquer resultado w da experiência: w   ).

55
Estatística
  também é um acontecimento.  é um acontecimento impossível pois não contém

algum elemento de  .

Nota

Com o intuito de facilitar a exposição supõe-se  equivalente a um rectângulo do espaço

IR 2 e os acontecimentos, seus subconjuntos.

Álgebra dos Acontecimentos

Definição: Diz-se que o acontecimento A se realizou, se o resultado da experiência

aleatória,  , é um elemento de A (   A ).

Definição: AB - União ou soma lógica dos acontecimentos A e B, define um novo

acontecimento que se realiza se e só se A ou B se realizam. É traduzido por

AB  :ω  A  ω  B .

Exemplo

Consideremos a experiência aleatória que consiste no lançamento de um dado e observação

do número inscrito na face voltada para cima e os dois acontecimentos a ela associados :

A   2, 4 

B 6 

A B = saída de face par =  2, 4, 6 

Definição: A  B - Intersecção ou produto lógico dos acontecimentos A e B, define um

novo acontecimento que se realiza se e só se A e B se realizam conjuntamente. É traduzido

por

56
Estatística
A B  :   A    B  .

Definição: Os acontecimentos A e B dizem-se incompatíveis ou mutuamente exclusivos

se

AB .

Exemplo

Consideremos a experiência aleatória que consiste no lançamento de um dado e observação

do número inscrito na face voltada para cima e os dois acontecimentos a ela associados :

A : saída de face par; A   2, 4, 6 

B : saída de face impar; B   1, 3, 5 

A e B são mutuamente exclusivos ou incompatíveis, uma vez que não podem ocorrer

simultaneamente: se ocorre A , isto é, sai face par, não pode ocorrer B e vice -versa.

Definição: AB (ou A\ B) - Diferença de dois acontecimentos A e B , define um novo

acontecimento que se realiza se e só se A se realiza sem que se realize B . É traduzido por

AB A\ B  :  A    B.

Exemplo

Seja  a experiência aleatória que consiste em medir o consumo médio per capita de

cerveja em Portugal (em litros) e A e B os seguintes acontecimentos:

A : consumo médio per capita é superior ou igual a 30 litros mas inferior a 50 litros.

B : consumo médio per capita é superior ou igual a 40 litros mas inferior a 75 litros.

A  B : o consumo médio per capita é superior ou igual a 30 mas inferior a 40

A =[30, 50 [

B =[40, 75[
57
Estatística
A  B =[30, 40[.

Definição: B - Complementar do acontecimento B , define um novo acontecimento que se

realiza se e só se B não se realiza. É traduzido por B B  :   B  .

Exemplo

Consideremos a experiência aleatória do exemplo anterior e A o seguinte acontecimento:

A = consumo médio per capita é superior ou igual a 30 litros

A = consumo médio per capita é inferior a 30 litros ou seja

A =[30, +[

A = ]–, 30[

Definição: A  B - Diferença simétrica entre dois acontecimentos A e B , define um novo

acontecimento que se realiza se e só se A se realiza e B não se realiza ou B se realiza e

A não se realiza. É traduzido por

A  B( AB)  ( A B)( AB )  ( A B) .

Exemplo
Consideremos a experiência aleatória em que A e B são os seguintes acontecimentos:

A   1, 2, 3 
B   2, 4 
A  B   1, 3, 4 

Algumas Propriedades das operações com acontecimentos:

a) Comutatividade de  e  :

A B  B  A

58
Estatística
A B  B  A

b) Associatividade de  e  :
A  B  C    A  B  C

A  B  C    A  B  C

c) Distributividade de  e  :
 A  B  C    A  B   A  C 

 A  B  C    A  B   A  C 

d) leis De Morgan:

 AB A B

 AB A B

e) dupla negação:

 AA

2.4. Probabilidade

2.4.1. Conceito clássico ou de Laplace de Probabilidade

Consideremos o caso em que  é finito:    w1 ,, wn 


Se os acontecimentos elementares têm igual probabilidade de ocorrer

Pwi  
1
, i  1,2,, n
n

Definição: Probalidade de um acontecimento A é o quociente entre o número de


resultados favoráveis ao acontecimento A e o número de resultados possíveis, supondo
todos os casos igualmente possíveis.

59
Estatística
Exemplo

Consideremos uma experiência com os resultados elementares equiprováveis: 1, 2, 3, 4, 5, 6.

   1,2,3,4,5,6 
P1,3  ?
número de resultados favoráveis a A 2 1
PA   
número de resultados possíveis 6 3

2.4.2. Conceito Frequencista de Probabilidade

Definição: Seja uma sequência de n provas onde A ocorre k vezes. A frequência relativa
do acontecimento A é

f  A 
k
n

Propriedades

I. f  A  0, A ;

II. f   1 onde  é acontecimento certo;


III. A, B disjuntos  f  A  B  f  A  f B ;

Já nos referimos a que o aspecto fundamental dos fenómenos aleatórios é a regularidade

das frequências relativas quando o número de provas ou repetições aumenta. Se

considerarmos uma experiência aleatória com espaço amostra  e se A for um seu


acontecimento; se efectuarmos n provas com a ocorrência de A k vezes, a experiência
ensina que à medida que o número de provas aumenta a frequência relativa da ocorrência de

A tende a estabilizar-se. Donde se associa intuitivamente a cada acontecimento um


número P A  probabilidade do acontecimento A .

Teorema de Bernoulli

À medida que o número de execuções de um acontecimento vai aumentando, a sua

frequência relativa vai-se estabilizando.

De um modo grosseiro,

60
Estatística

lim f  A  P A .
n

2.4.3. Axiomatização da Teoria de Probabilidade

Espaço de Probabilidade: , P 

 : Espaço Amostra;
P : Probabilidade associada a cada acontecimento.

Definição: Define-se Medida de Probabilidade P , a uma função definida em  que


satisfaz os seguintes axiomas:

I. P A  0, A  F

II. P  1
  
III. A1 , A2 , mutuamente exclusivos  P  Ai    P Ai 
 i 1  i 1

Têm-se os seguintes resultados:

 P   0
Ai  

  n  n
Ai  A j    P
 Ai  
  PAi 
 i 1  i 1

 PB  A  PB  P A  B

 P A  B  p A  PB  P A  B

 
P A  1  P A

 P A  B  p A  PB

 A  B  P A  PB

61
Estatística
2.5. Probabilidade Condicionada

Comecemos pelo seguinte exemplo:

Lançamento de um dado (equilibrado) com faces numeradas     1, 2, 3, 4, 5, 6 

Sejam,

C  "saída de face par"

D  "saída de face múltipla de 3"

E  "saída do número 4"

Então,

PC   P D   P E  
1 2 1 1
,  , .
2 6 3 6

Se a face voltada para cima é par, então o par amostral reduziu-se a   2,4,6 . Assim,

a) A probabilidade de E é PE | C  
1
.
3

b) A probabilidade de D é PD | C  
1
.
3

Conclusão: O facto de C ocorrer altera a probabilidade da ocorrência de E .

O facto de C ocorrer não altera a probabilidade da ocorrência de D .

Definição: Seja o espaço de probabilidade , P  e um acontecimento B   , tal que

PB   0 ,

P A  B 
 A  , P A | B  
PB 

P A | B   Probabilidade de A condicionada pela realização de B . Representa uma

reavaliação da probabilidade de A perante a informação da ocorrência de B .

Teorema

Dado um acontecimento B tal que PB   0 , a função que a cada acontecimento A associa

P A | B  é uma probabilidade.

62
Estatística
(isto equivale a, , P  é um espaço de probabilidade com PB  A  P A | B ).

Teorema das Probabilidades Compostas

Sejam A, B   , tais que P A  0, PB  0 então P A  B  P A.PB | A  PB.P A | B .

Definição: A1 , A2 , diz-se um partição de  se e só se forem satisfeitas :

I. Ai  A j  ,  i  j (acontecimentos incompatíveis)


II.  Ai   (acontecimentos exaustivos)
i 1

Lei de Probabilidade Total

Seja um espaço de probabilidade , P  e uma partição finita ou infinita numerável de

: Ai i 1,2, .
Supondo que P Ai   0,  i  1,2,3,  então


 B   : P B    PAi .PB | Ai  .
i 1

Teorema de Bayes

Seja o espaço de probabilidade , P  , e uma partição A1 , A2 , , An ,  de  , com

probabilidade de cada um dos acontecimentos ser não nula: P Ai   0, i  1,2,  . Então a

probabilidade de um acontecimento qualquer desta partição, sabendo que B   ocorreu é

tal que

P Ak .PB | Ak 
P Ak | B   
, P B   0 .
 P Ai .PB | Ai 
i 1

63
Estatística
Acontecimentos Independentes

Seja o espaço de probabilidade , P  .

Definição: A e B são independentes se e só se P A  B  P A.PB .

Como consequência da definição:

P A | B   P A, PB   0


A e B independentes  
PB | A  PB , P A  0

Teoremas

1) A e B independentes  A e B independentes;

2) A e B independentes  A e B independentes;

3) A e B independentes  A e B independentes;

64
Estatística

Exercícios I

1. Num restaurante, a ementa é constituída por 5 entradas, 12 pratos e 8 sobremesas. De

quantos modos diferentes se pode escolher uma refeição constituída por uma entrada,

um prato e uma sobremesa?

2. Fizeram-se códigos usando dois símbolos: uma letra seguida de um algarismo.

Considerando que o alfabeto tem 26 letras, determine o número de códigos diferentes

que é possível definir com:

a) todas as letras e todos os algarismos;

b) todas as consoantes e todos os algarismos;

c) todas as vogais e todos os algarismos que representam números pares.

3. Extraem-se duas cartas de um baralho com 40 cartas. De quantas maneiras diferentes

se podem extrair as duas cartas, considerando que uma é um ás e outra é uma carta de

paus?

4. Usando os algarismos 1, 3, 5, 7 e 9, determine quantos números é possível fazer com:

a) três algarismos;

b) cinco algarismos.

5. Em Portugal, as matrículas dos automóveis são constituídas por dois grupos de dois

algarismos, seguido de um grupo de duas letras, escolhidas de entre as 26 letras do

alfabeto.

a) Quantos carros é possível registar com matrículas diferentes?

65
Estatística
b) Supondo que as matrículas são constituídas por um grupo de dois algarismos,

seguidos de dois grupos de duas letras, quantos carros seria possível registar com

matrículas diferentes?

6. Uma aposta simples de totobola consiste em assinalar 13 cruzes, cada uma das quais

relativa a um dos trezes jogos. Quantas apostas simples diferentes é possível fazer no

totobola?

7. A polícia de um dado país atribuiu um código a cada um dos 200 000 cadastrados

existentes nesse país. Cada código é constituído por um algarismo, seguido de um certo

número de letras. Considerado que são usadas as 26 letras do alfabeto, quantas letras

deve ter cada código para ser possível registar todos os cadrastados?

8. Com os 10 algarismos, 0, 1, 2, ... ,9, quantos números de 4 algarismos podem ser

escritos, de modo que:

a) os números sejam pares?

b) os números sejam ímpares e formados por algarismos diferentes?

c) os números sejam múltiplos de 5?

d) os números sejam múltiplos de 10 e formados por algarismos diferentes?

9. No campeonato Nacional de Futebol da 1ª Divisão participam 18 equipas de futebol.

Considerando que cada uma das equipas joga com cada uma das outras equipas duas

vezes – em “casa” e “fora” – quantos jogos se realizam no campeonato?

10. Uma urna contém uma bola branca, uma bola vermelha , uma bola verde, uma bola azul e

uma bola preta. De quantas maneiras diferentes podemos extrair três bolas,

considerando a ordem e supondo que:

a) depois de extraída uma bola ela é colocada de novo na urna?

b) depois de extraída uma bola ela não é colocada de novo na urna?

c) a primeira bola extraída é vermelha, e que cada bola extraída não é colocada de

novo na urna?

66
Estatística
11. Quantos números de algarismos diferentes se podem escrever com os algarismos 2, 4,

6 e 8, de modo que:

a) os números tenham 4 algarismos?

b) os números tenham 4 algarismos e sejam maiores do que 4000?

c) Os números tenham 4 algarismos e sejam maiores do que 2500 e menores do que

6500?

d) os números tenham 3 algarismos e sejam maiores do que 468?

12. O Filipe tem 6 livros de Matemática, 3 de Física e 4 de Inglês. De quantas maneiras

diferentes pode o Filipe arrumar os livros numa prateleira, considerando que:

a) qualquer um dos livros pode ocupar uma posição qualquer?

b) os livros de cada uma das disciplinas devem ficar juntos?

c) apenas os livros de Matemática e os livros de Física devem ficar juntos?

d) apenas os livros de Inglês devem ficar juntos?

13. De entre 8 pessoas, vão-se escolher algumas delas para formar uma comissão.

Determine quantas comissões podemos formar, se:

a) cada comissão tem 2 elementos;

b) cada comissão tem 5 elementos;

c) cada comissão tem 6 elementos.

14. Escolheram-se 4 consoantes e 5 vogais do alfabeto. Não considerando o significado das

palavras, quantas palavras diferente se podem escrever com:

a) todas as letras?

b) duas consoantes e três vogais?

c) três consoantes e uma vogal?

15. Para fazer uma aposta simples do totoloto têm de escolher 6 de entre 49 números do

totoloto. Quantas apostas simples diferentes se podem fazer no totoloto?

16. Depois de bem baralhadas, das 40 cartas de um baralho extraíram-se cinco cartas.

Determinar de quantas maneiras diferentes se podem extrair as cinco cartas, de modo

a obter:

67
Estatística
a) três ases e uma dama;

b) duas cartas de um mesmo naipe e as outras três de outro naipe;

c) pelo menos um valete;

d) no máximo três cartas de ouros.

17. O Carlos tem 4 moedas, sendo os seus valores de 5, 10, 20 e 50 escudos. Com as

moedas do Carlos, quantas quantias diferentes se podem formar?

Exercícios II

1. Considere o lançamento de um tetraedro equilibrado com as faces numeradas de 1 a 4.

Represente o espaço de resultados.

2. Defina acontecimentos independentes, acontecimentos incompatíveis e acontecimentos

complementares.

Diga ainda se os acontecimentos A, B   são independentes, incompatíveis e

complementares com base nos seguintes dados:


PA  0,6; PA  B  0,55; P A  B  0,2 

3. Sejam A e B dois acontecimentos associados a uma certa experiência aleatória.

Defina em notação de acontecimentos:

a) Pelo menos um dos acontecimentos ocorre.

b) Apenas ocorre o acontecimento A .

c) Ocorre exactamente um dos acontecimentos.

4. Considere o tempo de vida útil de uma componente electrónica em centenas de horas,

admitindo assim que   t : t  0 .

Sejam os acontecimentos: A  t : t  10; B  t : 7  t  11; C  t : t  9

Nestas condições caracterize os acontecimentos seguintes:

a) A  B; A  C; B  C
b) A  B; A  C; B  C

68
Estatística
c) A, B e C

d) ABC
e) A  B  C
f) A  B  C

5. Qual a probabilidade de com 10 apostas simples (diferentes umas das outras):

a) acertar no totobola?

b) Acertar no totoloto?

6. Considere o lançamento ao ar de uma moeda perfeita, três vezes. Qual a probabilidade

de se obterem: zero faces, duas faces e três faces?

7. Uma experiência consiste em extrair aleatoriamente 3 bolas de uma caixa contendo 7

bolas brancas e 3 azuis. Diga qual a probabilidade de no máximo, serem extraídas duas

bolas azuis.

a) Admitindo que a extracção foi efectuada com reposição.

b) Admitindo que a extracção foi efectuada sem reposição.

8. Uma experiência consiste em extrair aleatoriamente 3 bolas de uma caixa contendo 7

bolas brancas, 3 azuis e 5 verdes. Diga qual a probabilidade de serem extraídas

exactamente: uma bola azul e no máximo uma verde.

c) Admitindo que a extracção foi efectuada com reposição.

d) Admitindo que a extracção foi efectuada sem reposição.

9. O número de transacções efectuadas em três moedas estrangeiras por duas empresas

nacionais, foi registado durante um longo período de tempo de acordo com a tabela que

se segue (p.e., naquele período foram efectuadas 110 transacções em DEM’s pela

empresa 1):
Empresa 1 Empresa 2

DEM (Marco 110 90

Alemão)

GBP (Libra Inglesa) 120 180

FRF (Franco 350 150

Francês)

69
Estatística

Tendo sido seleccionada aleatoriamente uma transacção de entre as registadas, diga qual a

probabilidade de:

a) Ter sido realizada em DEM?

b) Ter sido realizada pela empresa 1?

c) Ter sido realizada pela empresa 1 ou em FRF?

d) Sabendo que foi realizada em GBP, ter sido realizada pela empresa 1?

e) Sabendo que não foi realizada pela empresa 1, não ter sido realizada em GBP?

10. Num determinado jogo do campeonato do mundo de futebol estiveram presentes 50000

espectadores, dos quais 25000 eram dinamarqueses e 20000 eram brasileiros. Dos

dinamarqueses 12000 eram homens, enquanto dos brasileiros 8000 eram mulheres.

Sabe-se ainda que estavam presentes um total 23000 mulheres. Com base nestes dados

diga qual a probabilidade de:

a) seleccionando aleatoriamente um espectador, que o mesmo não seja de

nacionalidade brasileira ou dinamarquesa?

b) seleccionando aleatoriamente um espectador, que o mesmo seja um homem?

c) Tendo-se seleccionando aleatoriamente um espectador e verificado que era uma

mulher, seja brasileira?

d) Tendo-se seleccionando aleatoriamente um espectador e verificado que era uma

homem, seja brasileiro?

e) Tendo-se seleccionando aleatoriamente um espectador e verificado que não era uma

mulher, seja dinamarquês?

f) seleccionando aleatoriamente um espectador, que o mesmo seja de nacionalidade

brasileira? Resolva esta alínea invocando o teorema da probabilidade total.

11. A afinação de máquinas de determinada linha de produção está a cargo de 3

operadores: António, Bernardo e Carlos. O António é responsável pela afinação de

metade das máquinas, enquanto o Bernardo é responsável por um oitavo. Sabe-se que as

máquinas afinadas pelo António, Bernardo e Carlos têm probabilidade de se

70
Estatística
desafinarem na primeira hora de funcionamento após uma afinação, igual a 0,02, 0,03 e

0,05 respectivamente.

a) Diga qual a probabilidade que uma máquina aleatoriamente seleccionada da linha de

produção, se desafine na primeira hora de funcionamento após uma afinação.

b) Tendo-se verificado que uma máquina se desafinou na primeira hora de

funcionamento após uma afinação, diga qual a probabilidade do responsável ser o

Bernardo.

12. De um determinado instrumento de medição fazem parte três componentes

electrónicas cuja probabilidade de não estarem avariadas são respectivamente iguais a

0,7, 0,8 e 0,9. Se nenhuma das componentes estiver avariada, o sistema funciona

sempre; se uma das componentes estiver avariada, a probabilidade do sistema funcionar

é 0,75; se duas componentes estiverem avariadas, a respectiva probabilidade é 0,5; no

caso de todas as componentes estarem avariadas, o sistema não funciona.

Admita que as componentes funcionam independentemente uma das outras.

a) Determine a probabilidade do sistema funcionar.

b) Sabendo que o sistema não está a funcionar, determine a probabilidade de existir

uma componente avariada no sistema.

13. Um estudo efectuada na empresa “Gama”, onde o número de homens a trabalhar é o

dobro do número de mulheres, revelou que as mulheres faltam ao trabalho com

probabilidade igual a 0,05 e que os homens o fazem com probabilidade igual a 0,02.

Num dia aleatoriamente seleccionado diga qual a probabilidade de :

a) faltar uma pessoa?

b) Sabendo que faltou uma pessoa, tratar-se de uma mulher?

14. Suponha que determinado navio transportava 25 contentores dos quai 3 continham

material explosivo. Sabe-se ainda que todos os contentores foram carregados de forma

aleatória. A determinada altura, a agitação das águas do mar provocou a queda de dois

contentores. Nestas condições, responda às questões:

71
Estatística
a) Diga qual a probabilidade de terem caído dois contentores sem material explosivo?

b) Diga qual a probabilidade de não ter caído mais do que um contentor com material

explosivo?

c) Sabe-se que dos 25 contentores, um quinto pesa mais de 5 toneladas. Sabe-se ainda

que um contentor que pese mais de 5 toneladas tem probabilidade 0,4 de conter

material biodegradável e qu a probabilidade correspondente para um contentor que

não pese mais de 5 toneladas é 0,3. Tendo sido seleccionado aleatoriamente um

contentor, o qual se verificou conter material biodegradável, diga qual a

probabilidade do mesmo pesar mais de 5 toneladas?

15. António, Bento e Carlos são os únicos responsáveis pelas transacções efectuadas em

duas moedas estrangeiras (JPY’s-Iene Japonês e USD’s-Dólar Americano) numa

determinada empresa. Das transacções efectuadas em JPY’s, o Antónioe o Carlos

asseguraram respectivamente a realização de 10% e 30% das mesmas. Quanto às

transacções efectuadas em USD’s, o Bento e o Carlos asseguraram respectivamente a

realização de 20% e 50% das mesmas. Sabe-se ainda que as transacções efectuadas em

JPY’s representam o triplo das efectuadas em USD’s e que a empresa apenas efectua

transacções nestas duas moedas. Nestas condições diga:

a) Sabendo que uma transação foi realizada em USD’s, qual a probabilidade de que

tenha sido o António a realizar a mesma?

b) Qual a probabilidade de que uma transacção aleatoriamente seleccionada dentre as

realizadas pela empresa, não tenha sido realizada pelo António?

c) Sabendo que uma transação não foi realizada pelo António, qual a probabilidade de

que não tenha sido realizada em JPY’s?

72
Estatística

Capítulo III – Variáveis Aleatórias

Introdução
Vimos anteriormente que, em muitos casos, o espaço de resultados associado a uma

experiência aleatória é constituído por números reais. Quando tal não acontece, o processo

mais frequente é fazer corresponder um número real a cada elemento do espaço de

resultados.

Exemplo VA1
Considere a experiência aleatória lançamento de uma moeda ao ar por duas vezes. O espaço

de resultados é constituído por quatro elementos:    F , F , F , C , C, F , C, C   , em que

F representa o acontecimento associado à saída “cara” e C o acontecimento associado à

saída de “coroa”.

Para associar um valor quantitativo aos resultados, pode-se definir uma variável  nos

seguintes termos: Número de caras no lançamento de uma moeda por duas vezes.

Assim sendo, a cada elemento do espaço de resultados faz-se corresponder um número

real: F , F   2, F , C   1, C, F   1, C, C   0 , podendo-se escrever:

   0, 1, 2  .

Como  foi definida a partir de uma experiência aleatória, designa-se por variável

aleatória; e uma variável aleatória é uma função que faz corresponder um número real a
cada elemento do espaço de resultados. Por outras palavras, uma variável aleatória é uma

função cujo domínio é  e contradomínio é IR1.

1
No caso de se assinalarem dois ou mais atributos em simultâneo, a correspondência será de  para IRn onde n
representa o número de características simultaneamente em análise.
73
Estatística
Adoptando a metodologia já considerada anteriormente, as variáveis aleatórias também se

podem repartir por dois grandes grupos: variáveis aleatórias discretas, no caso do

contradomínio ser constituído por um conjunto finito ou infinito numerável de valores; e

variáveis aleatórias contínuas, se o contradomínio for constituído por um conjunto infinito

não numerável de valores.

1. Variáveis Aleatórias Unidimensionais

1.1. Variáveis Aleatórias Discretas

Função de Probabilidade
Uma vez definida a variável aleatória, é possível fazer corresponder um número real a cada

acontecimento definido sobre o espaço de resultados. A questão que agora se coloca, é

saber como calcular as probabilidades dos acontecimentos a partir das suas imagens, ou

seja, através dos valores assumidos pela variável aleatória  .

A partir do Exemplo VA1, podem-se definir os seguintes acontecimentos:

A - não sair nenhuma “cara” em dois lançamentos de uma moeda;

B - sair uma “cara” em dois lançamentos de uma moeda;

C - sairem duas “caras” em dois lançamentos de uma moeda;

Antes de calcular as probabilidades de cada um dos acontecimentos, vamos começar por

estabelecer a relação entre cada acontecimento e a sua imagem:

A    0; B    1; C    2

Para utilizar o conceito clássico no cálculo das probabilidades2 , vamos admitir que a moeda

é equilibrada. Assim,

P A  P  0  1 4

2
Relação entre o número de casos favoráveis e o número de casos possíveis.
74
Estatística
PB  P  1  2 4  1 2

PC   P  2  1 4

A partir deste exemplo, pode-se definir uma função f x  que faz corresponder uma

probabilidade a cada valor de  . Esta função designa-se por função de probabilidade com

domínio em IR e contradomínio no intervalo [ 0 , 1 ].

Apresentam-se a seguir os valores da função de probabilidade da variável aleatória

definida no Exemplo VA1 bem como a sua representação gráfica:

Figura VA1
Função de Probabilidade

0,6

f(x 0,4
)

0,2

 0 1 2

0
f x  14 12 14
0,5 1,0 1,5 2,0

Genericamente, se  é uma variável aleatória discreta, então a função de probabilidade é

dada por

f x   P  x  para valores de x  xi com i  1,2,3, , n .

Como os valores da função são probabilidades, f x  não pode assumir valores negativos e o

somatório de todos os valores que a função pode assumir tem de ser igual a um. São estas

as duas propriedades de uma função de probabilidade:

75
Estatística

 f x   0 x  IR

  f x   1
Função de Distribuição
A função f x  informa sobre a probabilidade da variável aleatória assumir determinado

valor concreto. No entanto, e frequentemente, em vez de um único valor, procura-se saber

qual a probabilidade de ocorrência de um conjunto de valores. Nestes casos torna-se mais

prático deduzir a função de distribuição.

A função de distribuição permite calcular a probabilidade acumulada até um determinado

valor da variável aleatória  . Designando a função de distribuição por F x  , podemos dizer

que F x   P  x  .

Esta função tem domínio IR e contradomínio no intervalo [ 0 , 1 ] e possui as seguintes

propriedades:

 0  F x   1 x  IR

 F x b   F x a  com xb  x a

 lim F x   0 e lim F x   1
x  x

 Px a    xb   F xb   F x a  com xb  x a

Apresenta-se a seguir os valores da função de distribuição da variável aleatória do Exemplo

VA1 bem como a representação gráfica que lhe corresponde:

0 x0
 1 4 0  x 1

F x   
 3 4 1 x  2

1 x2

Figura VA2
Função de Distribuição

 0 1 2
1 f x  14 12 14
F(x)
F x  14 34 1
0,5

0 1 2
76
Estatística
x

A probabilidade de sair no máximo uma “cara” em dois lançamentos3, pode ser obtida

através da função de distribuição:

P  1  F 1  3 4 ou a partir da função de probabilidade:

P  1  P  0  P  1  f 0  f 1

Também se pode utilizar a função de distribuição para calcular a probabilidade de sair pelo

menos uma “cara”4. Tenha no entanto em atenção, que a referida função apenas fornece

probabilidades acumuladas até determinado valor:

P  1  1  P  1  1  P  0  1  F 0  1  1 4  3 4 .

1.2. Varáveis Aleatórias contínuas

Função de Densidade de Probabilidade


Se  é uma variável aleatória contínua então pode assumir um conjunto infinito de valores.

Assim sendo, e ao contrário de variáveis aleatórias discretas, não é possível atribuir a cada

um desses valores uma probabilidade de ocorrência dada por f x  . Aliás, a infinidade de

valores que a variável pode assumir, conduz a que P  x   0 , o que não implica que tal

ocorrência seja impossível, mas significa apenas que, face á infinidade de valores que a

variável pode assumir, a probabilidade de  ser exactamente igual a x , é nula.

Quando as variáveis aleatórias são contínuas, a abordagem deve ser diferente daquela

utilizada nas variáveis aleatórias discretas.

3
Note-se que está implícito na questão o cálculo da probabilidade para um conjunto de valores. Neste caso, sair
zero “caras” ou uma “cara” em dois lançamentos de uma moeda.

4
Tal como no exemplo anterior, a questão formulada implica saber a probabilidade para um conjunto de valores
que a variável assume – uma ou duas “caras” em dois lançamentos de uma moeda.
77
Estatística
Suponha que se reparte uma infinidade de probabilidade ao longo do eixo dos números reais

e que a “massa” no intervalo   , x  é igual a F x  . A probabilidade da variável assumir

F x  x   F x 
valores no intervalo  x, x  x é dada por: F x  x   F x  ; e o quociente ,
x

representa o nível médio da probabilidade naquele intervalo.

O limite do referido quociente, quando x tende para zero, ou seja F' x  , representa a

densidade de probabilidade em torno do ponto x e designa-se genericamente por função

densidade de probabilidade e representa-se por f x  .

Pode-se então concluir que, se  é uma variável aleatória contínua, existe sempre uma

função f x  tal que:

x
F x   P  x    f x dx ,


ou ainda:
xb
P x a  x  x b   F  x b   F x a    f x dx .
xa

Para concluir, resta acrescentar que para f x  poder ser considerada uma função

densidade de probabilidade, é necessário que verifique cumulativamente dois requisitos:

 f x   0

  f x  dx  1


Exemplo VA2
Seja  uma variável contínua com a seguinte função de distribuição:

78
Estatística
0 x0
 x2
F x    0x2
4
1 x2

As probabilidades P  1 , P0    1 2 e P  3 2 , por exemplo, podem ser obtidas

directamente a partir de F x  :

P  1  F 1  1 4

P0    1 2  F 1 2  F 0  1 16

P  3 2  1  F 3 2  1  9 16  7 16

ou então, a partir da função densidade de probabilidade.

Para tal, é necessário deduzir a respectiva função:

1
 x 0 x2
f x   F ' x    2

0 outros valores de x

1
1  x2 
1
P  1 
1 1
 2
x dx    
2  2  4
0 0

12
1  x2 
12
P0    1 2 
1 1
  2
x dx    
2  2  16
0 0

2
1  x2 
2
1 4 9 4 7
P  3 2 
1
 
2
x dx      
2  2 

2  2 2  16
32 32

Graficamente, as funções têm a seguintes forma:

1
Figura VA3
f(x) 0,8
Função Densidade de Probabilidade
0,6
79
0,4

0,2

0
Estatística

7 16

14

F(x)
0,8 Figura VA4
0,6 Função de Distribuição

0,4

0,2

1 2 3 4
x

2. Variáveis Aleatórias Bidimensionais

Serão apresentados alguns tópicos da variáveis aleatórias bidimensionais (situações em que

se consideram dois atributos de uma só vez), os quais não são mais do que extensões lógicas

decorrentes dos pontos anteriores, em que consideramos apenas uma variável.

2.1. Variáveis Aleatórias Discretas

Defini-se como função de probabilidade conjunta de uma variável aleatória ,   a função

f x, y  que faz corresponder uma probabilidade a cada elemento de IR 2:

f x, y   P  x,   y  .

A função de probabilidade conjunta deve verificar cumulativamente as duas condições que

se seguem, para poder ser considerada como tal:

  
f xi , y j  0

80
Estatística

 f xi , y j   1
n t

i 1 j 1

À semelhança da função de distribuição unidimensional, a função de distribuição conjunta

de uma variável aleatória bidimensional ,   define-se como:

F ,    P  x,   y     f xi , y j 


xi  x y j  y

No caso bidimensional é frequente o recurso à chamada função de probabilidade marginal

de  ou de  . Esta função permite obter, por exemplo, a probabilidade de  assumir um

determinado valor ou um conjunto de valores, independentemente dos valores que a variável

 possa assumir. É comum representar a função de probabilidade marginal de  por f x x 

e a função de probabilidade marginal de  por f y  y  :

f x x    f x, y   P  x,       
y

f y y   f x, y   P     ,   y 


x

A partir das funções de probabilidade marginais, pode-se também analisar a independência

entre as variáveis que integram o par ,   . Assim, diz-se que as variáveis  e  são

independentes, se a função conjunta for igual ao produto das funções de probabilidade

marginais correspondentes, ou seja:

f x, y   f x x  f y  y , x, y  .

Exemplo VA3
Considere duas variáveis aleatórias  e  cuja função de probabilidade conjunta se

apresenta a seguir:

 2 xy  x  y 
 para x  1,2 e y  2,3,4
f x, y    27
0
 para outros valores x, y 

81
Estatística

Calcule as probabilidades P  1,   3 , P  1 , P  3 e verifique se  e  são

independentes.

2 1 3  1  3 2
 P  1,   3  f 1,3   ;
27 27

 Para calcular P  1 , começamos por deduzir a função de probabilidade marginal

de  :

f x x    f x, y 
y

2 x  2  x  2 2 x  3  x  3 2 x  4  x  4 15x  9
f x x      .
27 27 27 27

15 x  9
 x  1,2
Portanto, f x x    27 e P  1 
6
;
0 27
 o.v. x

 Para calcular P  3 , começamos também por deduzir f y  y  :

2 y  1  y  4 y  2  y  4 y  3
f y  y    f x, y    
x 27 27 27

4y  3
 y  2,3,4
Pelo que, f y  y    27 P  3 
9
e .
0 27
 o.v. y

 As variáveis  e  não são independentes já que:

2 xy  x  y  15 x  9 4 y  3
f x, y     .
27 27 27

2.2. Variáveis Aleatórias Contínuas

82
Estatística
Tal como no caso univariado, a função densidade de probabilidade conjunta é o resultado da

diferenciação da função de distribuição conjunta em ordem às variáveis que a integram, ou

seja:

 2 F  x, y 
f x, y   .
x y

A função densidade de probabilidade conjunta deve também verificar duas propriedades:

 f x i , y i   0
 
   f x, y  dx dy  1
 

Apresenta-se a seguir a forma de determinar as duas funções densidade de probabilidade

marginais:


f x x    f x, y  dy



f y y   f x, y  dx


As variáveis  e  são independentes, se a função densidade de probabilidade conjunta

f x, y  for igual ao produto das respectivas funções densidade de probabilidade marginais:

f x, y   f x x f y  y ,  x, y 

Exemplo VA4
Considere a função densidade de probabilidade conjunta das variáveis aleatórias  e  :

4 xy 0  x  1, 0  y  1
f x, y   
0 o.v. x

Calcule as probabilidades P  1 2,   1 3 , P  1 3 , P  1 2 e verifique se as

variáveis são independentes.

83
Estatística

1/ 3 12
 y2  4  x2 
12 13 12
4 1  1
 P  1 2,   1 3   0 4 xy dy dx  4 0  2 
x dx      8   36
0 0
18  0
2 18  

 P  1 3

Para começar, vamos determinar a função densidade de probabilidade marginal de  :


1
1
 y2 
f x x   4 xy dy  4 x    2 x
 para 0  x  1
0  2  0
13
13
 x2 
P  1 3  2 x dx  2  
1
  2 

9
0 0

 P  1 2

1 1
 x2 
f y  y   4 xy dx  4 y    2 y
 para 0  y  1
0  2 
0

12
12
 y2 
P  1 2  1  2 y dy  1  2    1  
1 3
  2  0 4 4
0

 As variáveis  e  são independentes, uma vez que:

f x, y   f x x f y  y ,  4 xy  2 x 2 y .

3. Parâmetros de Variáveis Aleatórias

Os parâmetros de variáveis aleatórias são medidas através das quais se pretende

sintetizar a informação a que diz respeito ao atributo (variável) em análise.

84
Estatística
Os parâmetros de utilização mais frequente são a média e a variância. Quando se pretende

analisar a relação linear entre duas variáveis, também se costumam utilizar a covariância e

o coeficiente de correlação linear.

3.1. Média Aritmética

Sendo  uma variável aleatória discreta, a média de  , ou o seu valor esperado, como

também se costuma designar, é dado por:

n
E     x i f x i 
i 1

Ou seja, é a soma dos valores que a variável pode assumir, ponderados pelas probabilidades

de ocorrência de cada um desses valores.

Se  for uma variável aleatória contínua, a média é obtida de forma semelhante,

atendendo, no entanto, à sua própria especificidade:


E     x f x  dx .


Voltando aos Exemplos VA1 e VA2 apresentados anteriormente, e que ilustram a

apresentação sobre as variáveis aleatórias discretas e contínuas unidimensionais e as

respectivas funções de probabilidade e de densidade de probabilidade, pode-se calcular a

média para cada uma das variáveis:

Exemplo VA1
n
E     x i f  x i   0  4  1 2  2  4  1
1 1 1
i 1

85
Estatística

Exemplo VA2
 2
1  x3 
2 2
E    x f x  dx  x
1 1 2 8
  2 
x dx 
2
x dx     .
2   0 6
3
 0 0

3.1.1. Propriedades da média ou valor esperado

Apresentam-se de seguida algumas propriedades do valor esperado, quando se considera

uma ou duas variáveis aleatórias  e   e uma constante k .

 Ek   k

 Ek X   k E X 

 E     E  E 

 E     E  E 

 E   COV    E E  5 ou E   E E  , desde que  e  sejam

independentes.

3.2. Variância e Desvio Padrão

A variância6 é uma medida de dispersão e pode definir-se como a média do quadrado dos

desvios, dos diferentes valores que a variável  pode assumir, em relação á média da

variável:

VAR  E   E 2 .

Designando E   por  7
, fica:

5
A covariância (COV) vai ser objecto de análise mais adiante neste capítulo.
6
Frequentemente representada por  , tal como vimos no capítulo da estatística descritiva. Dada a relação
2

entre a variância e o desvio padrão, este último é representado por  .

86
Estatística

VAR  E     2
 (1)

Quando se trata de variáveis aleatórias discretas a variância pode ser calculada a partir

de:
n
VAR     x i   2 f  x i  .
i 1

Para o caso de variáveis aleatórias contínuas, a variância pode ser calculada da seguinte

forma:

VAR     x    f x dx .
2



O desvio padrão é a raiz quadrada positiva da variância e tem a vantagem de vir expresso

nas mesmas unidades da variável. Assim,   VAR  .

As formas de cálculo que foram apresentadas, derivam da fórmula apresentada em (1), mas

não são, talvez, as formas de cálculo mais expeditas para calcular a variância de uma

variável aleatória. De seguida deduz-se uma fórmula alternativa.


VAR    E    2 

 E   2   2
2
 Desenvolve ndo o quadrado
 E    2 E    
2 2
Atendendo às propriedades do valor esperado e sendo  uma cons tan te
 E    
2 2
Atendendo a que E    

Voltemos aos Exemplos VA1 e VA2 para calcular a variância das variáveis aleatórias aí

representadas:

Exemplo VA1

  x
n
f  x i   0 2   12   2 2  
1 1 1 3
E 2  2
i
i 1 4 2 4 2

7
Símbolo geralmente utilizado para designar a média de uma variável aleatória.
87
Estatística
Como já vimos calculado E   1 , então

VAR  3 2  1  1 2 .

Exemplo VA2
 2

   x 1  x4 
2 2
f x  dx  x
1 1 3
E  x dx  x dx     2
2 2 2

 0
2 0
2 2  4 
0

pelo que,

VAR   2 
64
 0,22(2) .
36

3.2.1. Propriedades da Variância

Tal como para o valor esperado, apresentamos de seguida algumas regras práticas no

cálculo da variância, considerando uma ou duas variáveis aleatórias  e   e uma

constante k .

 VARk   0

 VARk X   k 2 VAR X 

 VAR     VAR  VAR   2 COV ,  

 VAR     VAR  VAR   2 COV ,  

4. Covariância e Coeficiente de Correlação Linear

A covariância é um parâmetro utilizado para medir o grau e o sentido da associação linear

entre duas variáveis.


COV ,    E    x     y 

88
Estatística
A covariância deve ser positiva se aos valores de  acima da respectiva média (  x )

corresponderem predominantemente valores de  também acima da sua média (  y ); ou, se

aos valores de  abaixo da respectiva média, corresponderem preponderantemente

valores de  também abaixo da sua média. Diz-se então que  e  tendem a variar no

mesmo sentido. A covariância é negativa, quando a valores de  acima da respectiva média,

correspondem preponderantemente, valores de  abaixo da sua média, ou vice-versa. Diz-

se, neste caso que  e  variam em sentidos opostos.

Se  e  forem variáveis aleatórias discretas, a covariância entre  e  pode ser

obtida a partir de

  
COV ,     xi   x  y j   y f xi , y j 
i j

Para calcular a covariância entre duas variáveis aleatórias contínuas pode-se utilizar a

seguinte fórmula

 
COV ,      x   x  y   y  f x, y  dx dy
 

A seguir vai deduzir-se uma fórmula alternativa, mais prática, para calcular a covariância

entre duas variáveis, sejam elas discretas ou contínuas:

 
COV ,    E    x     y
 E    y   x   x  y 
 E     y E     x E     x  y
 E     y  x   x  y   x  y
 E     x  y

Ou escrita de outra forma,

COV ,    E   E E  .

O valor esperado do produto entre as duas variáveis, atendendo à sua própria natureza,

pode ser calculado a partir das fórmulas seguintes:

89
Estatística
para variáveis aleatórias discretas E     xi x j f xi , y i  ;
i j

 
para variáveis aleatórias contínuas E      x y f x, y  dx dy .
 

Resta acrescentar que se duas variáveis ,   são independentes então COV ,    0 . O

inverso não pode ser verdadeiro. De facto uma vez que a covariância mede a associação

linear entre as variáveis, a medida pode ser nula (ausência de relação linear entre elas)

mas, na realidade, as variáveis podem estar relacionadas de outra forma que não a linear.

Para além disso, interessa sublinhar que a covariância pode assumir valores no intervalo

  ,    , dependendo também a sua magnitude, das unidades em que as variáveis em

análise vêm expressas. Importa pois encontrar uma medida, que para além de indicar o

sentido do relacionamento das variáveis (dada pelo sinal da covariância, como já se viu),

permita caracterizar a intensidade da relação entre  e  , independentemente das

unidades em que estas venham expressas. Essa medida, frequentemente utilizada, designa-

se por coeficiente de correlação linear (  x, y ) e é dada pelo quociente entre a covariância e

produto dos desvios-padrão das variáveis em análise:

COV ,  
 x, y 
 x2  y2

O coeficiente de correlação linear assume valores entre –1 e 1, podendo-se concluir que

para valores próximos de +1 ou –1, a relação linear entre as duas variáveis é forte. As

variáveis tendem a evoluir no mesmo sentido quando o sinal do coeficiente é positivo; e em

sentido contrário quando o sinal do coeficiente é negativo. Quando o valor de  x, y está

muito próximo de zero, isso significa que a relação linear entre as variáveis é muito fraca.

Embora já se saiba que as variáveis  e  apresentadas no Exemplo VA4 são

independentes, e por conseguinte, sabemos antecipadamente que quer a covariância quer o

90
Estatística
coeficiente de correlação linear são nulos, vamos utilizar esse exemplo a título ilustrativo

para proceder ao cálculo destas duas medidas.

COV ,  
COV ,    E    E   E   e  x, y 
 x2  y2

  1 1
E    xy f x, y  dx dy 
4
    xy 4 xy dx dy  9
  0 0

Quanto ao E   e ao E   , e uma vez que já deduzimos as respectivas funções densidade

de probabilidade marginais, tem-se:

  1
 x3 
E    x f x x  dx  x 2 x dx  2   
2
   3  3
  0

  1
 y3 
E    y f y  y  dy  y 2 y dy  2   
2
   3  0 3
 

Então:

COV ,    E    E   E   


4 2 2
   0, pelo que  x, y  0 .
9 3 3

91
Estatística
Exercícios

1. Uma caixa contém duas bolas azuis e três verdes. Considere uma experiência

aleatória que consiste retirar ao acaso duas bolas, sucessivamente e sem reposição.

Considere ainda definida a variável X={ número de bolas azuis retiradas}.

a) Determine a função probabilidade da variável aleatória X.

b) Calcule o valor esperado e a variância da variável aleatória X.

c) Determine a função de distribuição da variável aleatória X.

d) Calcule P  0 .

e) Calcule P  2   0

2. Considere a variável aleatória  , discreta, com a seguinte função de

probabilidade:

x 1 2 3 4

f (x) 0.1 0.3 0.4 0.2

a) Mostre que f é realmente uma função de probabilidade e represente-a

graficamente.

b) Calcule P(1) , P(01) , P(12) , P(13) , P(1) , P( 1) e P(2) .

c) Deduza a expressão da função de distribuição de  e represente-a graficamente.

d) Calcule as probabilidades pedidas em b) mas utilizando a função distribuição.

e) Determine E () , E (23) , V () e V (23) .

3. A procura diária de determinado bem segue, em determinado estabelecimento, a

seguinte lei de probabilidade:

x 2 3 4 5 6

f (x) 0.1 0.3 0.3 0.2 0.1

Admitindo que num determinado dia o estabelecimento possui em stock 5 unidades, calcule:

92
Estatística
a) A probabilidade de no fim desse dia todas as unidades terem sido vendidas.

b) A probabilidade de no fim desse dia nem todas as unidades terem sido vendidas.

c) Supondo que o preço de custo é de 500$00 e o preço de venda é de 1000$00 por

unidade, determine o lucro esperado para esse dia.

4. Considere a variável aleatória X e ainda a seguinte função densidade de

probabilidade

0 se x0
1

f x     ax se 0  x  3
4

0 se x3

a) Calcule o valor da constante a por forma a que f x  represente a função densidade

da variável aleatória x.

b) Calcule F x  .

c) Calcule P  2 .

d) Calcule P1    2 .

e) Calcule o valor esperado e a variância de X.

5. Considere a variável aleatória  , contínua, com a seguinte função densidade de

probabilidade:

 2x ,0 x1
f ( x)
0 , outros
valores

a) Mostre que f é realmente uma função densidade de probabilidade e represente-a

graficamente.

b) Calcule P(1) , P(1 31 2) , P(1 31 2) , P( 14) e P(1) .

c) Deduza a expressão da função de distribuição de  e represente-a graficamente.

d) Calcule as probabilidades pedidas em b) mas utilizando a função distribuição.

e) Determine E () , E(42) , V () e V ( 42) .

93
Estatística
6. Considere a seguinte função de probabilidade conjunta:

 2x  y
 x  0,1,2 e y  1,2
f x , y    21
0
 outros valores

a) Indique no plano xy os valores assumidos pela variável aleatória conjunta.

b) Verifique que se trata realmente de uma função de probabilidade.

c) Deduza as funções de probabilidade marginais para cada uma das variáveis.

d) Deduza a função de distribuição conjunta e as funções de distribuição marginais.

e) Calcule:

 
P  1,   2 , P  1 , P  2 , P   1   2 , P  1,   2

f) Verifique se as variáveis são independentes.

g) Calcule a covariância e o coeficiente de correlação linear. Interprete os resultados.

7. Considere a seguinte f.d.p. conjunta

k x  2 y  0  x  1, 0  y  1
f x , y   
0 outros valores

a) Determine K.

1 2 1 3
b) Calcule P     ,     .
5 5 2 4

c) Deduza as f.d.p. marginais de X e de Y.

1 2 1 3
Calcule, P      e P      .
5 5 2 4

d) Verifique se as variáveis são independentes. Em caso de o não serem, calcule

Cov,   e  x , y e interprete os resultados obtidos.

94
Estatística
Capítulo IV – Distribuições Teóricas Discretas

No âmbito da Estatística Descritiva, fala-se muitas vezes em distribuições de frequências

ou distrbuições empíricas de variáveis discretas e contínuas. As distribuições teóricas que

se irão abordar representam, afinal, os modelos matemáticos (expressão genérica)

daquelas distribuições empíricas.

1. Distribuição Uniforme

Em algumas situações assume-se que os valores que uma variável aleatória discreta  pode

assumir ocorrem com igual probabilidade. Diz-se então que  tem distribuição uniforme.

Exemplo DD1
Considere-se a experiência aleatória que consiste no lançamento de um dado perfeito.

Seja a variável  - número inscrito na face voltada para cima.

A variável aleatória  tem distribuição uniforme pois,

1
 , x  1,2,3,4,5,6
P  x  f x    6
0, outros valores

Ou seja,  pode assumir os valores inteiros x  1,2,3,4,5 e 6 com igual probabilidade.

Desta forma, diz-se que a variável aleatória discreta  tem distribuição uniforme se a

sua função de probabilidade for dada por:

1
 , x  1,2,3,  , N
f x    N .
0, outros valores

95
Estatística
Teorema
Se  é uma variável aleatória discreta com distribuição uniforme tem-se que:

N 1
E     (Média)
2

N 2 1
Var    2  (Variância).
12

A função de distribuição F x  duma uniforme facilmente se obtém recorrendo ao conceito

de função de distribuição anteriormente estudado:

0, x 1
x

F x    i , x i  x  x i 1 , x i  1,2,  , N  1 .
N

1, xN

A seguir apresentam-se os gráficos da função de probabilidade f x  e da função de

distribuição F x  .

f(x)

1/N

1 2 3 4 x

F(x)
1

(N–1)/N

2/N

1/N

1 2 N–1 N x

96
Estatística
2. Prova de Bernoulli

Considere-se uma experiência aleatória que tem apenas dois resultados possíveis: A que

se designa por sucesso e A designado por insucesso.

O sucesso ocorre com probabilidade p e o insucesso com probabilidade q  1  p .

Ou seja:

 
  A, A

A -Sucesso

A -Insucesso

P A  p


P A  q  1 p

Uma experiência aleatória com as características anteriores chama-se prova de Bernoulli.

Sucessão de provas de Bernoulli


Considere um processo ou experiência caracterizado or repetidas provas que têm lugar nas

seguintes condições:

1. Em cada prova só há dois resultados possíveis, mutuamente exclusivos, denominados

suceso e insucesso.

2. A probabilidade de sucesso, designada por p , mantém-se constante de prova para

prova. A probabilidade de insucesso é designada por q  1 p .

3. As provas são independentes, isto é, os resultados obtidos numa certa prova ou

sequência de provas não afectam os resultados da(s) prova(s) subsequente(s).

Exemplo DD2
Imagine que determinada empresa pretende efectuar uma campanha publicitária na

televisão. Para tal, tenciona patrocinar certo programa. No entanto, a dita campanha só é

vantajosa para a empresa se esse programa tiver uma audiência de pelo menos 40% dos

telespectadores.

97
Estatística
Para se decidir, a empresas pode levar a cabo uma experiência aleatória, que consistirá em

inquirir um certo número de telespectadores, perguntando-lhes se viram ou não aquele

programa.

Em que condições se estará perante um processo de Bernoulli?

As hipóteses subjacentes a um processo de Bernoulli estão satisfeitas neste exemplo se se

admitir que:

 Em cada entrevista (prova) a realizar, o entrevistado só poderá dar uma das duas

respostas possíveis: vi o programa ou não vi o programa;

 As probabilidades associadas àqueles resultados são respectivamente p e q  1  p

e mantêm-se fixas de entrevista para entrevista;

 Também é plausível que as entrevistas sejam independentes... isto é, os

entrevistados não estão “combinados”... .

3. Distribuição de Bernoulli

Considere-se uma prova de Bernoulli e uma variável aleatória  que só assume dois

valores: o valor 0 quando o resultado da prova é o insucesso e o valor 1 quando o resultado

da prova é o sucesso. Ao sucesso está associado a probabilidade p e ao insucesso a


probabilidade 1  p   q , fixas.

Diz-se que a variável aleatória discreta  tem distribuição de Bernoulli se a sua função

de probabilidade é dada por:

 p x (1 p) 1 x , x 0,1

f ( x) 
 0, outros valores

Esta distribuição tem só um parâmetro p que satisfaz a condição 0  p  1 .

98
Estatística
Recorrendo ao conceito de função de distribuição F x  , facilmente se deduz que a função
de distribuição de uma Bernoulli é dada por:

0 x0

P  x  F x   1  p 0  x 1
1 x 1

Teorema
Se a variável aleatória  tem distribuição de Bernoulli, então:

E  p e Var   p1  p   p  q .

4. Distribuição Binomial

A distribuição binomial assenta também no conceito de provas de Bernoulli e é sem dúvida

uma das distribuições de probabilidade duma variável aleatória discreta mais largamente

utilizada como modelo teórico adequado a uma grande variedade de situações observáveis

na prática.

Em termos genéricos, esta distribuição é um esquema probabilístico que se adapta a

situações em que se pretende analisar um conjunto finito (ou amostra) de

indivíduos/objectos que possuem determinado atributo com probabilidade p ou que não o


possuem com uma probabilidade 1  p   q .

Considere-se uma sucessão de 5 provas de Bernoulli, isto é, uma sucessão de 5

experiências aleatórias independentes, em cada uma das quais pode ocorrer ou não

determinado acontecimento A.
O acontecimento A , denominado sucesso, ocorre com probabilidade p e A , o insucesso,
com probabilidade 1  p   q .

O espaço de resultados associado àquelas 5 provas de Bernoulli é dado por:

    AAAAA , A AAAA , AA AAA , AAA AA, AAAA A, , A A A A A 


99
Estatística

em que    25 pois o número de provas é 5 e só há dois resultados possíveis: A e A.


Seja o acontecimento A -o recém nascido é do sexo feminino e suponha que se pretende,
por exemplo, saber:

- Qual a probabilidade de, em 5 recém nascidos,

 Todos serem do sexo feminino?

 Apenas três serem do sexo feminino?

 Nenhum ser do sexo feminino?

É uma distribuição binomial que permitirá responder a estas questões.

A distribuição Binomial parece estar associada à seguinte questão genérica: pretende-se

saber qual a probabilidade de, em n provas de Bernoulli, serem obtidos x sucessos ( a


realização de certo acontecimento A ) e portanto n  x  insucessos (a não realização de A ).

Suponhamos a seguinte sequência de n provas de Bernoulli:

n provas
 
AAA  A A  AAA  A
  
x sucessos n  x  insucessos

Note-se que há 2 n sequências diferentes possíveis, mas a todas elas corresponde a mesma
probabilidade p x 1  p n x .

No entanto, existem  n  maneiras diferentes de se obterem x sucessos (e portanto n  x 


 x
 

insucessos).

Diz-se que a variável aleatória discreta  -número de sucessos em n provas de Bernoulli-


tem distribuição Binomial e escreve-se:

  bx; n; p 

se a sua função de probabilidade for dada por

100
Estatística
 n  x
  p 1  p 
n x
x  0,1,2,, n
P  x  f x   f x, n; p    x 
0
 outros valores

em que n e p são os parâmetros caracterizadores desta distribuição.

O parâmetro n corresponde ao número de provas de Bernoulli a efectuar, sendo n


qualquer inteiro positivo. O parâmetro p corresponde à probabilidade associada ao
sucesso, 0  p  1 .

A respectiva função de distribuição, F x  , é dada por:

0 x0
 x
 n 
PX  x  F x       p xi 1  p n  xi 0 xn
 xi 0 xi 
1 xn

Os parâmetros n e p são suficientes para a especificação de uma distribuição binomial,


isto é, a valores diferentes de n e p correspondem diferentes distribuições desta
família.

Teorema
Se  é uma variável aleatória com distribuição Binomial, então

E  n. p e Var   n. p.q .

Exemplo DD3
Um técnico dos serviços de Prevenção e Segurança Rodoviária afirma que 1 em 10 acidentes

rodoviários é devido a cansaço.

Seja  - número de acidentes, em 5, devidos a cansaço.


  bn  5, p  0,1

5 
P  x  f x     0,1 x 0,95 x
 x

101
Estatística
Por exemplo, a probabilidade de 3 dos 5 acidentes serem devido ao cansaço é :

 5
f 3    0,13 0,953  0,0081 .
 3

As distribuições binomiais possuem a propriedade de serem aditivas, o que significa que a

soma de duas ou mais variáveis aleatórias independentes com distribuição binomial de

parâmetro p é ainda uma variável aleatória com distribuição binomial e com o mesmo

parâmetro p .

Teorema

Considerem-se k variáveis aleatórias  i i  1,2, , k  independentes em que  i  bxi ; ni ; p  .

Então.

k  k 
S k  1   2     k    i  b S ki ; n 
  ni ; p  .
i 1  i 1 

5. Distribuição Hipergeométrica

Suponha que, de um lote de 20 peças das quais duas são defeituosas, se extrai uma amostra

de 5 peças sem reposição.

Qual a probabilidade de, nas 5 peças extraídas, nenhuma ser defeituosa?

Se se definir a variável aleatória  -número de peças defeituosas extraídas sem reposição

duma amostra de 5 peças, a probabilidade pretendida será dada por:

 2  18 
   
0 5 
P  0   0,5526 .
 20 
 
5 

O denominador corresponde ao número de casos possíveis, isto é, ao número de maneiras

diferentes de extrair 5 peças dum total de 20 peças que constituem o lote.

102
Estatística
 2
O termo   corresponde ao número de maneiras diferentes de seleccionar 0 peças
0

18 
defeituosas num total de duas defeituosas e o termo   ao número de maneiras
5 

diferentes de seleccionar 5 peças não defeituosas dum total de 18 peças também não

defeituosas.

 2  18 
Pela regra da multiplicação, o número de casos favoráveis será   .   , que corresponde
0 5 

ao número de maneiras diferentes de seleccionar 5 peças não defeituosas dum lote de 20

peças das quais duas são defeituosas e 18 não são.

Como as “extracções” são feitas sem reposição (o que aliás sucede geralmente nos

problemas de amostragem), as 5 sucessivas “extracções” não são provas de Bernoulli.

Diz-se que a variável aleatória discreta  -número de sucessos ocorridos em n extracções

sem reposição, tem distribuição hipergeométrica e escreve-se:

  hx; M ; n; p 

se a sua função de probabilidade for dada por

 M . p   M 1  p   M . p   M .q 
       
 x  nx   x  n  x
P  x  f x; M ; n; p    , x  0,1,2,  , n com p  q  1
M  M 
   
n  n 

onde M e n correspondem respectivamente ao número total de objectos/indivíduos que

constituem a população e à dimensão da amostra (número de extracções a realizar).

Teorema
A média e a variância de uma variável aleatória  , com distribuição hipergeométrica, são

dadas por

M n
E  n. p e Var   n. p.q. .
M 1

103
Estatística
Exemplo DD4
Suponha que, 120 candidatos a um emprego numa empresa de telecomunicações, só 80 têm

as qualificações pretendidas.

Pretendemos saber a probabilidade de que apenas 2 tenham as qualificações pretendidas

num grupo de 5 seleccionados para uma entrevista piloto.

Seja  - número de seleccionados, em 5, com as qualificações pretendidas ( sem reposição)

80 2
p= 
120 3
 2
  h120,5,  .
 3

Logo

 80  40 
  
 x  5  x 
f x  
120 
 
 5 

pretendemos:

 80  40 
  
 2  3 
f (2)   0,138 .
120 
 
 5 

Nota

A diferença fundamental entre esta distribuição e a distribuição binomial reside no facto

de as provas na distribuição hipergeométrica não serem de Bernoulli, visto que a população

é finita e os elementos são retirados sem reposição, donde os resultados obtidos em

diferentes provas não serem independentes. Quando N é grande comparado com n, a

diferença entre retirar elementos com ou sem reposição é insignificante e tanto mais

insignificante quanto maior for N , número de elementos da população, ou seja, nestes

casos a distribuição binomial oferece uma boa aproximação da distribuição

hipergeométrica.

104
Estatística
6. Distribuição de Poisson

Muitos fluxos de eventos que se processam aleatoriamente ao longo do tempo ou do espaço

observam, pelo menos com grande aproximação, as seguintes hipóteses:

i. o número de eventos ocorridos em intervalos ( de tempo ou espaço ) disjuntos são

variáveis aleatórias independentes;

ii. a probabilidade de um certo número de eventos se verificar é a mesma para

intervalos da mesma dimensão, isto é, aquela probabilidade só depende da dimensão do

intervalo e não da posição em que se situa esse intervalo ( tudo se passa como se o

número de eventos tivesse sempre a mesma densidade média );

iii. a probabilidade para que ocorra um evento num intervalo arbitrariamente pequeno é

proporcional à dimensão do intervalo;

iv. a probabilidade de se verificarem dois ou mais eventos num intervalo de amplitude

muito pequena é negligenciável, quando comparada com a probabilidade de se verificar

apenas um evento ( os eventos ocorrem um a um e não aos grupos ).

As hipóteses anteriores definem um modelo de contagem (processo estocástico) conhecido

por processo de Poisson, em que  t , t  0, reproduz o número de eventos ocorridos no


intervalo 0, t  e segue uma distribuição de Poisson de parâmetro t, >0.

A distribuição de Poisson permite assim descrever certos tipos de fenómenos ou

acontecimentos cuja ocorrência se repete ao longo do tempo ou do espaço (isto é, num

espaço contínuo).

Muitas vezes é utilizada como distribuição limite ou aproximada da distribuição binomial.

Diz-se que a variável aleatória  tem distribuição de Poisson e escreve-se

105
Estatística
  p 

quando a sua função de probabilidade é dada por

 e  . x
 x  0,1,2, 
P  x  f x    x!
0
 outros valores

onde   0 é o parâmetro caracterizador desta distribuição.

Teorema

Sendo   p  então

E   e Var    .

Exemplo DD5

Admita que o número de camiões TIR que, por hora, atravessam a ponte 25 de Abril segue

uma distribuição de Poisson com variância igual a 8.

i) Qual a probabilidade de que, numa hora, exactamente 4 camiões TIR

atravessem a ponte?

ii) Qual a probabilidade de que, numa hora, pelo menos 6 camiões TIR

atravessem a ponte?

Seja  - número de camiões TIR que, numa hora, atravessam a ponte 25 de Abril.

  p  8 pois E  Var    8

A função probabilidade é a seguinte:

e 8 .8 x
f x   , x  0,1,2, 
x!
106
Estatística
8 4
pretende-se P  4 
e .8
i)  0,0573 ;
4!

ii) pretende-se

P  6  1  P  5  1   f 0  f 1  f 2  f 3  f 4  f 5


 1  0,0003  0,0027  0,0107  0,0286  0,0573  0,0916 .
 0,8088

Propriedades

A distribuição de Poisson não é afectada por agregações ou desagregações.

 A distribuição de Poisson não é afectada por agregações (ou seja, a soma de

variáveis aleatórias de Poisson independentes é ainda uma variável aleatória de

Poisson).

 i  pi , i  1,2,  , n n  n 
 i independen tes


  i  p  i 
i 1  i 1 

 A distribuição de Poisson não é afectada por desagregações:

A desagregação diz-nos que se  é uma variável aleatória de Poisson de parâmetro  , e

 i   n é uma variável aleatória binomial de parâmetros n e p i , então  i é uma variável

aleatória de Poisson de parâmetro i  pi . .

107
Estatística

Exercícios

1. Uma empresa comercializa garrafas de vinho do Porto de 1 litro. Supõe-se no entanto

que 40% dessas garrafas contém realmente uma menor quantidade de líquido do que o

volume indicado no rótulo.

Tendo adquirido 6 dessas garrafas, qual a probabilidade de:

a) Duas delas conterem menos de um litro?

b) No máximo 2 conterem menos de um litro?

c) Pelo menos 2 conterem menos de litro?

d) Todas conterem menos de um litro?

e) Todas conterem o volume indicado no rótulo?

f) Represente a função de probabilidade da variável aleatória em questão.

2. Qual a probabilidade de, em 10 lançamentos de um dado perfeito

a) Se obterem 5 faces par?

b) Se obterem 5 faces superiores a 4?

3. Suponha que X tem distribuição binomial, com parâmetros n e p; sabendo que E[X]=5 e

VAR[X]=4, determine n e p.

4. Admite-se ser de 0,4 a probabilidade de que um cliente que entre no supermercado M

realize despesa superior a 1000$00.

a) Qual a probabilidade de, em 3 clientes:

 Nenhum realizar despesa superior a 1000$00?

 No mínimo 2 gastarem mais de 1000$00?

b) Qual a probabilidade de, em 15 clientes:

 Nenhum realizar despesa superior a 1000$00?

 No mínimo 2 gastarem mais de 1000$00?

5. Se for estimada em 0,3 a probabilidade de uma pessoa contactada realizar uma

compra, calcule a probabilidade de um vendedor que visita num dia 16 pessoas:

a) Realizar 5 vendas?

108
Estatística
b) Realizar entre 4 e 8 vendas?

c) Realizar quanto muito 2 vendas?

d) Realizar no máximo 10 vendas?

e) Realizar pelo menos 12 vendas?

f) Realizar no mínimo 3 vendas?

g) 25% realizarem compras?

h) Seja de 0,5 a proporção das que realizam compras?

i) Continuando o vendedor a visitar 16 pessoas diariamente, qual o seu número médio

diário de vendas?

6. Estima-se que 70% dos acidentes rodoviários estejam relacionados, directa ou

indirectamente, com as más condições da rede rodoviária nacional. Qual a

probabilidade de, em 8 acidentes:

a) 5 estarem relacionados com o mau estado das estradas?

b) Entre 3 e 6 estarem relacionados com o mau estado das estradas?

7. Dum lote de 100 peças, das quais 20 são defeituosas, escolheu-se ao acaso uma

amostra de 10. Qual a probabilidade de nessa amostra:

a) Haver 3 defeituosas?

b) Haver 5 defeituosas?

8. O número de chamadas que chegam num período de 5 minutos à central telefónica de

uma empresa é uma variável aleatória com distribuição de Poisson, de parâmetro  =10.
Calcule a probabilidade de num período de 5 minutos:

a) Chegarem exactamente 8 chamadas?

b) Chegarem menos de 5?

c) Chegarem no mínimo 3?

d) Chegarem pelo menos 20?

e) Não chegar nenhuma?

9. Retomando os dados do exercício anterior, calcule a probabilidade de num período de

10 minutos, chegarem à central da empresa:

a) 16 chamadas?

109
Estatística
b) Menos de 10?

c) Qual o número esperado de chamadas em 10 minutos? E numa hora?

Capítulo V – Distribuições Teóricas Contínuas

1. Distribuição Uniforme

Se os valores de certa variável aleatória podem ocorrer dentro de um intervalo limitado

 a, b , e se quaisquer dois subintervalos de igual amplitude têm a mesma probabilidade,

então estamos perante uma variável aleatória com distribuição uniforme ou rectangular.

Diz-se que a variável aleatória contínua  tem distribuição uniforme no intervalo  a, b  e


escreve-se
 U a, b

se a sua função de densidade de probabilidade for dada por:

 1
 a xb
f x    b  a
0
 outros valores

Os parâmetros caracterizadores desta distribuição são a e b, que satisfazem a condição

  a  b   .

Facilmente se deduz que a função de distribuição F x  é dada por:

 0 xa
xa
P  x  F ( x)   a xb
b  a
 1 xb

110
Estatística
As duas figuras seguintes representam graficamente a f.d.p da distribuição uniforme e a

sua função distribuição.

f(x) F(x)

1/(b-a) 1

0 a b x 0 a b x

Teorema
Se a variável aleatória  tem distribuição uniforme em  a, b  então

E 
ab
e Var  
b  a 2 .
2 12

Exemplo DC1
O verdadeiro conteúdo de pacotes de leite de certa marca é uma variável aleatória com

distribuição uniforme entre 0,85 litros e 1,05 litros.

Seja  - verdadeiro volume de certa marca de pacotes de leite.

a) A f.d.p desta variável é:

 1
 0.85  x  1.05
f ( x)   0.20

 0 outros valores

b) Pretende-se saber, qual a probabilidade de um pacote de leite ter um volume inferior a

1 litro?

111
Estatística
1
1 3
P(   1)   0.20
dx  .
4
0.85

2. Distribuição Normal ou de Laplace-Gauss

A distribuição normal é sem dúvida uma das distribuições mais utilizadas na estatística.

São inúmeras as variáveis aleatórias que descrevem fenómenos, processos físicos ou

características humanas (peso, altura, etc.) que seguem uma distribuição normal.

Noutros casos, as variáveis não seguem uma distribuição normal mas aproximam-se muito

desta distribuição.

Por outro lado, a distribuição normal desempenha um papel crucial na inferência estatística.

Diz-se que a variável aleatória contínua  tem distribuição normal e escreve-se

  N ;  

se a sua função densidade de probabilidade (f.d.p.) for dada por

2
1  x 
  
f x  
1
e 2   com    x  
 2

onde  e  são os parâmetros caracterizadores da distribuição e que satisfazem

    ,   0 .

Os parâmetros  e  representam respectivamente a média ou valor esperado e o

desvio-padrão daquela distribuição.

Teorema
Se a variável aleatória  tem distribuição normal então:
112
Estatística

E   e Var    2 .

2.1. Características da Distribuição Normal

A função densidade de probabilidade de uma variável aleatória com distribuição normal tem

a forma de sino, é simétrica em relação ao eixo x   e tem pontos de inflexão em

x    .

A função densidade de probabilidade genérica da distribuição normal representa uma

família de distribuições em que cada membro específico dessa família é representado por

determinados valores dos parâmetros  e  . Ou seja, qualquer distribuição normal é

definida por duas medidas: a média  que localiza o centro da distribuição e o desvio-

padrão  que mede a variabilidade de  em torno da sua média.

2.2. Cálculo das Probabilidades na Distribuição Normal

Dado que  e  podem tomar uma infinidade não numerável de valores (

    ,   0 ) então existe também uma infinidade não numerável de diferentes

distribuições normais.

Daí que, para o cálculo de probabilidades, qualquer distribuição normal é transformada na

chamada normal-padrão, ou normal estandardizada.

Esta transformação, que consiste numa mudança de origem (subtracção por  ) e mudança

de escala (divisão por  ) é chamada estandardização.

Isto é, se a variável aleatória  tem distribuição normal de parâmetros  e  , então


 é a chamada normal estandardizada ou reduzida ou ainda normal-padrão.

Sabendo que, se   N  ,   tem E   e Var    2 , facilmente se deduzem os

parâmetros da normal-padrão  :

113
Estatística
    1
E  E    E   
   


1
E  E 


1
     0 .

   
Var   Var   2 Var    
1

   


1
Var   Var  
2


1
 2

0 1
 2

Note-se que  e  são parâmetros que, embora possam ser desconhecidos, são

constantes:

Conclui-se então que:



  N 0,1 .

A função de densidade de probabilidade da normal-padrão  é dada por

z2

 z  
1
.e 2    z   .
2

A respectiva função de distribuição, z  , permite calcular probabilidades em

determinados intervalos:

z   P  z 

A consulta na tabela permite concluir, a título de exemplo que:

a) P  0  0  0,5

b) P  1,15  1,15  0,8749

c) P  0,87  1  P  0,87  1  0,87  1  0,8078  0,1922 .


114
Estatística

Como  z  é simétrica, tem-se que  z   1  z  , como se ilustra na figura seguinte:

 z  1   z 

-z z Z

 z 

z Z

Exemplo DC2
O tempo em horas que um grupo de operários leva a executar determinada tarefa tem

distribuição normal com média 1000 horas e desvio padrão 200 horas.

Qual a probabilidade de os operários terminarem a tarefa em menos de 1200 horas e mais

de 800 horas?

Seja  - tempo (medido em horas) que determinado grupo de operários leva a executar

determinada tarefa

  N   1000;   200

115
Estatística
 800  1000 1200  1000 
P800    1200  P   
 200 200 

 P 1    1  1  1  1  0,8413  1  0,8413  0,6826 .

3. Distribuição Exponencial

A distribuição exponencial está intimamente relacionada com o processo de Poisson. De

facto, demonstra-se que, num processo de Poisson, o “tempo” de espera até ao primeiro

sucesso (ou entre dois sucessos consecutivos) segue uma certa distribuição exponencial.

Esta distribuição é também usualmente utilizada na descrição do tempo de vida (de

componentes, organismos, etc.).

Diz-se que a variável contínua  tem distribuição exponencial e escreve-se

  exp 

se a sua função densidade de probabilidade for dada por

f x   .e x , x0

onde  é o parâmetro caracterizador da distribuição, sendo   0 .

Facilmente se deduz que a sua função de distribuição F x  é dada por:

F x   1  .e x , x  0 .

Teorema

Se  tem distribuição exponencial de parâmetro  , então

E   e Var  


1 1
.
 2

116
Estatística

Exemplo DC3
Consideremos agora a situação do exemplo DD5 do capítulo anterior, em que, pretendemos

contar o número de camiões TIR, que passam, por hora, na ponte 25 de Abril. É aí assumido

 , definida como:

 - número de camiões que passam, por hora, na ponte 25 de Abril

Segue a distribuição de Poisson de parâmetro e, isto é   p8 .

Defina-se agora uma outra variável  :

 - tempo de espera até à passagem do primeiro camião TIR .

O que é esperar pelo menos y tempo até que passe o primeiro camião TIR? É assumir que

no intervalo (0, y) não passa qualquer camião.

Sabe-se que, se em uma hora passam em média 8 camiões, então no intervalo referido

passam em média 8(y–0)=8y camiões.

Assim, tem-se que, definindo que  y - número de camiões TIR em (0, y),

 y  p8 y  .

e 8 y 8 y 0

Então, P  y   P  y  0   0!
 e 8 y

Fy  y   P  y  1  P  y  1  e 8 y

sendo, portanto, f y  y   8.e 8 y , ou seja,   exp8 .

117
Estatística
Exercícios

1. O tempo de duração de pequenos anúncios (anúncios entre 5 e 12 segundos) numa

cadeia de televisão é aleatório, admitindo seguir uma distribuição uniforme.

a) Indique a f.d.p. correspondente.

b) Qual a probabilidade de um anúncio ter uma duração inferior a 8 segundos? E entre

8 e 12 segundos?

c) Qual a duração média por anúncio?

2. O verdadeiro peso de sacos de um quilo de café de certa marca é aleatório e

apresenta uma densidade de probabilidade uniformemente distribuída entre 0,8 e

1,05 kg.

a) Indique a f.d.p. correspondente.

b) Qual a probabilidade de um saco de café pesar menos de um quilo?

c) Qual o peso médio dos referidos sacos?

3. A variável aleatória X segue uma distribuição normal de parâmetros   20 e

  3 . Determine as seguintes probabilidades:

a) P  23 .

b) P  14 .

c) P  21 .

d) P  17.

e) P21,5    25 .

f) P16,2    18,8 .

g) P17    29,3 .

118
Estatística
4. O tempo (em minutos) que um operário leva a executar certa tarefa é uma variável

aleatória com distribuição normal de   72 min. e   12 min. . Qual a probabilidade

de que:

a) A tarefa leve mais de 93 minutos a executar?

b) Não leve mais de 65 minutos a executar?

c) Leve entre 63 e 78 minutos a executar?

d) Determine os valores de a e b tais que: P  a  0,2525 e P  b  0,0054 .

5. O diâmetro de um cabo eléctrico é normalmente distribuído com parâmetros 0,8 e

0,04.

a) Qual a probabilidade de que o diâmetro ultrapasse 0,81?

b) Qual a probabilidade de que o diâmetro ultrapasse 0,85?

c) Qual a probabilidade de que o diâmetro não ultrapasse 0,85?

d) Qual a probabilidade de que o diâmetro ultrapasse 0,75?

e) Qual a probabilidade de que o diâmetro se situe entre 0,78 e 0,83?

6. O tempo (em minutos) que um operário leva a executar certa tarefa é uma variável

aleatória com distribuição normal.

Sabe-se que a probabilidade de o operário levar mais de 13 minutos é de 0,0668 e a

de demorar menos de 8 minutos é de 0,1587.

a) Calcule o tempo médio requerido para efectuar a tarefa, e o respectivo desvio

padrão.

b) Calcule a probabilidade de o operário demorar entre 9 e 12 minutos a executá-la.

7. sabe-se que as alturas dos 13 400 estudantes de uma universidade têm uma

distribuição normal com   174cm e   12cm . Determine o número de estudantes

com altura inferior a 186 cm.

119
Estatística
Capítulo VI - Aproximação de Leis Teóricas

1. Aproximação da distribuição hipergeométrica à distribuição binomial

Seja  h( N ,n, p) . Com n e p fixos,

C xNp C nNxNp
lim  C xn p x 1  p n  x
N  C nN

Temos assim que quando N é grande comparado com n, a diferença entre retirar

elementos com ou sem reposição é insignificante e tanto mais insignificante quanto maior

for N. Nestes casos e por facilidades de cálculo, aplica-se a distribuição binomial.

Consideramos que a distribuição binomial oferece uma boa aproximação da distribuição

hipergeométrica quando n
 0.05 .
N

  h ( N , n, p ) 

n    apr B ( n, p )
 0.05 
N 

2. Aproximação da distribuição binomial à distribuição de Poisson

Seja   b(n, p) . Quando n  e p0 , mantendo-se constante o produto np , a

distribuição binomial converge para a distribuição de Poisson. Em termos práticos poder-

se-á utilizar a distribuição de Poisson quando n20 e p0.05 .

  b(n, p) 

n 20     apr p(np)
p0.05 

120
Estatística
Exemplo LT1
Uma companhia de seguros possui 10.000 apólices no ramo vida referente a acidentes de

trabalho. Sabe-se que, por ano, a probabilidade de determinado indivíduo morrer de

acidente é de 0.0001.

Qual a probabilidade de a companhia de seguros ter de pagar por ano a pelo menos 4 dos

seus segurados?

Seja  - número de apólices, em 10.000, que são pagas anualmente pela seguradora.

  b10000, 0.0001

Como n=10000 e p=0.0001 existem condições para fazer a aproximação à distribuição de

Poisson.
  apr p  np  1

Pretende-se então saber:


3
1 x .e 1
P  4  1  P  3  1   =1–0,981=0,019
x 0 x!

3. Aproximação da distribuição binomial à distribuição normal

Seja  n  b(n, p) .


  n np  
A sucessão de variáveis aleatórias   converge em distribuição para uma

 np (1 p ) 
 nIN

variável aleatória normal reduzida N (0,1) . Temos assim que quando n  a distribuição

binomial aproxima-se da distribuição normal. Em termos práticos, e constatando que quando

p0.5 a distribuição binomial é simétrica, poder-se-á utilizar a distribuição normal como

uma boa aproximação da distribuição binomial quando np10 e n(1 p)10 .

121
Estatística
  b(n, p) 
np 10


   apr N np, np (1  p ) 
n(1 p)10 

Nestes casos em que se está aproximar uma distribuição discreta a uma distribuição

contínua, aplica-se a chamada correcção de continuidade, obtendo-se desse modo melhores

resultados:

 a  1 2  np b  1 2  np 
Pa    b  P    , em que   N (0,1) .
 np 1  p  np 1  p  

Exemplo LT2

Um processo de fabrico produz parafusos, dos quais 2% são defeituosos. Se retirarmos

uma amostra de 2000 parafusos para inspecção, qual a probabilidade de que pelo menos 15

parafusos e não mais de 25 sejam defeituosos?

Seja  - número de peças defeituosas, em 2000.

  b2000, 0.02

Pretende-se: P15    25 =?

Como
np = 20000.02=40 >10 e 2000(0.98)=1960 >10

podemos aproximar à normal


  apr N 40, 39.2 

Com a devida correcção de continuidade temos então que:

 15  0.5  40 X  40 25  0.5  40 
P15    25  P     P 4.07    2.32

 39.2 39.2 39.2 
122
Estatística
=[1–(2.32)]–[1–(4.07)]=1–0.9898–1+1=0.0102

4. Aproximação da distribuição de Poisson à distribuição normal

Seja   p( ) .

u2
   1
x

lim P 
 
 
 x 
 2
e 2 du


Temos assim que quando    a distribuição de Poisson aproxima-se da distribuição

normal. Obtém-se já uma aproximação satisfatória para 30 , mas em termos práticos,

podemos considerar a aproximação à distribuição normal para 20 .

  p( ) 
   apr N ( ,  )
  20 

Obtêm-se melhores resultados, tal como no caso anterior, em que se está a aproximar uma

distribuição discreta a uma distribuição contínua, aplicando-se a chamada correcção de

continuidade.

Exemplo LT3

O número de avarias que uma máquina tem por dia é uma variável aleatória com distribuição

de Poisson de média 0,2.

Pretende-se calcular a probabilidade de a referida maquina ter durante um ano

exactamente 75 avarias.

Seja  - número de avarias que uma maquina tem por dia   p0,2 .

Seja  - número de avarias que uma maquina tem por ano   p0,2  365  73 (a

distribuição de Poisson é aditiva).

Como =73>20 podemos aproximar esta distribuição à normal,

123
Estatística


Y  apr N 73, 73 

Então o que pretendemos é, com a respectiva correcção de continuidade:

 74.5  73 75.5  73 
P75  0,5  Y  75  0,5  P Z   0,29  0,18  0,6141  0,5714  0,0427
 73 73 

5. Teorema do limite central

de variáveis aleatórias independentes e identicamente


Dada a sucessão
 X n  n  IN
n
 i  n 
distribuídas (i.i.d.), com E ( i ) e V ar ( i ) , a sucessão Yn nIN , n 
2 i 1
,
 n
converge em distribuição para uma variável aleatória normal reduzida N (0,1) .

 i , i.i.d . 

E  i    
2
n
   i  apr N n , n  
Var  i     i 1

n grande 

 i , i.i.d . 

E  i    
2
   apr N  ,   n 
Var  i    

n grande 

 i , i.i.d . 

E  i     
2
  apr N 0, 1
Var  i      n

n grande 
n
 i
i 1
sendo   .
n
124
Estatística

Resumo

Distribuição
Parâmetros Distribuição que se aproxima

Hipergeométrica n Binomial
 0.05
H(N, n, p ) N X~ apr B(n, p)

Binomial Poisson
n>20 e p<0.05
B(n, p) X~ apr P(np)

Binomial np>10 Normal

B(n, p) n(1–p)>10 
X~aprN np, np(1  p) 
Poisson Normal

P() >20 X~aprN(,  )

125
Estatística
Exercícios

1. Admita que numa certa cidade o número de filiados num certo clube de futebol é

100 000, sendo 2 000 000 a população da cidade.

Tendo-se escolhido ao acaso 10 dessas pessoas,

a) obtenha a distribuição da variável aleatória definida como “número de filiados no

clube de futebol que fazem parte da amostra”.

b) determine a média e a variância da variável aleatória definida na alínea a).

c) calcule a probabilidade de que na amostra de 10 pessoas exista, pelo menos, dois

filiados no clube de futebol.

2. De um lote de 300 peças retiram-se 5. Admitindo que a percentagem de peças

defeituosas no lote é de 1%, calcule a probabilidade de, entre as 5 peças retiradas,

haver pelo menos uma que é defeituosa.

3. Sabe-se que 3% dos condutores conduzem com uma percentagem de álcool no

sangue superior ao nível fixado pela lei.

a) Qual a probabilidade de em 15 condutores escolhidos ao acaso, haver no máximo

1 condutor a conduzir com uma percentagem de álcool no sangue superior ao nível

fixado pela lei.

b) Qual a probabilidade de em 200 condutores escolhidos ao acaso, haver pelo

menos 8 condutores a conduzir com uma percentagem de álcool no sangue

superior ao nível fixado pela lei.

4. Sabe-se que a probabilidade de um indivíduo ter uma má reacção a uma injecção de

um soro é de 0,001. Determine a probabilidade de, num grupo de 2000 pessoas

vacinadas, haver quando muito três que têm uma má reacção à injecção.

126
Estatística
5. Suponha que 0.2% dos indivíduos de uma determinada população são canhotos.

Sendo X o “número de canhotos existentes numa amostra (com reposição) de 1000

indivíduos dessa população”, determine a PX  1 e PX  3 .

6. Uma agência de publicidade afirma que 40% das donas de casa que recebem a visita

de um vendedor de enciclopédias, acabam por encomendar uma. De 12 donas de casa

que recebem a visita de um vendedor, qual a probabilidade de:

a) no máximo 3 encomendarem a enciclopédia?

b) no mínimo 5 encomendarem a enciclopédia?

c) entre 3 e 6 ( inclusive ) encomendarem a enciclopédia?

d) Se o vendedor numa semana abordar 100 donas de casa, qual a probabilidade de

entre 45 e 65 donas de casa encomendarem a enciclopédia?

e) Se o vendedor numa semana abordar 100 donas de casa, quantas enciclopédias

espera ele vender?

7. Uma emprese comercializa garrafas de vinho do Porto de 1 litro. Supõe-se que 40%

dessas garrafas contêm realmente uma menor quantidade de líquido do que o indicado

no rótulo.

Em 100 garrafas existentes numa loja, qual a probabilidade de:

a) haver 30 com menos de um litro;

b) haver entre 44 e 50 com menos de um litro.

8. O número de acessos, por dia, a um certo site da Internet é uma variável aleatória

com distribuição de Poisson de parâmetro =30.

a) Calcule P X  40 .
b) Qual a probabilidade de o número de acessos de uma semana (7 dias) se situar

entre 200 e 220?

127
Estatística
9. O professor de Probabilidades e Estatística de uma certa Universidade tem 500

alunos inscritos na respectiva cadeira. Faz parte das regras de avaliação dessa

universidade que os alunos com resultado no exame no intervalo 8,10 , tenham de


realizar oral de cujo júri faz parte o professor da cadeira.

Admita, pela experiência em anos anteriores, que 20% dos alunos têm de fazer orais.

Admita ainda que o tempo médio gasto numa oral é de meia hora e que a variância é

também meia hora.

Face a estes elementos,

a) Obtenha a distribuição do tempo que o professor em causa teria de dedicar à

realização de orais para dar cumprimento exacto ao regulamento.

b) Se a duração do semestre for de 15 semanas de aulas e o professor der por semana

6h de aula, calcule a probabilidade de que o professor gaste com as orais mais

tempo do que o dedicado à leccionação.

10. Admita que o passo de uma certa pessoa, isto é, a distância que essa pessoa avança

a dar um passo, é uma variável aleatória X com distribuição normal, média 1 metro e

desvio padrão 10 cm.

Obtenha a distribuição da distância percorrida por essa pessoa ao dar 1000 passos,

admitindo que a distância percorrida num passo não depende da distância percorrida

em passos anteriores. Qual o valor médio e variância dessa variável aleatória?

11. Considerem-se as variáveis aleatórias X 1 , X 2 ,..., X 30 , com distribuição uniforme no

intervalo (0, 10).

 30 
a) Determine P 

X i 1
i  170 .

 
30
Xi
b) Determine P X  5,5 . (onde X  
i 1 n
)

128
Estatística
Capítulo VII – Inferência Estatística

1. Amostra casual ou aleatória

O processo de amostragem, isto é, o processo seguido para escolher os elementos da

população a incluir na amostra, condiciona as inferências ou as conclusões permitidas a partir

da amostra. Quando o observador, numa perspectiva inferencial, se debruça sobre uma

amostra de n observações, seja x1 , x 2 ,..., xn  , supõe que tal amostra é uma realização de n

variáveis aleatórias 1 , 2 ,..., n  . Diz-se que se trata de amostragem casual ou aleatória

quando as n variáveis aleatórias observadas, X i , i1,2,...,n , são independentes e


identicamente distribuídas, i.i.d..

2. Estimação

Para que o comportamento duma variável aleatória seja conhecido, basta conhecer a sua

distribuição e o valor dos parâmetros caracterizadores dessa distribuição. Um parâmetro é

um valor caracterizador da população que, embora seja desconhecido, é fixo. Deste modo os

parâmetros duma população só serão conhecidos se for possível estudar todos os indivíduos

dessa população, donde a necessidade em retirar uma amostra dessa população e estimar

esses parâmetros a partir dos valores amostrais, inferindo assim da amostra para a

população. Uma estatística é uma característica da amostra, isto é, é uma função da amostra,

assumindo portanto valores diferentes para diferentes amostras, ou seja, trata-se duma

variável aleatória.

2.1. Estimação Pontual

De entre as estatísticas, há algumas especiais que se designam por estimadores. Um

estimador fornece um valor concreto para um determinado parâmetro da população que se

desconhece. A selecção de um estimador entre vários possíveis é feita com base num

conjunto de propriedades consideradas desejáveis para um “bom” estimador.

129
Estatística

Propriedades de um bom estimador em pequenas amostras

i. Não enviesamento:

Um estimador ˆ diz-se não enviesado ou centrado para  se E ˆ   . 


ii. Eficiência:

Um estimador ˆ diz-se eficiente se dentro da classe dos não enviesados

tiver variância mínima.

iii. Suficiência:

Um estimador ˆ diz-se estimador suficiente , se utiliza toda a informação

disponível na amostra, relevante para a estimação  .

Propriedades de um bom estimador em grandes amostras

i. Não enviesamento assimptótico:

Um estimador ˆn diz-se não enviesado assimptóticamente quando lim E ˆn   .


n 
 

ii. Consistência:

Um estimador ˆ diz-se consistente se lim P(| ˆn   |  )  1 ,   0 ou


n 

quando lim E ((ˆn   ) 2 )  1 .


n 

iii. Eficiência assimptótica:

Um estimador ˆ é assimptóticamente mais eficiente, se de entre os

estimadores consistentes, for aquele cuja distribuição assimptótica tem

variância mínima.

Exemplo IE1
n
 i
i 1
1) A média amostral ̂    é um estimador para a verdadeira média da
n

população E(X i ) .


130
Estatística

n
 (  i  )
i 1
2) A variância amostral ̂ 2  S 2  é um estimador para a verdadeira
n

variância da população Var ( i ) 2 .


n
 (  i  )
i 1 n 2
Temos ˆ  S ' 
2 2
 S , variância amostral corrigida, como sendo um
n1 n1

estimador para a verdadeira variância da população Var () 2 , com melhores

propriedades que S 2 .

2.2. Estimação por intervalos

Na estimação por intervalos, em vez de se indicar um valor concreto para certo parâmetro

da população, constroi-se um intervalo, que com certo grau de certeza previamente fixado,

contenha o parâmetro em causa. Estes intervalos, denominados intervalos de confiança,

permitem assim medir a precisão de um estimador.

Para construir um intervalo de confiança é necessário encontrar um estimador pontual,

estabelecer um nível de confiança igual a 1 , conhecer a dimensão da amostra e conhecer

a distribuição do estimador.

 Intervalo de confiança a (1–) 100% para a média duma população normal, com

desvio padrão , conhecido:

Sabe-se que

 i independen tes 
 
  N (0,1)

 i  N  , 2
 
  n

Queremos determinar  tal que

131
Estatística
   
P(| | ) P   1 .
  n  n
 

O intervalo assim construído é centrado na média amostral, visto que como a função

densidade de probabilidade duma distribuição normal estandardizada é simétrica em

relação a z0 , a amplitude do intervalo é mínima para valores de Z que sejam

simétricos, donde a precisão é maior.

Obtém-se deste modo o seguinte intervalo para a média verdadeira da população, :

  1  1 
   1   2,    1   2 
 n n 

onde a função  representa a função distribuição de Z (variável aleatória normal

estandardizada).

Exemplo IE2

Pretendemos estimar a média de uma população da qual se conhece .


A função contém na sua expressão , o parâmetro a estimar, e não contém qualquer
 n

outro parâmetro desconhecido. A sua distribuição, N(0, 1), não depende de nenhum valor que

se ignore. Logo, aquela função pode ser utilizada como variável fulcral na construção do

intervalo de confiança para . Pretendemos que P(| X –|)<95%.

Temos então =5. E o intervalo será:

  1  1 
   (1.5),    1 (1.5),    (1.5) 
 n n 

   
=   1.96,    1 (1.5),   1.96  ]I0.95[
 n n 

132
Estatística

Supondo que n=100, x =200000 e =4000, (valores dados ou calculados)

Tínhamos

 4000 4000 
]I0.95[=  200000  1.96  ;200000  1.96   =]199216; 200784[
 100 100 

 Intervalo de confiança a (1–)100% para a média duma população não normal,

com desvio padrão , conhecido ou desconhecido:

Usa-se o teorema do limite central:

 i , i.i.d . 

E  i     
2
  apr N 0, 1
Var  i      n

n grande 

3. Testes de Hipóteses Paramétricos

Em várias áreas de economia e gestão é necessário, muitas vezes, decidir entre opções

alternativas. Esta decisão comporta um risco, risco de errar, que pode ser controlado e

minimizado.

Vão-se estudar métodos que possibilitem validar ou não determinadas afirmações sobre os

parâmetros de uma população.

Designe-se a hipótese a testar ou hipótese nula por H 0 e a hipótese alternativa por H1


(as hipóteses que admitem um único valor para o parâmetro dizem-se simples, as que

admitem mais do que um valor dizem-se compostas).

O teste consiste em optar por uma das duas hipóteses H 0 ou H 1 com base numa amostra.

Ao proceder ao ensaio de H 0 podem cometer-se dois tipos de erro antagónicos:

133
Estatística
 se H 0 é verdadeira e é rejeitada comete-se um erro de 1ª espécie ou erro de

tipo I que se designa por  ;

 se H 0 é falsa e é aceite comete-se um erro de 2ª espécie ou erro de tipo II que

se designa por  .

Situação Real

H0 H1

Decisão H0 isenção de erro  (erro de tipo II)

H1  (erro de tipo I) isenção de erro

  P(Re jeitar H 0|H 0 verdadeira )

  P( Aceitar H 0 |H 0 falsa)

A formulação das hipóteses deve ser anterior à recolha da amostra, para que o

procedimento não seja enviesado. É a informação da amostra que vai ser confrontada com

os critérios entretanto estabelecidos para decidir da rejeição ou não da hipótese nula.

Seria desejável que tanto  como  fossem o mais pequenos possível. Como os dois tipos de
erro variam em relação inversa, a única saída consiste em aumentar o tamanho da amostra

para dessa forma fazer baixar  e  simultaneamente, ou apenas um deles, mantendo o

outro fixo.

É essa a abordagem que se faz num teste de hipóteses, onde o valor de  ( chama-se o

nível de significância do teste ) é fixado à partida, sendo geralmente um valor baixo, 0.01

ou 0.05. Por isso é preferível muitas vezes dizer “não rejeitar H 0” a dizer “aceitar H 0 ” e

por isso muitas vezes a afirmação a provar é colocada na hipótese alternativa.

Em determinadas situações pode ser vantajoso procurar um equilíbrio. A cada tipo de erro

está associado um custo, e depende do julgamento do decisor qual dos erros é mais

gravoso, isto é, se traduz num custo maior.

134
Estatística

Seja 1 ,  2 ,  ,  n  uma amostra casual da população em causa. A regra de decisão

consiste em estabelecer uma região W, no espaço das amostras possíveis de IR n, tal que:

se 1 ,  2 ,  ,  n W rejeita-se H 0

se 1 ,  2 ,  ,  n W não se rejeita H 0

W designa-se por região crítica ou região de rejeição, denominando-se o seu

complementar por região de aceitação.

O aspecto fundamental da teoria do ensaio de hipóteses prende-se com a escolha da região

crítica W  IRn, que permita controlar a probabilidade de cometer cada um dos tipos de

erro.

Metodologia utilizada

1 Formulação das hipóteses e fixação do nível de significância  .

2 Escolha da estatística T adequada ao ensaio.

3 Estabelecimento da regra de decisão ( determinação da região crítica ).

4 Recolha da amostra.

5 Tomada de decisão.

Nota

Se as condições de aplicabilidade de um certo teste não forem verificadas, a validade das

conclusões é posta em causa.

3.1. Ensaio para a média  duma população normal com variância  2

conhecida

Formulação das hipóteses e região crítica:

135
Estatística

Testes unilaterais:

H 0 :  0
H 1:  0

Região crítica: RC = : c 

H 0 :  0
H 1:  0

Região crítica: RC = : c 

H 0 :  0
H 1:  0

Região crítica: RC = : c 

H 0 :  0
H 1:  0

Região crítica: RC = : c 

H 0 :  0
H 1: 1
 
Região crítica: RC = : c se 1   2

Região crítica: RC = : cse 1   2

Testes bilaterais:

H0:   0 
Região crítica: RC =  :    0 c 
H1:    0

Estatística a usar e respectiva distribuição amostral:

136
Estatística
 0
T ~ N (0,1)
 n

3.2. Ensaio para a média  duma população de distribuição desconhecida

(para amostras grandes)

Estatística a usar e respectiva distribuição amostral:

Para n grande, pelo Teorema do Limite Central,

 0
T  apr N 0,1 , com variância  2 conhecida
 n

 0
T  apr N (0,1) , com variância  2 desconhecida
S n

3.3. Ensaio para a proporção p duma população de Bernoulli

Estatística a usar e respectiva distribuição amostral:

1, se sucesso
Para n grande,  estimador de p, onde  i  ,
 0, se insucesso

 p 0
T  apr N (0,1)
p 0 (1 p 0 )
n

137
Estatística
3.4. Ensaio para a diferença de duas médias de populações normais com

variâncias  12 e  22 conhecidas

Sejam duas amostras aleatórias retiradas de duas populações normais  1 e 2

independentes, com dimensões n1 e n 2 respectivamente.

Estatística a usar e respectiva distribuição amostral:

1   2 estimador de 1   2 ,

T
 1   2  1  2   N (0,1)
 12  22

n1 n2

3.5. Ensaio para a diferença de duas médias de populações de distribuições

desconhecidas (para amostras grandes)

Sejam duas amostras aleatórias retiradas de duas populações  1 e  2 independentes

com dimensões n1 e n 2 respectivamente.

Estatística a usar e respectiva distribuição amostral:

Para n1 e n 2 grandes, 1   2 estimador de 1   2 ,

 T
X 1 X 2  1  2 
~ N(0,1) , com variâncias  12 e  22 conhecidas
apr
  2 2
 1 2

n1 n 2

138
Estatística

 T
X 1 X 2  1  2 
~ N(0,1) , com variâncias  12 e  22 desconhecidas
apr
2 2
s s
 1 2

n1 n 2

Exercícios

Estimação e intervalos de confiança

1. Considere uma variável aleatória  normal de variância igual a 4.

a) Determine um intervalo de confiança a 80% para a média de  , com base na

amostra (9,14,10,12,7,3,11,12) .

b) Qual devia ser o nível de confiança a utilizar para que a amplitude do intervalo

fosse de 2,77?

2. Da experiência passada admite-se que o peso, em gramas, de certas embalagens, se

comporta normalmente com uma dispersão dada por  5 gramas.

a) Construa um intervalo de confiança a 99% para a média, sabendo que numa

amostra de 100 embalagens, se obteve o peso médio de 905 gramas.

b) Determine a dimensão que a amostra deverá ter para se obter um intervalo de

confiança a 99% com amplitude igual a 2.2.

Testes de hipóteses

1. O ministério da Saúde afirma que, com os meios agora postos à disposição dos

Hospitais Civis, o número médio de dias de internamento é no máximo 15. Estas

declarações foram postas em causa por alguns gestores hospitalares que decidiram

proceder em conjunto à recolha de uma amostra de 225 doentes onde se observou

que o número médio de dias de internamento foi de 18. Com base nestes dados, e

139
Estatística
supondo que a variável em estudo segue uma distribuição normal com desvio padrão

de 15 dias, responda:

a) Terão os gestores hospitalares razão? Justifique convenientemente a sua resposta,

utilizando o teste adequado, a 1% de significância. Na decisão que tomou, qual a

probabilidade de estar a cometer um erro?

b) Com que probabilidade é dada razão aos gestores hospitalares, se o verdadeiro

número médio de dias de internamento for 17?

c) Como variava aquela probabilidade se a hipótese alternativa fosse superior ao valor

especificado na alínea b)? E se o tamanho da amostra aumentasse?

2. O departamento de controle de qualidade de uma firma produtora de conservas de

alimentos especifica que o peso líquido médio por embalagem de certo produto deve

ser de 500 gramas. Experiência passada indica que os pesos são normalmente

distribuidos com desvio padrão 15 gramas. Se numa amostra de 20 embalagens for

encontrado um peso líquido médio de 495 gramas, constitui isso prova suficiente de

que o verdadeiro peso médio é inferior ao estabelecido? ( 0.05) .

3. Um vendedor diz que 10% das lâmpadas de uma certa marca são defeituosas.

Rejeitaria a afirmação do vendedor para  0.05 , sabendo que

a) tendo-se examinado 15 dessas lâmpadas se verificou que 3 eram defeituosas?

b) tendo-se examinado 100 dessas lâmpadas se verificou que 24 eram defeituosas?

4. Uma firma tem seguido a política de oferecer uma garantia de 2000 utilizações

para determinado aparelho que vende. Esse procedimento baseia-se em estudos

levados a efeito no período inicial de produção, que indicaram um número médio de

utilizações possíveis por aparelho de 2060 com uma variabilidade traduzida por

 20 . Existindo indícios de que presentemente a situação pode ter mudado

(diferente qualidade dos materiais utilizados, condições de fabrico alteradas, mais

experiência, etc.), pretende-se averiguar se continua a ser de 2060 o número médio

140
Estatística
de utilizações possíveis por aparelho. Proceda ao ensaio apropriado (supondo que 
se mantém), sabendo que 10 aparelhos seleccionados ao acaso e testados pela firma

forneceram os seguintes valores: 2100, 2025, 2071, 2067, 2150, 2115, 2064, 2088,

1995, 2095. Suponha que o número de utilizações permitidas por aparelho se

comporta de forma aproximadamente normal.

5. Suponha que se registaram os seguintes tempos de actuação de duas companhias de

ambulâncias de uma pequena aldeia ( do instante em que a mensagem é recebida ao

momento em que o paciente chega à sala de urgências do hospital ):

Companhia 1: 10.2 9.1 9.3 10.7 7.8

Companhia 2: 10.1 10.3 9.7 12.1 8.1

Com base nestes dados, e para um nível de 0.05 poder-se-á rejeitar a hipótese das

duas companhias serem igualmente rápidas? Suponha que os tempos de actuação são

variáveis aleatórias normalmente distribuídas com variância comum  2 1 .

141
Estatística
Tabelas de Distribuição

Tabelas de Distribuição

142
Estatística

143
Estatística

144
Estatística

145
Estatística

146
Estatística

147
Estatística

148
Estatística

149
Estatística

150
Estatística

151
Estatística

152
Estatística

153
Estatística

154
Estatística

155
Estatística

Soluções dos Exercícios da Sebenta

CAPÍTULO 1
  272,4
c1) 30% 9. a) Me=200 a)   53,3
1. Mo=200
13. Me=54,4
c2) 47,5% 10. 1,71 m b) Mo=72,2
Distribuição
6. c) 38% a) 47 c) Assimétrica
Negativa
  24,9
c) 6 11. b) 15 b) Me=25,4
Mo=25,8
7. 14.
  4,5
d) 77% d)   129,85 d)
 2  20,24
  28,08
Me=28,33
  22,82 Mo=28,39
Para Grupo
a) Me=23 a) 118 15. de operários   4,87
Mo=20
CV=17,34
G  0,15
  38,45   3,79
8. b) Me=23 12. b) 38 19. Me=3
Mo=20 Mo=3
  4,125 O nível médio de
vendas da loja A é
c) Me=4 c) 26 a) inferior ao da loja
Mo=1;4;5 B
  108,75 20.
  126,34 ; Distribuição
d) Me=108,5
Mo=105;113
e) 101,150 b) Assimétrica
Positiva

156
Estatística

CAPÍTULO 2
EXERCÍCIOS I

1. 480 c) 1800 12. d) 20183040


8.
a) 260 d) 504 a) 28
2. b) 210 9. 306 13. b) 56
c) 25 a) 125 c) 28
10.
3. 39 b) 60 a) 387420489
a) 125 10. c) 12 14. b) 466560
4.
b) 3125 a) 24 c) 4720
a) 6760000 b) 18 15. 13983816
5. 11.
b) 45697600 c) 12 a) 512
6. 1594323 d) 14 b) 182700
16.
7. log 26 200000 a) 6227020800 c) 281016
a) 4500 12. b) 622080 d) 651456
8.
b) 2240 c) 1036800 17. 15

EXERCÍCIOS 2

a) 1,2,3,4 e) t : t  9 c) 0,348
, 1, 2, 3,  4.
4, 1,2,3,4,  f) t : t  7 d) 0,44
 
1,2, 1,3, 
1.   10.
b) 1,4, 2,3, 
10
5. a) e) 0,44
2,4, 3,4,  4782969
 
1,2,3, 1,3,4,  10
  5. b) f) 0,4
1,2,4, 2,3,4
13983816

A e B não são 0,125;


acontecimentos 6. 0,375; a) 0,0325
independentes, não 0,125.
2. são incompatíveis 11.
nem
complementares a) 0,973 b) 0,11538
7.
a) A B b) 0,99167 a) 0,8485
A B
12.
3. b) a) 0,31734 b) 0,65677
8.
c) AB b) 0,36923 a) 0,03
t : t  7 ; a) 0,2
13.
b) 0,556
a) t : t  9  t  10;
t : t  11 b) 0,58 a) 0,77
t : 10  t  11 ; 9. c) 0,73 14. b) 0,99
b) ;
4. t : 7  t  9 d) 0,4 c) 0,25
t : t  10; e) 0,57143 a) 0,3
c) t : t  7  t  11
t : t  9 a) 0,1 15. b) 0,85
10.
d) t : 9  t  10 b) 0,54 c) 0,206

157
Estatística

CAPÍTULO 3
x 0 1 2
a) 0,2 2/3
-2/3
a) f x 
6 12 2 e) 1/18
20 20 20 3. b) 0,7 8/9

EX  
4
c) 1950
5
b) b) Ver aula
Var  X  
9 a  1 18
1. a)
25
 0 ,x0
 0 ,x0
 6 20 ,0  x  1 
F X      2
F X  x 4  x 36 ,0  x  3
c) 18 20 ,1  x  2 b) c) Ver aula
 
 1 x3
 1 ,x2

d) 0,7 4. c) 7/18
d) Ver aula
e) 0,142857 d) 1/3
0,1
0 6. 4/21
EX  
0,4 13 7/21
b) 0,4 e) 8 e) 12/21
0,9 Var  X   0,734375 1/3
1 6/21
0,9
0 ,x 1 0
2.  0,1 ,1  x  2 5/36
Não são

F  X   0, 4 , 2  x  3
variáveis
c) b) 5/36 f) independe
0,8 ,3  x  4 1
1 ,x4 5.
n-tes
 0
2,7 0 ,x  0
 2
e)
8,4
c)  
F X   x , 0  x 1 g)
-0,0272
0,81  1 -0,0761
x 1
3,24

158
Estatística

CAPÍTULO 4
0,0005
a) 0,3110 4. b) 0,9948 6. b) 0,7334

b) 0,5443 a) 0,2099 a) 0,2092


7.
c) 0,7667 b) 0,7285 b) 0,0215

1. d) 0,004096 c) 0,0993 a) 0,1126


e) 0,0467 d) 0,0084 b) 0,0293
 6  x 6 x
f x    0,4 0,6 5. e) 0,0002 8. c) 0,9972
f)  x
(falta o gráfico) f) 0,9007 d) 0,0034

a) 0,2461 g) 0,2040 e) 0
2.
b) 0,1366 h) 0,0487 a) 0,0646
n=25
3. p=0,2 i) 4,8
9. b) 0,005
0,2160
4. a) 0,3520 6. a) 0,2541 c) 120

CAPÍTULO 5
1 7 ,5  x  12   10
a) f x    f) 0,2426 a)
0 , o.v.  2
3. 6.
1. 3/7
b) 4/7 g) 0,8403 b) 0,5328

c) 17/2 a) 0,0401 7. 11273


4 se 0,8  x  1,05

f x  0
a)  o.v. de x b) 0,281
4.
2. b) 0,8 c) 0,4649
a  80,04
c) 0,9525 d) b  41,4
a) 0,8413 a) 0,4013

b) 0,0228 b) 0,1056
3. c) 0,3707 5. c) 0,8944
d) 0,8413 d) 0,8944
e) 0,2610 e) 0,4649

CAPÍTULO 6
a) Ver aula 4. 0,8571 6. e) 40
1. b) 0,475 5. 0,1429 a) 0,0106
7.
c) 0,0862 a) 0,2254 b) 0,2227
2. 0,05 b) 0,5618 a) 0,8139
6. 8.
a) 0,93 c) 0,6164 b) 0,5284
3.
b) 0,256 d) 0,1788

159

Você também pode gostar