Você está na página 1de 83

Sebenta de Estatistica

Alberto Hermenegildo António Tépulo - Licenciado em Ensino de Matemática na UP Nampula | 1


Sebenta de Estatistica

UNIDADE I: INTRODUÇÃO À ESTATISTICA

1. Origem da Estatística

O termo Estatística, provem do latin status que significa (estado) e foi introduzida na
Alemanha, em 1748, por Achenwall, para denominar levantamento de dados cuja finalidade era
orientar o estado em suas decisões.

A Estatística é uma ciência Matemática interessada nos métodos científicos para colecta,
organização, resumo, apresentação e a análise de dados referentes a uma população ou amostra,
bem como na obtenção de conclusões válidas e na tomada de decisões baseadas em tais análises.

A Estatística desempenha um papel crescente e importante em quase todas as fases da pesquisa


humana. No início a estatística tinha a finalidade de colectar impostos e para fins militares. Mais
tarde tornou-se uma ciência associada á Demografia e epidemiologia. Hoje é aplicada na
Agricultura, Biologia, comércio, educação, química, economia, comunicações, educação,
electrónica, medicina, física, ciências políticas, ciências sociais, psicologia, sociologia e em outros
numerosos ramos do saber.

Estuda-se Estatística para aplicar seus conceitos como auxilio nas tomadas de decisão diante de
incertezas, justificando cientificamente as decisões. Os princípios estatísticos são utilizados em
uma grande variedade de situações no governo, nos negócios e na indústria, bem como no âmbito
das ciências sociais, biológicas e físicas. A estatística presta-se a aplicações operacionais e de
pesquisa, sendo efectiva não só em experimentos de laboratório, mas também em estudos fora
dele.

A Estatística divide-se e dois grandes ramos: A Estatística Descritiva (ou dedutiva) e a


Estatística Inferencial (ou indutiva). A Estatística Descritiva fornece técnicas de recolha,
organizações, apresentação, sumarização e interpretação de dados. A Estatística inferencial
consiste no método científico de tirar conclusões duma certa população a partir de resultados ou
dados amostrais.

Alberto Hermenegildo António Tépulo - Licenciado em Ensino de Matemática na UP Nampula | 2


Sebenta de Estatistica

1.1. Conceitos básicos da Estatística

Há termos usados em Estatística que têm um conceito ligeiramente diferente do utilizado


na linguagem comum. A seguir são apresentados alguns conceitos fundamentais usados no
contexto estatístico.

i. População ou universo

É um conjunto de objectos ou indivíduos que têm pelo menos uma característica em


comum e com potencial interesse para o estudo.

Exemplos: população de empresas da indústria Mineira em Moçambique em certa data,


Estudantes matriculados nas universidades públicas de Moçambique, população de salários pagos
na construção civil em Moçambique em Dezembro de 2013, a população de carros fabricados
numa firma, todas as pessoas que compram telefone celular.

Uma população pode ser finita (reais) ou infinita (Hipotéticas). É finita quando o processo
de contagem dos seus elementos tem fim. Por exemplo número de habitantes da cidade de
Nampula constitui uma população finita.

Uma população é infinita se a quantidade de unidades de observação é ilimitada, ou a sua


composição é tal que as unidades da população não podem ser contadas. Por exemplo os cristais de
açúcar numa embalagem de 1 kg.

ii. Amostra

Na impossibilidade, na maioria das vezes, do tratamentos de todos elementos da população,


retira-se dela um subconjunto finito que se supõe representativo e se designa por amostra.
Portanto, amostra é uma parte representativa duma de uma população. Por exemplo, para se testar
Alberto Hermenegildo António Tépulo - Licenciado em Ensino de Matemática na UP Nampula | 3
Sebenta de Estatistica

se alguém tem ou não malária, tira-se uma pequena amostra de sangue para o teste de plasmódio, e
não todo sangue do indivíduo. Para se saber a opinião dos munícipes da cidade de Nampula em
relação ao desempenho da edilidade selecciona-se de forma aleatória uma parte da população e não
todos os munícipes.

Raramente é possível analisar todos elementos de uma população finita. Vários factores
contribuem para este facto: limitações de tempo, custos, vantagens do uso de técnicas de recolha
de dados, factores geográficos e políticos, etc.

Para procurar assegurar a representatividade da amostra são necessários alguns cuidados:


As técnicas de selecção de amostras devem deixar total ou parcialmente ao acaso (aleatório) a
indicação dos elementos da população que devem ser incluídos na amostra.

Uma amostra é aleatória se cada um dos seus elementos tem a mesma possibilidade, chance
ou probabilidade de ser escolhido.

Quando ao escolher a amostra se dá preferência a determinados elementos da população, a


amostra diz-se viciada ou enviesada.

iii. Unidade Estatística denota cada elemento que constitui a população observada. É
precisamente sobre este elemento que recai a observação estatística.

1.2. Método Estatístico

Quando se pretende empreender um estudo estatístico completo, existem divesas fases do


trabalho que devem ser desenvolvidas para se chegar aos resultados finais de um eestudo capaz de
produzir resultados válidos. Quer dizer, é um processo para se obter, apresentar e analisar
características ou valores numéricos para uma melhor tomada de decisão em situações de
incerteza. As fases do método estatístico são as seguintes:

 Definição do problema

 Planejamento

 Coleta de dados

 Apuramento dos dados


Alberto Hermenegildo António Tépulo - Licenciado em Ensino de Matemática na UP Nampula | 4
Sebenta de Estatistica

 Apresentação dos dados

 Análise e interpretação dos dados

Definição do problema: consiste em saber exactamente o que se pretende investigar. Para


tal o problema e os objectivos devem ser claramente definidos.

Planeamento: nesta etapa, procura-se responder as seguintes perguntas de entre outras


questões: que dados deverão ser obtidos? que tipo de amostragem deverá ser usado? Que
instrumentos devera ser usado para colecta de dados? Qual será o tamanho de amostra? Qual será o
cronograma de actividades? Quais serão os custos envolvidos?

Colecta de dados: esta corresponde a fase operacional da pesquisa. É o registo sistemático


dos dados, com um objectivo previamente determinado.

Apuramento: esta etapa consiste em fazer uma análise exploratória dos dados para
identificar valores extremos, valores estranhos e erros na recolha e digitação dos dados.

Apresentação dos dados: há duas formas de apresentação de dados: Apresentação tabular


e apresentação gráfica. A apresentação tabular é a apresentação numérica dos dados em linhas e
colunas distribuídas de modo ordenado. Enquanto a apresentação gráfica dos dados constitui uma
apresentação geométrica, permitindo uma visão rápida e clara do fenómeno.

Análise e interpretação dos dados: Corresponde a ultima fase do trabalho estatístico e é a


mais importante e delicada. Está ligada essencialmente ao cálculo de medidas e coeficiente, cuja
finalidade principal é descrever o fenómeno sem pretender tirar conclusões de carácter mais
genérico (Estatística descritiva). Na estatística indutiva, os resultados obtidos da análise de uma
amostra da população e com apoio da teoria da probabilidade se pode inferir, estimar ou induzir as
leis comportamento da qual a amostra foi tirada.

1.3. Variáveis

Alberto Hermenegildo António Tépulo - Licenciado em Ensino de Matemática na UP Nampula | 5


Sebenta de Estatistica

Uma Variável é a característica em estudo numa população ou amostra. Antes de realizar qualquer
tratamento estatístico de um conjunto de dados, é importante identificar qual é o tipo de variável
que será analisado, pois, é mediante a este conhecimento que o pesquisador poderá ou não adoptar
determinadas técnicas estatísticas para a resolução de problemas.

Classificação de Variáveis

Basicamente, as variáveis podem ser classificadas como sendo Qualitativas ou Quantitativas.

Variáveis Quantitativas - quando os valores que ela pode assumir são numéricos, os quais
podem ser obtidos através de uma contagem ou mensuração.

As variáveis quantitativas podem ser classificadas de acordo com o processo de obtenção,


podendo ser: Discreta ou Contínua.

(a) Variáveis quantitativas discretas - são variáveis numéricas obtidas a partir de


procedimento de contagem. Por exemplo: Quantidade de pessoas numa família, quantidade de
acidentes numa cidade, receita monetária dum município, etc.

(b) Variáveis quantitativas contínuas - são variáveis numéricas cujos valores são obtidos
por um procedimento de mensuração, podendo assumir quaisquer valores num intervalo dos
números reais, como por exemplo, a temperatura, altura, salário, tempo de percurso de casa a
escola, etc.

Obs: O fato de uma variável ser expressa por números não significa que ela seja
necessariamente quantitativa. Por exemplo, para a variável peso de um lutador de boxe, se for
anotado o peso marcado na balança, a variável é quantitativa contínua; por outro lado, se esse peso
for classificado segundo as categorias do boxe, a variável é qualitativa ordinal.

Variáveis Qualitativas - quando os valores que elas podem receber são referentes à
qualidade, atributo ou categoria. Exemplos são:

Alberto Hermenegildo António Tépulo - Licenciado em Ensino de Matemática na UP Nampula | 6


Sebenta de Estatistica

 Raça: podendo assumir os valores Branco ou Negro;

 Resultado de um teste: aprovado ou reprovado;

 Satisfação dos clientes em relação a uma padaria: boa, suficiente, má.

Por sua vez, as variáveis qualitativas podem, ainda, ser classificadas como: Nominais ou Ordinais.

(a) As variáveis qualitativas nominais - são caracterizadas por dados que se apresentam
apenas sob o aspecto qualitativo (Ex: nível académico, o grupo sanguíneo, carreira profissional,
categoria profissional, etc).

(b) As variáveis qualitativas ordinais - são caracterizadas por categorias que apresentam
uma ordenação natural. Por exemplo: escolaridade ( 1ª classe, 2ª classe, etc).

Esquema resumo:

Antes de realizar qualquer tratamento estatístico de um conjunto de dados, é importante


identificar qual é o tipo de dado (ou variável) que será analisado, pois, é mediante a este

Alberto Hermenegildo António Tépulo - Licenciado em Ensino de Matemática na UP Nampula | 7


Sebenta de Estatistica

conhecimento que o pesquisador poderá ou não adoptar determinadas técnicas estatísticas para a
resolução de problemas.

Exercícios

1. Num estudo feito numa escola, recolheram-se dados referentes às seguintes variáveis:
(A) idade (E) tempo gasto diariamente no estudo

(B) ano de escolaridade (F) distância de casa à escola

(C) sexo (G) local de estudo

(D) nota na disciplina de Matemática (H) número de irmãos

Classifique cada uma das variáveis acima

2. Uma socióloga quer saber a opinião de mulheres empregadas sobre a política do governo em
relação as creches. Ela tem uma lista de todas as mulheres que pagam cotas a um dos sindicatos.
Ela envia um questionário a 100 destas mulheres, escolhidas aleatoriamente. Destas, 68 preenchem
e devolvem o questionário.

a) O que é, neste caso, a população, o que é a amostra?


b) Acha que a amostra é representativa?

3. Coloque-se no lugar de pesquisador que pretende estudar se há relação entre o peso e a pressão
arterial de um indivíduo. Que variáveis usarias neste caso? Classifique-as.

Alberto Hermenegildo António Tépulo - Licenciado em Ensino de Matemática na UP Nampula | 8


Sebenta de Estatistica

4. Uma estação biológica foi indicada para fazer um inquérito sobre nutrição numa província. Para
o efeito, foram enviados 8000 inquéritos. Destes, 6500 foram preenchidos pelos inqueridos e
posteriormente devolvidos. O que é neste caso a população? E a amostra?

5. Distinga amostra aleatória da amostra viciada.

6. Na impossibilidade de se trabalhar com toda a população, muitas vezes, retira-se dela uma
amostra.

a) Explique como é que cada um dos factores (Geográficos, custos, limitação de tempo e políticos)
pode motivar o recurso a uma amostra.

a) O que deve-se satisfazer para que uma amostra sege a mais representativa possível.

Alberto Hermenegildo António Tépulo - Licenciado em Ensino de Matemática na UP Nampula | 9


Sebenta de Estatistica

1.4. Gráficos Estatísticos

Os gráficos estatísticos é uma forma de apresentação de dados estatísticos, cujo objectivo é


o de produzir, no investigador ou no publico em geral, uma visão mais imediata de como se
distribuem os dados duma amostra ou população, ou sobre como se relacionam os valores da
amostra. Existe uma grande variedade de gráficos estatísticos com o fim de responder as mais
variadas situações. Eis alguns tipos de gráficos:

1.4.1. Gráfico em colunas simples

É o mais adequado para variáveis discretas, mas também pode ser utilizado para variáveis
qualitativas ordinais, ou ainda, para variáveis qualitativas nominais cujos nomes das categorias são
pequenos.

Exemplo: Número de livros existentes na Biblioteca da da Universidade Pedagógica


Delegação de Nampula:

Livros Número
Matemática 30
Física 45
Historia 75
Química 12
Inglês 20
Desenho Técnico 16
TOTAL 198

Dos dados da tabela pode-se construir o seguinte gráfico em colunas, em que os


rectângulos são dispostos verticalmente.

Alberto Hermenegildo António Tépulo - Licenciado em Ensino de Matemática na UP Nampula | 10


Sebenta de Estatistica

1.4.2. Gráfico em Barras simples.

É análogo ao gráfico em colunas, mas os rectângulos são dispostos horizontalmente.

Para o exemplo anterior, eis a sua configuração:

1.4.3. Gráfico em Sectores ou gráficos de Pizza

Alberto Hermenegildo António Tépulo - Licenciado em Ensino de Matemática na UP Nampula | 11


Sebenta de Estatistica

É a representação gráfica de dados estatísticos, em um círculo, por meio de sectores. Estes


gráficos são usados frequentemente quando se pretende comparar cada valor da amostra com o
total. Para construi-lo, divide-se o círculo em sectores. Cada sector representa uma categoria e
o seu tamanho é proporcional à frequência da categoria representada por este mesmo sector.
Essa divisão poderá ser obtida pela solução da regra de três (ou do produto dos meios e
extremos), da seguinte maneira:

Total_______________360 0

Parte_______________ X 0

Do exemplo anterior vem:

30 x 3600
Para Matemática: 198_____360º então X   54,5o
198

30 _____ x

45 x 3600
Para Física: 198____360º então X   81,80
198

45_____x

Depois de calcular todos valores angulares para todos os restantes casos, tem o seguinte
gráfico em sectores:

Alberto Hermenegildo António Tépulo - Licenciado em Ensino de Matemática na UP Nampula | 12


Sebenta de Estatistica

A escolha do gráfico mais apropriado ficará ao critério do pesquisador ou analista. Contudo, a


simplicidade, clareza e veracidade devem ser respeitados na elaboração de um gráfico.

Simplicidade: possibilitar a análise rápida do fenómeno observado. Deve conter apenas o


essencial.

Clareza: possibilitar a leitura e interpretação correcta dos valores do fenómeno.

Veracidade: deve expressar a verdade sobre o fenómeno observado, e não inventar dados.

1.4.4. Gráficos em colunas múltiplas ou agrupadas

Corresponde ás tabelas de dupla entrada ou de contingência, em cada dado é analisado em duas


ou mais classificações.

Exemplo: Produção de Cereais em (toneladas) na província de Nampula nos anos 2011-2013

Cereais em (toneladas) Produzidos na província de


Nampula
Milho Mapira Mechoeira
2011 80 70 90

Alberto Hermenegildo António Tépulo - Licenciado em Ensino de Matemática na UP Nampula | 13


Sebenta de Estatistica

2012 120 50 85

2013 90 100 50

Da tabela obtêm-se o seguinte gráfico

1.5. Representação de dados por tabelas

A Estatística tem como objectivo encontrar leis de comportamento para todo o conjunto,
por meio da sintetização dos dados numéricos sob a forma de tabelas, gráficos e medidas. A seguir
são apresentados os procedimentos para representação dos dados por tabelas. Representação de
dados por tabelas baseia-se nas frequências dos valores. A seguir apresentam-se alguns
procedimentos para representação dos dados por tabela frequências:

Alberto Hermenegildo António Tépulo - Licenciado em Ensino de Matemática na UP Nampula | 14


Sebenta de Estatistica

1.5.1. Dados brutos

É o conjunto dos dados numéricos e que ainda não foram numericamente organizados. Por
exemplo:

7, 4, 3, 6, 5, 3, 4, 4, 3

Rol

É o arranjo dos dados brutos em ordem crescente ou decrescente. Do exemplo intervêm:

3, 3, 3, 4, 4, 4, 5, 6, 7.

1. Frequência Absoluta (Fi)


É o número de vezes que o elemento aparece na amostra ou, o número de elementos pertencentes a
mesma classes/intervalos.

Do exemplo anterior: F( 3)  3 F( 7 )  1 ,

2. Distribuição de frequência
É o arranjo dos valores com as suas respectivas frequências.

Do exemplo anterior tem-se:

X i (valor) Fi

3 3
4 3
5 1
6 1
7 1
Total 9

Alberto Hermenegildo António Tépulo - Licenciado em Ensino de Matemática na UP Nampula | 15


Sebenta de Estatistica

Eis um exemplo de distribuição de frequências para uma variável contínua, da vida útil de
ferramentas de corte em um processo industrial:

Horas antes da
0|--- 25 25|--- 50 50|--- 75 75|--- 100
reposição
Nº de
2 4 12 30
ferramentas

3. Frequência Absoluta Acumulada ( Fac )

É a soma das frequências absolutas dos valores inferiores ou iguais ao valor dado.

Exemplo: Tabela de frequência absoluta acumulada sobre o número de agregado familiar de 36


famílias inquiridas.

Xi Fi Fac

5 8 8

6 10 18

7 12 30

8 6 36

 36

Fonte: autor

4. Frequência Relativa ( f r ) e Relativa Percentual

É a razão entre a frequência absoluta e o tamanho N da amostra. A frequência relativa é


F
calculada pela fórmula: f r  i e
N

Alberto Hermenegildo António Tépulo - Licenciado em Ensino de Matemática na UP Nampula | 16


Sebenta de Estatistica

A frequência relativa percentual obten-se multiplicando por 100 a frequência relativa, isto é,
F
f r %  i  100
N

Do exemplo anterior pode-se introduzir na 3ª coluna a distribuição das respectivas f r :

Xi Fi fr fr %
5 8 8 0.22x100=22
 0.22
36
6 10 10 28
 0.28
36
7 12 12 33
 0.33
36
8 6 6 17
 0.17
36
 36 1 100

Obs1: A soma de todas as frequências absolutas é igual ao número N dos elementos da


respectiva amostra ou população, isto é: F  N
i e soma das frequências relativas é unitária, isto

é, f r  1,0

Distribuição de frequências de dados de uma variável contínua

1. Amplitude total ou Range (R)

É a diferença entre o maior r o menos valor observados.

R= Xmáx - Xmáx

Onde Xmáx e Xmin é o valor máximo e mínimo observado no conjunto de dados.

Alberto Hermenegildo António Tépulo - Licenciado em Ensino de Matemática na UP Nampula | 17


Sebenta de Estatistica

Do exemplo anterior vem: R  7  3  4


2. Número de classes ( K)

Na construção de uma tabela, há necessita de estabelecer o número de intervalos/classes da


referida tabela. Não há uma fórmula exacta para o cálculo do número de classes. Entretanto pode-
se usar as seguintes:

i) Se n  25 usa-se k=5 e se n  25 usa-se K  n


ii) Fórmula de Sturges: K  1  3,22 lg n

Exemplo: supomos que uma amostra tenha 58 dados numéricos, isto é n = 58. Neste caso o
número de classes será

K  58  7,62  8 classes ou K  1  3,22 lg 58  1  3,22 x1,76  6,67  7 classes

N.B. O K deve ser arredondado sempre para o número inteiro seguinte.

3. Amplitude das classes (h)

R
É a diferença entre o limite inferior e o superior das classes, e é dada por h  , onde R é o
K
range e K o número de classes.

4. Limite das classes


Existem diversas maneiras de expressar os limites das classes. Eis uma delas:

a) 10 ; 20: Compreende todos os valores ente 10 e 20 incluindo 10 e 20;

Alberto Hermenegildo António Tépulo - Licenciado em Ensino de Matemática na UP Nampula | 18


Sebenta de Estatistica

b) 10 | - - - 20 : Compreende todos os valores ente 10 e 20, excluindo 20;


Nas questões práticas usaremos o caso b).

5. Ponto médio de uma classe (Ci)

Linf  Lsup
É a média aritmética entre o limite superior e o limite inferior da classe , isto é, xi  .
2

Linf  Lsup 10  20
Ex: O ponto médio da classe 10 |--- 20 é xi    15
2 2

Obs2: A soma de todas as frequências relativas é igual ao número 1, f i  1.

6. Histograma

É representação gráfica de uma distribuição de frequências por meio de rectângulos


justapostos.

Exemplo: Salário semanal de 100 operários não especializados.

Salário ( $) Nr de
Operários

140|--- 160 11

160|--- 180 20

180 |--- 200 33

200|--- 220 25

220|--- 240 11

Total N=100

Da tabela obtêm-se o seguinte histograma:


Alberto Hermenegildo António Tépulo - Licenciado em Ensino de Matemática na UP Nampula | 19
Sebenta de Estatistica

7. Polígono de frequências

É a representação gráfica de uma distribuição por meio de um polígono. O polígono de


frequências um gráfico de linhas que se obtêm ligando os pontos médios dos topos de cada
rectângulo.

Do exemplo anterior pode-se obter o seguinte polígono de frequências;

Alberto Hermenegildo António Tépulo - Licenciado em Ensino de Matemática na UP Nampula | 20


Sebenta de Estatistica

Poligono de frequencias de sarios semanais

35
33
30

25 25

20 20
Fi

15

11 11
10

0
140 - 160 160 - 180 180 - 200 200 - 220 220 - 240
salario semanal

8. Polígono de frequências acumuladas ou ogivas

Do exemplo anterior podemos achar as frequências acumuladas:

Salário ( $) Nr de Fac
Operários

140 |---160 11 11

160 |--- 180 20 31

180 |--- 200 33 64

200 |--- 220 25 89

220 |--- 240 11 100

E de seguida o polígono de frequências acumuladas.

Alberto Hermenegildo António Tépulo - Licenciado em Ensino de Matemática na UP Nampula | 21


Sebenta de Estatistica

Ogiva de salarios semanais

120

100 100

89
80

64
Fac

60

40
31

20
11
0
140 - 160 160 - 180 180 - 200 200 - 220 220 - 240
sa la rio se ma na l

Alberto Hermenegildo António Tépulo - Licenciado em Ensino de Matemática na UP Nampula | 22


Sebenta de Estatistica

CAPITULO II: MEDIDAS DE TENDÊNCIA CENTRAL

As medidas de posição mais importantes são as medidas de tendência central, que recebem
tal denominação pelo facto de os dados observados tenderem, em geral, a se agruparem em torno
de valores centrais. Existem muitos tipos de medidas de tendência central. Dentre elas as mais
comuns são: a mediana, a moda, e a média aritmética.

2.1. Média Aritmética ( X )

Na recolha dos dados de pesquisa sobre um determinado fenómeno, pode-se sintetizar pela
fórmula de tabelas, gráficos e distribuições de frequências. Mas também destaca-se o cálculo de
medidas que possibilitam representar um conjunto de dados relativos a observação de determinado
fenómeno de forma resumida para a sua análise. São as medidas de posição. Tais medidas
orientam-nos quanto a posição da distribuição no eixo do x (eixo dos números reais),
possibilitam comparações de séries de dados entre si pelo confronto desses números. São
chamadas medidas de tendência central, pois representam os fenómenos pelos seus valores
médios, em torno dos quais tendem a concentrar-se os dados, (cf.Fonseca, 1995:118).

Pesquisadores em muitos campos têm usado o termo “ média” em questões tais como:
qual a renda média de colegiais e universitários já graduados? Quantos cigarros fumam em média,
o adolescente? Qual a nota media de uma cadeira dos estudantes de um determinado curso em uma
universidade? Em média, quantos acidentes de viação que resultam da ingestão de álcool ou
droga? etc.

A média é um valor típico ou representativo de um conjunto de dados. Como esses valores


típicos tendem a se localizar centralmente em um ponto de um conjunto de dados ordenados
segundo suas grandezas, as médias também são denominadas medidas de tendência central.

É obtida a partir da razão entre a soma dos valores observados e o total de observações, isto é:
Alberto Hermenegildo António Tépulo - Licenciado em Ensino de Matemática na UP Nampula | 23
Sebenta de Estatistica

 Xi x1  x 2  ...  x n
X  i 1
ou X 
n n

4  6  7  8  9 39
Exemplo: a média dos dados 4, 6, 7, 8, 9 é X    9,75
4 4

Para dados agrupados em classes ou numa distribuição de frequências, a média é calculada


dos valores x1 , x 2 , x3 , ..., x n , ponderados pelas respectivas frequências absolutas Fi , da seguinte
forma:

 X .F i i
F1 X 1  F2 X 2  ...  Fn X n
X  i 1
ou X 
n n

Exemplo: a tabela abaixo ilustra a distribuição do número de casos de assedio sexual,

Confirmados, por escola de certa província, durante um ano lectivo. Calcule a média dos
números de casos:

Nº de 10 12 13 14 15
Casos

Nº de 20 16 19 24 30
Escolas

Um dispositivo mais prático e rápido para esse cálculo é a construção da seguinte tabela,
onde se acrescenta uma coluna para os produtos X i .Fi , como se segue:

Nº de Fi X i .Fi
Casos

10 20 200

Alberto Hermenegildo António Tépulo - Licenciado em Ensino de Matemática na UP Nampula | 24


Sebenta de Estatistica

12 16 192

13 19 247

14 24 336

15 30 450

 109 1425

X i * Fi
1425
Assim, a média é X  i 1
  13,08 .
n 109

Quando os dados estiverem agrupados em classes/intervalos, a média é calculada através


dos pontos médios das respectivas classes.

Exemplo: Para avaliar, na escala de 0 a 50, a satisfação dos munícipes de certa autarquia
em relação ao desempenho da respectiva edilidade, foi feito um estudo que forneceu os seguintes
dados:

Pontuação 0|--- 10 10|--- 20 20|--- 30 30|--- 40 40|--- 50

Nr de Munícipes 100 140 200 320 280

Determine a pontuação média da satisfação dos munícipes, e comente-a.

Solução: tal como no caso anterior, dispomos a tabela da seguinte forma, introduzindo a
coluna dos pontos médios X i das classes e a coluna dos produtos X i .Fi , assim:

Alberto Hermenegildo António Tépulo - Licenciado em Ensino de Matemática na UP Nampula | 25


Sebenta de Estatistica

Pontuação Fi Xi X i .Fi

0|---10 100 5 500

10|---20 140 15 2100

20|---30 200 25 5000

30|---40 320 35 11200

40|---50 280 45 12600

 1040=n 31.400

 X .F i i
31.400
O perímetro torácico médio é X  i 1
  32.440 .
n 1040

Comentário: A classificação média dos munícipes em relação ao desempenho da autarquia é


positiva (boa), uma vez que está acima do ponto médio da escala de pontuação ( 25pontos).

2.1.1. Média Geral

Sejam X 1 , X 2 , X 3 ,...., X k as médias aritméticas de k amostras e n1 , n2 , n3 ,...., nk os


respectivos tamanhos amostrais. A média geral das médias é dada por

 n .X i i
n1 .x1  n 2 .x 2  ...  n k .x k
X  i 1
ou X 
k
n1  n 2  ...  n k
ni
1

Calcule a média geral dos dados:

Alberto Hermenegildo António Tépulo - Licenciado em Ensino de Matemática na UP Nampula | 26


Sebenta de Estatistica

1) 4, 5, 6, 7, 8 observe que n1  5 e X1  6

2) 2, 4, 6 observe que n2  3 e X2 4

3) 10, 11, 12, 13 observe que n3  4 e X 3  11,5

Assim, a média geral das médias é:

n1 .x1  n 2 .x 2  n 3 .x 3 5.6  3.4  4.11,5 88


X     7,34
n1  n 2  n 3 53 4 12

2.2. Mediana Md 


~
FONSECA (1995:126) “ colocados em ordem crescente, mediana ( X ) é o valor que divide a
amostra, ou população, em duas partes iguais”. Assim:

1.2.5. Cálculo da Mediana – Variável discreta

n 1
Se n for impar, a mediana será o elemento central (de ordem ). Caso n seja par, a mediana
2
n n
será a média entre elementos centrais (de ordem e 1 )
2 2

Exemplo1:

Rol de dados: 1, 1, 1, 1, 1, 1, 2, 2, 3, 4, 5, 6, 7. Fazendo a contagem da esquerda

Alberto Hermenegildo António Tépulo - Licenciado em Ensino de Matemática na UP Nampula | 27


Sebenta de Estatistica

e a direita para o centro, veremos que o valor central que divide o conjunto dos numero é 2.
~
Logo mediana dos dados corresponde a 2, isto é, X  2

Exemplo2:

Dada a distribuição:

~ n 1 11  1
n  11, n é impar, logo X será o elemento que localiza na posição , ou seja,  60 .
2 2
O que indica que a mediana é o sexto elemento e para identifica-lo, abre-se a coluna das
frequências acumuladas crescente ( Fiac ). Neste caso a mediana será
~
X  X  n 1   X  111   X  12   X 6 0  3 .
     
 2   2   2 

Exemplo3:

Alberto Hermenegildo António Tépulo - Licenciado em Ensino de Matemática na UP Nampula | 28


Sebenta de Estatistica

~ n n 42
n  42, n é par, logo X será o elemento que localiza nas posições e  1 , ou seja,  210
2 2 2
42
 1  22 0 . O que indica que a mediana identificam-se os elementos de ordem 21 e 22 pela
2
Fiac .

Assim : 210 corresponde a 87

22 0 corresponde a 87, logo

~ 87  87
X   87 .
2

2.2.2. Cálculo da Mediana – Variável contínua

n
1º Passo: calcula-se a ordem . Como a variável é continua, não se preocupe se n é
2

par ou impar;

2º Passo: pela Fiac identifica-se a classe que contém a mediana( Md).

3º Passo: utiliza-se a fórmula:

n 
  F i 1 
   .h
~ 2
X  L Md
n onde:

LMd  limite inferior da classe mediana Md

Alberto Hermenegildo António Tépulo - Licenciado em Ensino de Matemática na UP Nampula | 29


Sebenta de Estatistica

n  tamanho de amostra ou numero de elementos

F i 1  soma das frequências das classes anteriores a classe mediana

h  amplitude da classe Md

FMd  Frequência da classe mediana Md.

Exemplo1: dada aa distribuição amostral, calcular a mediana.

n 58
1º Passo: calcula-se a ordem . Como n  58 temos  29 0
2 2

2º Passo: identifica-se a classe mediana Md. pela Fiac neste caso a classe Md é ]

3º Passo: aplicara-se a fórmula:

n 
  F i 1 
   .h
~ 2
X  L Md
n

Neste caso,

LMd  55 , n  58 , F i 1  17 , h  10 , FMd  18
Alberto Hermenegildo António Tépulo - Licenciado em Ensino de Matemática na UP Nampula | 30
Sebenta de Estatistica

 58 
  17 
Logo X  55  
~ 2   10  55   29  17   10  55  12  10  55  120  55  6 , 67
18 18 18 18
~
X  61 , 67

2.3. Moda ( M o )

É o escore ou categoria que, numa distribuição ocorre com maior frequência. Por exemplo: No
conjunto de escores:

A moda é 1, uma vez que ocorre com maior frequência no conjunto (6 vezes), portanto Mo = 1.

No caso de uma distribuição de frequências com dados isolados, onde os escores e as frequências
figuram em colunas separadas, a moda é o valor (escore) que aparece mais na tabela.

Algumas distribuições de frequências apresentam duas ou mais modas. No seguinte conjunto de


dados, por exemplo, o conjunto: 6, 6, 7, 2, 6, 1, 2, 3, 2,4, os escores 2 e 6 ocorrem ambos com
igual frequência alta (3 vezes). Graficamente, tais distribuições têm dois pontos de frequências
máxima. Essas distribuições chamam-se bimodais.I

Segundo FONSEGA (1995:134), para dados agrupados em classes, há diversas fórmulas para o
cálculo da moda.

 1º Processo: fórmula de Czuber

1º Passo: identifica-se a classe modal ( aquela que possuir maior frequência).

2º Passo: aplica-se a fórmula Mo  L Mo  1


.h
1   2

Em que

Alberto Hermenegildo António Tépulo - Licenciado em Ensino de Matemática na UP Nampula | 31


Sebenta de Estatistica

LMo  limite inferior da classe modal Mo

 1  diferença entre a frequência da classe modal e a imediatamente anterior

 2  diferença entre a frequência da classe modal e a imediatamente posterior

h  amplitude da classe modal

Exemplo: Determinar a moda para a distribuição anterior sobre a renda familiar (milhões
de $).

xi Fi

[2; 4 [ 5
[4; 6[ 10
[6; 8[ 14
[8; 10[ 8
[10; 12[ 2
Total 40

1º Passo: identifica-se a classe modal. Neste caso, trata-se da 3ª classe [6; 8[

1
2º Passo: aplica-se a fórmula Mo  L Mo  .h
1   2

Em que

LMo  6 ,  1  14  10  4 ,  2  14  8  6 , h  2

Portanto Mo  L Mo  1 4 8
.h  6  2 6  6 ,8
1   2 46 10

R: a renda familiar mais frequente é de 6,8 milhões de $, que constitui a moda.

 2º Processo: fórmula de Pearson

Alberto Hermenegildo António Tépulo - Licenciado em Ensino de Matemática na UP Nampula | 32


Sebenta de Estatistica

~
Mo  3 X  2 X

Ou seja, a moda é aproximadamente a diferença entre o triplo da mediana e dobro da média. Esta
fórmula dá uma boa aproximação quando a distribuição apresenta razoável simetria em relação à
média.

N.B: Se a distribuição tiver uma moda, denomina-se unimodal; duas modas diz-se bimodal;
três trimodal; e quatro ou mais diz-se multimodal. Se todos os valores ocorrem a mesma
quantidade de vezes, a amostra denomina-se amodal.

2.4. Os Quartís

Os Quartís dividem um conjunto de dados em quatro partes iguais, assim:

Onde:

Q1 = primeiro quartil, deixa os primeiros 25%;

Q2 = Segundo quartil, deixa os primeiros 50%;

Q3 = Terceiro quartil, deixa os primeiros 75%;

Eis as fórmulas para o cálculo dos quartís para uma variável contínua.

2.4.1. Primeiro Quartil

Procedimentos para o seu cálculo


Alberto Hermenegildo António Tépulo - Licenciado em Ensino de Matemática na UP Nampula | 33
Sebenta de Estatistica

n
1º calcula-se a ordem ;
4

2º Identifica-se o Q1 pela Fac ;

n 
  F *h
Q1  lQ1   
4
3º Aplica-se a fórmula
FQ1

Onde: l Q1 = Limite inferior da classe Q1 ;

 F = Soma das frequências absolutas inferiores a classe Q1 ;

FQ1 = Frequência da classe Q1 ;

h = amplitude das classes.

2.4.2. Segundo Quartíl

O segundo quartíl é igual a mediana da distribuição, dai que a fórmula é a mesma.

n 
  F *h
 
~ 2
Q2  X  lMd
FMd

2.4.3. Terceiro Quartil

Procedimentos para o seu cálculo

3n
1º Calcula-se a ordem ;
4

2º Identifica-se o Q3 pela Fac ;

Alberto Hermenegildo António Tépulo - Licenciado em Ensino de Matemática na UP Nampula | 34


Sebenta de Estatistica

 3n 
  F *h
3º Aplica-se a fórmula Q3  lQ 3   
4
FQ 3

Onde: lQ 3 = Limite inferior da classe Q3 ;

 F = Soma das frequências absolutas inferiores a classe Q3 ;

FQ 3 = Frequência da classe Q3 ;

h = amplitude das classes.

Exemplo: Calcule os quartís dos seguintes dados

Anos de serviço 0|--- 5 5|--- 10 10|--- 15 15|--- 20 20|--- 25 25|--- 30


Fi 18 22 20 14 10 6

Solução: construamos primeiro a coluna das Fac:

Anos Fi Fac

0|--- 5 18 18
5|--- 0 22 40
10|--- 15 20 60
15|--- 20 14 74
Classe Q1
20|--- 25 10 84
25|--- 30 6 90
Classe Q2
 N=90

Alberto Hermenegildo António Tépulo - Licenciado em Ensino de Matemática na UP Nampula | 35


Sebenta de Estatistica

Para o 1º Quartíl
n 90
Do 1º passo calculemos   22,5 , este valor situa-se na Fac  40 , isto é a classe Q1 é
4 4

5|--- 0 ( 2º passo).

Pelo 3º passo vem:

l Q1 = 5  F = 18 h5 FQ1  22

Assim, vem:

n   90 
   F *h   18  * 5
Q1  lQ1     5  
4 4
 6,03
FQ1 22

Para o 2º Quartíl

Calcular segundo os procedimentos do cálculo da mediana.

Para o 3º Quartíl

3n 3 x 90
Do 1º passo calculemos   67,5 , este valor situa-se na Fac  74 , isto é a classe
4 4
Q1 é 15-20 ( 2º passo).

Pelo 3º passo vem:

lQ 3 = 15  F = 18+22+20=60 h=5 FQ 3 = 14

Assim, vem:

 3n   3 x90 
   F *h   60  * 5
 4   4 
Q3  l Q 3   15   17,68
FQ 3 14

Alberto Hermenegildo António Tépulo - Licenciado em Ensino de Matemática na UP Nampula | 36


Sebenta de Estatistica

CAPITULO III. MEDIDAS ESTATÍSTICAS DE DISPERSÃO OU DE VARIABILIDADE


E DE ASSIMETRIA

Verificou-se, ao longo da história da Estatística, que a melhor e a mais usada medida de


tendência central é a media aritmética da amostra. Entretanto, a media aritmética da amostra
sozinha, não fornece toda a informação necessária para se descreverem adequadamente os valores
das unidades observadas. Considere por exemplo, os valores em quilómetros, de duas Amostras, A
e B.

 Amostra A: 30 km, 30km, 30km

 Amostra B: 20 km, 30km, 40 km

Embora cada amostra tenha a mesma média aritmética, 30km, vê-se que há maior variabilidade
na amostra B do que na amostra A.

Desse modo, para descrever adequadamente uma amostra é necessária uma outra medida que,
alem da informação do valor representativo do conjunto de valores da amostra (fornecido pela
medida de tendência central), exprima a variabilidade desses valores em relação a uma
determinada referência. Quanto maior for a medida de variabilidade, maior é a dispersão do
conjunto de valores da amostra.

Medidas de dispersão ou de variabilidade são medidas estatísticas que permitem avaliar o grau
de variabilidade ou dispersão dos valores quantitativos em torno da média. As principais medidas
de dispersão são: Amplitude total, desvio médio, variância, desvio padrão e coeficiente de
variação.

Na nossa abordagem e por uma questão prática de aplicabilidade, sugerimos o estudo apenas
da variância, desvio padrão e coeficiente de variação.

Alberto Hermenegildo António Tépulo - Licenciado em Ensino de Matemática na UP Nampula | 37


Sebenta de Estatistica

3.1. Variância
É uma medida que representa a variabilidade de um conjunto de dados e, é obtida pelo
cálculo da média dos quadrados dos desvios em relação à média.

Se os dados forem amostrais, a variância diz-se amostral e é dada por:

S 
2 
 X i  X Fi 
2
 2
 2

X  X F1  X 2  X F2  ....  X n  X Fn
ou seja S 2  1

2

n 1 n 1

Se os dados forem populacionais, a variância diz-se populacional e é dada por:

 
2 
 X i  X Fi 
2
 2
 2

X  X F1  X 2  X F2  ....  X n  X Fn
ou seja  2  1

2

N N

N.B. N- representa o tamanho populacional ou número de elementos da população

n- representa o tamanho amostral ou número de elementos da amostra

3.2. Desvio Padrão

É a raiz quadrada da variância. Isto é:

S  S2 Desvio padrão amostral

  2 Desvio padrão populacional

Exemplo: Um estudo levado a cabo, para avaliar a satisfação dos clientes pelos serviços prestados
por certa instituição, na escala de 0 a 50, forneceu os seguintes dados:

Alberto Hermenegildo António Tépulo - Licenciado em Ensino de Matemática na UP Nampula | 38


Sebenta de Estatistica

Pontuação 0|--- 10 10|--- 20 20|--- 30 30|--- 40 40|--- 50

Fi 60 80 120 140 90

Calcule a variância e o desvio padrão das pontuações obtidas.

Solução:

Para facilitar os cálculos dispomos a tabela da seguinte forma. Saliente-se que a construção
da tabela não obedece alguma ordem rigorosa das colunas, pois elas devem ser introduzidas em
conformidade com as necessidades do que se pretende calcular e os resultados parciais.

Pontuação Fi Xi X i Fi X i 2
 X Fi

0 |--- 10 60 5 300 5  27,52 60  30.375

10|--- 20 80 15 1200 27,5  152 80 =12.500

20|--- 30 120 25 3000 750

30|--- 40 140 35 4900 7.875

40|--- 50 90 45 4050 27.562

 n = 490 13.450 79.062

X i Fi 13450
Média: X    27,5
N 490

Variância: S 
2  

2
 X i  X Fi 79.062
 161,36
n 490

Alberto Hermenegildo António Tépulo - Licenciado em Ensino de Matemática na UP Nampula | 39


Sebenta de Estatistica

Desvio padrão: S  S 2  161,36  12,7

Exemplo: Numa fábrica de produtos químicos fez-se, durante 30 dias, o registo diário do número
de casos ocorridos de uma intoxicação de etiologia desconhecida, obtendo-se a distribuição:

Nr de casos 0 1 2 3 4 5 6

Nr de dias 12 10 4 2 1 0 1

Calcule o desvio padrão dos casos de intoxicação.

Solução: Tal como no caso anterior, construamos a seguinte tabela

i Fi X i Fi X i  X Fi 
2

0 12 0 0  1,142 12  15,6
1 10 10 0,2
2 4 8 2,96
3 2 6 6,92
4 1 4 8,18
5 0 0 0
6 1 6 23,62
 N=30 34 57,48

X i Fi 34
Média: X    1,14
N 30

Alberto Hermenegildo António Tépulo - Licenciado em Ensino de Matemática na UP Nampula | 40


Sebenta de Estatistica

Variância:  2  
2
 X i  X Fi 57,48
 1,92
n 30

Desvio padrão:    2  1,92  1,38

3.3. Coeficiente de Variação

Trata-se de uma medida relativa de dispersão, útil para a comparação em termos relativos
do grau de concentração dos valores em torno da média de duas amostras ou populações distintas.

Não se deve comparar directamente duas ou mais medidas de dispersão. Como por
exemplo comparar a variabilidade da temperatura e a variabilidade do comprimento. Para tornar
compreensível uma comparação entre essas grandezas com relação a variabilidade é necessário
converte-las para um valor relativo. Karl Pearson, Matemático Inglês (1857-1936), que contribuiu
significativamente para ciência Estatística, desenvolveu uma medida relativa, denominado
coeficiente de variação (CV), calculado pela expressão


CV  .100% para o caso populacional
X

S
CV  .100% para o caso amostral
X

Observação:

 Se CV for menor que 15%, diz-se que há baixa dispersão dos valores;

 Se CV situar-se entre 15% a 30%, diz-se que há média dispersão dos

valores;

Alberto Hermenegildo António Tépulo - Licenciado em Ensino de Matemática na UP Nampula | 41


Sebenta de Estatistica

 Se CV for maior que 30%, diz-se que há alta dispersão dos valores.

Exemplo: Numa instituição, o salário médio dos homens é de 12.800Mt com um desvio padrão
de 1100Mt e, o das mulheres é em média 10.200Mt com desvio padrão de 1.300 Mt. Avalie o grau
de dispersão dos referidos salários.

Solução: como não vem especificado que se trata de amostra, devemos considerar que os
dados populacionais. Assim vem:

 1500
Para mulheres: CV  .100%  100%  13%
X 12.800

 1100
Para os homens: CV  .100%  100%  9%
X 10.200

Os salários dos homens apresentam baixa dispersão em relação a respectiva média,


enquanto que os das mulheres apresentam média dispersão.

4. Medidas de Assimetria

Denomina-se assimetria o grau de afastamento de uma distribuição da unidade de simetria.

Em uma distribuição simétrica tem-se igualdade dos valores da média, mediana e moda. Eis um
exemplo gráfico de distribuição simétrica

Alberto Hermenegildo António Tépulo - Licenciado em Ensino de Matemática na UP Nampula | 42


Sebenta de Estatistica

Em uma distribuição simétrica positiva, ou assimétrica à direita, tem-se:

Mo  Md  X

Eis um exemplo gráfico de distribuição assimétrica positiva:

Em uma distribuição assimétrica negativa, ou assimétrica à esquerda tem-se:

Mo  Md  X

Exemplo de distribuição assimétrica negativa:

Alberto Hermenegildo António Tépulo - Licenciado em Ensino de Matemática na UP Nampula | 43


Sebenta de Estatistica

Uma das fórmulas para o cálculo do coeficiente de assimetria é a seguinte:

X  Mo X  Mo
C AS  ou C AS 
 S

Se C AS  0 Diz - se que a distribuicao e simetrica

Se C AS  0 Diz - se que a distribuicao e assimetrica positiva

Se C AS  0 Diz - se que a distribuicao e assimetrica negativa

EXERCICIOS II

1. De 75.200 mortes por acidentes nos EUA, em um ano recente, 43500 foram causadas por
veículos motorizados, 12.200 por quedas, 6400 por envenenamento, 4600 por afogamento, 4200
por incêndios, 2900 por ingestão de alimentos 1400 por armas de fogo.

a) Apresente os dados num gráfico de barras;

b) Apresente os dados num gráfico de coluna;

c) Apresente os dados num gráfico em sectores.

2. Para os conjuntos de valores seguintes, encontre a média, moda mediana, primeiro e terceiro
quartis.

Alberto Hermenegildo António Tépulo - Licenciado em Ensino de Matemática na UP Nampula | 44


Sebenta de Estatistica

a) 21, 22, 27, 36, 22, 29,22, 23, 22, 28

b) 3,6 3,1 3,9 3,7 3,5 3,7 3,4 3,0 3,6

2. A uma amostra de 8 estudantes vivendo em residências universitárias pediu-se que classificasse,


numa escala de 1 (um) a 7 (excelente) a qualidade das refeições servidas na residência. Os
seguintes resultados foram obtidos: 2, 4, 2, 3, 5, 4, 3, 2.

a)Encontre a classificação média dada pela amostra;

b)Calcule a mediana.

3. Uma cadeia de 10 lojas comparou as vendas nos períodos natalícios dos anos 97 e 98, tendo
concluído que as vendas subiram em qualquer das lojas; as percentagens de subida foram as
seguintes (cada percentagem refere-se a uma loja): 10,2 3,1 5,9 7,0 3,7 2,9 6,8 7,3 8,2
4,3.

a)Calcule a percentagem média de crescimento das vendas;

b)Calcule a mediana e os quartis Q 1 e Q 3 ;

c)Calcule a variância e o desvio padrão.

4. Os valores abaixo representam o número de horas que uma amostra de 13 estudantes de


Estatística leva a estudar para o exame: 12, 7, 4, 16, 21, 5, 9, 3, 11, 14, 10, 6, 12.

a)Calcule a média;

b)Calcule a mediana e os quartis Q 1 e Q 3 ;

c)Calcule a variância e o desvio padrão.

5. Considere as quatro populações seguintes:

(i) 1, 2, 3, 4, 5, 6, 7, 8;
(ii) 1, 1, 1, 1, 8, 8, 8, 8;

Alberto Hermenegildo António Tépulo - Licenciado em Ensino de Matemática na UP Nampula | 45


Sebenta de Estatistica

(iii) 1, 1, 4, 4, 5, 5, 8, 8;
(iv) -6, -3, 0, 3, 6, 9, 12, 15.

Nos quatro casos a média é a mesma (4,5). Sem fazer cálculos, ordene as populações de acordo
com as magnitudes das suas variâncias, da menor para a maior. Confirme o seu ordenamento,
calculando as variâncias.

6. Os 40 estudantes de uma determinada turma deram, numa escala de 1 a 5, a seguinte


classificação a um dos seus professores:

CLASSIFICAÇÃO 1 2 3 4 5
N° DE 1 7 15 10 7
ESTUDANTES

a)Calcule a classificação média;

b)Encontre a mediana e a moda;

c)Calcule a variância e o desvio padrão;

d)Qual é a percentagem de estudantes que deu classificação igual ou inferior a 3?

e)Qual é a percentagem de estudantes que deu classificação superior a 2.

7. A tabela abaixo apresenta as nota dos 35 estudantes de uma determinada turma a Estatística:

NOTAS 0|--- 5 5|--- 10 10|--- 15 15|--- 20


N° DE 4 8 18 5
ESTUDANTES

a)Encontre as frequências absolutas, relativa, acumulada absoluta e acumulada relativa;

b)Construa um histograma.

Alberto Hermenegildo António Tépulo - Licenciado em Ensino de Matemática na UP Nampula | 46


Sebenta de Estatistica

8. Inquéritos realizados em 20 residências de diversas universidades de um determinado país


revelaram os seguintes valores para o número de estudantes de Gestão por residência:

N° DE ESTUDANTES DE GESTÃO 0|--- 10 10|--- 20 20|--- 30 30|--- 40

N° DE RESIDÊNCIAS 2 4 9 5

a)Encontre as frequências absolutas, relativa, acumulada absoluta, e acumulada relativa;

b)Construa um histograma;

c)Construa um histograma usando as frequências absolutas relativas.

11. Um psico- pedagogo administrou, a uma amostra de 25 crianças, um teste consistindo de 50


questões. A tabela mostra os tempos gastos pelas crianças para responder às questões do teste.

TEMPO (MINUTOS) 0|--- 5 5|--- 10 10|--- 15 15|--- 20 20|--- 25

N° DE CRIANÇAS 4 7 8 4 2

a)Responda às questões a) e b) do exercício 10.

CAPITUOLO IV: TEORIA DE PROBABILIDADE

4.1. Introdução

Todas as vezes que estudam fenómenos de observação, cumpre-se distinguir o próprio


fenómeno e o modelo matemático (determinístico ou probabilístico) que melhor o explique.

Alberto Hermenegildo António Tépulo - Licenciado em Ensino de Matemática na UP Nampula | 47


Sebenta de Estatistica

Os fenómenos estudados pela estatística são fenómenos cujo resultado, mesmo em


condições normais de experimentação, varia de uma observação para outra, dificultando dessa
maneira a previsão de um resultado.

A observação de um fenómeno casual é recurso poderoso para se entender a variabilidade


do mesmo. Entretanto, com suposições adequadas e sem observar directamente o fenómeno,
podemos criar um modelo teórico que reproduza de forma bastante satisfatória a distribuição das
frequências quando o fenómeno é observado directamente. Tais modelos são os chamados modelos
de probabilidades.

Os fenómenos determinísticos conduzem sempre a um resultado quando as condições


iniciais são as mesmas. Ex: tempo de queda livre de um corpo. Mantidas as mesmas condições, as
variações obtidas para o valor do tempo de queda livre de um corpo são extremamente pequenas
(em alguns casos, desprezíveis).

Os fenómenos aleatórios podem conduzir a diferentes resultados e mesmo quando as


condições iniciais são as mesmas, existe a impossibilidade de prever o resultado. Ex: Lançamento
de um dado.

Embora o cálculo das probabilidades pertença ao campo da Matemática, sua inclusão se


justifica pelo facto da maioria dos fenómenos de que trata a Estatística ser de natureza aleatória ou
probabilística. Consequentemente, o conhecimento dos aspectos fundamentais do cálculo das
probabilidades é uma necessidade essencial para o estudo da Estatística Inferencial.

Procuramos resumir aqui os conhecimentos que julgamos necessários para termos um


ponto de apoio em nossos primeiros passos no caminho da estatística Inferencial. Esses passos
serão apresentados no capítulo que trata da conceituação de variável aleatória das principais
distribuições de probabilidades de variáveis discretas e continuas.

4.2. Pequeno historial sobre as probabilidades

As primeiras ideias sobre probabilidades surgiram por volta de 1500, seu objectivo era
associar a Matemática aos jogos de azar, que já existiam antes de Cristo. O inicio real da teoria das
Alberto Hermenegildo António Tépulo - Licenciado em Ensino de Matemática na UP Nampula | 48
Sebenta de Estatistica

probabilidades ocorrem por volta de 1600, com importantes estudos feitos por Matemáticos, em
sua maioria franceses, como Pascal, Fermat, Poncelet de De Moire. Mas o surgimento da teoria das
probabilidades deve-se mais ao matemático francês Laplace, do que a qualquer outro.

4.3. Conceitos básicos de Probabilidade

Experiências Determinísticas: são aqueles cujos resultados podem ser determinados antes
da sua realização. Por exemplo: quanto tempo levará um carro para percorrer um trajecto de 200
Km numa velocidade média de 100 Km/h? Não é necessário executar a experiência para
determinar a resposta: 2 horas.

Experiências Aleatórias: são aquelas que, mesmo repetidas várias vezes sob condições
idênticas, apresentam resultados imprevisíveis. Assim, da afirmação ʺ é provável que a minha
ganhe a partida de hoje ˮ pode se resultar:

a) Que, a pesar do favoritismo ele perca;


b) Que, como pensamento, ele ganhe;
c) Que, empate.

Como vimos, o resultado final depende do acaso, fenómenos como esses são chamados fenómenos
aleatórios e as experiencias associadas a eles de Experiencias Aleatórias.

Espaço Amostral

A cada experiência aleatória corresponde, em geral, vários resultados possíveis. Assim, ao


lançarmos uma moeda, há dois resultados possíveis: ocorrer cara ou ocorrer coroa. Já ao lançarmos
um dado há seis resultados possíveis: 1,2,3,4,5,6.

Alberto Hermenegildo António Tépulo - Licenciado em Ensino de Matemática na UP Nampula | 49


Sebenta de Estatistica

Ao conjunto formado por todos os possíveis e diferentes resultados de uma experiência


aleatória, dá-se o nome de Espaço Amostral ou Conjunto Universo, representado por S.

As duas experiências citadas anteriormente tem os seguintes espaços amostrais:

 Lançamento de uma moeda: S  Ca, Co

 Lançamento de um dado: S  1, 2, 3, 4, 5, 6

Outros dois exemplos são:

 dois lançamentos sucessivos de uma moeda: S  Ca, Ca ; Ca, Co ; Co, Ca , Co, Co 

 Lançamento simultâneo de dois dados:

S  1, 1; 1, 2 ; 1, 3; 1, 4 ; 1, 5; 1, 6 ; 2, 1, 2, 2 2, 3; 2, 4 ; 2, 5, 2, 6 ;....; 6,6  .

Cada um dos elementos de S que corresponde a um resultado, recebe o nome de ponto


amostral. Assim:
2

Eventos

Chamamos de evento qualquer subconjunto de espaço amostral S de uma experiência


aleatória.

Assim, qualquer que seja E, se

ES e E e subconjunto unitario, E e chamado evento elementar

E   , E e chamado evento impossivel

No lançamento de um dado, onde S  1, 2, 3, 4, 5, 6

temos:

Alberto Hermenegildo António Tépulo - Licenciado em Ensino de Matemática na UP Nampula | 50


Sebenta de Estatistica

A  1, 2, 3  S ; logo , A é um evento de S.

B  1, 2, 3, 4, 5, 6  S ; logo, B é um evento certo S

C  4  S ; logo C é um evento elementar de S

D   , logo D é um evento impossível

Um evento é sempre definido por uma sentença. Assim, os eventos acima podem ser
definidos pelas sentenças:

 obter um número impar na face superior;

 obter um número menor ou igual a seis na face superior;

 obter número 4 na face superior;

 obter um número maior que seis na face superior.

4.4. Operações com Eventos

O complementar de um conjunto A é o subconjunto A formado pelos elementos do


espaço amostral não incluídos no evento A.

Por exemplo, complementar do evento A  Caco, Coca é o evento A=


Caca, Coco

Dois ou mais eventos de um mesmo espaço amostral podem ser agrupados em operações
de união e intersecção, assim definidas:

A operação união de eventos A e B gera um novo evento formado pelos elementos comuns
e não comuns e dos dois conjuntos A e B.

A operação Intersecção dos eventos A e B gera um novo elemento formado apenas pelos
elementos comuns aos dois conjuntos A e B.

Alberto Hermenegildo António Tépulo - Licenciado em Ensino de Matemática na UP Nampula | 51


Sebenta de Estatistica

Vejamos algumas consequências das operações com eventos:

A união de um evento A e o seu complementar A é o próprio espaço amostral S; isto é A  A  S .

A intersecção de um evento A e seu complementar é o conjunto vazio, isto é, A  A  

Eventos Mutuamente Exclusivos

Os resultados possíveis do lançamento de uma moeda são apenas dois eventos elementares
Ca e Co. Pela própria característica da experiência, se o resultado de um lançamento for cara este
resultado não poderá ser também e ao mesmo tempo coroa, pois são eventos mutuamente
exclusivos. São mutuamente excludentes se sua intersecção for vazia: A  B   não tem nenhum
elemento em comum.

4.5. Definição de Probabilidade

Dado uma experiência aleatória, sendo S o seu espaço amostral, vamos admitir que todos os
elementos de S tenham a mesma chance, ou seja, que S é um conjunto equiparável.
Chamamos de probabilidade de um evento A (A o número real P(A), tal que:
n  A
P  A 
n S
Onde:
n(A) é o número de elementos de A;

n(S) é o número de elementos de S.

Exemplos:

a) Considerando o lançamento de uma moeda e o evento A " obter cara" temos:


S  Ca, Co  n (S)  2

Alberto Hermenegildo António Tépulo - Licenciado em Ensino de Matemática na UP Nampula | 52


Sebenta de Estatistica

A  Ca  n A   1 Logo: P A 
1
.
2

O resultado acima nos permite afirmar que, ao lançarmos uma moeda equilibrada, temos 50%
de chance de que apareça cara na face superior.

b) Considerando o lançamento de um dado, vamos calcular:

- a probabilidade do evento A ʺobter um número par na face superior”.

Temos:

S  1, 2, 3, 4, 5, 6  n S  6

A  2, 4, 6  n A   3 Logo: P A 
3
.
6

-a probabilidade do evento B ʺobter um número menor ou igual a 6 na face superior”.


Temos:

S  1, 2, 3, 4, 5, 6  n S  6

A  1, 2, 3, 4, 5, 6  n B  6 Logo: PB  


6
 1.
6

- a probabilidade do evento D ʺobter um numero maior que 6 na face superiorʺ. Temos:

S  1, 2, 3, 4, 5, 6  n S  6 D    n D   0 logo P D  


0
0
6

Pelos exemplos que acabamos de ver, podemos concluir que, sendo n S  n :
a. A probabilidade do evento certo é igual a 1: P(S) 1.
b. A probabilidade do evento impossível é igual a 0: P( ) 0
c. A probabilidade de um evento E que qualquer (E⊂S) é um número real P(E), tal que:
0  PE   1
d. A probabilidade de um evento elementar E qualquer é, lembrando que n(E)=1:

Alberto Hermenegildo António Tépulo - Licenciado em Ensino de Matemática na UP Nampula | 53


Sebenta de Estatistica

P E  
1
n

Probabilidade de eventos complementares

Sabemos que um evento pode ocorrer ou não, Sendo P a probabilidade de que ele ocorra
(sucesso) e que a probabilidade de que ele não ocorra (insucesso), para um mesmo evento existe
sempre a relação:

p + q = 1⇒ q = 1 - p

1
Assim, se a probabilidade de se realizar um evento é P  ,
5
1 4
a probabilidade de que ele não ocorra é: p  q  1  q  1  p  q  1  
5 5

4.6. Probabilidade condicional e Eventos Independentes

4.6.1. Probabilidade Condicional

O evento em que a ambos, A e B, ocorrem é chamado A intersecção B; portanto, a probabilidade


do evento A ocorrer, dado que B ocorreu, é de:

P A B  P PABB , P B  0

Isso significa que a probabilidade de A ocorrer, dado que B ocorreu, é igual a probabilidade
de ocorrência simultânea de A e B dividida pela probabilidade de ocorrência de B.

Alberto Hermenegildo António Tépulo - Licenciado em Ensino de Matemática na UP Nampula | 54


Sebenta de Estatistica

Exemplo:

Considere o conjunto de números inteiros 1, 2, 3, 4, ....,19, 20   n S  20

A  13   n A   1 B  1, 2, 3, 4, 5, 6, 7, 8, 9, 11, 13, 16, 17, 19   n B   10

 A  B   13 , n A  B  1

 B  PPAB B   101
P A

Teorema do Produto

A probabilidade de ocorrência simultânea de dois eventos, A e B, do mesmo espaço


amostral, é igual ao produto da probabilidade de um deles pela probabilidade condicional do outro,
dado o primeiro.

 B  PPAB B   P A  B  PB * P A B
P A

 A   P PAAB   P A  B  P A* P B A 
P B

Exemplo:

São retiradas sem reposição duas cartas de um baralho de 52 cartas. Qual a probabilidade
de que as duas cartas sejam de ouros?
13
P (probabilidade de se retirar a primeira carta de ouros)
52

 A   1251 (probabilidade de se retirar a segunda carta de ouros, tendo sido já retirada a primeira
P B

carta de ouros).

Alberto Hermenegildo António Tépulo - Licenciado em Ensino de Matemática na UP Nampula | 55


Sebenta de Estatistica

P A  B  P A * P B A   13 12 152
*  
52 51 2625 51
3

4.6.2. Eventos Independentes

Diz – se que dois eventos são independentes quando a realização ou não realização de um dos
eventos não afecta a probabilidade da realização o outro e vice - versa.

Se dois eventos A e B são independentes: P A  B  P A * P B 

Se n eventos são independentes: então: P A  B  C  ....  P  A * P B  * P C ....

Exemplo 1: São retiradas com reposição, duas cartas de um baralho de 52 cartas. Qual a
probabilidade de que as duas cartas sejam ouro?

P A   P A  
13 13
e
52 52

Como há reposição, das cartas do baralho, as possibilidades são iguais.

P A  B  P A * P B  
13 13 1
* 
52 52 16

4.6.3. Eventos Mutuamente Exclusivos

Diz - se que dois eventos são mutuamente exclusivos quando a realização de um exclui a
realização do outro ou seja: A  B  

P A  B  P A  P B 
Neste caso:
se A  B   ; A  B   ; A  B   ,  P A  B  C   P A  P B   PC 

Assim, no lançamento de uma moeda, o evento ʺtirar cara ʺ e o evento ʺ tirar coroaʺ são
mutuamente exclusivos, já que, ao se realizar um deles, o outro não se realiza.

Alberto Hermenegildo António Tépulo - Licenciado em Ensino de Matemática na UP Nampula | 56


Sebenta de Estatistica

Exemplo:

No Lançamos um dado, considera – se o evento A  1, 5  e o evento B   2, 4, 6 

Solução:

Como os dois eventos são mutuamente exclusivos, teremos:

P A  B  P A  P B  
2 3 5
 
6 6 6

Eventos não Mutuamente Exclusivos

Diz - se que dois eventos não são mutuamente exclusivos se: A  B   , assim, obtemos:

P A  B  P A  P B   P A  B 

Exemplo:

No Lançamento de um dado, consideremos o evento B  1,2, 5, 6  e o evento B   2, 4, 6 

Os eventos não são mutuamente exclusivos, pois, a intersecção de A e B não é um conjunto vazio:
A  B   2, 6 

P A  B  P A  P B   P A  B  
4 3 2 5
  
6 6 6 6

4.7. Teorema de Bayes

Alberto Hermenegildo António Tépulo - Licenciado em Ensino de Matemática na UP Nampula | 57


Sebenta de Estatistica

Sejam A1 , A2 , A3 ,..., An , n eventos mutuamente exclusivos, tais que

A1  A2  A3 ...  An  S

Sejam, P(Ai) as probabilidades conhecidas dos vários eventos e B um evento qualquer de S,

tal que são conhecidas todas probabilidades condicionais P  B  .


 A1 

P Ai  * P  B 
P Ai  B   Ai 
P  i  
A

 B P B 
P A1  * P  B   P A2  * P  B   .....  P An  * P  B 

 A1   A2   An 

Exemplo:

Os estudantes do 2º Ano do Curso da Administração Militar da Academia Militar


“Marechal Samora Machel” de Nampula, 5% dos homens e 2% das mulheres têm mais do que
1,80 m de altura. Por outro lado, 60% dos estudantes são homens. Se um estudante é seleccionado
aleatoriamente e tem mais de 1,80m de altura, qual a probabilidade de que o estudante seja
mulher?

Alberto Hermenegildo António Tépulo - Licenciado em Ensino de Matemática na UP Nampula | 58


Sebenta de Estatistica

CAPITULO V: TEORIA DE CONTAGEM

5.1. Generalidades

Há duas formas de contagens:

 Contagem directa
 Contagem indirecta

Uma contagem diz-se indirecta quando não é possível efectuar directamente.

Exemplo:

A Ana tem 3 saias, 4 blusas e 2 pares de sapatos. De quantas maneiras diferentes a Ana
pode-se vestir no seu dia de aniversário?

R: de 24 maneiras

Neste caso, para determinar o número total de maneiras efectuamos o produto

5.2. Princípio de contagem

O princípio fundamental da contagem é um princípio combinatório que indica de quantas


formas se pode escolher um elemento de cada um de n conjuntos finitos. Se o primeiro conjunto
tem k elementos, o segundo tem k elementos, e assim sucessivamente, então o número total T de
escolhas é dado por: .

Princípio Fundamental da Contagem é o mesmo que a Regra do Produto, um princípio


combinatório que indica quantas vezes e as diferentes formas que um acontecimento pode ocorrer.
O acontecimento é formado por dois estágios caracterizados como sucessivos e independentes:

 O primeiro estágio pode ocorrer de m modos distintos.

 O segundo estágio pode ocorrer de n modos distintos.

Alberto Hermenegildo António Tépulo - Licenciado em Ensino de Matemática na UP Nampula | 59


Sebenta de Estatistica

Desse modo, podemos dizer que o número de formas diferentes que pode ocorrer em um
acontecimento é igual ao produto .

Exemplo: Alice decidiu comprar um carro novo, e inicialmente ela quer se decidir qual o
modelo e a cor do seu novo veículo. Na concessionária onde Alice foi há 3 tipos de modelos que
são do interesse dela: A, B e C, sendo que para cada carro há 5 opções de cores: preto, vinho, azul,
vermelho e prata. Qual é o número total de opções que Alice poderá fazer?
Segundo o Princípio Fundamental da Contagem, Alice tem opções para fazer, ou seja, ela

poderá optar por 15 carros diferentes.


Em geral, um acontecimento é formado por estágios sucessivos e independentes, com

possibilidades para cada. O total de maneiras distintas de ocorrer este acontecimento

é . Este método chama-se princípio fundamental de contagem.

5.3. Arranjos

Dado um conjunto A, que tem elementos quaisquer, chama-se arranjos de elementos

p a p, todas as aplicações injectivas do conjunto 1, 2, 3, …, p no conjunto A. O número de todos


possíveis arranjos m elementos p a p é designado pela notação.

ou (lê-se arranjo de m, p a p).

Exemplos:

1) Calcule:

Alberto Hermenegildo António Tépulo - Licenciado em Ensino de Matemática na UP Nampula | 60


Sebenta de Estatistica

2) Com os algarismos 1, 3, 4, 5 quantos números diferentes podem ser escritos sem repetir os
algarismos:

a) Com 2 números.

b) Com 3 números.

Solução

Note que para este caso, a troca de sequência dos algarismos escolhidos dentes os 4 algarismos,
obtém-se um novo número, isto é, um elemento.

a)

b)

Alberto Hermenegildo António Tépulo - Licenciado em Ensino de Matemática na UP Nampula | 61


Sebenta de Estatistica

5.3.1. Classificação dos arranjos

 Arranjos de 1ª ordem

 Arranjos de 2ª ordem

 Arranjos de 3ª ordem

E assim sucessivamente.

Arranjos com repetições

Este tipo de arranjos é usado quando tratamos de conjuntos numéricos.

Exemplo: Com os algarismos do conjunto , quantos números de 3 algarismos

podem ser escritos?

R: Podem ser escritos 64 números.

5.4. Factorial

Dado o número , chama-se factorial de ao produto dos primeiros números naturais.

O factorial de é designado pela notação , lê-se “ factorial”.

, ou seja

Alberto Hermenegildo António Tépulo - Licenciado em Ensino de Matemática na UP Nampula | 62


Sebenta de Estatistica

Exemplo: determine.

a)

b)

Solução

a) b)

Relação entre factorial e arranjos simples

5.5. Permutações
A permutação é um caso particular de arranjos em que , isto é, aquele em que cada

arranjo é uma aplicação injectiva do conjunto no conjunto A que tem m elementos

e é uma aplicação bijectiva.


Chama-se permutação de m elementos, que compõe o conjunto A, os arranjos desse
conjunto a ; ou seja as aplicações bijectivas do conjunto A no conjunto A.

As permutações de m elementos representam-se por e lê-se, permutações de m.

Esta designação indica o número total das aplicações bijectivas dum conjunto de m
elementos.

Alberto Hermenegildo António Tépulo - Licenciado em Ensino de Matemática na UP Nampula | 63


Sebenta de Estatistica

ou seja

Exemplo1: De quantas maneiras diferentes se podem sentar a uma mesa 6 pessoas,


sentando-se todos de cada vez em lugares fixos.

É obvio que neste caso, as maneiras de as pessoas se sentarem dizem respeito unicamente
aos lugares por uma ordem determinada (1º, 2º, etc.). Cada uma dessas maneiras é uma aplicação
injectiva do conjunto 1, 2, 3, 4, 5, 6 (conjunto dos lugares) ao conjunto das pessoas (6
elementos).

Trata-se pois da permutação de 6 elementos e o número pedido será, portanto:

Exemplo2: Com as letras da palavra MATEMÁTICA, quantas palavras com ordem e


sentido é possível formar?

Solução:

MATEMÁTICA

Números da palavra: 10

Letra M: 2; Letra A: 3; Letra T: 2; Letra E: 1; Letra I:1; Letra C: 1

Logo, há palavras diferentes que é possível formar.

5.6. Combinações

Dado o conjunto , quantos produtos de três factores é possível formar com

os elementos do conjunto A?

Alberto Hermenegildo António Tépulo - Licenciado em Ensino de Matemática na UP Nampula | 64


Sebenta de Estatistica

Note que os produtos pedidos são agrupamentos de três elementos de A, que apenas se
distinguem se forem diferentes os seus elementos. Neste caso,
representa o mesmo produto, isto é, o

mesmo elemento (pela comutatividade da multiplicao).

Definição:

Dados m elementos quaisquer, chama-se combinações desses m elementos p a p a todos


subconjuntos que é possível obter com p elementos escolhidos entre os m dados. O numero de

todas as possíveis combinações de m elementos p a p é designado pelo símbolo ou , lê-

se, combinações de m, p a p.

É obvio que duas combinações serão distintas quando e, só quando, existir pelo menos
um elemento de uma que não seja elemento da outra.

ou seja:

Exemplo: Ao terminar uma festa os seus 10 participantes se despediram com um aperto


de mão. Quantos apertos de mão foram trocados?

R: Foram trocados 45 apertos de mão.

Convenções

Propriedades das combinações

Alberto Hermenegildo António Tépulo - Licenciado em Ensino de Matemática na UP Nampula | 65


Sebenta de Estatistica

i)

ii)

iii)

Triângulo d pascal

Substituindo os termos pelos respectivos valores, teremos:

Alberto Hermenegildo António Tépulo - Licenciado em Ensino de Matemática na UP Nampula | 66


Sebenta de Estatistica

Exercícios resolvidos

1. De quantas formas diferentes se podem sentar 5 amigos em 5 lugares no cinema, de modo


que dois deles, o Guiliche e a Albertina fiquem juntos numa das pontas?

Solução:

Se considerarmos o Guiliche e a Albertina como uma so pessoa, teremos formas de sentar o

grupo (Guiliche/Alberina) e outros três amigos. No entanto o Guiliche e a Albertina podem


permutar entre si. Assim há formas diferentes de sentarem

2. Os números de telefones de uma operadora de telefonia fixa têm 8 dígitos. Sabendo que o
primeiro dígito deve ser diferente de zero, quantos telefones no máximo a operadora pode
instalar?

Solução:

Como é de verificar, a operadora pode instalar

telefones.

9 10 10 10 10 10 10 10

Então tem-se:

Alberto Hermenegildo António Tépulo - Licenciado em Ensino de Matemática na UP Nampula | 67


Sebenta de Estatistica

CAPITULO VI: VARIÁVEIS ALEATÓRIAS E DISTRIBUIÇÕES

6.1. Variável Aleatória

Definição: Considere um experimento para o qual o espaço amostral é denotado por S.


Define-se variável aleatória como uma função que associa um valor real a cada elemento do
espaço amostral.

Representamos as variáveis aleatórias por letras maiúsculas e suas ocorrências por letras
minúsculas.

Exemplo:

Suponha o experimento "lançar três moedas". Seja X: número de ocorrências da face


cara. O espaço amostral do experimento é:

S = {(c; c; c); (c; c; r); (c; r; c); (c; r; r); (r; c; c); (r; c; r); (r; r; c); (r; r; r)}.

Se X é o número de caras, X assume os valores 0, 1, 2 e 3. Podemos associar a esses


números eventos que correspondem a nenhuma, uma, duas ou três caras respectivamente, como
segue:

X Evento Correspondente

Alberto Hermenegildo António Tépulo - Licenciado em Ensino de Matemática na UP Nampula | 68


Sebenta de Estatistica

6.2. Tipos de Variáveis Aleatórias, Função de Probabilidade e Função Densidade de


Probabilidade

Definição: Seja X uma variável aleatória (v.a). Se o número de valores possíveis de X


(isto é o seu contradomínio) for finito ou infinito enumerável, denominaremos X de variável
aleatória discreta. Isto é, existe um conjunto finito ou enumerável {x1 , x2 ....}  IR tal que

X s   {x1 , x2 ....};s  S .

Definição: Seja X uma variável aleatória discreta. Portanto, o contradomínio de X será


formado por um número finito ou enumerável de valores x1 , x2 .... . A cada possível resultado xi,

associaremos um número pxi   P X  xi ; i  1,2,3,..., denominado probabilidade de xi. Os

números pxi  devem satisfazer às seguintes condições:

A função p, definida acima, é denominada função de probabilidade da variável


aleatória X. A coleção de pares [ xi ; pxi ]; i  1,2,3,... , é denominada distribuição de
probabilidade de X.

Exemplos.

Consideremos o exemplo anterior, do lançamento

X Evento Correspondente

Alberto Hermenegildo António Tépulo - Licenciado em Ensino de Matemática na UP Nampula | 69


Sebenta de Estatistica

Vamos verificar se se pode tratar de uma distribuição de probabilidade ao calcular a


função densidade apresentada na tabela seguinte.

X 0 1 2 3 Soma

Observamos que todas as probabilidades calculadas são positivas e a, também, o somatório


de todas as probabilidades calculadas resulta em uma unidade, pelo que as condições estão
satisfeitas e por isso, trata-se de uma distribuição de probabilidade.

b) Lançam-se d o i s dados. Seja a v.a. X : soma das fa ce s . Determinar a


distribuição de probabilidade d a variável aleatória X (Figura 3.1).

X 2 3 4 5 6 7 8 9 10 11 12
p  xi  1 2 3 4 5 6 5 4 3 2 1
36 36 36 36 36 36 36 36 36 36 36

Alberto Hermenegildo António Tépulo - Licenciado em Ensino de Matemática na UP Nampula | 70


Sebenta de Estatistica

Fig. 3.1 – G r á f i c o de P X  para dois dados

b) Considere o experimento no qual uma moeda é jogada dez vezes e seja X ser o
número de caras que são obtidas. Neste experimento, o s possíveis valores de X são 0, 1, 2,
n 1
3, 4, 5, 6, 7, 8, 9, 10 e P X     10 ; x  1,2,3,4,...,9,10
 x2

Definição: Seja X uma variável aleatória. Suponha que  x o contradomínio de X,

seja um intervalo ou uma coleção de intervalos. Então diremos que X é uma variável
aleatória contínua.

Definição: Seja X uma variável aleatória contínua. A função densidade de


probabilidade f, indicada abreviadamente por f.d.p., é uma função f que satisfaz às
seguintes condições:

a) f x   0; x   x

b)  x f  x dx  1

d
Além disso, definimos, para qualquer c  d (em  X ) P c  x  d    f  x dx
c

Obs:

a) A Pc  x  d  representa a área sob a curva, como exemplificado no gráfico da

Alberto Hermenegildo António Tépulo - Licenciado em Ensino de Matemática na UP Nampula | 71


Sebenta de Estatistica

Figura 3.2, da f.d.p. f, entre x = c e x = d.


b) Constitui uma consequência da descrição probabilística de X que, para qualquer
valor especificado de X, digamos x0 , teremos P X  x0   0 porque calculando a
x0

integral num mesmo ponto ela é nula, isto é, P X  x0    f x dx  0 .


x0

Exemplo:

a) Suponhamos que a v.a. X seja contínua. Seja a f.d.p. f dada por:

2 x Se 0  x  1,
f x   
 0 Caso contrario.

Gráfico 3.2. da f.d.p de f.

1/ 2

Evidentemente, f  x   0 e  f x dx   2 xdx  1 . Para calcular, P  X  1 / 2    2 xdx  1 / 4
1

 0
0

b) Seja X a duração de vida (em horas) de um certo tipo de lâmpada. Admitindo que
X seja uma variável aleatória contínua, suponha que a f.d.p. f de X seja dada por:
 a
1500  x  2500
f x    x 3
a
. Para calcular, se efectua 
2500
dx  1  a  7031250
 0 outros
1500 x3

Alberto Hermenegildo António Tépulo - Licenciado em Ensino de Matemática na UP Nampula | 72


Sebenta de Estatistica

6.3 Função de Distribuição Acumulada

Definição: A função de distribuição da variável aleatória X, representada por FX


ou simplesmente por F, é definida por:

FX (x) = P (X ≤ x) (3.2)

Observação:

a) A função de distribuição de X é também frequentemente chamada de função de


distribuição acumulada de X.
b) A função FX (x) é não-decrescente quando x aumenta, isto é, se x1  x2 , então FX (x1 )
≤ FX (x2 ).
c) Para qualquer valor de x, P X  x   1  FX x  (3.3)

d) Para quaisquer valores x1 e x2 , tais que x1 <x2 , Px1  X  x2   FX x2   FX x1 


(3.4)

Teoremas:

a) Se X for uma variável aleatória discreta,

FX  x    p x j 
j

Onde o somatório é estendido a todos os índices j que satisfaçam à condição xj  x

x
b) Se X for uma variável aleatória contínua com f.d.p. f , F X  x    f s ds Exemplos:


a) Suponhamos que a v.a. X tome os três valores 0,1, e 2, com probabilidades

1/3, 1/6 e 1/2, respectivamente. Então:

Alberto Hermenegildo António Tépulo - Licenciado em Ensino de Matemática na UP Nampula | 73


Sebenta de Estatistica

 0; x  0
1 / 3;0  x  1

F x   
1 / 2;1  x  2
 1;0  x  2

O gráfico de F está apresentado na Figura 3.3.

Fig. 3.3 – Gráfico F

6.4 Distribuições Bivariadas

Em alguns experimentos, é necessário considerar as propriedades de 2 ou mais


variáveis simultaneamente. A distribuição de probabilidade conjunta de duas v.a. é
denominada uma distribuição bivariada.

3.4.1 Distribuições Conjuntas Discretas

Suponha que um certo experimento envolve duas v.a. X e Y, cada qual com uma
distribuição discreta.

A função de probabilidade conjunta de X e Y é definida pela função p tal que


qualquer ponto (x, y) no plano xy,

p x, y   P X  x  e PY  y  (3.5)

Observação:

a)  p(xi, yi) = 1
Alberto Hermenegildo António Tépulo - Licenciado em Ensino de Matemática na UP Nampula | 74
Sebenta de Estatistica

b) Se X e Y forem independentes p (xi , yi ) = P (X = xi ) · P (Y = yi )

Exemplo:

Suponha que a variável aleatória X possa assumir somente os valores 1, 2, e 3, que


a variável aleatória Y possa assumir somente os valores 1, 2, 3 e 4, e que a função de
probabilidade conjunta de X e Y seja dada pela tabela:

YX 1 2 3 4

1 0,1 0 0,1 0

2 0,3 0 0,1 0,2

3 0 0,2 0 0

A função de probabilidade-conjunto é mostrada na Figura 3.5. Deseja-se determinar:

a) P (X ≥ 2 e Y ≥ 2);

b) P (X = 1).

a) Somando-se p (x, y) para todos os valores de x ≥ 2 e y ≥ 2, tem-se:

Alberto Hermenegildo António Tépulo - Licenciado em Ensino de Matemática na UP Nampula | 75


Sebenta de Estatistica

P X  2eY  2   P2,2   P2,3  P2,4   P3,2   P3,3  P3,4   0,5


4
b) P X  1   p1, y   0,2
y 1

3.4.2 Distribuições Conjuntas Contínuas

É dito que duas v.a. X e Y possuem uma distribuição conjunta contínua se


existe uma função f não negativa, definida sobre o plano xy, tal que para qualquer
subconjunto A do plano

P[x, y   A]   f x, y dxdy (3.6)


A

A função f é denominada função densidade de Probabilidade de X e Y. Esta função


deve satisfazer

f  x, y   0; para    x  ;  y  

 

  f x, y dxdy  1
  
(3.7)

A probabilidade que o par (X, Y) pertença a uma região do plano xy pode ser
encontrada integrando a f.d.p. conjunta sobre esta região. A Figura 3.5 mostra um exemplo
de f.d.p. conjunta.

Alberto Hermenegildo António Tépulo - Licenciado em Ensino de Matemática na UP Nampula | 76


Sebenta de Estatistica

Fig. 3.6

6.5 Distribuições Marginais

Denomina-se função densidade de probabilidade marginal de X à função


densidade de probabilidade de X quando ela é obtida através da f.d.p. conjunta de X e Y.

Caso Discreto

Se X e Y são v.a. discretas com f.p. conjunta p (x, y), então a f.p. marginal de X é
obtida por:

PX  x   P  X  x    p  x, y  (3.8)
y

Simultaneamente, a f.p. marginal de Y é PY  y   P Y  y    p  x, y  (3.9)


x

Exemplo:

Suponha que a variável aleatória X possa assumir somente os valores 1, 2, e 3, que


a variável aleatória Y possa assumir somente os valores 1, 2, 3 e 4, e que a função de
probabilidade conjunta de X e Y seja dada pela tabela:

Y 1 2 3 4 Marginal de X
X
1 0,1 0 0,1 0 0,2
2 0,3 0 0,1 0,2 0,6
3 0 0,2 0 0 0,2
Marginal de Y 0,4 0,2 0,2 0,2 1,0

A f.p. marginal de X é determinada somando-se os valores de cada linha da tabela,


e é dada na última coluna da tabela. Analogamente a f.p. marginal de Y é dada na última

Alberto Hermenegildo António Tépulo - Licenciado em Ensino de Matemática na UP Nampula | 77


Sebenta de Estatistica

linha da tabela.

Caso Contínuo

Se X e Y possuem uma distribuição conjunta com f.d.p. conjunta f (x, y), então a
f.d.p. marginal fX (x) de X é obtida por:


f X x    f x, y dy (3.10)


Simultaneamente, a f.d.p. marginal de Y é obtida por:


f Y x    f x, y dx (3.11)


Observação

Se X e Y forem independentes

P x, y   PX  x   PY  y  (Caso discreto)

f  x, y   f X  x   f Y  y  (Caso contínuo)

Exemplo:

Suponha que X e Y possuam um distribuição contínua conjunta, cuja p.d.f. conjunta


seja definida por:

3 2
 y 0  x  2 e 0  y 1
f  x, y    2
 0 caso contrario

a) Determine as f.d.p’s marginais de X e Y;


b) X e Y são independentes?
 1
c) Determine P X  2 e P Y   .
 2

Alberto Hermenegildo António Tépulo - Licenciado em Ensino de Matemática na UP Nampula | 78


Sebenta de Estatistica

Sol.

1
3 2
a) Tem - se que  y dy  1 / 2. Logo, a f.d.f. marginal de X é dada por
0
2

1 / 2 0x2
f X x   
 0 caso contrario
2
3 2
b) Tem - se que  y dy  3 y 2 . Logo, a f.d.f marginal de Y é dada por
0 2

3 y 2 0  y 1
f X x    .
 0 caso contrario

c) Tem-se que f  x, y   f X  x   f Y  y  logo X e Y são independentes.


2 1
d) P X  1 / 2    dx  3 / 4 e P Y  1 / 2    3 y 2 dx  7 / 8 .
1
1 2 1/ 2
2

6.6. Esperança de Uma Variável Aleatória

3.6.1 Distribuições Discretas

Suponha que uma variável aleatória (v.a.) X possua uma distribuição discreta cuja
f.d.p. é p (x). A esperança de X, denotada por E(X), é um número definido por

  E  X    xp  x 
x

Exemplo

Suponha que uma v.a. X possa assumir somente quatro valores: −2, 0, 1, e4, e que

P (X = −2) = 0.1; P (X = 0) = 0.4; P (X = 1) = 0.3; P (X = 4) = 0.2

Então E  X   2.0.1  0.0.4   1.0.3  4.0.2   0.9

Alberto Hermenegildo António Tépulo - Licenciado em Ensino de Matemática na UP Nampula | 79


Sebenta de Estatistica

6.6.2 Distribuições Contínuas

Se uma variável aleatória (v.a.) X possui uma distribuição contínua com f.d.p. f (x),
então a esperança E(X) é definida p o r


  EX    xf x dx


Exemplo

Suponha que a f.d.p. de uma v.a. X com uma distribuição contínua seja:

2x 0  x 1
f X x   
 0 caso contrario

1
1 1
Então, E  X    x2 x dx   2 x dx 
2 3  2/3
 3 x 
2

0 0
0

Observação

O número E  X  é também denominado valor esperado de X,ou a média de X.

6.6.3 Propriedades da Esperança

P1.

Se a é uma constante qualquer E  X  a   E  X   a

Se a é uma constante qualquer E aX   aE  X 

P3.

Se X1 , X2 , , Xn são n variáveis aleatórias tais que E(Xi ) existe (i = 1, 2, ..., n), então
E(X1 + X2 + ... + Xn ) = E(X1 ) + E(X2 ) + ... + E(Xn )

Alberto Hermenegildo António Tépulo - Licenciado em Ensino de Matemática na UP Nampula | 80


Sebenta de Estatistica

6.7 Variância de uma Variável Aleatória

Definição

Suponha que X é uma v.a. com média   E  X  . A variância de x,


representada por V ar(X) é definida por

Var  X   E[ x    ] onde   E X 


2

6.7.1 Variáveis Aleatórias Discretas

Suponha que uma v.a. X possua uma distribuição discreta, cuja f.d.p. é p  x  . Então

Var  X     x    . p x    x 2 . p x    2
2

x x

Exemplo:

Suponha que uma v.a. X possa assumir somente quatro valores: −2, 0, 1, e 4, e que

P (X = −2) = 0, 1; P (X = 0) = 0, 4; P (X = 1) = 0, 3; P (X = 4) = 0, 2. Como visto


anteriormente, E  X  = 0, 9. Então

Var  X    2  0.9  * 0.1  0  0.9  * 0.4  1  0.9  0.3  4  0.9  * 0.2  3.09
2 2 2 2

6.7.2 Variáveis Aleatórias Contínuas

Suponha que a f.d.p. de uma v.a. X com uma distribuição contínua seja:

2x para 0  x  1
f x   
 0 o caso contrario

Como foi visto anteriormente E  X   2 / 3 , então,

Alberto Hermenegildo António Tépulo - Licenciado em Ensino de Matemática na UP Nampula | 81


Sebenta de Estatistica

2
2
1
Var  X    x .2 x dx    
2 1
2

0 3 36 18

Alberto Hermenegildo António Tépulo - Licenciado em Ensino de Matemática na UP Nampula | 82


Sebenta de Estatistica

Bibliografia:

1. FONSECA, Jairo Simon da & MARTINS, Gilberto de Andrade: Curso de Estatística. 5ª


ed, Editora Atlas, S. Paulo, 1995, 315p;
2. FERNANDES, Edite Manuela da G. P.: Estatística: s/ed , Universidade do Minho, Braga,
1999, 108p;
3. CORREA, Sónia Maria Barros Barbosa. Probabilidade e Estatística. 2ª Edição – Belo
horizonte: PUC Minas Virtual 2003;
4. MARTINS, Gilberto de A.. Estatistica geral e Aplicada. 3ª Ed. São Paulo: Editora Atlas
S.A.,2010;
5. MULENGA, Alberto. Introdução à Estatística. Maputo 2004;
6. SPIEGEL, Murray R. & STEPHENS, Larry J..Estatística. 4ª ed. Porto Alegre:Bookman,
2009;
7. TIBONE, Conceição Gentil Rebeli. Estatística Básica para o curso de Turismo – 2ª
Edição. Editora Atlas, São Paulo, 2003;
8. ROBALLO, A. Estatística – exercícios - Probabilidade e variáveis aleatorias.5ª edicao.
Editora Silabo, Lisboa, 2003;
9. NUNES, Cristina N..Probabilidade & Estatistica. Escolar editora, Lisboa 2012.

Alberto Hermenegildo António Tépulo - Licenciado em Ensino de Matemática na UP Nampula | 83

Você também pode gostar