Escolar Documentos
Profissional Documentos
Cultura Documentos
Nelson Mulemba
Maputo, 2018
Nelson Mulemba
Introdução 1
1 A Natureza da Estatística 2
1.1 Estatística . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.2 Divisões da Estatística . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.3 Método Cientíco . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.3.1 Método Experimental . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.3.2 Método Estatístico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.4 Fases de um Método Estatístico . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2 População e Amostra 8
2.1 População e Amostra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
2.2 Amostragem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.2.1 Importância da Amostragem . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.2.2 Tipos de Amostragens . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
2.3 Variável e suas classicações . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
3 Distribuição de Frequências 20
3.1 Tabelas de frequências . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
3.1.1 Tipos de Frequências . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
3.1.2 Tabelas de Frequências em Intervalos de Classes . . . . . . . . . . . . . . 23
Só para relaxar 50
8 Introdução às Probabilidades 75
8.1 Experimento aleatório . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
8.2 Espaço Amostral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
Só para relaxar 81
Referências Bibliográcas 90
Todos os exercícios deverão ser resolvidos num caderno. Meu desejo é que aqueles que
zerem o bom uso deste manual, tenham um bom aproveitamento e conquistem linguagem
estatística para toda a vida.
Aproveitar agradecer todos aqueles que farão uso deste manual, e em especial aqueles que
farão críticas com intuito de melhoramento e aperfeiçoamento deste manual.
Em nelsonrafaelmulemba@gmail.com
DoceModel
1
Capı́tulo 1
A Natureza da Estatística
empírico.
A Estatística, ramo da Matemática Aplicada, teve origem semelhante. Desde antiguidade, vá-
rios povos já registavam o número de habitantes, de nascimentos, de óbitos, faziam estimativas
de riqueza individual e social, distribuiam equitativamente terras ao povo, cobravam impostos
e realizavam inquéritos quantitativos por processo que, hoje chamariamos de "estatísticas".
A partir do século XVI começaram a surgir as primeiras análises de factos sociais, como ba-
tizados, casamentos, funerais, originando as primeiras tábuas e tabelas e os primeiiros números
relativos.
Ao longo da idade média e até ao século XVIII, a estatística foi puramente descritiva, coexistindo
duas escolas: a escola descritiva alemã, cujo representante mais conhecido é o economista Go-
dofredo Achenwall (1719-1772), professor na Universidade de Gottingen, considerado pelos
alemães como o pai da estatística, batizou a nova ciência (ou método) com o nome de Estatís-
tica, determinando o seu objectivo e suas relações com as ciências e a escola dos matemáticos
sociais, que procuravam traduzir por leis as regularidades observadas de certos fenômenos, de
carácter econômico e sociológico. Embora essa escola procurasse fundamentar a formulação de
previsões com base de leis sugeridas pela experiência, a estatística confundia-se, praticamente,
com a demograa à qual fornecia métodos sistemáticos de enumeração e organização. Na re-
alidade a necessidade sentida, em todas épocas, de conhecer numérica e quantitativamente, a
2
realidade política e social tornou análise demográca uma preocupação constante.
Em todas as áreas da ciência, a colecta de dados se faz necessaria e com isso a Estatística tem
crescido muito nos últimos anos, especialmente com o advento de computadores e surgimento
de softwares cada vez mais sosticados. Observar uma extensa listagem de dados colectados
não nos permite chegar a uma conclusão concisa. Este facto se afasta se esse conjunto de dados,
possui muitas características que devem ser investigadas.
Os métodos descritivos são utilizados, portanto, para organizar, resumir e descrever aspectos
importantes de um conjunto de características observadas ou comparar tais características entre
dois ou mais conjuntos.
Ao se resumir ou condensar um conjunto de dados, informacões são perdidas, visto que, não
estamos mais trabalhando com as observações originais. Entretanto, esta perda de informação
é pequena se compararmos ao ganho que se tem com a clareza da interpretação proporcionada.
Não só nos artigos técnicos direcionados para pesquisadores mas também, nos artigos de jornais
e revistas escritos para o público leigo, é cada vez mais frequente a utilização dos recursos de
descrição para complementar a apresentação de um facto, justicar ou referendar um argu-
mento.
1.1 Estatística
A Estatística originou-se da colecta de dados e construção de tabelas de dados para o governo.
A situação foi evoluindo e esta colecta de dados representa somente um dos aspectos da Esta-
tística.
Exprimindo por meio de números as observaçoes que se fazem de elementos com, pelo menos,
Sendo assim torna-se como objectivo principal da estatística, o auxílio na tomada de decisão
ou tirar conclusões en situações de incerteza, a partir de informações numéricas.
Denição 1.1.1. A Estatística é uma parte da Matemática Aplicada que fornece métodos
para a colecta, organização, descrição, análise e interpretação de dados e para a utilização dos
• Meteorologia: Informa que a chance de chuva para hoje é de 30% (utilização de métodos
estatísticos de previsão);
• INE/Índices: Censo; taxa de desemprego; inação; custo de vida; valor do salário mínimo,
índices de preços; taxa de mortalidade/natalidade; índices de analfabetismo, etc.
II: Estatística indutiva ou inferencal: é o ramo da estatística cujo objectivo é fazer ar-
mações a partir de um conjunto de valores representativo (amostra) sobre um universo,
fundamentado pela teoria da probabilidade.
II: Planeamento: Nesta fase temos a considerar os procedimentos necessários para o desen-
volvimento do trabalho, ou seja, Como levantar informações? Que dados deverão ser
obtidos? Que tipo de amostragem será usada? O cronograma das actividades e os custos
envolvidos, etc.
IV: Apuração dos Dados: Não nada mais do que o resumo dos dados através de sua conta-
gem e agrupamento. É a condensação e tabulação de dados.
V: Apresentação dos Resultados: Por mais diversa que seja a nalidade que se tenha
em vista, os dados devem ser apresentados sob forma adequada (tabelas ou grácos),
tornando mais fácil o exame daquilo que está sendo objecto de tratamento estatístico e
posterior obtenção de medidas típicas. As duas formas de apresentação, não se excluem
mutuamente. A apresentação tabular, ou seja é uma apresentação númerica de dados
em linhas e colunas distribuídas de modo ordenado. A apresentação gráca dos dados
númericos constitui uma apresentação geométrica permitindo uma visão rápida e clara
do fenómeno.
VI: Análise dos Resultados: O último objectivo da Estatística é de tirar conclusões sobre o
todo (população) a partir de uma parte representativa do todo (amostra). Sendo assim,
concluídas as fases anteriores (Estatística Descritiva), fazemos uma análise dos resul-
tados obtidos através dos métodos da Estatística Indutiva ou Inferencial, e tiramos
desses resultados conclusões e previsões. É a etapa mais delcada e importante, está liga
ao cálculo de medidas e coecientes. Aqui temos que tirar conclusões que servirão para
auxiliar o pesquisador a resolver o seu problema. Na estatística indutiva a interpretação
dos dados se fundamentam na teoria de probabilidade.
Actualmente a empresa é uma das vigas mestras da Economia dos povos. A direcção de
qualquer tipo de empresa, exige dos seu administrador a importante tarefa de tomar de-
cisões, e o conhecimento e o uso da Estatística facilitará seu tríplice trabalho de oganizar,
dirigir e controlar a empresa.
elementos que possuem pelo menos, uma característica em comum e com interesse para o estudo.
Denição 2.1.2. População nita: é aquela população em que é possível conhecer a quanti-
Denição 2.1.3. População innita: é aquela população em que não é possível conhecer a
Exemplo 2.1.2. Um estudo sobre espécies de pássaros que frequentam uma certa zona.
Assim, os estudantes, por exemplo, constituem uma população, pois apresentam pelo menos
uma característica em comum: estudam.
Como em qualquer estudo estatístico temos em mente pesquisar uma ou mais características
dos elementos de alguma população, esta característica deve estar bem denida. É isso que se
dá quando, considerando um elemento qualquer, podemos armar, sem ambiguidade, se esse
elemento pertence ou não à população. É necessário, pois existir um critério de constituição da
população, válido para qualquer pessoa, no tempo ou no espaço.
8
Denição 2.1.4. Amostra é um subconjunto (parte) nito da população que é examinada
Exemplo 2.1.3. Medicina: Pretende-se estudar o efeito de um novo medicamento para curar
Nos casos em que o estudo é feito a toda população, denomina-se por Censo.
todos os seus elementos, e fazer juízos quantitativos acerca de características importantes desse
universo.
de interesse comum.
2.2 Amostragem
Denição 2.2.1. Amostragem: é uma técnica estatística que signica extrair uma parte da
Portanto, quando se trata de amostra, a preocupação central é que ela seja representativa.
Assim que decidimos obter informações através de um levantamento amostral, temos imedian-
tamente dois problemas:
1. Economia: Quando não houver recursos sucientes para estudar toda a população, é
bem mais económico estudar uma parte dela;
4. Operacionalidade: a condução do estudo ca bem mais fácil com menor número de
elementos pesquisados.
A decisão de quem pesquisar exige que o universo seja denido de modo que uma amostra
adequada possa ser selecionada. As entrevistas realizadas com o público correcto são factores
básicos para a validade do estudo. O tamanho da amostra depende do orçamento disponível e
do grau de conança que se quer alocar aos resultados.
• Amostragens Probabilísticas
2. Amostragem Sistemática
2. Amostragem Intencional
4. Bola de Neve
Amostragens Probabilísticas
Nesse tipo de amostragem, os elementos da amostra são seleccionados aleatoriamente e todos
eles possuem probabilidade conhecida de serem escolhidos. Tal selec ção ocorre através de uma
forma de sorteio não viciado, como o sorteio em uma urna por números gerados por computa-
dor. A amostragem probabilística é objectiva , pois não né inuenciada pela pessoa que está
Exemplo 2.2.1. Vamos obter uma amostra representativa de nove alunos para a pesquisa de
Temos que: N = 90 e n = 9 .
b): Escrevemos os números de 01 a 90, com pedaços iguais de um mesmo papel, colocando-os
dentro de uma caixa. Agitamos sempre a caixa para misturar bem os pedaços de papel e
2: Amostragem Sistemática
amostra formada por cinquenta prédios. Podemos, neste caso, usar o seguinte procedimento:
900
Como N = 900 e n = 50 , determinemos o valor de K , dado por K = = 18 , escolhemos
50
aleatoriamente um número de 1 a 18, o qual será o primeiro elemento sorteado da amostra, os
Assim, se o número escolhido fosse 5, tomariamos os prédios: 5◦ prédio, 23◦ prédio, 41◦ prédio,
Muitas vezes a população se divide em subpopulações (estratos). Como é provável que a va-
riável em estudo apresente, de estrato em estrato, um comportamento heterogêneo (diferenças)
e, dentro de cada estrato, um comportamento homogêneo.
Quando a população se divide em estratos (sub-populações), convém que o sorteio dos ele-
mentos da amostra leve em consideração tais estratos, daí obtemos os elementos da amostra
proporcional ao número de elementos desses estratos. A esolha dos elementos amostrais dos
estratos pode ser feita aleatoriamente
O número de elementos a ser seleccionado em cada estrato deve ser proporcionalmente (regra
de três simples) ao tamanho do estrato, portanto, o processo do cálculo de número de elementos
a serem extraídos em cada estrato é:
N -número de elementos da população; n -número de elementos da amostra;
N1 -número de elementos 1◦ estrato; n1 -número de elementos da amostra de N1
N2 -número de elementos 2◦ estrato; n2 -número de elementos da amostra de N2 ; etc.
Então:
N1 n1 n
= , ou seja, n1 = N1 · ;
N n N
N2 n2 n
= , ou seja, n2 = N2 · ; etc.
N n N
Exemplo 2.2.3. Supondo uma turma de 90 alunos, sendo 54 meninos e 36 meninas. Pretende-
se estudar o tempo de ocupação pelas tarefas domésticas, com uma amostra representativa de
9 elementos.
Como a variável de estudo pode apresentar muita divergência em relação ao género, pois pode-
mos supor que as meninas gastam mais tempo em relação aos meninos nas tarefas domésticas,
então é recomendável uma amostra proporcional aos dois estratos (género masculino e género
Temos: N = 90 , n = 9
• Não se possui uma lista contendo todos os nomes dos elementos da população;
• O custo de obtenção dos dados cresce com o aumento da distância entre os elementos.
mapa indicando cada quarteirão e não dispor de uma relação actualizada dos seus moradores.
Pode-se, então, colher uma amostra dos quarteirões e fazer a contagem completa de todos os
Quem determina a amostra a ser utilizada? O pesquisador é quem irá determinar. Para isso
deverá estar atento, a pergunta da pesquisa, ao tipo de estudo e as variáveis estudadas. Com
este conjunto de informações é que o pesquisador determinará qual o método viável de análise
estatística a ser utilizado, ou seja, tipo de amostragem, etc.
As amostras não probabilísticas são muitas vezes a opção para alguns estudos devido á sua
simplicidade ou, como acontece na maioria das vezes, não é possível uma amostra tão denida
para se obterem amostras probablísticas. Principalmente quando não é objectivo do estudo,
fazer generalização dos resultados das análises estatísticas da amostra para a população de onde
a amostra foi retirada.
LEMBRAR QUE: É preciso car claro para os pesquisadores e para os usuários da pes-
quisa que essemétodo possui inúmeras limitações, sendo inferior à amostragem probabilística em
termos de precisão de resultados. Quando utilizar o processo de amostragem não probabil±tica
LEMBRAR QUE os resultados produzidos por este tipo de pesquisa devem ser interpretados
com cuidado.
O uso de amostragem não probabilística é uma das principais escolhas por alunos que desenvol-
vem um Trabalho dem do curso, uma monograa ou uma Tese de Mestrado, etc. Geralmente
esses estudos são exploratórios e não existe a necessidade de uma amostra altamente "precis"e
Trata-se de uma amostra formada por aqueles elementos que vão aparecendo, que são possíveis
de se obter até completar o número de elementos da amostra. É o pesquisador quem dene
quais são convenientes para a pesquisa.
2: Amostragem Intencional
Exemplo 2.2.5. Numa pesquisa sobre preferência por determinado cosmetível, o pesquisador
A população é dividida em vários subgrupos, na realidade é comum dividir emum grande nú-
mero para compensar a falta de aleatoriedade, e selecciona-se uma quota de cada subgrupo,
proporcional ao tamanho. Por exemplo, em uma equipa de opinião eleitoral poderíamos dividir
a população de eleitores por sexo, nível de instrução, faixas de rendas entre outros aspectos,
e obter quotas proporcionais ao tamanho dos grupos (que poderia ser obtido através das in-
formações do INE). Na amostragem por quotas os elementos da amostra são escolhidos pelos
entrevistadores (de acordo comos critérios,...),geralmente em pontos de grande movimento,o
que sempre acarreta certa subjectividade (e impede que qualquer um que não esteja passando
pelo local no exacto momento da pesquisa possa ser seleccionado). Na prática muitas pesquisas
são realizadas utilizando amostragem por quotas.
4: Bola de Neve
Um modelo de bola de neve é apropriadamente utilizado em pesquisa quando os membros da
população são difíceis de localizar, por exemplo: imigrantes sem visto de permanência no país.
Em uma amostragem bola de neve, o pesquisador colecta dados sobre um pequeno número
de membros da população alvo quue consegue localizar e solicita a estes que o auxiliem a
providenciar o contacto com outros membros dessa população.
Exemplo 2.2.6. Se o pesquisador quer entrevistar imigrantes de um país especíco, pode iniciar
buscando por pessoas que conhece e pedindo novos contactos de conterrâneos conhecidos a estes.
Esse processo continua até que o pesquisador tenha todas as entrevistas que necessita que sejam
atingidas.
amostra ou população. Como o nome diz, seus valores variam de elemento para elemento. As
De acordo com a sua natureza, as variáveis podem ser classicadas como: variável quali-
tativa ou variável
quantitativa
.
N ominal
Qualitativa
Ordinal
Variável
Discreta
Quantitativa
Continua
forma de qualidade ou atributo. Esses dados não podem ser operados algebricamente: Temos
vações. Exemplo: Classe social (baixa, média, alta), etc. Para além dos nomes, estas variáveis
permitem a sua organização numa certa ordem, lógica e objectiva, cerscente ou decrescente.
resulta de uma contagem ou medição. Exemplo: número de lhos, salário semanal, agregado
familiar, etc.
nito de valores e, assim, somente fazem sentido valores inteiros não negativos. Como exemplo,
temos: número de lhos, número de alunos presentes na aula, etc.
Quantitativas contínuas: resulta normalmente de uma medição, e a escala numérica de seus
possíveis valores corresponde ao conjunto de números reais. Temos como exemplo: Tempera-
tura, preço, altura, etc.
Após a colecta de informações relativamente a uma variável dispomos dos dados de uma forma
desarumada e, naturamente devemos organizá-los. Essa organização facilita a interpretação
dos dados e condensa o número de informações. Não são raras as situações onde existem vários
valores repetidos. Denominamos frequência absoluta ou simplesmente frequência ao número de
vezes que um determinado valor da variável aparece. Somos capazes de observar muito mais
facilmente esses valores ordenados se os dispusermos em uma coluna e, ao lado de cada valor
a sua respectiva frequência. Esta tabela é denominada distribuição de frequências ou dados
agrupados.
Dados Brutos: é uma tabela ou relação de elementos que não foram numericamente
organizados. Nela não é fácil formarmos uma ideia exacta do comportamento do grupo como
um todo, a partir de dados não agrupados ou ordenados.
Exemplo 3.1.1. 45; 41; 42; 41; 42; 43; 44; 41; 50; 46; 50; 46; 60; 54; 52; 58; 57; 58; 60; 51
20
3.1.1 Tipos de Frequências
Frequência absoluta fi : ou simplesmente frequência de um valor é o número de vezes que
uma determinada variável assume esse valor. A sima de todas frequências é igual ao número
de observações ou seja ao número de elemetos da população ou amostra. Em outras palavras
X
fi = n.
Exemplo 3.1.2. Considere a seguinte amostra que resultou na observação da variável "Cor
Castanho, Azul, Castanho, Castanho, Preto, Castanho, Verde, Castanho, Preto, Castanho,
As respostas são os dados observados de umavariável estatística, número de lhos por cada
estudante, e não estão agrupados. Olhando para eles será difícil tirar conclusões.
Os valores que a variável estatística assumiu durante o inquérito são: 0, 1, 2, 3, 4, 6, 7.
Pode-se representar a tabela dos resultados obtidos, fazendo a contagem. Passará se a ter os
dados agrupados a partir dos avalores que a variável estatística pode assumir:
Números de lhos por estudante (Xi ) Número de estudantes (fi )
0 2
1 2
2 8
3 4
4 2
6 1
7 1
Total n=20
Em contrapartida com os dados recolhidos com esta tabela já se podem tirar algumas con-
clusões , como por exemplo, que a maioria dos estudantes inquiridos têm dois lhos.
No entanto, se acrescentar á atabela anterior duas colunas, uma com a frequência relativa fr
e a outra a frequência relativa percentual fr % , pode-se tirar mais conclusões e comparar os
resultados com estudos semelhantes em outras populações, ou seja, a frequência relativa do
valor de (3 lhos) é 0.2, que é o mesmo que dizer 20%. Isto quer dizer que, em cada 100 alunos,
20 têm lhos.
Xi fi Fi fr fr % Fr %
0 2 2 0.1 10 10
1 2 4 0.1 10 20
2 8 12 0.4 40 60
3 4 16 0.2 20 80
4 2 18 0.1 10 90
6 1 19 0.05 5 95
7 1 20 0.05 5 100
Total n=20
P P
fr = 1 f r% = 100
Limites de classe: são os extremos de cada classe. O menor número é o limite inferior de
classe (Li ) e o maior número, limite superior de classe (Ls ) .
Ponto médio da classe (xp ) : é o ponto que divide o intervalo de classe em duas partes
Li + Ls
iguais. É denido pela expressão xp = .
2
Primeiro Passo: Identicar o valor máximo ( Xmax ) e valor mínimo (Xmin ) para determinar
a Amplitude Total (At ) : onde At = Xmax − Xmin .
√
Segundo Passo: Determinar o número de classes ou intervalos (K) : K ∼
= n (aproximação
em excesso), onde n é o número de observações e deve ser maior ou igual a 30. Para n
menor que 30 podemos adoptar como K = 5 .
At
Terceiro Passo: Determinar a amplitude da classe (a) : a ∼
= (aproximação em excesso).
K
Em princípio a amplitude da classe deve ser igual em todas classes.
Quinto Passo: Fazer a contagem (senecessário) e preencher a respectiva frequência para cada
classe, determinando o seu ponto médio (xp ) pois este representa a classe.
2. Não deve existir classe com frequência nula, caso existir deve ser eliminada;
4. O número de classes de um modo geral, não deve ser menor que 5 ou maior que 25.
Exemplo 3.1.7. Os seguintes dados referem-se aos gastos totais (em dólar) em bebidas e
petiscos consumidos por 36 grupos dem um domingo no Campo da Costa do Sol durante o Jogo
23 22 37 32 7 17 15 38 20 11 26 25
27 8 24 12 39 28 9 47 19 22 42 18
Representemos os dados em uma tabela de frequência em classe.
Nos dados apresentados temos que o valor máximo é Xmax = 47 e o valor mínimo é
Xmin = 5 .
Determinando a Amplitude total, tem-se que: At = Xmax − Xmin = 47 − 5 = 42.
√
Número de classes (K) , é dado por K ∼ = n , pode-se notar que trata-se de dados relacionados
√
a 36 observações logo n = 36 . Então K ∼ = 36 = 6.
At 42
Amplitude da classe (a) : a = = = 7. Agora vamos fazer a tabela de frequência com 6
K 6
classes a amplitude de classe a = 7 .
O tratamento e interpretação torna-se difícil para quem pretende colocar uma informação como
um todo, razão pela qual costuma-se calcular algumas medidas que resumidamente traduzem
as importantes características das distribuições de frequências.
O estudo que zemos sobre distribuições de frequências, até agora, permite-nos descrever, de
um modo geral, os grupos de valores que uma variável pode assumir. Dessa forma, podemos
localizar a maior concentração de valores de uma dada distribuição, isto é, se ela se localiza
no início, no meio ou no nal, ou ainda, se há distribuição por igual.
porém, para ressaltar as tendências características de cada distribuição, isoladamente, ou
em confronto com outras, necessitamos introduzir coneitos que se expressem através de números,
que nos premitam traduzir essas tendências. Esses conceitos denominam-se elementos típicos
da distribuição, que são:
As Medidas de posição tem como objectivo descrever um conjunto de dados de forma or-
ganizada e compacta que possibilita a visualização do conjunto estudado por meio de suas
estatísticas, o que não signica que estes cálculos e conclusões possam ser levados para a po-
pulação.
As medidas de posição mais usadas são as medidas de tendência central, que recebem tal
denomição pelo facto de os dados observados tenderem, em geral, a se agrupar em torno dos
valores centrais tenderem. Dentre as medidas de tendência central, destacamos:
27
• Média aritmética ou simplesmente Média • Moda
• Mediana
• Mediana • Decis
Exemplo 4.1.1. Sabendo que a produção diária de leite de uma vaca, durante uma semana foi
10 + 14 + 13 + 15 + 16 + 18 + 12 98
X= = = 14.
7 7
Nota: A média tanto como outras medidas de tendência central encontram-se sempre entre o
Xmin e Xmax , ou seja não deve ser menor que Xmin nem maior que Xmax .
• É denida rigorosamente, ou seja sempre existe e pode ser interpretada sem ambiguidades;
Entretanto, esta medida leva consigo alguns inconvenientes como o facto de ser muito sensível
a valores extremos, isto é a valores excessivamente menores ou excessivamente maiores em
relação às demais observações do conjunto de dados. Por exemplo: Se estivermos interessados
em conhecer o salário médio dos funcionários de uma certa empresa com cinco funcionários e
obtivermos o seguinte conjunto de dados, em meticais:
1.230; 1.450; 2.100; 2.250; 25.000;
Podemos observar quatro dos cinco funcionários recebem entre 1.230 e 2.250 meticais e um
deles (talvez o Director) recebe 25.000 , porém calculando o salário médio:
Pode-se concluir que em média cada funcionário dessa empresa recebe 6.0406 meticais, o que
difere-se tanto aos demais valores do conjunto, isso pela inuência do salário 25.000 meticais
que puxou o salário médio para cima.
Podemos observar que a fórmula da média dada na equação (4.1) apenas é válida para dados
brutos ou não agrupados.
Consideremos a distribuição relacionada a 34 famílias, tomando como variável o número de
lhos por família:
Número de lhos 0 1 2 3 4
Número de famílias 2 6 10 12 4
Neste caso, como as frequências são números que indicam repetições de cada valor da variável,
elas funcionam como factores de repetições, o que nos leva a calcular a média ponderada ou
média para dados agrupados, dada pela seguinte fórmula:
P
(Xi · fi )
X= (4.2)
n
Exemplo 4.1.2.
Isto é X = 2.294 ∼
= 2.3 , como iremos interpretar o resultado de 2 lhos e 3 décimos de lhos?
Caso isso aconteça é recomendável o arredondamento da medida em questão para um valor
discreto, ou seja X = 2, 294... ∼
= 2. O que signica que em média cada família tem dois lhos.
Exemplo 4.1.3. Os seguintes dados referem-se aos gastos totais (em dólar) em bebidas e
petiscos consumidos por 36 grupos dem um domingo no Campo da Costa do Sol durante o Jogo
Pela mesma razão do caso anterior de dados agrupados, vamos adicionar uma coluna dos pontos
médios e outra para os produtos xp · fi
i Gastos fi xp xp · f i
1 5 ` 12 6 8.5 51
2 12 ` 19 8 15.5 124
3 19 ` 26 8 22.5 180
4 26 ` 33 7 29.5 206.5
5 33 ` 40 4 36.5 146
6 40 ` |47 3 43.5 130.5
Total 36 838
P
(xp · fi ) 838
X= = = 23, 278.
n 36
Podemos interpretar este resultado como sendo o gasto médio por grupo foi de 23 doláres e 28
centavos, ou seja, 23, 278 dolares
Portanto dene-se Moda como sendo o valor da variável que ocorre com maior frequência.
Desse modo, o salário modal dos empregados de uma fábrica é o salário mais comum, isto é, o
salário recebido pelo maior número de empregados dessa fábrica.
A moda é uma das medidas de tendência central das mais simples, sendo aplicável a qualquer
variável, seja quantitativa ou qualitativa. A moda pode não existir, e mesmo que exista, pode
não ser única. Assim, um conjunto de dados ou uma distribuição de frequência pode ter várias
modas. De acordo com as frequências de cada valor observado, é possível que um conjunto de
dados seja:
Podemos, entretanto, encontrar conjunto de dados, nas quais não exista observação modal:
Exemplo 4.1.5. A: {10; 12; 21; 17; 32} , não existe moda. A distribuição é amodal
C: {azul; verde; azul; azul; vermelho; preto; preto; vermelho; verde; vermelho; cinzento; verde}.
Existêm três modas, a distibuição é trimodal, onde M01 = azul , M02 = vermelho e
M03 = verde .
Exemplo 4.1.6.
Através da tabela podemos observar que a maior frquência é 12 que corresponde a observação
3 logo M0 = 3 ou seja, a maioria das famílias têm 3 lhos.
Quando temos dados agrupados em classe, a moda é calculada por aproximação, começando
por localizar a classe modal (aquela que tiver maior frequência absoluta).
Existêm várias fórmulas para determinar a moda. De entre elas, para nosso estudo iremos
usar a fórmula de Czuber, que é uma das alternativas para calcular o valor da moda com apro-
ximação.
neste processo considera-se a inuência, sobre a classe modal, das frequências das classes adja-
centes (vizinhas), anterior e superior, assim como da frequência da classe modal.
fimo − fia
M0 = Li + · a, (4.4)
2fimo − (fia + fip )
onde
Nota: A moda deve percenter a classe modal, ou seja Li ≤ M0 < Ls , onde Li e Ls são os
limites inferior e superior da classe modal, respectivamente.
Determine a Moda.
i Classes (Km) xp fi
1 10 ` 20 15 10
2 20 ` 30 25 20
3 30 ` 40 35 35
4 40`50 45 40
5 50 ` 60 55 25
6 60 ` 70 65 15
7 70 ` 80 75 5
Total 150
Resolução:
Pela tabela, podemos notar que a classe com maior frequência é 4a classe, isto é, a classe modal
é de 40 ` 50 , onde Li = 40 ; fimo = 40 ; fia = 35 ; fip = 25 ; a = 10 . Usando a fórmula dada na
equação (4.4), de moda para dados em classes, temos que:
fimo − fia 40 − 35 5 5 50
M0 = Li + ·a = 40+ ·10 = 40+ ·10 = 40+ ·10 = 40+
2fimo − (fia + fip ) 2 · 40 − (35 + 35) 80 − 60 20 20
M0 = 40 + 2, 5 = 42, 5.
Sendo assim, podemos interpretar M0 = 42, 5 como: A maioria dos estudantes do IF percerro-
rem diariamente 42, 5km .
Se porém, o conjunto tiver um número par de elementos, a mediana será a média aritmética
dos dois valores centrais.
2 6 7 10 12 13 18 21
Tem para a mediana a média aritmética de 10 e 12.
10+12 22
Med = 2
= 2
= 11.
32.2 29.5 29.9 32.4 30.1 32.1 35.2 10.0 20.6 28.6 30.5 38.0 33.0 29.4 37.1
Assim, a mediana é 30.5. Isto signica que 50% das pessoas (ou a metade) pagaram menos
de 30.5% do valor que receberam quanto pediram empréstimo e outra metade (das pessoas)
devoveram igual ou maior que 30.5% do total.
Xi fi Fi
0 2 2
1 6 8
2 10 18
3 12 30
4 4 34
Total 34
Determine a Mediana.
i Classes (Km) xp fi Fi
1 10 ` 20 15 10 10
2 20 ` 30 25 20 30
3 30 ` 40 35 35 65
4 40 ` 50 45 40 105
5 50 ` 60 55 25 130
6 60 ` 70 65 15 145
7 70 ` 80 75 5 150
Total 150
n 150
Antes determinemos o identicador da classe mediana. Temos que n = 150 , então = = 75.
2 2
Na coluna de frequência absoluta acumulada é possível notar que a posição pertence a 4a classe
(classe mediana).
Outros dados referentes a classe mediana são: Li = 40; Fia = 65; fi = 40 e a = 10 . Então:
n
2
− Fia 75 − 65 10 100
Med = Li + · a = 40 + · 10 = 40 + · 10 = 40 + = 40 + 2.5 = 42.5.
fi 40 40 40
Além das medidas de posição que estudamos, há outras que, consideradas individualmente, não
são medidas de tendência central, mas estão ligadas à mediana relativamente à sua característica
de separar o conjunto em duas partes que apresentam o mesmo número de valores.
Desta forma, a mediana que divide o conjunto ordenado em dois grupos, cada um deles
contendo 50% dos valores do conjunto, é também uma medida separatriz. Além da mediana,
as outras medidas separatrizes são: Quartis (Qi ) , Decis (Di ) e Percentis (Pi ) .
Como foi referido anteriormente, para além das medidas de tendência central, os quartis,
decis e percentis são outras medidas conhecidas por separatrizes utilizados como medidas de
posição.
Assim, o primeiro quartil, que é indicado por Q1 , separa o conjunto ordenado deixando
25% de seus valores abaixo (ou à esquerda) e 75% dos seus valores acima (ou a direita.)
O segundo quartil, que é indicado por Q2 , separa o conjunto ordenado deixando 50% dos seus
39
valores abaixo e 50% dos seus valores acima.
O terceiro quartil Q3 obedece a mesma regra dos anteriores, ísto é, um valor tal que 75% das
observações são menores e 25% são maiores que este.
iguais.
Assim, o primeiro decil, indicado por D1 , separa o conjunto ordenado deixando 10% dos
seus valores abaixo e 90% dos seus valores acima. De modo análogo são denidos e interpretados
os outros decis.
Nos decis, a distribuição é dividida em 10 partes iguais (D1 ; D2 ; D3 ; · · · ; D9 ) .
partes iguais.
Assim, o primeiro percentil, indicado por P1 , separa o conjunto ordenado deixando 1% dos
seus valores abaixo e 99% dos seus valores acima.
Nos percentis, a distribuição é dividida em 100 partes iguais (P1 ; P2 ; P3 ; · · · ; P99 ) .
P1 : é o primeiro percentil, corresponde à separação do primeiro 1% de elementos do conjunto.
P50 : é o quinquagésimo percentil, coincide com a mediana (P50 = D5 = Q2 ) .
Tanto para variáveis discretas ou contínuas, ou seja, para dados agrupados ou em classes, o
procedimento para determinar a posição da separatriz é feito usando a fórmula:
n
· i, Qi onde i = 1; 2; 3
4
n·i
p= , Di onde i = 1; 2; · · · ; 9
10
n · i,
Pi onde i = 1; 2; · · · ; 99
100
X[p] , se p for decimal;
Qi ; Di ; Pi =
Xp + Xp+1 , se p não for decimal.
2
, onde:
• p é a posição do quantil;
2 20 ` 30 25 20 30
3 30 ` 40 35 35 65
4 40 ` 50 45 40 105
5 50 ` 60 55 25 130
6 60 ` 70 65 15 145
7 70 ` 80 75 5 150
Total 150
Antes determinemos a posição p da classe quantílica. Temos que n = 150 , e por ser Q3 i = 3 ,
n 150
então p · i = · 3 = 112, 5.
4 4
Na coluna de frequência absoluta acumulada é possível notar que a posição pertence a 5a classe
(classe quantílica).
Outros dados referentes a classe quantílica são: Li = 50; Fia = 105; fi = 25 e a = 10 . Então:
unidade de simetria.
Destacamos que as distribuições de frequências não diferem apenas quanto ao valor médio
e a variabilidade, como também quanto a sua forma.
Assimetria Positiva
Neste caso, a média aritmética apresentará um valor maior do que a mediana, e esta, por sua
vez, apresentará um valor maior do que a moda.
Em outras palavras, Mo < Me < X .
Nas distribuições assimétricas á direita, h'a uma predomin
ncia de valores superiores a moda.
Assimetria Negativa
Neste caso a média aritmética ser'a menor do que a mediana, e esta, por sua vez, é menor do
que a moda.
Nas distribuições assimétricas negativas, predominam valores inferiores á moda.
Nas aulas anteriores, vimos que um conjunto de observações pode ser sintetizado ou resumido,
por meios de procedimentos matemáticos, em poucos representativos: (medidas de tendência
central) a média, moda e mediana. Tais valores podem servir de comparação para dar a posição
de qualquer elemento do conjunto. A análise de um conjunto de observações com base numa
medida de tendência central não nos fornece informaç oes sucientes para o conjunto de valores.
Por vezes não é suciente usar apenas uma das medidas de posição para caracterizar perfei-
tamente um conjunto de valores , pois, mesmo sabendo, por exemplo, que a temperatura média
entre duas cidades (Por exemplo: Chimoio e Lichinga) é a mesma, e igual a 24◦ C , ainda somos
levados a pensar a respeito do clima dessas cidades. Em uma delas a temperatura poderá variar
em limites de muito calor e de muito frio e haver, ainda, uma temperatura média de 24◦ C . A
outra poderá ter uma variação pequena de temperatura, mas mantendo uma média de 24◦ C .
E1: 15; 15; 15; 15; 15 E2: 13; 14; 15; 16; 17 E3: 7; 12; 17; 19; 20
44
Vemos, então, que os três estudantes apresentam a mesma média aritmética de 15valores. En-
tranto, é fácil notar que o Estudante E1 é o mais homogêneo que os estudantes E2 e E3, já que
todos os valores são iguais a média. O estudante E2, por sua vez, é mais homogêneo que o estu-
dante E3, pois há menor diversicação entre cada um de seus valores e a média é representativa.
Vemos, então que a média ainda que considerada como um número de que tema facili-
dade de representar um conjunto de observações, não pode, por si mesma, destacar o grau de
homogenidade ou heterogeneidade que existem entre os valores que compoem um conjunto.
A análise de um conjunto de observações com base numa medida de tendência central não
nos fornece informações sucientes para o conjunto de dados. Em outras palavras, as medidas
de tendência central são úteis em identicar um valor típico numa distribuição de frequência,
porém, estes não apresentam a disparidade existentes na distribuição.
Portanto, as medidas de dispersão são utilizadas para avaliar o grau de variabilidade ou de
dispersão dos valores da distribuição em torno da média. Estas medidas permitem estabelecer
comparações entre fenômenos de mesma natureza ou de natureza distinta e, em geral, essa
disparidade(variabilidade) é observada em torno de uma medida de tendência central (média).
• Entre duas amostras com a mesma média, será mais representativa aquela que apresentar
menor dispersão.
Portanto, para qualicar os valores de uma dada variável , ressaltando a maior ou menor
dispersão ou variabilidade entre esses valores e a sua medida de posição, a Estatística recorre ás
medidasde dispersão ou de variabilidade. Dessas medidas, serão descritas: Amplitude total,
Variância, Desvio padrão e Coeciente de variação de Pearson.
Exemplo 6.1.1. Consideremos as notas do Estudante E3 dadas por: 7; 12; 17; 19; 20.
At = 20 − 7 = 13 .
A média aritmética de cada um desses conjuntos é igual a 20. Portanto , no que diz respeito a
uma medida de posição, ambos os conjuntos podem ser considerados idênticos. Ao calcularmos
a amolitude total, vericamos que as observações do conjunto A apresentam maior dispersão.
Todavia, no cálculo da amplitude não são considerados os valores do conjunto que se encon-
tram entre os extremos,o que poderia conduxir o analista a interpretações equivocadas. Muitas
vezes,um valor particularmente anormal poderá afectar de maneira acentuada a medida. Ocon-
junto A, por exemplo, apresenta o último valor (45) sensivelmente distante do penúltimo (25),
facto que talvez tenha provocado uma amplitude total de (35) magnitude.
6.2 Variância ( S 2 )
Como vimos que a amplitude é uma medida que se deixa inuenciar pelos valores extremos,
que em grande maioria são devidos ao acaso.
Quanto menor é a variância, mais próximos os valores estão da média, mas quanto maior
for a variância, mais os valores estão distantes da média.
Quando precisamos comparar duas ou mais conjuntos de valores quanto à sua dispersão e
variabilidade e esses conjuntoos estão expressos em natureza diferentes ou em grandezas difren-
tes é preciso dispor de outra medida. Para contornar essas diculdades e limitações, podemos
caracterizar a dispersão ou variabilidade dos dados de maneira relativa ao seu valor médio.
Essa medida que mede o grau de concentração dos valores em torno da média é denominada
de Coeciente de variação.
• 15% < Cv ≤ 30% trata-se distribuição com uma dispersão média ou moderada;
Em todo caso, mquanto maior for o valor do coeciente de variação, maior é a dispersão dos
valores do conjunto e quanto menor é o coeciente de variação, mais homogêneo é a distribuição.
Exemplo 6.4.1. Considere os dados da tabela abaixo e determine: amplitude total, variância,
Amplitude total
P At = Xmax − Xmin = 21 − 17 = 4
(xi · fi ) 942
Média: x = = = 18, 84
n 50
P
(xp · fi ) 6360
A média aritmética calculada anteriormente foi: x = = = 79, 5
rP r rn 80
[(xp − x)2 · fi ] 80780 80780 p
Desvio-padrão: S = = = = 1022, 53 = 31, 98
n−1 80 − 1 79
Então S = 31, 98 . O desvio padrão do consumo de energia elétrica é 31, 98Kwh .
2. População ou Universo é:
51
(a) Uma estatística é um valor numérico que descreve uma característica da população;
(c) É impossível para o INE obter todos os dados censitários sobre a população moçam-
bicana;
(d) A estatística inferencial envolve o uso de uma população para chegar a conclusões
sobre a amostra correspondente;
(b) Para coletar informação sobre os salários iniciais de empresas listadas entre as 500
ações mais importantes do mercado nanceiro levantadas pela KPMG, um pesqui-
sador abordou 65 das 500 empresas.
(d) Uma pesquisa com 500 espectadores em um estádio com 42.000 espectadores;
(e) Para saber as intenções de voto dos portugueses nas eleições passadas, uma empresa
entrevistou 2.000 cidadãos representativos da população portuguesa com mais de 18
anos;
(f) Uma pesquisa com 496 estudantes da Faculdade de Economia descobriu que 10%
planejavam viajar para fora do país durante o recesso escolar.
(h) Um estudo sobre o tempo gasto, em segundos, por 100 atletas na corrida dos 400
metros obstáculos, registou-se o tempo gasto por 16 desses atletas;
(i) Uma pesquisa com 2018 alunos do ensino médio descobriu que eles dedicam uma
média de 7 horas e 38 minutos por dia usando mídias de entretenimento.
(j) Desejando-se saber a hora a que se deitam e que se levantam os alunos do IF,
realizou-se um estudo em que participaram 250 alunos, de entre os 1.000 alunos do
IF;
(k) Uma pesquisa com 961 consumidores que adquiriram eletrodomésticos descobriu que
23% contrataram a garantia estendida.
(a) O salário médio anual para 35 dos 1.200 Gestores das empresas é de 31.000, 0mt ;
(b) Uma pesquisa com 514 membros do conselho dos institutos descobriu que 38% acham
que o ensino médio tem custo justo relativamente ao seu valor;
(c) Sessenta e dois dos 97 passageiros a bordo da aeronave Boeing sobreviveram á sua
explosão.
(d) Em uma pesquisa com 300 usuários de computador, 8% disseram que seus compu-
tadores tinham mau funcionamento e requeriam reparos técnicos.
(e) Em um ano recente, a nota média de Estatística para todos os graduandos no IF era
14.5.
10. Uma pesquisa educacional procura determinar a ecácia de um novo método de alfabe-
tização de adultos. Terminado o período de ensino, o rendimento é medido através dos
resultados obtidos pelos alunos na leitura de um texto
11. Identique qual destes tipos de amostragem é usado: aleatória simples, sistemática, es-
traticada, por conglomerados ou por conveniência e indicando a população e amostra
(b) Seleção de Júri- O comissário de jurados de Condado de Dutches obtêm uma lista
de 42.763 proprietários de carros e obtêm um conjunto de jurados seleccionando cada
centésimo nome da lista
(c) Pesquisa de carro- Uma pesquisadora da Ronil-Auto dividiu todos os carros re-
gistados em categorias de subcompacto, compacto, médio, intermédio e grande. Ele
está pesquisando 200 proprietários de carro de cada categoria
(d) Bebida entre estudantes- Movido pelo facto de um estudante ter morrido por
excesso de bebida, o IF fez um estudo do hábito de bebida dos estudantes, selecci-
onando aleatoriamente 5 turmas diferentes e entrevistando todos os estudantes em
cada uma dessas turmas
(g) Pesquisa de TV- Um especialista de Marketing para a TVM está planejando uma
pesquisa na qual 500 pessoas serão seleccionadas aleatoriamente de cada faixa etária
de 10-19, 20-29, e assim por diante
(h) Um jornal escreve, em cartões separados, o nome de cada um dos seus 250 deputados
da Assembleia da República, mistura-os e extrai 10 deles para uma entrevista sobre
a situação político-militar no país
(j) A empresa 2M selecciona cada 200◦ garrafa de cerveja acabada de ser enchida numa
linha de produção entre 14 ás 16 horas de um dia para fazer teste de qualidade
(k) Um entrevistador entrevista cada 10◦ eleitor que deixa uma mesa de voto de uma
cidade entre as 8 e 17 horas de um dia de eleições
(n) Um administrador hospitalar faz uma pesquisa com as pessoas que estão na la de
espera para serem atendidas pelo Sistema Nacional de Saúde, entrevistando uma a
cada 15 pessoas na la
13. Uma Faculdade abriga 124 estudantes. Sugira uma técnica de amostragem e obtenha
uma amostra representativa correspondendo a 15% da população
15. Uma população encontra-se dividada em três estratos, com tamanhos, respectivamente:
N1 = 40, N2 = 100, e N3 = 60 . Sabendo que, ao ser realizada uma amostragem
estraticada proporcional, nove elementos da amostra foram do 3◦ estrato, determine o
n◦ total de elementos da amostra
16. Uma cidade possui N=200 zonas eleitorais. Uma empresa destinada a fazer pesquisa
eleitoral vai seleccionar aleatoriamente n = 15 zonas e entrevistar todos os elementos que
estão dentro dessas zonas eleitorais. Qual é a técnica de amostragem que vai ser usada?
17. Numa turma com N = 36 elementos, deseja-se retirar uma amostra de 5 elementos para
vericar uma característica de interesse, utilizando a técnica de amostragem sistemática
para retirar essa amostra quais os números dos alunos sorteados
18. Suponha duas amostras colhidas de uma mesma população, sendo que uma de tamanho
100 e outra de tamanho 200. Então, não há dúvida de que a amostra de tamanho maior
é mais representativa da população, certo? Porquê?
20. Suponha que existem 1000 chas de pacientes das quais uma amostra aleatória de 20 deve
ser seleccionada. Determine que chas devem ser escolhidas na amostra de tamanho 20.
Diga que tipo de amostragem foi feito e como foram seleccionadas as chas
21. Para cada um dos estudos seguintes, justique a utilização de uma amostra
(b) Estabelecer o conteúdo mineral da água potável fornecida pela empresa XYZ na
cidade de Maputo
(e) Parece que o único modo de eliminar os erros amostrais consiste em estudar toda
população em vez de uma amostra. No entanto, muitas indústrias e os governos
continuam a utilizar amostras. Porquê?
22. Para pesquisar o Desporto preferido dos estudantes de uma escola com 1.500 estudantes,
foram seleccionados, de modo imparcial, 900 estudantes. Com base nessas informações,
responda
(f) O número de consultas médicas feitas por ano por um associado de certo plano de
saúde;
(g) O teor de gordura, medido em gramas por 24 horas, nas fezes de crianças de 1 a 3
anos de idade;
(k) Sexo;
25. Determine quais das seguintes variáveis são quantitativas ou qualitativas. Para as variá-
veis quantitativas diga se são contínuas ou discretas
26. Classique as variáveis abaixo como Qualitativa (nominal ou ordinal) Quantitativa (dis-
creta ou contínua (razão/racio ou intervalar))
27. Os itens a seguir aparecem em uma cha de emprego. Determine o nível de mensuração
dos dados.
28. Pretende-se realizar de um estudo sobre os hábitos de fumar dos jovens Moçambicanos
do ensino médio.
29. Numa creche Don' Orio questionaram as crianças com mais de 3 anos relativamente ao
tipo preferido de bebidas. Das 160 crianças inquiridas, 30 indicaram o leite como a bebida
preferida, 10 referiram água, 40 disseram os sumos naturais e 80 referiram os refrigerantes.
30. Numa aula teórica de Bioestatística perguntou-se aos 50 alunos presentes quantos livros
ligados a saúde leram durante as férias, tendo-se obtido os seguintes resultados: 1 aluno
leu 4 livros, 8 leram 3 livros, 27 leram 2 livros, 12 leram apenas 1 livros e os restantes
alunos não leram qualquer livro.
31. Os dados abaixo foram registados em vinte pacientes que foram submetidos a determinado
tratamento tendo-se vericado que melhoraram depois de terem alguns dias.
5, 2, 1, 3, 2, 3, 4, 5, 3, 1, 3, 2, 6, 4, 5, 6, 1, 3, 3, 12.
33. O QUE FARIAS? Você trabalha em um banco e deve recomendar a quantia de dinheiro
que será colocada em uma ATM a cada dia. Você não quer colocar dinheiro em excesso
(por segurança) ou pouco dinheiro (por problemas com clientes). As quantias retiradas
diariamente (em milhares de meticais) em um período de 30 dias são mostradas a seguir:
72 84 61 76 104 76 87 92 80 88
98 76 97 82 84 67 70 81 82 89
74 73 86 81 85 78 82 80 91 83
(b) Se você colocar 90.000mt na ATM a cada dia, qual é a percentagem de dias em um
mês que você espera car sem dinheiro? Explique.
(c) Se você está disposto a car sem dinheiro em 10% dos dias, quanto dinheiro você
deveria colocar na ATM a cada dia? Explique.
35. Os seguintes dados de 45 alunos, foram obtidos no 1◦ Teste duma turma do Saúde Pública
6 3 5 7 5 7 7 5 6 7
6 6 7 4 5 7 5 4 6 6
6 3 5 7 5 7 7 5 6 7
4 4 4 4 3 4 3 7 3 3
6 3 6 5 6
(g) Determine as notas mínima e máxima dos 50% com notas centrais
36. Considerando a distribuição abaixo: Calcule a média, mediana, a moda e o desvio padrão
Xi 3 4 5 6 7 8
fi 4 8 11 10 8 3
37. As notas de um candidato em seis provas de um concurso foram 8.4, 9.1, 7.2, 6.8, 8.7 e
7.2
Determine a nota média, a nota mediana, a nota modal, a variância e o desvio padrão
(f) Determine o ano mínimo dos 33% com mais anos de experiência
40. Considere os dados abaixo, faça um agrupamento em classes e construa uma tabela de
frequências.
4, 1 9, 8 5, 8 6, 1 6, 7 7, 0 7, 0 7, 5 7, 5 7, 5
7, 7 8, 2 8, 8 9, 0 9, 0 9, 1 9, 1 9, 1 9, 2 9, 2
9, 2 9, 2 9, 4 9, 4 9, 7 9, 8 10, 0 10, 0 10, 2 10, 2
10, 3 10, 6 10, 6 10, 8 10, 9 10, 9 11, 6 11, 7 11, 8 11, 8
11, 8 12, 0 12, 2 12, 2 12, 3 12, 5 12, 6 12, 7 8, 3 9, 4
11, 0 14, 0 8, 5 9, 5 11, 1 14, 2 8, 7 9, 5 11, 1 14, 8
42. Numa turma de um determinado ano estão matriculados 40 alunos. O levantamento das
chas biométricas revelou as seguintes estatuturas em centímetros
161 152 157 172 152 161 158 168 155 154
167 151 148 161 157 170 165 153 155 159
170 151 156 175 157 163 168 155 160 162
153 155 165 160 158 159 163 165 157 165
43. A tabela abaixo, mostra a distribuição de frequências dos salários mensais, em meticais,
de 65 funcionários de uma do Ministério da Saúde. Determine:
(i) A percentagem dos funcionários que ganham menos de 8.000, 00 meticais mensais
(j) A percentagem dos funcionários que ganham menos que 10.000, 00 e pelo menos
6.000, 00 mensais
Salários Funcionários
5.000`6.000 8
6.000`7.000 10
7.000`8.000 16
8.000`9.000 14
9.000`10.000 10
10.000`11.000 5
11.000`a12.000 2
Total 65
44. Obtenha a distribuição de frequências dos dados abaixo, que representam a quantidade
de autocarros estacionados no parque da HCM, durante o mês passado. Determinando a
mediana, moda e o desvio padrão.
14 12 11 13 14 13 12 14
12 14 10 13 15 11 15 13
13 14 11 12 16 17 14 14
45. Abaixo está apresentada a distribuição de frequências dos pesos de uma amostra de 79
alunos
46. O quadro seguinte representa as alturas (em cm) de 40 alunos de uma classe:
162 163 166 176 175 169 172 170 162 168
164 165 169 163 157 155 154 171 166 164
170 157 148 152 165 157 163 158 172 178
160 158 159 166 170 164 165 150 158 165
47. Dado o rol de medidas das alturas (dadas em cm) de uma amostra de 100 estudantes de
uma Faculdade:
48. A tabela abaixo representa os salários pagos a 100 operários da empresa DoceModel
Lda:
Determine
49. Uma distribuidora de refrigerantes fez um levantamento sobre o consumo semanal (em
litros) por pessoa, em Janeiro de 2016, em uma cidade moçambicana, obtendo a tabela
abaixo:
(b) Qual é o percentual de pesoas que consomem menos de 1 litro por semana
Classes fi xp Fi fr
0, 02
12
62| − 65 0, 06
66, 5 84
126
36
225
0, 15
300
Total - -
51. A nota média dos alunos de uma turma foi 7 e das alunas foi 9. O número de alunos era
20 e das alunas 30. Qual é a nota média de toda turma?
53. Uma empresa possui dois serventes recebendo 600, 0mt cada um, quatro escriturários
recebendo 2.000, 0mt cada um, um chefe de escritório com salário de 3.500, 0mt e três
técnicos recebendo 6.000, 0mt cada um.
Determine o salário médio, mediano e modal da empresa.
54. Num quartel, constantou-se que o peso médio de 40 soldados era de 69 kg . Posteri-
ormente, vericou-se que a balança estava desregulada, ocasionando um peso indicado
superior em 1kg ao peso verdadeiro. Qual era a média verdadeira dos pesos dos soldados?
55. De entre as alternativas, assinale aquelas que contiverem uma armação verdadeira
(a) Reunindo-se dados brutos em classes pode-se obter o número de indivíduos perte-
centes a cada uma das classes, que é denominado frequência da classe
(e) A amplitude do intervalo da classe é calculada pela soma entre os limites reais inferior
e superior de uma classe
(f) Obtém-se o ponto médio de uma classe pela média aritmética dos limites inferior e
superior reais de uma classe
(g) Um intervalo de classe aberto em seus dois limites inclui ambos os números extremos
(h) Intervalos de classe fechados têm seus limites superior e inferior reais excluídos dos
números que os compoem
(a) As idades dos pacientes, em geral, num hospital ou as idades das crianças doentes
no mesmo hospital
(d) Os gastos entre duas cidades nas viagens de voo e transporte rodoviário
57. A seguir são mostrados os tempos de espera em la (em minutos) nas Farmácias de
Chimoio.
Farmac: 6.5 6.6 6.7 6.8 7.1 7.3 7.4 7.7 7.7 7.7
Vida: 4.2 5.4 5.8 6.2 6.7 7.7 7.7 8.5 9.3 10.0
(a) Calcule a amplitude total, o desvio padrão e o coeciente de variação de cada la
(b) Suponha que precisas levantar medicamentos em uma dessas farmácias, qua escolhe-
rias?
58. Uma pesquisa sobre o consumo de combustível nas viaturas dos directores dos hospitais
públicos deu os seguintes valores para a quilometragem percorrida por três marcas de
carro diferentes, em cinco testes com um tanque de 40 litros:
59. Suponha que, numa particular cidade, tanto os comerciantes quanto os serventes tenham
uma renda anual de de 90.000mt . Será que essa informação indica que as duas distribui-
ções de renda são necessáriamente semelhantes?
O êxito na vida não se mede pelo que você conquistou, más sim pelas diculdades que
superou na caminhada .
A análise combintória visa desenvolver métodos que permitem contar número de elementos de
um conjunto, sendo esses elementos, agrupamentos formados sob certas condições.
A primeira vista pode parecer desnecessária a existência destes métodos. Isto de facto é ver-
dade, se o número de elementos que queremos contar for pequeno. Entretanto, se o número de
elementos a serem contados for grande, esse trabalho torna-se quase impossível, sem o uso de
métodos especiais.
Como resposta temos: {45; 48; 54; 58; 84; 85} , logo #A = 6 , ou seja, podemos formar seis
números diferentes considerando os dígitos dados.
Exemplo 7.1.1. Existem três cidades A, B e C. Existem quatro estradas que ligam a cidade
A com a cida B, e cinco que ligam a cidade B com a C. Partindo da cidade A e passando da
69
Cada modo de efectuar a viagem de A para C pode ser considerada como um par de estradas
(ai , bj ) onde ai é uma das quatro vias de A para B e bj é uma das 5 vias de B para C. Vejamos
a seguir todas as vias que podem ser usadas.
De A para B temos 4 vias {a1 ; a2 ; a3 ; a4 } e de B para C temos 5 vias {b1 ; b2 ; b3 ; b4 ; b5 } .
a1 b 1 a2 b 1 a3 b 1 a4 b 1
a1 b 2 a2 b 2 a3 b 2 a4 b 2
a1 b 3 a2 b 3 a3 b 3 a4 b 3
a1 b 4 a2 b 4 a3 b 4 a4 b 4
a1 b 5 a2 b 5 a3 b 5 a4 b 5
Temos 20 possibilidades (caminhos) de sair da Cidade A até a Cidade C passando pela cidade
B.
Este número de caminhos podemos determinar facilmente, como de A até B temos 4 vias e de
B para C temos 5 vias, então de A para C teremos 4 × 5 = 20 caminhos.
por: N = k1 × k2 × k3 × · · · kn ·
Exemplo 7.1.2. Sabendo que os números de telefone são feito usando a combinação de dígitos
0 a 9 (10 dígitos no total). Qual é o número máximo de clientes que a vodacom pode ter?
Um número de telefone na vodacom leva 9 dígitos mas os primeiros dois iniciais são xos,
ou seja, temos: 84 .
Cada quadrado corresponde a um dígito. São no total sete dígitos. Tomando em cosideração
que os dígitos que entram num número de telefone podem estar repetidos, então comecemos
assim:
No lugar do primeiro quadro pode estar qualquer dígito entre 0 a 9 então temos 10 possibilida-
des.
No lugar do segundo quadro pode estar qualquer dígito entre 0 a 9, também temos 10 possibi-
lidades e assim sucessivamente até o último (sétimo) quadrado.
Então teremos 10 × 10 × 10 × 10 × 10 × 10 × 10 = 107 = 10.000.000
Então 10.000.000 é o número máximo de clientes qua a vodacom pode ter com o prexo 84.
(b) 5! = 5 × 4 × 3! = 20 × 3! = 20 × 6 = 120
(n + 1)! (n + 1)n(n − 1)!
(c) = = (n + 1)n = n2 + n
(n − 1)! (n − 1)!
7.3 Arranjos
Dado um conjunto, aos agrupamentos que podem ser formados a partir dos elementos do con-
junto dado denomina-se arranjos, esses agrupamentos diferem-se da ordem dos seus elemetos,
isto é, dado um arranjo se mudarmos a ordem dos elementos obtem-se um outro arranjo dife-
rente do arranjo dado.
Exemplo 7.3.1. Consideremos o seguinte problema. Quantos PINs com três dígitos podemos
Exemplo 7.3.2. Consideremos o seguinte problema. Quantos números com três dígitos dife-
Também podemos notar que: Um número de três algarismos: . Temos 4 dígitos
para formar um número com três algarismos diferentes que precisamos ou preencher os espaços
(quadrados) em branco dados que correspondem a cada algarismo. Comecemos assim:
Para o primeiro quadrado, temos 4 alternativas entre os números dados podemos escolher 4
ou 5 ou 6 ou 7. Já para o segundo quadrado, restá-nos 3 alternativas pois o número usado no
primeiro quuadrado não pode ser usado (repetido) nos restantes quadrados. E por último, para
o lugar do último algarismo restá-nos 2 algarismos pois os dois escolhidos anteriormente já não
podem ser usados. Multiplicando as alternativas para cada quadrado, temos 4 × 3 × 2 = 24
números que podem ser formados com algarismos diferentes.
7.4 Permutações
Dado um conjunto, quando os agrupamentos feitos, ou seja, quando os arranjos desse conjunto
englobam todos elementos, esse tipo de arranjo denomina-se permutação
Exemplo 7.4.1. Quantas palavras com ou sem sentido (anagramas) podemos formar com as
Exemplo 7.4.2. Quantas anagramas podemos formar com as letras da palavra MATEMA-
TICA?
A palavra MATEMATICA tem 10 letras, então n = 10 , sendo que a letra M está repetida
duas vezes, a letra A repetida tres vezes e a letra T repetida duas vezes.
2,3,2 10!
Baseando-se na fórmula, temos que: n = 10; a = 2; b = 3; c = 2 , logo P10 = = 151.200
2!3!2!
Resposta: São 151.200 anagramas.
Exemplo 7.5.1. Pretende-se formar uma comissão de três funcionários, sabendo que a empresa
têm dez funcionários. Quantas comissões podem ser formadas?
Nesta secção veremos realmente como é que as incertezas podem ser medidas, como associa-
las números e como interpretar estes valores chamados de probabilidades, que vai nos permitir
a tomar decisões adequadas, auxiliar a desenvolver estratégias. O ponto principal é a possibi-
lidade de quanticar o quanto provável será a ocorrência de determinada situação.
A: Que mesmo com o favoritismo, os Mambas percam diante dos Bafana Bafana
75
Como vimos, o resultado depende de ao acaso, fenômenos como estes são denominados fenô-
menos aleatórios ou experimentos aleatórios.
Denição 8.1.1. Fenômenos ou experimentos aleatórios são aqueles que, mesmo repeti-
das várias vezes sob mesmas condições ou semelhantes, apresentam resultados imprevisíveis.
Exemplo 8.2.1.
1. Se lançarmos uma moeda no ar, os resultados esperados nesse experimento são cara (Ca)
ou coroa (Co). Então o espaço amostral U = {Ca, Co}
Do mesmo modo, como em dois lançamentos simultâneos de duas moedas, podemos ter cara
nas duas moedas, cara na primeira moeda e coroa na segunda, entre outros resultados de tal
modo que o seu espaço amostral será dado por:
U = { (Ca,Ca), (Ca,Co), (Co,Ca), (Co,Co)}.
8.3 Eventos
Denição 8.3.1. Chama-se evento a qualquer subconjunto do espaço amostral U. E reperesenta-
se pela letra maíscula.
espaço amostral ( #A = 1 )
Exemplo 8.3.2. No lançamento de um dado, considere o evento G sair um número maior que
5.
Podemos notar que o único número maior que 5 no espaço amostral de lançamento de um dado
Denição 8.3.3. Evento Certo: é um evento que sempre ocorre, ou seja é igual ao espaço
amostral. (A = U )
igual que 6.
Podemos notar que todos elementos do espaço amostral são menores ou igual a 6. Então o
evento E será dado por E = {1, 2, 3, 4, 5, 6} . E é evento certo porque possui todos elementos do
espaço amostral.
ainda #A = 0.
Podemos notar que no espaço amostral não temos nenhum número negativo, logo D = ∅ . D é
denotado por A , é o conjunto de todos os elementos do espaço amostral U , que não pertencem
Exemplo 8.3.4. Ao lançar um dado e observar a face superior, considere os seguintes eventos:
Considere os eventos:
Resolução:
(b) A ∩ B = ∅
Denição 8.3.10. Eventos Independentes: Dois eventos são independentes quando a rea-
no período laboral.
Olhando para esses dois eventos, podemos armar que são independentes, pois ter positiva não
8.4 Probabilidade
Dado um experimento aleatório, sendo U o seu espaço amostral, vamos admitir que que todos
os elementos de U tenham a mesma chande acontecer, ou seja, que U é um conjunto equi-
provável.
0 ≤ P (A) ≤ 1,
Resolução:
Temos que, o espaço amostral no lançamento de um dado é dado por: U = {1; 2; 3; 4; 5; 6} logo
#U = 6 .
Dados dois eventos A e B associados ao mesmo espaço amostral U, se P (B) > 0 , então a pro-
babilidade de ocorrênciia do evento A condicionado a ocorrência do evento B ou probabilidade
de A visto que B ocorreu, é dada por
P (A ∩ B)
P (A/B) = , (8.1)
P (B)
de ter sido ímpar uma vez que o número era maior que 1?
Resolução:
Primeiro Método de Resolução:
O espaço amostral no lançamento de um dado é U = {1; 2; 3; 4; 5; 6} . E o evento sair ímpar é
dado por A = {1; 3; 5} .
Pelo exercício percebe-se que a face é de um número maior que 1. Então o nosso espaço amostral
transforma-se em U1 = {2; 3; 4; 5; 6} e o nosso evento A transforma-se em A1 = {3; 5} .
Logo, a probabilidade de ter sido ímpar uma vez que o número era maior que 1 é dada por
#A1 2
P (A/B) = = = 0, 4 ou 40%.
#U1 5
Segundo Método de Resolução:
Pelos eventos dados temos que: U = {1; 2; 3; 4; 5; 6} , A = {1; 3; 5} , e B número maior que 1,
B = {2; 3; 4; 5; 6} , então A ∩ B = {3; 5} A probabilidade de ter sido ímpar uma vez que o
número era maior que 1 é dada pela fórmula (8.1):
P (A ∩ B) #(A ∩ B) 2 #B 5
P (A/B) = =? P (A ∩ B) = = e P (B) = = , então:
P (B) #U 6 #U 6
2
P (A ∩ B) 2 6 2
P (A/B) = = 65 = × = = 0, 4 .
P (B) 6
6 5 5
1. Calcule:
(a) P4 (c) P7 (e) C410 (g) C35 − A42 (i) C25 · A53
P5
(b) A62 (d) C38 (f) A10 (h) (j) P3 · C47
4 P3
2. Quantos são os anagramas formados com as letras da palavra MULEMBA. Quantos destes
anagramas começam com a letra A? (ANAGRAMA: é a palavra obtida usando as mesmas
letras da palavra incial, invertendo a ordem, mesmo sem sentido)
(a) De quantas maneiras diferentes a Lizete Magaia poderia fazer um pedido contendo,
uma salada, um tipo de carne, e uma sobremesa?
(b) De quantas maneiras diferentes a Elisa poderia fazer um pedido contendo, uma
salada, um tipo de carne, e uma sobremesa e uma variedade das bebidas?
82
6. De quantos modos pode se vestir um homem que tem 2 pares de sapatos, 4 casacos e seis
calças diferentes, usando sempre uma calça, uma casaco e um par de sapatos?
10. De uma sala de 25 alunos devem ser escolhidos 5 alunos para receberem prêmios. De
quantas maneiras diferentes poderão ser distribuidos os prêmios se:
11. Cinco pessoas decidem viajar num automóvel. De quantas maneiras diferentes eles podem
se assentar se:
12. No Moçambola a equipa Saúde de Chimoio obteve 8 vitórias, 5 empates e 2 Derrotas, nos
15 jogos realizados. De quantas maneiras distintas esses resultados podem ter ocorrido?
4 2 √
14. Quais dos seguintes valores não podem ser probabilidades? 0 ; 0, 0001 ; −0, 2 ; ; ; 2 ;
√ 3 4
0, 2
(b) Conduzir um carro / Andar a pé (d) Ganhar num jogo / Perder no mesmo jogo
(c) Um espaço amostral consiste em 200 eventos separados e igualmente prováveis. Qual
é a probabilidade de cada evento?
18. Um lote é formado por 10 peças boas, 4 com defeitos leves e 2 com defeitos graves. Uma
peça é retirada ao acaso deste lote. Calcule a probabilidade de que esta peça:
19. Um estudo de 500 voos da LAM seleccionados aleatoriamente mostrou que 430 chegaram
no horário. Qual é a probabilidade de um voô da LAM chegar no horário? E de não
chegar no horário?
20. Qual é a probabilidade de acidentes de trabalho, por ano, em uma determinada indústria
se uma amostra aleatória de 10 rmas que empregam um total de 8.000 pessoas, mostrou
que ocorreram 400 acidentes de trabalho durante os últimos doze meses?
(d) Sabendo-se que a pessoa escolhida é adulto, qual é a probabilidade de ser homem?
(a) Apenas o homem estar vivo (c) Pelo menos um estar vivo
27. Melanie chega atrasada ao trabalho 25% das vezes, e esquece o material de trabalho 20%
das vezes. Admitindo que essas ocorrências sejam independentes, determine a probabili-
dade da Winny:
(b) Chegar atrasada e sem o material (d) Chegar na hora e sem o material
1
28. A probabilidade de que você resolva correctamente a 1a questão duma prova é e de
3
2
seu colega resolva correctamente é , sendo que ambos tentam, sozinhos, resolvê-la.
5
Considere o experimento em que se verica se a questão foi resolvida correctamente ou
não pelos dois.
(a) Os eventos você resolver correctamente e seu colega resolver correctamente são:
mutuamente exclusivos? Justique. independentes? justique.
29. Das 100 pessoas que se candidatam ao emprego na área aduaneira e contabilística em
uma empresa, 40 possuíam experiência anterior, 30 curso superior, e destes 20 possuíam
ambos
(a) Qual a probabilidade de uma candidato escolhido aleatoriamente possuir curso su-
perior ou experiência anterior
(b) Qual a probabilidade de uma candidato escolhido aleatoriamente possuir curso su-
perior e experiência anterior
30. Sejam A e B dois eventos associados com um experimento E. Supondo que P (A) = 0.4 ,
P (A ∪ B) = 0.7 e P (B) = p , qual é o valor de p para que se tenha:
31. Os arquivos da polícia revelam que, das vítimas de acidente automobilístico que utilizam
cinto de segurança, apenas 10% sofrem ferimentos graves, enquanto que essa incidêndia
é de 50% entre as vitímas que não utilizam o cinto de segurança. Estima-se em 60%
o percentual dos motoristas que usam o cinto de segurança. A polícia acaba de receber
uma chamada para investigar um acidente em que houve um indivíduo gravemente ferido.
Calcule a probabilidade de ele estar usando o cinto no momento do acidente. Se a pessoa
que dirigia o outro carro não sofreu ferimentos graves. Calcule a probabilidade de ela não
estar usando o cinto no momento do acidente.
(b) Qual a probalidade de seu concorrente ter apresentado proposta, dado que a empresa
ganhou a concorrência?
33. Um fazendeiro estima que quando uma pessoa experimentada planta árvores, 90% so-
brevivem, mas quando um novato as planta, apenas 50% sobrevivem. Se uma árvore
plantada não sobreviveu, determine a probabilidade de ela ter sido plantada por um
2
novato, sabendo que das árvores são plantadas por novatos.
3
34. Uma Companhia com três lojas A, B e C tem respectivamente 50, 75 e 100 empregados.
A percentagem de mulheres a trabalhar em cada uma dessas lojas é 50, 60 e 70, respecti-
vamente. No nal de cada mês é nomeado o empregado do mês. Qual é a probabilidade
desse empregado trabalhar na loja C, sabendo que é mulher?
35. Num centro de cópias existem três impressoras A, B e C que imprimem a velocidades
diferentes. A probabilidade de um cheiro ser enviado para as impressoras A, B e C
é respectivamente 0.6 , 0.3 e 0.1 . Ocasionalmente a impressora avaria-se e destroi a
impressão. As impressoras A, B ou C avariam-se, respectivamente, com probabilidades
0.01 , 0.05 e 0.04 . A impressão de um cheiro foi destruída! Qual é a probabilidade de
ter sido enviada para a impressora B?
36. No centro de inspecção dos medicamentos existêm três inspectores, Eugênio Jambo, Me-
lanie Mulemba e Amândio Ndlovu, cada um deles responsável pela vericação de 20% ,
30% e 50% dos artigos inspecionados. A probabilidade do inspector Eugênio deixar pas-
sar um artigo ilegalmente é 0.05 , a probabilidade da inspectora Melanie deixar passar
um artigo ilegalmente é 0.10 e probabilidade do inspector Amândio Ndlovu cometer o
mesmo erro é 0.15 . Escolhe-se ao acaso um artigo inspeccionado:
(b) Sabendo que é ilegal, qual e a probabilidade de ter sido Melanie a inspecciona-lo?
(d) Sabendo que o animal roubado era uma ovelha, qual é a probabilidade de pertencer
ao Sr. Mulemba?
38. Num determinado curso, estão matriculados 100 estudantes, entre os quais 10 repetentes.
São escolhidos 4 estudantes ao acaso. Encontrar a probabilidade de que os 4 estudantes
sejam todos:
39. Três estudantes são escolhidos ao acaso de um grupo de 15 estudantes dos quais 5 são
mulheres. Calcular a probabilidade de que:
40. Uma companhia multinacional tem três fábricas que produzem o mesmo tipo de produto.
A fábrica I é responsável por 30% do total produzido, a fábrica II produz 45% do total, e
o restante vem da fábrica III. Cada uma das fábricas, no entanto, produz uma proporção
de produtos que não atendem aos padrões estabelecidos pelas normas internacionais. Tais
produtos são considerados defeituosos e correspondem a 1% , 2% e 1.5% , respectiva-
mente, dos totais produzidos por fábrica. No centro de distribuição, é feito o controle de
qualidade da produção combinada das fáricas. Qual é a probabilidade:
Viver de aparências é querer fazer uma viagem com um carro sem combústivel . A. Huxley
[1] CRESPO, António. (2002) Estatística fácil. 18rd Edição. Editora Saraiva. São Paulo.
[3] FARIAS, Ana. et all (2006) Estatística Descritiva Universidade Federal Fluminese. Brasil
90