Manual BioEstatística Nelson Mulemba

Manual de BioEstatística
Nelson Mulemba
Maputo, 2018
Nelson Mulemba
|| IF - - 2018 - - Manual de BioEstatística Nelson Mulemba

Índice
Introdução 1
1 A Natureza da Estatística 2
1.1 Estatística . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.2 Divisões da Estatística . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.3 Método Cientíco . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.3.1 Método Experimental . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.3.2 Método Estatístico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.4 Fases de um Método Estatístico . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2 População e Amostra 8
2.1 População e Amostra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
2.2 Amostragem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.2.1 Importância da Amostragem . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.2.2 Tipos de Amostragens . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
2.3 Variável e suas classicações . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
3 Distribuição de Frequências 20
3.1 Tabelas de frequências . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
3.1.1 Tipos de Frequências . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
3.1.2 Tabelas de Frequências em Intervalos de Classes . . . . . . . . . . . . . . 23
4 Medidas de Posição de Dados 27

4.1 Medidas de tendência central . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
4.1.1 Média (X) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
4.1.2 Moda (M0 ) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
4.1.3 Mediana (M ed) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
5 Medidas de localização e de assimetria 39

5.1 Medidas de localização ou separatrizes . . . . . . . . . . . . . . . . . . . . . . . 39
5.1.1 Quartis (Qi ) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
5.1.2 Decis (Di ) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
5.1.3 Percentis (Pi ) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
5.1.4 Procedimentos para determinar separatrizes . . . . . . . . . . . . . . . . 40
5.2 Medidas de Assimetria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
5.2.1 Tipos de curvas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
6 Medidas de Dispersão ou de Variabilidade 44

6.1 Amplitude Total ( At ) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
6.1.1 Restrições ao uso da Amplitude Total . . . . . . . . . . . . . . . . . . . . 46
6.2 Variância ( S 2 ) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
6.3 Desvio Padrão (S) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
6.4 Coeciente de Variação de Pearson (Cv) . . . . . . . . . . . . . . . . . . . . . . 48
Só para relaxar 50
7 Introdução à Análise Combinatória 69

7.1 Princípio Fundamental de Contagem . . . . . . . . . . . . . . . . . . . . . . . . 69
7.2 Factorial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
7.3 Arranjos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
7.3.1 Arranjos com repetição . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
7.3.2 Arranjos sem repetição . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
7.4 Permutações . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
7.4.1 Permutações Simples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
7.4.2 Permutações com repetições . . . . . . . . . . . . . . . . . . . . . . . . . 73
7.5 Combinações Simples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
8 Introdução às Probabilidades 75
8.1 Experimento aleatório . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
8.2 Espaço Amostral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76

8.3 Eventos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
8.3.1 Classicação dos eventos . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
8.3.2 Operações com eventos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
8.4 Probabilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
8.4.1 Propriedades de probabilidade . . . . . . . . . . . . . . . . . . . . . . . . 80
8.4.2 Probabilidade Condicional . . . . . . . . . . . . . . . . . . . . . . . . . . 80
Só para relaxar 81
Referências Bibliográcas 90

Nelson Mulemba

Introdução
Bem Vindo à BioEstatística.

Caro aluno, este manual foi produzido com o objectivo de dar suporte aos estudantes do IF-
Instituto Foco, dos curos: Saúde Pública e Gestão Ambiental e Higiene e Segurança no Trabalho
na displina de BioEstatística.
O manual intitulado Manual de BioEstatística apresenta uma síntese dos assuntos que serão
abordados durante as aulas. O manual é composto por 8 (oito) capítulos teóricos e 2 (dois)
práticos. Os primeiros capítulos que antecedem a parte prática, fazem parte da estatística
descritiva. Utiliza-se métodos para organizar, resumir e descrever aspectos importantes de um
dado conjunto de dados. Após a primeira parte do bloco prático, encontramos contéudos que
compõem o campo das probabilidades para medidas de incerteza.
Nos capítulos práticos intitulados Só para relaxar estão patentes os exercícios que fundamen-
tam a parte teórica.
Todos os exercícios deverão ser resolvidos num caderno. Meu desejo é que aqueles que
zerem o bom uso deste manual, tenham um bom aproveitamento e conquistem linguagem
estatística para toda a vida.
Aproveitar agradecer todos aqueles que farão uso deste manual, e em especial aqueles que
farão críticas com intuito de melhoramento e aperfeiçoamento deste manual.
Em nelsonrafaelmulemba@gmail.com
DoceModel
1
Capı́tulo 1
A Natureza da Estatística
Todas as ciências têm as suas raízes da história do Homem.

A Matemática, que é considerada, a ciência que une à clareza do raciocínio a síntese da lingua-
gem, originou-se do convívio social, das trocas, de contagem, com carácter prático, utilitário,
empírico.
A Estatística, ramo da Matemática Aplicada, teve origem semelhante. Desde antiguidade, vá-
rios povos já registavam o número de habitantes, de nascimentos, de óbitos, faziam estimativas
de riqueza individual e social, distribuiam equitativamente terras ao povo, cobravam impostos
e realizavam inquéritos quantitativos por processo que, hoje chamariamos de "estatísticas".
A partir do século XVI começaram a surgir as primeiras análises de factos sociais, como ba-
tizados, casamentos, funerais, originando as primeiras tábuas e tabelas e os primeiiros números
relativos.
Ao longo da idade média e até ao século XVIII, a estatística foi puramente descritiva, coexistindo
duas escolas: a escola descritiva alemã, cujo representante mais conhecido é o economista Go-
dofredo Achenwall (1719-1772), professor na Universidade de Gottingen, considerado pelos
alemães como o pai da estatística, batizou a nova ciência (ou método) com o nome de Estatís-
tica, determinando o seu objectivo e suas relações com as ciências e a escola dos matemáticos
sociais, que procuravam traduzir por leis as regularidades observadas de certos fenômenos, de
carácter econômico e sociológico. Embora essa escola procurasse fundamentar a formulação de
previsões com base de leis sugeridas pela experiência, a estatística confundia-se, praticamente,
com a demograa à qual fornecia métodos sistemáticos de enumeração e organização. Na re-
alidade a necessidade sentida, em todas épocas, de conhecer numérica e quantitativamente, a
2
realidade política e social tornou análise demográca uma preocupação constante.
As tabelas tornaram-se mais completas, surgiram as representações grácas e o cálculo de

probabilidades, e a estatística deixou de ser simples catalogação de dados númericos colectivos
para se tornar o estudo de como chegar a conclusões sobre o todo partindo da observação de
partes desse todo.
Em todas as áreas da ciência, a colecta de dados se faz necessaria e com isso a Estatística tem
crescido muito nos últimos anos, especialmente com o advento de computadores e surgimento
de softwares cada vez mais sosticados. Observar uma extensa listagem de dados colectados
não nos permite chegar a uma conclusão concisa. Este facto se afasta se esse conjunto de dados,
possui muitas características que devem ser investigadas.
Os métodos descritivos são utilizados, portanto, para organizar, resumir e descrever aspectos
importantes de um conjunto de características observadas ou comparar tais características entre
dois ou mais conjuntos.
Ao se resumir ou condensar um conjunto de dados, informacões são perdidas, visto que, não
estamos mais trabalhando com as observações originais. Entretanto, esta perda de informação
é pequena se compararmos ao ganho que se tem com a clareza da interpretação proporcionada.
Não só nos artigos técnicos direcionados para pesquisadores mas também, nos artigos de jornais
e revistas escritos para o público leigo, é cada vez mais frequente a utilização dos recursos de
descrição para complementar a apresentação de um facto, justicar ou referendar um argu-
mento.
As ferramentas descritivas são os muitos tipos de grácos e tabelas e as medidas de síntese,

como os índices e as médias.
1.1 Estatística
A Estatística originou-se da colecta de dados e construção de tabelas de dados para o governo.
A situação foi evoluindo e esta colecta de dados representa somente um dos aspectos da Esta-
tística.
Exprimindo por meio de números as observaçoes que se fazem de elementos com, pelo menos,
3 || IF - - 2018 - - Manual de BioEstatística Nelson Mulemba

uma característica comum (por exemplo: os alunos do sexo masculino de uma escola), obtemos
os chamados dados referentes a esses elementos.
Sendo assim torna-se como objectivo principal da estatística, o auxílio na tomada de decisão
ou tirar conclusões en situações de incerteza, a partir de informações numéricas.
Denição 1.1.1. A Estatística é uma parte da Matemática Aplicada que fornece métodos
para a colecta, organização, descrição, análise e interpretação de dados e para a utilização dos
mesmos na tomada de decisões.
Denição 1.1.2. Bioestatística é o conjunto de conceitos e métodos cientícos usados no
tratatmento de variabilidade nas ciências médicas e biológicas.
A Biostatística fornece métodos para se tomar decisões óptima na presença de incerteza,

estabelecendo faixas de conança para a ecácia dos tratamentos e vericando a inuência de
factores de risco no aparecimento de doenças. Dentro da área biológica, compreende-se por
Biometria a ciência que estuda as medidas de seres vivos.
A Estatística está presente em diversas áreas e em diversas abordagens. Podemos citar

alguns exemplos de suas aplicações:
• Eleições: Anúncio prévio, em termos percentuais, de que o candidato A é o provável

vencedor. (A previsão pode ser feita após a contagem de 2% dos votos);
• Indústria: Teste de lâmpadas ash ou lentes para máquinas fotográcas. O fabricante

deve saber com antecedência se o lote fabricado pode ser colocado no mercado ou não
(pois pode estar sujeito a riscos!);
• Meteorologia: Informa que a chance de chuva para hoje é de 30% (utilização de métodos
estatísticos de previsão);
• Instituições Bancárias/Crédito: Análise de crédito; seguro de vida e/ou de automóveis;
• INE/Índices: Censo; taxa de desemprego; inação; custo de vida; valor do salário mínimo,
índices de preços; taxa de mortalidade/natalidade; índices de analfabetismo, etc.
• Farmácia/Medicina: Analisar a entrada de um novo medicamento, vericando a sua

ecácia. Deve-se tomar muito cuidado com a tomada de decisão;

• Pesquisas: Estudo sobre hábitos migratórios de certo animal; estimação do tamanho
populacional de certas espécies;
• Experimentação Agrícola: Estudos de uma nova variedade de semente (modicação ge-

nética) ou de fertilizantes;
• Telecomunicações: A utilização da Internet gera informações preciosas de clientes; controle

de tráfego telefônico, chamadas e consumo, forçam a utilização de modelos estatísticos
complexos;
• Experimentação Zootécnica: Estudo do desenvolvimento de um animal e análise de fac-

tores que inuenciam neste desenvolvimento tais como, alimentação, cativeiro e outros;
melhoramento genético; pesquisas com vacinas animais entre outros.
1.2 Divisões da Estatística

A Estatística pode ser dividida em dois ramos:
I: Estatística Descritiva: diz respeito aos métodos de recolha, apuração, apresentação e ao

resumo dos dados,os quais podem ser apresentados sob a forma numérica ou gráca.
II: Estatística indutiva ou inferencal: é o ramo da estatística cujo objectivo é fazer ar-
mações a partir de um conjunto de valores representativo (amostra) sobre um universo,
fundamentado pela teoria da probabilidade.
1.3 Método Cientíco

Muitos dos conhecimentos que temos foram obtidos na Antiguidade por acaso e, outros, por
necessidades práticas, sem aplicação de um método.
Actualmente, quase todo acréscimo do conhecimento resulta da observação e do estudo. Se bem
que muito desse conhecimento possa ter sido observado essencialmente por acaso, a verdade é
que desenvolvemos processos cientícos para seu estudo e para adquirirmos tais conhecimentos.
Denição 1.3.1. Método é um conjunto de meios dispostos convenientemente para se chegar

a um m que se deseja ou a um determinado objectivo.
Dos métodos cientícos vamos considerar os métodos:

1.3.1 Método Experimental
O Método experimental consiste em manter contantes todas as causas (factores) menos uma,
e variar esta causa de modo que o pesquisador possa descobrir seus efeitos, caso existam. É o
método mais preferido no estudo da Física e Química, etc.
1.3.2 Método Estatístico

Muitas vezes temos necessidade de descobrir factos em um campo em que o método experi-
mental não se aplica (nas ciências sociais), já que os vários factores que afectam o fenômeno
em estudo não podem permanecer constantes enquanto fazemos variar a causa que, naquele
momento nos interessa.
Como por exemplo, podemos citar a determinação das causas que denem o preço de uma
mercadoria. Para aplicarmos o método experimental, teriamos de fazer variar a quantidade da
mercadoria e vericar se tal afecto iria inuenciar seu preço.
Porém, seria necessário que não houvesse alterações nos outros factores. Assim, deveria existir,
no momento de uma uniformidade dos salários, o gosto dos consumidores deveria permanecer
constante, seria necessária a xação do nível geral de preços das outras necessidades, etc. Mas
isso tudo é impossível. Nestes casos, cosideramos um outro método, embora mais difícil e menos
preciso, denominado método estatístico.
Denição 1.3.2. O Método estatístico, diante da impossibilidade de manter as causas cons-

tantes, admite todas essas causas presentes variando-as, registando essas variações e procurando
determinar, no resultado nal, que inuências cabem a cada uma delas.
1.4 Fases de um Método Estatístico

I: Denição do problema: Saber exactamente aquilo que se pretende pesquisar é o mesmo
que denir correctamente o problema
II: Planeamento: Nesta fase temos a considerar os procedimentos necessários para o desen-
volvimento do trabalho, ou seja, Como levantar informações? Que dados deverão ser
obtidos? Que tipo de amostragem será usada? O cronograma das actividades e os custos
envolvidos, etc.

III: Colecta de dados: É a fase operacional, a fase que consiste em adquirir as informações
necessárias eé feita através de um questionário e boletim
IV: Apuração dos Dados: Não nada mais do que o resumo dos dados através de sua conta-
gem e agrupamento. É a condensação e tabulação de dados.
V: Apresentação dos Resultados: Por mais diversa que seja a nalidade que se tenha
em vista, os dados devem ser apresentados sob forma adequada (tabelas ou grácos),
tornando mais fácil o exame daquilo que está sendo objecto de tratamento estatístico e
posterior obtenção de medidas típicas. As duas formas de apresentação, não se excluem
mutuamente. A apresentação tabular, ou seja é uma apresentação númerica de dados
em linhas e colunas distribuídas de modo ordenado. A apresentação gráca dos dados
númericos constitui uma apresentação geométrica permitindo uma visão rápida e clara
do fenómeno.
VI: Análise dos Resultados: O último objectivo da Estatística é de tirar conclusões sobre o
todo (população) a partir de uma parte representativa do todo (amostra). Sendo assim,
concluídas as fases anteriores (Estatística Descritiva), fazemos uma análise dos resul-
tados obtidos através dos métodos da Estatística Indutiva ou Inferencial, e tiramos
desses resultados conclusões e previsões. É a etapa mais delcada e importante, está liga
ao cálculo de medidas e coecientes. Aqui temos que tirar conclusões que servirão para
auxiliar o pesquisador a resolver o seu problema. Na estatística indutiva a interpretação
dos dados se fundamentam na teoria de probabilidade.
Actualmente a empresa é uma das vigas mestras da Economia dos povos. A direcção de
qualquer tipo de empresa, exige dos seu administrador a importante tarefa de tomar de-
cisões, e o conhecimento e o uso da Estatística facilitará seu tríplice trabalho de oganizar,
dirigir e controlar a empresa.

Capı́tulo 2
População e Amostra
2.1 População e Amostra

Denição 2.1.1. População estatística ou Universo é o conjunto (nito ou innito) de
elementos que possuem pelo menos, uma característica em comum e com interesse para o estudo.
Denição 2.1.2. População nita: é aquela população em que é possível conhecer a quanti-
dade de todos os elementos da população.
Exemplo 2.1.1. Um estudo sobre as idades dos alunos do IF.
Denição 2.1.3. População innita: é aquela população em que não é possível conhecer a
quantidade de todos os elementos da população.
Exemplo 2.1.2. Um estudo sobre espécies de pássaros que frequentam uma certa zona.
Assim, os estudantes, por exemplo, constituem uma população, pois apresentam pelo menos
uma característica em comum: estudam.
Como em qualquer estudo estatístico temos em mente pesquisar uma ou mais características
dos elementos de alguma população, esta característica deve estar bem denida. É isso que se
dá quando, considerando um elemento qualquer, podemos armar, sem ambiguidade, se esse
elemento pertence ou não à população. É necessário, pois existir um critério de constituição da
população, válido para qualquer pessoa, no tempo ou no espaço.
Na maioria das vezes, por impossibilidade ou inviabilidade econômica ou temporal, limita-

mos as observaçoões referentes a uma determinada pesquisa a apenas uma parte da população.
A essa parte proveniente da população denominamos por amostra.
8
Denição 2.1.4. Amostra é um subconjunto (parte) nito da população que é examinada
com o propósito de levarmos conclusões sobre essa população.
LEMBRAR QUE: A quantidade dos elementos da população representa-se por N e para

a amostra por n .
Exemplo 2.1.3. Medicina: Pretende-se estudar o efeito de um novo medicamento para curar
determinada doença. É seleccionado um grupo de 20 doentes, administrando-se o medicamento
a esses doentes escolhidos ao acaso, e o medicamento habitual aos restantes.
População: Conjunto de todos os doentes com a doença especíca.

Amostra: Conjunto dos 20 doentes seleccionados.
Nos casos em que o estudo é feito a toda população, denomina-se por Censo.
Denição 2.1.5. Censo ou Recenseamento: é um estudo estatístico de um universo de
pessoas, instituições ou objectos físicos com o propósito de adquirir conhecimentos, observando
todos os seus elementos, e fazer juízos quantitativos acerca de características importantes desse
universo.
Denição 2.1.6. Sondagem: é um estudo cientíco com o objectivo de melhor conhecer
atitudes , hábitos e preferências da população relativamente a aconteccircunstâncias e assuntos
de interesse comum.
Em resumo pode-se denir Recenseamento ou Censo como um estudo estatístico rea-

lizado sobre toda a população, enquanto que Sondagem é um estudo estatístico realizado a
partir de uma amostra.
Dados consistem em informações provenientes de observações, contagens, medições ou res-
postas.
Estatística é a ciência que trata da colecta, organização, análise e interpretação dos dados
para a tomada de decisões.
Uma amostra é um subconjunto ou parte de uma população.
Um parâmetro é a descrição numérica de uma característica populacional.
Uma estatística é a descrição numérica de uma característica amostral.
Estatística descritiva é o ramo da estatística que envolve a organização, o resumo e a
representação dos dados.

Estatística inferencial é o ramo da estatística que envolve o uso de uma amostra para
chegar a conclusões sobre uma população. Uma ferramenta básica no estudo da estatística
inferencial é a probabilidade.
2.2 Amostragem
Denição 2.2.1. Amostragem: é uma técnica estatística que signica extrair uma parte da
população (amostra) com o propósito de avaliar certas características desta população.
2.2.1 Importância da Amostragem

Na realização de qualquer estudo quase nunca é possível examinar todos os elementos da po-
pulação de interesse. Temos usualmente de trabalhar com uma amostra da população. A
inferência estatística nos dá elementos para generalizar, de maneira segura, as conclusões obti-
das da amostra para a população.
As vezes é enganoso pensar que, caso tivéssemos acesso a todos os elementos da população,
seríamos mais preciosos. Os erros de colecta de dados e manuseio de um grande número de
dados são maiores do que as imprecisões a que estamos sujeitos quando generalizamos, via
inferência, as conclusões de uma amostra bem selecionada.
Portanto, quando se trata de amostra, a preocupação central é que ela seja representativa.
Assim que decidimos obter informações através de um levantamento amostral, temos imedian-
tamente dois problemas:
• Denir cuidadosamente a população de interesse;
• Selecionar a característica que iremos pesquisar.
Para que serve e quando deve ser utilizada?

São apontadas algumas razões para o uso de amostragens:
1. Economia: Quando não houver recursos sucientes para estudar toda a população, é
bem mais económico estudar uma parte dela;

2. Tempo: Quando não houver tempo, ou existem situações que não haveria tempo su-
ciente para pesquisar toda a população, por outro lado a característica a ser estudada é
muito variável , sujeita a alteração brusca em curto período de tempo;
3. Conabilidade de dados: Pesquisar um número menor de elementos ajuda na veri-

cação de erros;
4. Operacionalidade: a condução do estudo ca bem mais fácil com menor número de
elementos pesquisados.
Um plano de amostragem deve responder às seguintes questões: quem pesquisar (unidade

de amostragem), quantos pesquisar (tamanho da amostra) e como selecionar(o procedi-
mento da amostragem).
A decisão de quem pesquisar exige que o universo seja denido de modo que uma amostra
adequada possa ser selecionada. As entrevistas realizadas com o público correcto são factores
básicos para a validade do estudo. O tamanho da amostra depende do orçamento disponível e
do grau de conança que se quer alocar aos resultados.
A decisão de utilizar amostras ou utilizar a população total está directamente ligada ao
objectivo do estudo. Ora vejamos:
Se o objectivo do estudo for:
1. Avaliar a prevalência de malária entre as 45 crianças com necessidades especiais de uma

determinada comunidade da Província de Manica.
Neste caso, podemos utilizar a população total já que o número de participantes no estudo
é menor.
2. Avaliar a prevalência de malária entre as crianças moçambicanas em um determinado ano.

Neste caso torna-se impossível utilizar a populaçào total vistto que o número de partici-
pantes no estudo muito maior.
Quando não se deve utilizar amostragem?

Existem situações em quen não se deve fazer amostragem porque o resultado do estudo precisa
ser altamente preciso como é o caso do Censo demográco realizado a cada dez anos pelo INE

no nosso país. O parâmetro número de habitantes residentes no país é fundamental para o
planeamento de políticas de governo e deve ser avaliado com grande precisão. Por isso, se deve
pesquisar toda a população.
Também não se deve fazer amostragem quando população do estudo é pequena, pois devemos
nos lembrar que, a validade está directamente ligada ao tamanho da amostra. Amostras pe-
quenas geram dados imprecisos.
2.2.2 Tipos de Amostragens

Com a utilização de amostragem, cada elemento da população passa a ter a mesma chance de
ser escolhido, o que garante o carácter de representatividade, e isto é muito importante, pois,
como vimos, nossas conclusões relativas à população vão estar baseadas nos resultados obtidos
nas amostras dessa população.
De seguida, apresentamos dois grupos de técnicas de amostragem:
• Amostragens Probabilísticas
1. Amostragem Aleatória Simples
2. Amostragem Sistemática
3. Amostragem Estraticada (Proporcional)
4. Amostragem por Conglomerados
• Amostragens não Probabilísticas
1. Amostragem por Convêniência ou Acidental
2. Amostragem Intencional
3. Amostragem por quotas
4. Bola de Neve
Amostragens Probabilísticas
Nesse tipo de amostragem, os elementos da amostra são seleccionados aleatoriamente e todos
eles possuem probabilidade conhecida de serem escolhidos. Tal selec ção ocorre através de uma
forma de sorteio não viciado, como o sorteio em uma urna por números gerados por computa-
dor. A amostragem probabilística é objectiva , pois não né inuenciada pela pessoa que está

a conduzir a pesquisa. Enquanto que a amostragem não probabil±tica é subjcetiva, pois
baseia-se nas decisões pessoais do pesquisador.
1: Amostragem Aleatória Simples

Este tipo de amostragem é equivalente a um sorteio de lotaria.
Todos os elementos da população tem a mesma chance de ser pertencerem a amostra. Na
prática a amostragem aleatória simples é feita unidade por unidade. As unidades da população
são numeradas de 1 a N. Em seguida escolhe-se na tábua de números aleatórios, n números
compreendidos entre 1 e N . Esse processo é equivalente a um sorteio no qual se colocam todos
os números misturados dentro de uma amostra de uma urna. As unidades correspondentes aos
números escolhidos formarão a amostra.
Exemplo 2.2.1. Vamos obter uma amostra representativa de nove alunos para a pesquisa de
altura de noventa alunos de um curso.
Temos que: N = 90 e n = 9 .
a): Numeramos os alunos de 01 a 90.
b): Escrevemos os números de 01 a 90, com pedaços iguais de um mesmo papel, colocando-os
dentro de uma caixa. Agitamos sempre a caixa para misturar bem os pedaços de papel e
retiramos um a um, nove peda

os de papel com os números que formarão a nossa amostra.
2: Amostragem Sistemática
Quando os elementos da população já se encontram ordenados, não há necessidade de construir

o sistema de refrência. São exemplos as las de consultas médicas de um hospital, bichas
de depósitos, os prédios uma rua, os carros numa avenida (engarrafamento). Nestes casos, a
seleção dos elementos que constituirão a amostra pode ser feita por um sistema imposto pelo
pesquisador. A este tipo de amostragem denominamos sistemática.
Em geral, para se obter uma amostra sistemática de n elementos de uma população de tamanho
N
N , temos que determinar a constante K que deve ser menor ou igual a . Não é possível
n
determinar K precisamente quando o tamanho da população é desconhecido, mas pode-se
supor um valor de K de tal modo que seja possível obter uma amostra de tamanho n .
N
Caso o valor de K for decimal, temos que arredondar por defeito. K ≤ .
n

Exemplo 2.2.2. Suponhamos uma rua contendo 900 prédios dos quais desejamos obter uam
amostra formada por cinquenta prédios. Podemos, neste caso, usar o seguinte procedimento:
900
Como N = 900 e n = 50 , determinemos o valor de K , dado por K = = 18 , escolhemos
50
aleatoriamente um número de 1 a 18, o qual será o primeiro elemento sorteado da amostra, os
demais elementos serão encontrados adicionando a constante K = 18 .
Assim, se o número escolhido fosse 5, tomariamos os prédios: 5◦ prédio, 23◦ prédio, 41◦ prédio,
etc...até completarmos 50 prédios seleccionados.
3: Amostragem Estraticada (Proporcional)
Muitas vezes a população se divide em subpopulações (estratos). Como é provável que a va-
riável em estudo apresente, de estrato em estrato, um comportamento heterogêneo (diferenças)
e, dentro de cada estrato, um comportamento homogêneo.
Quando a população se divide em estratos (sub-populações), convém que o sorteio dos ele-
mentos da amostra leve em consideração tais estratos, daí obtemos os elementos da amostra
proporcional ao número de elementos desses estratos. A esolha dos elementos amostrais dos
estratos pode ser feita aleatoriamente
O número de elementos a ser seleccionado em cada estrato deve ser proporcionalmente (regra
de três simples) ao tamanho do estrato, portanto, o processo do cálculo de número de elementos
a serem extraídos em cada estrato é:
N -número de elementos da população; n -número de elementos da amostra;
N1 -número de elementos 1◦ estrato; n1 -número de elementos da amostra de N1
N2 -número de elementos 2◦ estrato; n2 -número de elementos da amostra de N2 ; etc.
Então:
N1 n1 n
= , ou seja, n1 = N1 · ;
N n N
N2 n2 n
= , ou seja, n2 = N2 · ; etc.
N n N
Exemplo 2.2.3. Supondo uma turma de 90 alunos, sendo 54 meninos e 36 meninas. Pretende-
se estudar o tempo de ocupação pelas tarefas domésticas, com uma amostra representativa de
9 elementos.
Como a variável de estudo pode apresentar muita divergência em relação ao género, pois pode-
mos supor que as meninas gastam mais tempo em relação aos meninos nas tarefas domésticas,
então é recomendável uma amostra proporcional aos dois estratos (género masculino e género

feminino).
Temos: N = 90 , n = 9
Género Masculino N1 = 54 e Género feminino N2 = 36 .
Temos que determinar as amostras por cada estrato:

n 9
Para o género masculino: n1 = N1 · = 54 · = 5, 4 ≈ 5 meninos.
N 90
n 9
Para o género masculino: n2 = N2 · = 36 · = 3, 6 ≈ 4 meninas.
N 90
Sendo assim, a amostra será composta por 5 meninos e 4 meninas, que ao todo são 9 alunos.
4: Amostragem por Conglomerados
A população é dividida sicamente em conglomerados (grupos). A seguir seleccionam-se ale-

atoriamente os conglomerados que farão parte da amostra. Depois todos os elementos dos(s)
conglomerados(s) seleccionados serão amostras.
Na amostragem por conglomerado, ao invés de seleccionar elementos, selecciona-se um grupo
(famílias, organizações, quarteirões, etc), ou seja, a unidade a ser sorteada inicialmente é um
conglomerado o qual é formado por elementos (pessoas). De cada um desses conglomerados
observa-se todos os seus elementos.
É muito utilizada quando há necessidade de se realizar entrevistas ou observações em grandes
áreas.
Uma amostragem por conglomerado é recomendável quando:
• Não se possui uma lista contendo todos os nomes dos elementos da população;
• Existe grande heterogeneidade entre os elementos da população;
• É preciso fazer entrevistas ou observações em grandes áreas geográcas;
• O custo de obtenção dos dados cresce com o aumento da distância entre os elementos.
Exemplo 2.2.4. Num levantamento da população de determinada cidade, podemos dispor do
mapa indicando cada quarteirão e não dispor de uma relação actualizada dos seus moradores.
Pode-se, então, colher uma amostra dos quarteirões e fazer a contagem completa de todos os
que residem naqueles quarteirões sorteados.
Então, quando utilizar um processo de amostragem não probabilística?

Atenção: Não é o pesquisador que dene o tipo de amostragem a utilizar.
São os objectivos do estudo que denem: Qual será o tipo de estudo, quem será a população e

como ela deve ser seleccionada, assim como o local, a amostra, os procedimentos, as variáveis
e o cálculo dtamanho da amostra.
Supondo-se que o objectivo da pesquisa seja:

Avaliar o uso do preservativo masculino por adolescentes no início da vida sexual, alunos do
ensino médio em escolas de uma certa província.
Quem determina a amostra a ser utilizada? O pesquisador é quem irá determinar. Para isso
deverá estar atento, a pergunta da pesquisa, ao tipo de estudo e as variáveis estudadas. Com
este conjunto de informações é que o pesquisador determinará qual o método viável de análise
estatística a ser utilizado, ou seja, tipo de amostragem, etc.
As amostras não probabilísticas são muitas vezes a opção para alguns estudos devido á sua
simplicidade ou, como acontece na maioria das vezes, não é possível uma amostra tão denida
para se obterem amostras probablísticas. Principalmente quando não é objectivo do estudo,
fazer generalização dos resultados das análises estatísticas da amostra para a população de onde
a amostra foi retirada.
LEMBRAR QUE: É preciso car claro para os pesquisadores e para os usuários da pes-
quisa que essemétodo possui inúmeras limitações, sendo inferior à amostragem probabilística em
termos de precisão de resultados. Quando utilizar o processo de amostragem não probabil±tica
LEMBRAR QUE os resultados produzidos por este tipo de pesquisa devem ser interpretados
com cuidado.
O uso de amostragem não probabilística é uma das principais escolhas por alunos que desenvol-
vem um Trabalho dem do curso, uma monograa ou uma Tese de Mestrado, etc. Geralmente
esses estudos são exploratórios e não existe a necessidade de uma amostra altamente "precis"e
também não se pretende generalizar os dados obtidos para a população.
Amostragens não Probabilísticas
1: Amostragem por Convêniência ou Acidental
Trata-se de uma amostra formada por aqueles elementos que vão aparecendo, que são possíveis
de se obter até completar o número de elementos da amostra. É o pesquisador quem dene
quais são convenientes para a pesquisa.

É adequada e frequentemente utilizada para geração de ideias em pesquisas exploratórias. É
utilizada quando se deseja obter informações de maneira rápida e barata. Geralmente utilizada
em pesquisas de opinião, em que os entrevistados são acidentalmente escolhidos, é possível
recrutar elementos para a amostra tais como; estudantes em sala de aula, mulheres no su-
permercado, alguns amigos e vizinhos, pesquisas de opinião em praças públicas ou em ruas
movimentadas de grandes cidades, etc.
Este método não permite que o pesquisador tenha qualquer controle de representatividade da
amostra. Ele só se justica se o pesquisador estudar as características das pessoas que passam
por uma esquina em um determinado ponto ou tempo ou se outros métodos de amostragem
não forem possíveis.
2: Amostragem Intencional
Amostragem intencional é acuja selecção é baseada no conhecimento sobre a população e o

propósito do estudo. O pesquisador corre o risco de entrevistar pessoas que não estão dentro
do assunto. De acordo com determinado critério, é escolhido intencionalmente um grupo de
elementos que irão compor a amostra. O investigador se dirige intencionalmente a grupos de
elementos dos quais deseja saber a opinião.
Este técnica é muito comum em pesquisas qualitativas.
Exemplo 2.2.5. Numa pesquisa sobre preferência por determinado cosmetível, o pesquisador
se dirige a um grande salão de beleza e entrevista as pessoas que ali se encontram.
3: Amostragem por quotas
A população é dividida em vários subgrupos, na realidade é comum dividir emum grande nú-
mero para compensar a falta de aleatoriedade, e selecciona-se uma quota de cada subgrupo,
proporcional ao tamanho. Por exemplo, em uma equipa de opinião eleitoral poderíamos dividir
a população de eleitores por sexo, nível de instrução, faixas de rendas entre outros aspectos,
e obter quotas proporcionais ao tamanho dos grupos (que poderia ser obtido através das in-
formações do INE). Na amostragem por quotas os elementos da amostra são escolhidos pelos
entrevistadores (de acordo comos critérios,...),geralmente em pontos de grande movimento,o
que sempre acarreta certa subjectividade (e impede que qualquer um que não esteja passando
pelo local no exacto momento da pesquisa possa ser seleccionado). Na prática muitas pesquisas
são realizadas utilizando amostragem por quotas.

Parece semelhante a uma amostragem estraticada proporcional, da qual se diferencia por não
empregar sorteio na selecção dos elementos.
4: Bola de Neve
Um modelo de bola de neve é apropriadamente utilizado em pesquisa quando os membros da
população são difíceis de localizar, por exemplo: imigrantes sem visto de permanência no país.
Em uma amostragem bola de neve, o pesquisador colecta dados sobre um pequeno número
de membros da população alvo quue consegue localizar e solicita a estes que o auxiliem a
providenciar o contacto com outros membros dessa população.
Exemplo 2.2.6. Se o pesquisador quer entrevistar imigrantes de um país especíco, pode iniciar
buscando por pessoas que conhece e pedindo novos contactos de conterrâneos conhecidos a estes.
Esse processo continua até que o pesquisador tenha todas as entrevistas que necessita que sejam
atingidas.
2.3 Variável e suas classicações

A cada fenómeno característica corresponde um número de respostas possíveis. Assim, por
exemplo:
Para o fenómeno sexo, os resultados possíveis são sexo masculino e sexo feminino;
Para o fenómeno número de lhos há um número de resultados possíveis expresso através dos
números naturais... 0; 1; 2; 3;...; n ;...
Denição 2.3.1. Variável: é a característica de interesse que é medida em cada elemento da
amostra ou população. Como o nome diz, seus valores variam de elemento para elemento. As
variáveis podem ter valores númericos ou não númericos.
De acordo com a sua natureza, as variáveis podem ser classicadas como: variável quali-
tativa ou variável
 quantitativa
 .

  N ominal
Qualitativa




  Ordinal
Variável 

  Discreta
Quantitativa




  Continua
Denição 2.3.2. Variável qualitativa: quando o resultado da observação é apresenatado na
forma de qualidade ou atributo. Esses dados não podem ser operados algebricamente: Temos
como exemplo: sexo, cor dos olhos, categoria prossional, etc

As variáveis categoricas, por sua vez classicam-se em:
Qualitativas nominais: indicam apenas os nomes e não existe uma certa ordenção entre os
resultados obtidos. Exemplo: Sexo, Cor dos olhos, etc.

Qualitativas ordinais: quando existe uma possível ordenação nos resultados obtidos nas obser-
vações. Exemplo: Classe social (baixa, média, alta), etc. Para além dos nomes, estas variáveis
permitem a sua organização numa certa ordem, lógica e objectiva, cerscente ou decrescente.
Denição 2.3.3. Variável quantitativa: quando o resultado da observação é um número que
resulta de uma contagem ou medição. Exemplo: número de lhos, salário semanal, agregado
familiar, etc.
As variáveis numéricas, por sua vez classicam-se em:

Quantitativas discretas: características mensuráveis que podem assumir apenas um número -
nito de valores e, assim, somente fazem sentido valores inteiros não negativos. Como exemplo,
temos: número de lhos, número de alunos presentes na aula, etc.
Quantitativas contínuas: resulta normalmente de uma medição, e a escala numérica de seus
possíveis valores corresponde ao conjunto de números reais. Temos como exemplo: Tempera-
tura, preço, altura, etc.
As variáveis contínuas podem ser medidas numa escala de razões (razão/Racio) ou de

intervalos (intervalar). O que diferencia essas duas classicações é o número zero.
Na escala razão, o zero signica ausência da magnitude em causa. Exemplo: peso, altura.
Na escala intervalar, o zero signica existência e não ausência. Exemplo: Temperatura.

Capı́tulo 3
Distribuição de Frequências
Após a colecta de informações relativamente a uma variável dispomos dos dados de uma forma
desarumada e, naturamente devemos organizá-los. Essa organização facilita a interpretação
dos dados e condensa o número de informações. Não são raras as situações onde existem vários
valores repetidos. Denominamos frequência absoluta ou simplesmente frequência ao número de
vezes que um determinado valor da variável aparece. Somos capazes de observar muito mais
facilmente esses valores ordenados se os dispusermos em uma coluna e, ao lado de cada valor
a sua respectiva frequência. Esta tabela é denominada distribuição de frequências ou dados
agrupados.
3.1 Tabelas de frequências

É um tipo de tabela que condennsa uma coleção de dados conforme as frequências. Em ou-
tras palavras, tabela de frequências é uma forma de representação da frequência de cada
valor distinto da variável. Esta poderá incluir frequências relativas, frequências acumuladas e
frequências relativas acumuladas.
Dados Brutos: é uma tabela ou relação de elementos que não foram numericamente
organizados. Nela não é fácil formarmos uma ideia exacta do comportamento do grupo como
um todo, a partir de dados não agrupados ou ordenados.
Exemplo 3.1.1. 45; 41; 42; 41; 42; 43; 44; 41; 50; 46; 50; 46; 60; 54; 52; 58; 57; 58; 60; 51
Distribuição de Frequência Simples (Sem intervalos de classe): é a simples con-

densação dos dados conforme as repetições de seus valores.
20
3.1.1 Tipos de Frequências
Frequência absoluta fi : ou simplesmente frequência de um valor é o número de vezes que
uma determinada variável assume esse valor. A sima de todas frequências é igual ao número
de observações ou seja ao número de elemetos da população ou amostra. Em outras palavras
X
fi = n.
Frequência relativa fr é a razão (resultado da divisão) entre a frequência absoluta e o número

total de observações, ou seja
fi fi
fr = ou f r = P
n fi
(arrendodar a 3 casas decimas se necessário) e a soma de todas frequências relativas da distri-
buição deve ser igual a 1. Ou seja,
X
fr = 1.
De modo a facilitar a comparação de grupos diferentes, a frequência relativa na maioria das

vezes é expresso em percentagem ( % ).
A Frequência relativa percentual f r% obtem-se multiplicando a frequência relativa por

100. Ou, seja
X
f r(%) = fr × 100 e fr % = 100%.
Frequência acumulada de um valor: (usada para variável quantitativas ou qualitativa

ordinal), é a soma das frequências dos valores menores ou iguais ao referido valor, ou por outra, é
o número de vezes que uma dada resposta duma variável assume um valor inferior ou igual a esse
valor. Em outras palavras, é a soma das frequências de cada valor com as frequências de todos
os valores anteriores. Podem ser tanto das frequências absolutas (fi ) , como das frequências
relativas (fr ) ou (fr (%)) . Representaremos por Fi para Frequencia absoluta acumulada e Fr
ou Fr % para Frequência relativa ou percentual, respectivamente.
Exemplo 3.1.2. Considere a seguinte amostra que resultou na observação da variável "Cor
dos Olhos"em 20 estudantes da turma de Gestão Financeira e Bancária: Castanho, Preto,
Castanho, Azul, Castanho, Castanho, Preto, Castanho, Verde, Castanho, Preto, Castanho,
Azul, Castanho, Castanho, Preto, Preto, Castanho, Preto, Preto.

A informação acima pode ser resumida na tabela de frequências:
Cor dos Olhos fi fr fr % Freq. absoluta acumulada (Fi %) Freq. relativa acumulada (Fr %)
Azul 2 0.1 10 2 10
Castanho 10 0.5 50 12 60
Preto 7 0.35 35 19 95
Verde 1 0.05 5 20 100
Total 20 1 100
Exemplo 3.1.3. Perguntou-se aos estudantes da turma de Contabilidade-Noite quantos lhos
tinham. Obtiveram-se as seguintes respostas:

1 2 3 3 2 4 2 3 7 0
3 2 6 4 2 2 1 2 0 2
As respostas são os dados observados de umavariável estatística, número de lhos por cada
estudante, e não estão agrupados. Olhando para eles será difícil tirar conclusões.
Os valores que a variável estatística assumiu durante o inquérito são: 0, 1, 2, 3, 4, 6, 7.
Pode-se representar a tabela dos resultados obtidos, fazendo a contagem. Passará se a ter os
dados agrupados a partir dos avalores que a variável estatística pode assumir:
Números de lhos por estudante (Xi ) Número de estudantes (fi )
0 2
1 2
2 8
3 4
4 2
6 1
7 1
Total n=20
Em contrapartida com os dados recolhidos com esta tabela já se podem tirar algumas con-
clusões , como por exemplo, que a maioria dos estudantes inquiridos têm dois lhos.
No entanto, se acrescentar á atabela anterior duas colunas, uma com a frequência relativa fr
e a outra a frequência relativa percentual fr % , pode-se tirar mais conclusões e comparar os
resultados com estudos semelhantes em outras populações, ou seja, a frequência relativa do
valor de (3 lhos) é 0.2, que é o mesmo que dizer 20%. Isto quer dizer que, em cada 100 alunos,
20 têm lhos.

Xi fi fr fr %
0 2 0.1 10
1 2 0.1 10
2 8 0.4 40
3 4 0.2 20
4 2 0.1 10
6 1 0.05 5
7 1 0.05 5
Total n=20
P P
fr = 1 f r% = 100
Se a tabela incidisse sobre um grande número de dados seria útil acrescentar mais duas colunas
à tabela para apresentar as frequências acumuladas, ou melhor:
Xi fi Fi fr fr % Fr %
0 2 2 0.1 10 10
1 2 4 0.1 10 20
2 8 12 0.4 40 60
3 4 16 0.2 20 80
4 2 18 0.1 10 90
6 1 19 0.05 5 95
7 1 20 0.05 5 100
Total n=20
P P
fr = 1 f r% = 100
3.1.2 Tabelas de Frequências em Intervalos de Classes

Quando os dados do conjunto apresentada variáveis qantitativas contínuas, existe uma neces-
sidade de organizar os dados originais em uma distribuição de frequências na qual os valores
agrupados são agrupados em classe de valores.
As tabelas de frequências em classes são tabelas frequentemente usadas para resumir um con-
junto de dados de natureza contínuos ou discretos com valores muito distintos.
Elementos de uma distribuição de frequências em classe

Quando o tamanho da amostra é elevado, é mais racional efetuar o agrupamento dos valores
em vários intervalos de classe.

i Classes Frequência
1 41 ` 45 7
2 45 ` 49 3
3 49 ` 53 4
4 53 ` 57 1
5 57 ` 61 5
Total 20
Classe- são os intervalos de variação da variável e é simbolizada por i e o número total de

classes simbolizada por K .
Exemplo 3.1.4. Na tabela anterior K = 5 e 49 ` 53 é a 3a classe, onde i = 3.
Limites de classe: são os extremos de cada classe. O menor número é o limite inferior de
classe (Li ) e o maior número, limite superior de classe (Ls ) .
Exemplo 3.1.5. Em 49 ` 53 , temos que Li = 49 e Ls = 53 . O símbolo ` representa um
intervalo fechado à esquerda e aberto á direita. O dado 53 da distribuição não pertence a 3a
classe e sim a 4a classe representada por 53 ` 57.
Ponto médio da classe (xp ) : é o ponto que divide o intervalo de classe em duas partes
Li + Ls
iguais. É denido pela expressão xp = .
2
Exemplo 3.1.6. Em 49 ` 53 , o ponto médio é xp = 49+53

2
= 51 .
Portanto, para a construção de uma distribuição de frequência por intervalo de classe, é

necessário o seguinte procedimento:
Primeiro Passo: Identicar o valor máximo ( Xmax ) e valor mínimo (Xmin ) para determinar
a Amplitude Total (At ) : onde At = Xmax − Xmin .
√
Segundo Passo: Determinar o número de classes ou intervalos (K) : K ∼
= n (aproximação
em excesso), onde n é o número de observações e deve ser maior ou igual a 30. Para n
menor que 30 podemos adoptar como K = 5 .
At
Terceiro Passo: Determinar a amplitude da classe (a) : a ∼
= (aproximação em excesso).
K
Em princípio a amplitude da classe deve ser igual em todas classes.

Quarto Passo: Temos então o menor valor da amostra (Xmin ) , o número de classes (K) e
a amplitude do intervalo (a) . Podemos montar a tabela, O limite inferior da primeira
classe é o Xmin e o limite superior para a primeira classe é o resultado da soma do Xmin
e amplitude (a) . Para as classes seguintes, o limite inferior é o limite superior da classe
anterior.
Quinto Passo: Fazer a contagem (senecessário) e preencher a respectiva frequência para cada
classe, determinando o seu ponto médio (xp ) pois este representa a classe.
Sexto Passo: A determinação do tamanho e das quantidades de classes deve obedecer as

seguintes condições:
1. Todos os dados devem ser abrangidos na contagem sem repetir;
2. Não deve existir classe com frequência nula, caso existir deve ser eliminada;
3. Cada dado ou valor deve ser enquadrado em apenas uma classe.
4. O número de classes de um modo geral, não deve ser menor que 5 ou maior que 25.
Exemplo 3.1.7. Os seguintes dados referem-se aos gastos totais (em dólar) em bebidas e
petiscos consumidos por 36 grupos dem um domingo no Campo da Costa do Sol durante o Jogo
Costa do Sol vs Textáfrica de Chimoio.

5 21 26 13 14 29 12 31 5 47 18 33
23 22 37 32 7 17 15 38 20 11 26 25
27 8 24 12 39 28 9 47 19 22 42 18
Representemos os dados em uma tabela de frequência em classe.
Nos dados apresentados temos que o valor máximo é Xmax = 47 e o valor mínimo é
Xmin = 5 .
Determinando a Amplitude total, tem-se que: At = Xmax − Xmin = 47 − 5 = 42.
√
Número de classes (K) , é dado por K ∼ = n , pode-se notar que trata-se de dados relacionados
√
a 36 observações logo n = 36 . Então K ∼ = 36 = 6.
At 42
Amplitude da classe (a) : a = = = 7. Agora vamos fazer a tabela de frequência com 6
K 6
classes a amplitude de classe a = 7 .

i Classe fi xp Fi fr f r%
1 5 ` 12 6 8.5 6 0.167 16.7
2 12 ` 19 8 15.5 14 0.222 22.2
3 19 ` 26 8 22.5 22 0.222 22.2
4 26 ` 33 7 29.5 29 0.194 19.4
5 33 ` 40 4 36.5 33 0.111 11.1
6 40 ` |47 3 43.5 36 0.083 8.3
Total 36 1 100
Onde xp é o ponto médio de cada classe.

Capı́tulo 4
Medidas de Posição de Dados
O tratamento e interpretação torna-se difícil para quem pretende colocar uma informação como
um todo, razão pela qual costuma-se calcular algumas medidas que resumidamente traduzem
as importantes características das distribuições de frequências.
O estudo que zemos sobre distribuições de frequências, até agora, permite-nos descrever, de
um modo geral, os grupos de valores que uma variável pode assumir. Dessa forma, podemos
localizar a maior concentração de valores de uma dada distribuição, isto é, se ela se localiza
no início, no meio ou no nal, ou ainda, se há distribuição por igual.
porém, para ressaltar as tendências características de cada distribuição, isoladamente, ou
em confronto com outras, necessitamos introduzir coneitos que se expressem através de números,
que nos premitam traduzir essas tendências. Esses conceitos denominam-se elementos típicos
da distribuição, que são:
• Medidas de posição • Medidas de assimetria
• Medidas de dispersão ou variabilidade • Medidas de curtose
As Medidas de posição tem como objectivo descrever um conjunto de dados de forma or-
ganizada e compacta que possibilita a visualização do conjunto estudado por meio de suas
estatísticas, o que não signica que estes cálculos e conclusões possam ser levados para a po-
pulação.
As medidas de posição mais usadas são as medidas de tendência central, que recebem tal
denomição pelo facto de os dados observados tenderem, em geral, a se agrupar em torno dos
valores centrais tenderem. Dentre as medidas de tendência central, destacamos:
27
• Média aritmética ou simplesmente Média • Moda
• Mediana
As outras medidas de posição, são as separatrizes, que englobam:
• Mediana • Decis
• Quartis • Percentis ou Centis
4.1 Medidas de tendência central

Uma medida de tendência central de um conjunto de dados mostra o valor em torno do qual
se agrupam as observações. Dentre as medidas de tendência central as mais importantes são:
média, mediana e moda.
4.1.1 Média (X)

Representa o centro de gravidade da distribuição da variável, sendo obtida por meio da soma
de todos os valores observados dividida pelo número de observações. A sua aplicação requer
uma variável quantitativa. As variações nos valores centrais afectam muito pouco o seu valor,
porém é muito inuenciado pelos valores extremos da variável.
Em um conjunto de dados, podemos denir vários tipos de média. Porém em nosso estudo
iremos nos limitar à mais usada e universal: a média aritmética ou simplesmente média.
A média aritmética (X) é obtida pela divisão da soma de todos os valores observados pelo
número de observações. A fórmula de cálculo é dada por:
P
Xi
X= . (4.1)
n
Exemplo 4.1.1. Sabendo que a produção diária de leite de uma vaca, durante uma semana foi
de 10; 14; 13; 15; 16; 18; e 12 litros.
Então, para a produção média semanal (n = 7) temos:
10 + 14 + 13 + 15 + 16 + 18 + 12 98
X= = = 14.
7 7
Nota: A média tanto como outras medidas de tendência central encontram-se sempre entre o
Xmin e Xmax , ou seja não deve ser menor que Xmin nem maior que Xmax .

A média é a principal medida de tendência central. Algumas das razões para que seja a medida
de posição mais recomendada são:
• É denida rigorosamente, ou seja sempre existe e pode ser interpretada sem ambiguidades;
• Leva em consideração toas as observações efectuadas;
• Calcula-se com facilidade.
Entretanto, esta medida leva consigo alguns inconvenientes como o facto de ser muito sensível
a valores extremos, isto é a valores excessivamente menores ou excessivamente maiores em
relação às demais observações do conjunto de dados. Por exemplo: Se estivermos interessados
em conhecer o salário médio dos funcionários de uma certa empresa com cinco funcionários e
obtivermos o seguinte conjunto de dados, em meticais:
1.230; 1.450; 2.100; 2.250; 25.000;
Podemos observar quatro dos cinco funcionários recebem entre 1.230 e 2.250 meticais e um
deles (talvez o Director) recebe 25.000 , porém calculando o salário médio:
1.230 + 1.450 + 2.100 + 2.250 + 25.000 32.030

X= = = 6.406 meticais.
5 5
Pode-se concluir que em média cada funcionário dessa empresa recebe 6.0406 meticais, o que
difere-se tanto aos demais valores do conjunto, isso pela inuência do salário 25.000 meticais
que puxou o salário médio para cima.
Média para Dados Agrupados
Podemos observar que a fórmula da média dada na equação (4.1) apenas é válida para dados
brutos ou não agrupados.
Consideremos a distribuição relacionada a 34 famílias, tomando como variável o número de
lhos por família:
Número de lhos 0 1 2 3 4
Número de famílias 2 6 10 12 4
Neste caso, como as frequências são números que indicam repetições de cada valor da variável,
elas funcionam como factores de repetições, o que nos leva a calcular a média ponderada ou
média para dados agrupados, dada pela seguinte fórmula:
P
(Xi · fi )
X= (4.2)
n

O modo mais prático e recomendável de obter a média em dados agrupados consiste em adici-
onar na tabela, uma coluna correspondente aos produtos Xi · fi . Para a tabela relacionada a
númerode lhos por família, temos:
Exemplo 4.1.2.
N ◦ de lhos (Xi ) N ◦ de famílias (fi ) Xi · f i

0 2 0
1 6 6
2 10 20
3 12 36
4 4 16
Total 34 78
Pela tabela, temos que: (Xi · fi ) = 78 , n = 34 .

P
Logo, a média será dada por

P
(Xi · fi ) 78
X= = = 2, 294...
n 34
Isto é X = 2.294 ∼
= 2.3 , como iremos interpretar o resultado de 2 lhos e 3 décimos de lhos?
Caso isso aconteça é recomendável o arredondamento da medida em questão para um valor
discreto, ou seja X = 2, 294... ∼
= 2. O que signica que em média cada família tem dois lhos.
Média para Dados em Classe

Neste caso, consideramos que os pontos médios são os valores que melhor representam cada
classe, ou seja, que todos os valores incluídos em um determinado intervalo de classe coincidem
com o seu ponto médio, e determinamos a média por meio da fórmula:
P
(xp · f i)
X= , (4.3)
n
onde xp é o ponto médio de cada classe.
Exemplo 4.1.3. Os seguintes dados referem-se aos gastos totais (em dólar) em bebidas e
petiscos consumidos por 36 grupos dem um domingo no Campo da Costa do Sol durante o Jogo
Costa do Sol vs Textáfrica de Chimoio.

i Gastos N ◦ de Grupos (fi )
1 5 ` 12 6
2 12 ` 19 8
3 19 ` 26 8
4 26 ` 33 7
5 33 ` 40 4
6 40 ` |47 3
Total 36
Pela mesma razão do caso anterior de dados agrupados, vamos adicionar uma coluna dos pontos
médios e outra para os produtos xp · fi
i Gastos fi xp xp · f i
1 5 ` 12 6 8.5 51
2 12 ` 19 8 15.5 124
3 19 ` 26 8 22.5 180
4 26 ` 33 7 29.5 206.5
5 33 ` 40 4 36.5 146
6 40 ` |47 3 43.5 130.5
Total 36 838
Como, neste caso: (xp · fi ) = 838 e n = 36 , então a média

P
P
(xp · fi ) 838
X= = = 23, 278.
n 36
Podemos interpretar este resultado como sendo o gasto médio por grupo foi de 23 doláres e 28
centavos, ou seja, 23, 278 dolares
4.1.2 Moda (M0)

O termo Moda (valor frequente de um conjunto) foi introduzido por Karl Pearon em 1895 e
originou-se talvez na maneira de se falar tal coisa está na moda, tal coisa é mais frequente.
Portanto dene-se Moda como sendo o valor da variável que ocorre com maior frequência.
Desse modo, o salário modal dos empregados de uma fábrica é o salário mais comum, isto é, o
salário recebido pelo maior número de empregados dessa fábrica.

Da mesma maneira, podemos armar que a cor modal das camisas dos estudantes do Insti-
tuto Foco é vermelho ou a cor mais frequente nas camisas dos estudantes do Instituto Foco é
vermelho.
A moda é uma das medidas de tendência central das mais simples, sendo aplicável a qualquer
variável, seja quantitativa ou qualitativa. A moda pode não existir, e mesmo que exista, pode
não ser única. Assim, um conjunto de dados ou uma distribuição de frequência pode ter várias
modas. De acordo com as frequências de cada valor observado, é possível que um conjunto de
dados seja:
• Amodal: quando não possui nenhum valor modal;
• Unimodal: quando possui uma única moda;
• Bimodal: quando possui duas modas para o conjunto;
• Trimodal: quando possui três modas para o conjunto;
• Multimodal: quando possui muitas modas.
Moda para Dados brutos ou não Agrupados

Quando lidamos com dados não agrupados, a moda é facilmente reconhecida, de acordo com a
denição, procurar a observação da variável que aparece mais repetida.
Exemplo 4.1.4. O conjuntoo dos dados:
12; 9; 7; 8; 10; 10; 10; 11; 12; 13; 15
tem moda igual a 10 .
Podemos, entretanto, encontrar conjunto de dados, nas quais não exista observação modal:
Exemplo 4.1.5. A: {10; 12; 21; 17; 32} , não existe moda. A distribuição é amodal
B: {5; 2; 2; 5; 7; 7} , não existe moda. A distribuição é amodal
C: {azul; verde; azul; azul; vermelho; preto; preto; vermelho; verde; vermelho; cinzento; verde}.
Existêm três modas, a distibuição é trimodal, onde M01 = azul , M02 = vermelho e
M03 = verde .

Moda para Dados Agrupados
Uma vez agrupados os dados, é possível determinar imediatamente a moda: basta xar a
observação da variável de maior frequência.
Exemplo 4.1.6.
N ◦ de lhos (Xi ) N ◦ de famílias (fi )

0 2
1 6
2 10
3 12
4 4
Total 34
Através da tabela podemos observar que a maior frquência é 12 que corresponde a observação
3 logo M0 = 3 ou seja, a maioria das famílias têm 3 lhos.
Moda para Dados em Classe

Nas distribuições de frequências em classe, não temos o valor que se repete e sim a classe que
possui a maior frequência. Nestas condições, é dita classe modal, que é a classe com maior
frequência.
Quando temos dados agrupados em classe, a moda é calculada por aproximação, começando
por localizar a classe modal (aquela que tiver maior frequência absoluta).
Existêm várias fórmulas para determinar a moda. De entre elas, para nosso estudo iremos
usar a fórmula de Czuber, que é uma das alternativas para calcular o valor da moda com apro-
ximação.
neste processo considera-se a inuência, sobre a classe modal, das frequências das classes adja-
centes (vizinhas), anterior e superior, assim como da frequência da classe modal.
fimo − fia
M0 = Li + · a, (4.4)
2fimo − (fia + fip )
onde
• Li - Limite inferior da classe modal;

• fimo - frequência absoluta da classe modal;
• fia - frequência absoluta anterior à classe modal;
• fip - frequência absoluta posterior à classe modal;
• a - amplitude da classe modal.
Nota: A moda deve percenter a classe modal, ou seja Li ≤ M0 < Ls , onde Li e Ls são os
limites inferior e superior da classe modal, respectivamente.
Exemplo 4.1.7. Consideremos a tabela seguinte referente as distâncias percorridas diaria-
mente em km , por estudantes do IF:
Determine a Moda.
i Classes (Km) xp fi
1 10 ` 20 15 10
2 20 ` 30 25 20
3 30 ` 40 35 35
4 40`50 45 40
5 50 ` 60 55 25
6 60 ` 70 65 15
7 70 ` 80 75 5
Total 150
Resolução:
Pela tabela, podemos notar que a classe com maior frequência é 4a classe, isto é, a classe modal
é de 40 ` 50 , onde Li = 40 ; fimo = 40 ; fia = 35 ; fip = 25 ; a = 10 . Usando a fórmula dada na
equação (4.4), de moda para dados em classes, temos que:
fimo − fia 40 − 35 5 5 50
M0 = Li + ·a = 40+ ·10 = 40+ ·10 = 40+ ·10 = 40+
2fimo − (fia + fip ) 2 · 40 − (35 + 35) 80 − 60 20 20
M0 = 40 + 2, 5 = 42, 5.
Sendo assim, podemos interpretar M0 = 42, 5 como: A maioria dos estudantes do IF percerro-
rem diariamente 42, 5km .

4.1.3 Mediana (M ed)
Mediana é outra medida de posição denida como o número que se encontra no centro de
um conjunto de dados, quando estes estão disposto seguindo uma ordem ( crescente ou decres-
cente). Em outras palavras, a mediana de um conjunto de valores, ordenados segundo a sua
ordem de grandeza, é o valor situado de tal forma que separa o conjunto em dois subconjuntos
de mesmo número de elementos.
Exemplo 4.1.8. Dado o conjunto de valores, como por exemplo: 5 13 10 2 18 15 6 16 9

De acordo com a denição da mediana, o primeiro passo a ser dado é o da ordenação (cres-
cente ou decrescente) dos valores:
2 5 6 9 10 13 15 16 18
Em seguida tomamos aquele valor que separa a mesma quantidade de elementos á direita e á
esquerda. Em nosso exemplo, esse valor é 10. Já que no conjunto temos 4 elementos tanto á
esquerda como á direita.
Temos, então que: Med = 10 .
Se porém, o conjunto tiver um número par de elementos, a mediana será a média aritmética
dos dois valores centrais.
Exemplo 4.1.9. O conjunto de valores (já ordenado crescentemente)
2 6 7 10 12 13 18 21
Tem para a mediana a média aritmética de 10 e 12.
10+12 22
Med = 2
= 2
= 11.
Conhecendo o número de elementos do nosso conjunto de observações é possível determinar

a posição da mediana do conjunto ordenado.
Se o conjunto de observações tiver n elementos, então a posição da mediana determina-se pela
fórmula a seguir:

 X n+1 ,
( 2 ) se n f or ímpar;
Med = X( n ) +X( n +1) (4.5)
 2
2
2
, se n f or par.
Exemplo 4.1.10. Os dados que se seguem representam as percentagens do valor total de 15
credores do Minllenium Bim que retornaram ao banco durante 3 trimestres.
32.2 29.5 29.9 32.4 30.1 32.1 35.2 10.0 20.6 28.6 30.5 38.0 33.0 29.4 37.1

Para localizar o valor mediano, primeiro, vamos ordenar os dados em ordem crescente. Como
o n é ímpar (n = 15) , a posição em que se encontra o valor mediano será:
X( n+1 ) = X( 15+1 ) = X( 16 ) = X8 , portanto o valor mediano está na posição 8, vejamos:
2 2 2
1◦ 2◦ 3◦ 4◦ 5◦ 6◦ 7◦ 8◦ 9◦ 10◦ 11◦ 12◦ 13◦ 14◦ 15◦

10.0 20.6 28.6 29.4 29.5 29.9 30.1 30.5 32.1 32.2 32.4 33 35.2 37.2 38.0
Assim, a mediana é 30.5. Isto signica que 50% das pessoas (ou a metade) pagaram menos
de 30.5% do valor que receberam quanto pediram empréstimo e outra metade (das pessoas)
devoveram igual ou maior que 30.5% do total.
Mediana para Dados Agrupados
Se os dados se agrupam em uma distribuição de frequências, o cálculo da mediana se processa

de modo muito semelhante áquele de dados não agrupados, implicando, a prévia determinação
de frequências acumuladas. Neste caso, é bastante determinar a posição da mediana usando a
fórmula (4.5) e de seguida achar o valor mediano com aux
'ilio da Frequência acumulada (que indica a posição) encontrando a frequência (no Fi ) igual ou
superior a posição da mediana.
Exemplo 4.1.11. Consideremos o seguinte exemplo, relacionado ao número de irmãos da
turma de Jornalismo do IF com 34 estudantes:
Xi fi Fi
0 2 2
1 6 8
2 10 18
3 12 30
4 4 34
Total 34
Temos que, n = 34 (par) então n

2
= 34
2
= 17 . Na frequência acumulada procuramos as
observações que ocupam as posições 17a e 18a posição.
A mediana será dada por Med = X17 +X18
2
= 2+2
2
= 2.
Sendo assim o valor mediano é de 2 irmãos.

Mediana para Dados em Classe
Neste caso, o problema consiste em determinar o intervalo em que encontra-se contida a medi-
ana. Para tal, temos que determinar a classe mediana, tal classe será aquela que apresentara
frequência acumulada imediatamente igual ou superior a n
2
.
De seguida, determinar a mediana, usando a fórmula:
n
− Fia
Med = Li + 2
· a, (4.6)
fi
onde:
n
2
-identicador da classe mediana (na Fi )
Li -Limite inferior da classe mediana
Fia -Frequência absoluta anterior á classe mediana
fi -frequência absoluta da classe mediana
a -amplitude da classe mediana
Determine a Mediana.
i Classes (Km) xp fi Fi
1 10 ` 20 15 10 10
2 20 ` 30 25 20 30
3 30 ` 40 35 35 65
4 40 ` 50 45 40 105
5 50 ` 60 55 25 130
6 60 ` 70 65 15 145
7 70 ` 80 75 5 150
Total 150
n 150
Antes determinemos o identicador da classe mediana. Temos que n = 150 , então = = 75.
2 2
Na coluna de frequência absoluta acumulada é possível notar que a posição pertence a 4a classe
(classe mediana).
Outros dados referentes a classe mediana são: Li = 40; Fia = 65; fi = 40 e a = 10 . Então:
n
2
− Fia 75 − 65 10 100
Med = Li + · a = 40 + · 10 = 40 + · 10 = 40 + = 40 + 2.5 = 42.5.
fi 40 40 40

Interpretação: 50% dos estudantes do IF percorrem diariamente abaixo ou igual a 42.5km, ou
também podemos dizer que"
50% dos estudantes do IF percorrem diariamente acima ou igual a 42.5km.

Capı́tulo 5
Medidas de localização e de assimetria
Além das medidas de posição que estudamos, há outras que, consideradas individualmente, não
são medidas de tendência central, mas estão ligadas à mediana relativamente à sua característica
de separar o conjunto em duas partes que apresentam o mesmo número de valores.
5.1 Medidas de localização ou separatrizes

Denição 5.1.1. Separatrizes: são números que dividem um conjunto ordenado de dados
em partes que contêm a mesma quantidade de elementos do conjunto.
Desta forma, a mediana que divide o conjunto ordenado em dois grupos, cada um deles
contendo 50% dos valores do conjunto, é também uma medida separatriz. Além da mediana,
as outras medidas separatrizes são: Quartis (Qi ) , Decis (Di ) e Percentis (Pi ) .
Como foi referido anteriormente, para além das medidas de tendência central, os quartis,
decis e percentis são outras medidas conhecidas por separatrizes utilizados como medidas de
posição.
5.1.1 Quartis (Qi)

Denição 5.1.2. Quartis: são medidas númericas que dividem o conjunto de dados ou dis-
tribuições de frequências em 4(quatro) partes iguais.
Assim, o primeiro quartil, que é indicado por Q1 , separa o conjunto ordenado deixando
25% de seus valores abaixo (ou à esquerda) e 75% dos seus valores acima (ou a direita.)
O segundo quartil, que é indicado por Q2 , separa o conjunto ordenado deixando 50% dos seus
39
valores abaixo e 50% dos seus valores acima.
O terceiro quartil Q3 obedece a mesma regra dos anteriores, ísto é, um valor tal que 75% das
observações são menores e 25% são maiores que este.
5.1.2 Decis (Di)

Denição 5.1.3. Decis: são separactrizes que dividem as observações em 10 (dez) partes
iguais.
Assim, o primeiro decil, indicado por D1 , separa o conjunto ordenado deixando 10% dos
seus valores abaixo e 90% dos seus valores acima. De modo análogo são denidos e interpretados
os outros decis.
Nos decis, a distribuição é dividida em 10 partes iguais (D1 ; D2 ; D3 ; · · · ; D9 ) .
5.1.3 Percentis (Pi)

Denição 5.1.4. Percentis: são separactrizes que dividem as observações em 100 (cem)
partes iguais.
Assim, o primeiro percentil, indicado por P1 , separa o conjunto ordenado deixando 1% dos
seus valores abaixo e 99% dos seus valores acima.
Nos percentis, a distribuição é dividida em 100 partes iguais (P1 ; P2 ; P3 ; · · · ; P99 ) .
P1 : é o primeiro percentil, corresponde à separação do primeiro 1% de elementos do conjunto.
P50 : é o quinquagésimo percentil, coincide com a mediana (P50 = D5 = Q2 ) .
5.1.4 Procedimentos para determinar separatrizes

A determinação de separatrizes requerer o conhecimento de como determinar a mediana, ou
seja, é análogo.
Primeiro: Determinar a o posição p da separatriz:
Tanto para variáveis discretas ou contínuas, ou seja, para dados agrupados ou em classes, o
procedimento para determinar a posição da separatriz é feito usando a fórmula:
n


 · i, Qi onde i = 1; 2; 3
 4


n·i
p= , Di onde i = 1; 2; · · · ; 9
 10
 n · i,

Pi onde i = 1; 2; · · · ; 99


100

Segundo: Determinar a separatriz no conjunto de dados ordenados ou agrupados
Para Dados agrupados simples
O Quartil Qi , o Decil Di e o Percentil Pi de ordem i numa distribuição ordenada de dados, é

determinado por:

 X[p] , se p for decimal;
Qi ; Di ; Pi =
 Xp + Xp+1 , se p não for decimal.
2
, onde [p] representa aproximação em excesso.
Para Dados agrupados em Classe
O Quartil Qi , o Decil Di e o Percentil Pi de ordem i numa distribuição ordenada de dados, é

determinado por:
p − Fia
Qi ; Di ; Pi = Li + ·a
fi
, onde:
• p é a posição do quantil;
• Li é o limite inferior da classe quantílica;
• Fia é a frequência absoluta acumulada anterior à classequantílica;
• fi é a frequência absoluta à classe quantílica;
• a é a amplitude da classe quantílica.
Determine Quartil 3 e interprete.

i Classes (Km) xp fi Fi
1 10 ` 20 15 10 10
2 20 ` 30 25 20 30
3 30 ` 40 35 35 65
4 40 ` 50 45 40 105
5 50 ` 60 55 25 130
6 60 ` 70 65 15 145
7 70 ` 80 75 5 150
Total 150
Antes determinemos a posição p da classe quantílica. Temos que n = 150 , e por ser Q3 i = 3 ,
n 150
então p · i = · 3 = 112, 5.
4 4
Na coluna de frequência absoluta acumulada é possível notar que a posição pertence a 5a classe
(classe quantílica).
Outros dados referentes a classe quantílica são: Li = 50; Fia = 105; fi = 25 e a = 10 . Então:
p − Fia 112, 5 − 105 7.5 75

Q3 = Li + · a = 50 + · 10 = 50 + · 10 = 50 + = 50 + 3 = 53.
fi 25 25 25
Interpretação: 75% dos estudantes do IF percorrem diariamente abaixo ou igual a 53km, ou

também podemos dizer que"
25% dos estudantes do IF percorrem diariamente acima ou igual a 53km.
5.2 Medidas de Assimetria

Agora trataremos que são as medidas de assimetria. Elas referem-se à forma da curva de uma
distribuição de frequência, mais especicamente do polígono de frequência ou do histograma.
Denição 5.2.1. Medidas de assimetria: é o grau de afastamento de uma distribuição da
unidade de simetria.
Destacamos que as distribuições de frequências não diferem apenas quanto ao valor médio
e a variabilidade, como também quanto a sua forma.

5.2.1 Tipos de curvas
Simétrica
Quando a média, mediana e a moda são iguais, isto é, apresentam o mesmo valor, ou seja,
X = Me = Mo .
Assimetria Positiva
Neste caso, a média aritmética apresentará um valor maior do que a mediana, e esta, por sua
vez, apresentará um valor maior do que a moda.
Em outras palavras, Mo < Me < X .
Nas distribuições assimétricas á direita, h'a uma predomin
ncia de valores superiores a moda.
Assimetria Negativa
Neste caso a média aritmética ser'a menor do que a mediana, e esta, por sua vez, é menor do
que a moda.
Nas distribuições assimétricas negativas, predominam valores inferiores á moda.

Capı́tulo 6
Medidas de Dispersão ou de Variabilidade
Nas aulas anteriores, vimos que um conjunto de observações pode ser sintetizado ou resumido,
por meios de procedimentos matemáticos, em poucos representativos: (medidas de tendência
central) a média, moda e mediana. Tais valores podem servir de comparação para dar a posição
de qualquer elemento do conjunto. A análise de um conjunto de observações com base numa
medida de tendência central não nos fornece informaç oes sucientes para o conjunto de valores.
Por vezes não é suciente usar apenas uma das medidas de posição para caracterizar perfei-
tamente um conjunto de valores , pois, mesmo sabendo, por exemplo, que a temperatura média
entre duas cidades (Por exemplo: Chimoio e Lichinga) é a mesma, e igual a 24◦ C , ainda somos
levados a pensar a respeito do clima dessas cidades. Em uma delas a temperatura poderá variar
em limites de muito calor e de muito frio e haver, ainda, uma temperatura média de 24◦ C . A
outra poderá ter uma variação pequena de temperatura, mas mantendo uma média de 24◦ C .
Consideremos os seguintes conjuntos de valores referentes a avaliações de três estudantes

(E1, E2 e E3) :
E1: 15; 15; 15; 15; 15 E2: 13; 14; 15; 16; 17 E3: 7; 12; 17; 19; 20
Calculando a média aritmética de cada um dos estudantes, obtemos:

P
Xi 15 + 15 + 15 + 15 + 15 75
E1: X = = = = 15
n 5 5
P
Xi 13 + 14 + 15 + 16 + 17 75
E2: X = = = = 15
n 5 5
P
Xi 7 + 12 + 17 + 19 + 20 75
E3: X = = = = 15
n 5 5
44
Vemos, então, que os três estudantes apresentam a mesma média aritmética de 15valores. En-
tranto, é fácil notar que o Estudante E1 é o mais homogêneo que os estudantes E2 e E3, já que
todos os valores são iguais a média. O estudante E2, por sua vez, é mais homogêneo que o estu-
dante E3, pois há menor diversicação entre cada um de seus valores e a média é representativa.
Vemos, então que a média ainda que considerada como um número de que tema facili-
dade de representar um conjunto de observações, não pode, por si mesma, destacar o grau de
homogenidade ou heterogeneidade que existem entre os valores que compoem um conjunto.
A análise de um conjunto de observações com base numa medida de tendência central não
nos fornece informações sucientes para o conjunto de dados. Em outras palavras, as medidas
de tendência central são úteis em identicar um valor típico numa distribuição de frequência,
porém, estes não apresentam a disparidade existentes na distribuição.
Portanto, as medidas de dispersão são utilizadas para avaliar o grau de variabilidade ou de
dispersão dos valores da distribuição em torno da média. Estas medidas permitem estabelecer
comparações entre fenômenos de mesma natureza ou de natureza distinta e, em geral, essa
disparidade(variabilidade) é observada em torno de uma medida de tendência central (média).
Chamamos de dispersão ou de variabilidade a maior ou menor diversicação dos valores de

uma váriavel em torno deum valor de tendência central,tomando como ponto de comparação.
Assim podemos dizer que o estudante E1 apresenta dispersão ou variabilidade nula e que o
estudante E2 apresenta variabilidade menor que do estudante E3.
• Entre duas amostras com a mesma média, será mais representativa aquela que apresentar
menor dispersão.
Portanto, para qualicar os valores de uma dada variável , ressaltando a maior ou menor
dispersão ou variabilidade entre esses valores e a sua medida de posição, a Estatística recorre ás
medidasde dispersão ou de variabilidade. Dessas medidas, serão descritas: Amplitude total,
Variância, Desvio padrão e Coeciente de variação de Pearson.
6.1 Amplitude Total ( At )

A amplitude total de um conjunto de observações é a diferença entre o maior e o menor valor
da distribuição. Para calcular basta subtrair o maior valor ( Xmax ) pelo menor valor ( Xmin ).

At = Xmax − Xmin .
Quanto maor for a a amplitude total de um conjuto de dados, maior é a dispersão ou variabi-
lidade dos valores.
Exemplo 6.1.1. Consideremos as notas do Estudante E3 dadas por: 7; 12; 17; 19; 20.
At = 20 − 7 = 13 .
Se os dados (já) estiverem dispostos em uma tabela de frequências,com os valores agrupados

em classes, aamplitude total pode ser dada por:
At = ponto médio da última classe-ponto médio da primeira classe.
6.1.1 Restrições ao uso da Amplitude Total

A aplitude total éa mais simples medida de dispersão, há uma forte restrição ao seu uso em
virtude de sua grande instabilidade, uma vez que ela leva em conta apenas os valores extremos
do conjunto de observações. Vejamos o seguinte caso:
Conjunto de observações Média Ampitude Total At

A: 10; 12; 13; 15; 20; 25; 45 x = 20 At = 35
B: 17; 18; 19; 20; 21; 22; 23 x = 20 At = 6
A média aritmética de cada um desses conjuntos é igual a 20. Portanto , no que diz respeito a
uma medida de posição, ambos os conjuntos podem ser considerados idênticos. Ao calcularmos
a amolitude total, vericamos que as observações do conjunto A apresentam maior dispersão.
Todavia, no cálculo da amplitude não são considerados os valores do conjunto que se encon-
tram entre os extremos,o que poderia conduxir o analista a interpretações equivocadas. Muitas
vezes,um valor particularmente anormal poderá afectar de maneira acentuada a medida. Ocon-
junto A, por exemplo, apresenta o último valor (45) sensivelmente distante do penúltimo (25),
facto que talvez tenha provocado uma amplitude total de (35) magnitude.
6.2 Variância ( S 2 )
Como vimos que a amplitude é uma medida que se deixa inuenciar pelos valores extremos,
que em grande maioria são devidos ao acaso.

A variância é uma medida que leva em consideração valores extremos e os valores interme-
diários, isto é expressa melhor os resultados obtidos. A variância relaciona os desvios em torno
da média.
Quanto menor é a variância, mais próximos os valores estão da média, mas quanto maior
for a variância, mais os valores estão distantes da média.
A variância amostral é denida como:

(xi − x)2
P
2
• S = , para dados brutos;
n−1
[(xi − x)2 · fi ]
P
2
• S = , para dados agrupados;
n−1
[(xp − x)2 · fi ]
P
2
• S = , para dados em classes;
n−1
onde: x é a média amostral, xi é cada elemento do conjunto de observações, xp é o ponto
médio e n é o número total das observações.
(xi − µ)2
P
Quando se trabalha com toda população, a variância populacional é dada por: σ =2
,
N
onde µ é a média populacional e N é o tamanho da população.
Observação: É mais comum na estatística trabalhar com a amostra e não com a população.
Neste caso o denominador do cálculo da variância amostral passa a ser (n − 1) em vez de n .
6.3 Desvio Padrão (S)

A amplitude total é uma medida instável, pois se deixa inuenciar pelos valores, que são, na
sua maioria, devido aom acaso. O desvio-padrão e a variância são medidas que fogem essa
falha, pois levam em consideração a totalidade dos valores da varíavel em estudo, o que faz com
que estes serem considerados índices de variabilidade bastante estáveis e, por isso, são os mais
geralmente usados ou empregados.
O desvio-padrão é uma das medidas de variação mais utilizadas de um conjunto de obser-

vações. A vantagem que apresenta sobre a variância é de permitir uma interpretação directa
da variação do conjunto de dados, pois o desvio padrão é expresso na mesma unidade que a
variável em estudo (kg, cm, ◦ C, atm, · · · ).

Assim, podemos denir o desvio-padrão como uma medida da magnitude do espalhamento
ou dispersão dos dados em relação á medida do conjunto.
A expressão para o cálculo do desvio-padrão amostral (S) é:
rP
(xi − x)2
• S= , para dados brutos;
n−1
rP
[(xi − x)2 · fi ]
• S= , para dados agrupados;
n−1
rP
[(xp − x)2 · fi ]
• S= , para dados em classes;
n−1
Observação: Podemos denir o desvio-padrão como sendo a raiz quadrada da variância

√
S = S2 .
6.4 Coeciente de Variação de Pearson (Cv)

O desvio-padrão por si só não revela muita coisa. Assim, um desvio padrão pode ser considerado
pequeno para uma média e para outra é extremamente grande. Por exemplo, um desvio-padrão
de 40 pode ser considerado pequeno para uma média de 350, entretanto, se a média for 4, este
se torna muito grande.
Quando precisamos comparar duas ou mais conjuntos de valores quanto à sua dispersão e
variabilidade e esses conjuntoos estão expressos em natureza diferentes ou em grandezas difren-
tes é preciso dispor de outra medida. Para contornar essas diculdades e limitações, podemos
caracterizar a dispersão ou variabilidade dos dados de maneira relativa ao seu valor médio.
Essa medida que mede o grau de concentração dos valores em torno da média é denominada
de Coeciente de variação.
Coeciente de variação é uma medida relativa para estimar a precisão de experimentos e

representa o desvio-padrão expresso como percentagem da média. Sua principal qualidade é a
capacidade de comparação de distribuições diferentes, portanto, o coeciente de variação pode
ser útil para se comparar a variabilidade de diferentes conjuntos de dados em duas situações:
1. Médias muito diferentes, mas provenientes de uma mesma variável
2. Comparar a homogeneidade de variáveis diferentes

O coeciente de variação (Cv) é denido por:
S
Cv = desvio padrao
media
× 100 ou Cv = × 100
x
O uso do coeciente de variação é usualmente recomendável para variáveis quantitativas

do tipo razão, tais como (altura, peso, etc) e se a variável for quantitativa do tipo intervalar
(temperatura), o Cv pode assumir valores negativos devido a média que pode ser negativa (isso
diculta a interpretação).
O coeciente de variação pode ser interpretado das seguintes maneiras:
• Cv ≤ 20% trata-se de distribuição homogênea
• Cv > 20% trata-se de distribuição heterogênea.
Por outro lado, podemos considerar os seguintes casos também:
• Cv ≤ 15% trata-se distribuição com uma dispersão fraca;
• 15% < Cv ≤ 30% trata-se distribuição com uma dispersão média ou moderada;
• Cv > 30% trata-se de uma dispersão alta
Em todo caso, mquanto maior for o valor do coeciente de variação, maior é a dispersão dos
valores do conjunto e quanto menor é o coeciente de variação, mais homogêneo é a distribuição.
Exemplo 6.4.1. Considere os dados da tabela abaixo e determine: amplitude total, variância,
desvio-padrão e coeciente de variação.
xi fi xi · f i (xi − x)2 (xi − x)2 · fi

17 3 51 3,386 10,157
18 18 324 0,706 12,701
19 17 323 0,026 0,435
20 8 160 1,346 10,765
21 4 84 4,666 18,662
Total ( 50 942 52,72
P
)
Amplitude total
P At = Xmax − Xmin = 21 − 17 = 4
(xi · fi ) 942
Média: x = = = 18, 84
n 50

[(xi − x)2 · fi ]
P
52, 72 52, 72
Variância: S =
2
= = = 1, 0759
rnP−1 50 − 1 r 49 r
[(xi − x)2 · fi ] 52, 72 52, 72 p
Desvio-padrão: S = = = = 1, 0759 = 1, 04
n−1 50 − 1 49
S 1, 04
Coeciente de variação de Pearson: Cv = × 100 = × 100 = 5, 52% , logo a distribuição
x 18, 84
tem dispersão fraca porque é menor que 15%
Exemplo 6.4.2. Considera os dados na tabela, calcule o desvio-padrão da distribuição de
frequências do consumo de energia (Kwh)
Consumo (Kwh) Número de úsuarios (fi ) xp xp · f i (xp − x)2 · fi

5 ` 25 4 15 60 16641,0
25 ` 45 6 35 210 11881,5
45 ` 65 14 55 770 8403,5
65 ` 85 26 75 1950 526,5
85 ` 105 14 95 1330 3363,5
105 ` 125 8 115 920 10082,0
125 ` 145 6 135 810 18481,5
145 ` 165 2 155 310 11400,5
Total ( ) 80 6360 80780
P
P
(xp · fi ) 6360
A média aritmética calculada anteriormente foi: x = = = 79, 5
rP r rn 80
[(xp − x)2 · fi ] 80780 80780 p
Desvio-padrão: S = = = = 1022, 53 = 31, 98
n−1 80 − 1 79
Então S = 31, 98 . O desvio padrão do consumo de energia elétrica é 31, 98Kwh .

Só para relaxar
1. As principais fases do método estatístico são:
(a) colecta de dados, amostragem, apresentação tabular, representação gráca e deni-

ção do problema
(b) amostragem, apresentação tabular, apuração dos resultados, interpretação de dados

e planeamento
(c) denição do problema, planeamento, colecta de dados, apuração, apresentação dos

resultados, análise e interpretação de dados
(d) colecta de dados, apuração de dados, análise e interpretação de dados, apresentação

de dados
2. População ou Universo é:
(a) Conjunto de pessoas
(b) Conjunto de indivíduos que apresentam características especiais.
(c) Conjunto de elementos que apresentam uma característica comum.
(d) Subconjunto conável para um estudo qualquer.
3. Qual é a diferença entre um Bioestatística e uma Estatística?
4. Quais são as duas ramicações principais da estatística?
5. Como uma amostra é relacionada a uma população?
6. Qual é a diferença entre um parâmetro e uma estatística?
7. Das armaçoes abaixo, indique as verdadeiras (V) ou as falsas (F):
51
(a) Uma estatística é um valor numérico que descreve uma característica da população;
(b) Uma amostra é um subconjunto de uma população;
(c) É impossível para o INE obter todos os dados censitários sobre a população moçam-
bicana;
(d) A estatística inferencial envolve o uso de uma população para chegar a conclusões
sobre a amostra correspondente;
8. Para as situações descritas a seguir, identique a população e a amostra correspondente:
(a) Para vericar a audiência de um programa de TV em Maputo, indivíduos foram

entrevistados com relação ao canal em que estavam sintonizados;
(b) Para coletar informação sobre os salários iniciais de empresas listadas entre as 500
ações mais importantes do mercado nanceiro levantadas pela KPMG, um pesqui-
sador abordou 65 das 500 empresas.
(c) A m de avaliar a intenção de voto para presidente do Moçambique, pessoas foram

entrevistadas em cidades moçambicanas;
(d) Uma pesquisa com 500 espectadores em um estádio com 42.000 espectadores;
(e) Para saber as intenções de voto dos portugueses nas eleições passadas, uma empresa
entrevistou 2.000 cidadãos representativos da população portuguesa com mais de 18
anos;
(f) Uma pesquisa com 496 estudantes da Faculdade de Economia descobriu que 10%
planejavam viajar para fora do país durante o recesso escolar.
(g) Avaliou-se os níveis de colesterol de 20 pacientes em um hospital com 100 pacientes;
(h) Um estudo sobre o tempo gasto, em segundos, por 100 atletas na corrida dos 400
metros obstáculos, registou-se o tempo gasto por 16 desses atletas;
(i) Uma pesquisa com 2018 alunos do ensino médio descobriu que eles dedicam uma
média de 7 horas e 38 minutos por dia usando mídias de entretenimento.
(j) Desejando-se saber a hora a que se deitam e que se levantam os alunos do IF,
realizou-se um estudo em que participaram 250 alunos, de entre os 1.000 alunos do
IF;
(k) Uma pesquisa com 961 consumidores que adquiriram eletrodomésticos descobriu que
23% contrataram a garantia estendida.

9. Determine se o valor numérico é um parâmetro ou uma estatística. Explique seu raciocínio
(a) O salário médio anual para 35 dos 1.200 Gestores das empresas é de 31.000, 0mt ;
(b) Uma pesquisa com 514 membros do conselho dos institutos descobriu que 38% acham
que o ensino médio tem custo justo relativamente ao seu valor;
(c) Sessenta e dois dos 97 passageiros a bordo da aeronave Boeing sobreviveram á sua
explosão.
(d) Em uma pesquisa com 300 usuários de computador, 8% disseram que seus compu-
tadores tinham mau funcionamento e requeriam reparos técnicos.
(e) Em um ano recente, a nota média de Estatística para todos os graduandos no IF era
14.5.
10. Uma pesquisa educacional procura determinar a ecácia de um novo método de alfabe-
tização de adultos. Terminado o período de ensino, o rendimento é medido através dos
resultados obtidos pelos alunos na leitura de um texto
(a) Descreva a população de interesse
(b) Deve-se usar amostragem neste caso? Por quê?
11. Identique qual destes tipos de amostragem é usado: aleatória simples, sistemática, es-
traticada, por conglomerados ou por conveniência e indicando a população e amostra
(a) Notícias de televisão- Um repórter de noticiário da STV analisa a reação a uma

história impressionante entrevistando pessoas que passam em frente ao seu estúdio
(b) Seleção de Júri- O comissário de jurados de Condado de Dutches obtêm uma lista
de 42.763 proprietários de carros e obtêm um conjunto de jurados seleccionando cada
centésimo nome da lista
(c) Pesquisa de carro- Uma pesquisadora da Ronil-Auto dividiu todos os carros re-
gistados em categorias de subcompacto, compacto, médio, intermédio e grande. Ele
está pesquisando 200 proprietários de carro de cada categoria
(d) Bebida entre estudantes- Movido pelo facto de um estudante ter morrido por
excesso de bebida, o IF fez um estudo do hábito de bebida dos estudantes, selecci-
onando aleatoriamente 5 turmas diferentes e entrevistando todos os estudantes em
cada uma dessas turmas

(e) Pesquisa de Boca da Urna- Uma rede de notícias está planejando uma pesquisa na
qual 100 seções eleitorias serão seleccionadas e todos os eleitores serão entrevistados
ao deixarem o local
(f) Educação e Sálario- Um economista está estudando o efeito da educação sobre o

salário e realiza uma pesquisa com 150 trabalhadores seleccionados aleatoriamente
de cada uma das seguintes categorias: menos do que Ensino Médio, Ensino Médio,
mais do que Ensino Médio
(g) Pesquisa de TV- Um especialista de Marketing para a TVM está planejando uma
pesquisa na qual 500 pessoas serão seleccionadas aleatoriamente de cada faixa etária
de 10-19, 20-29, e assim por diante
(h) Um jornal escreve, em cartões separados, o nome de cada um dos seus 250 deputados
da Assembleia da República, mistura-os e extrai 10 deles para uma entrevista sobre
a situação político-militar no país
(i) Um médico entrevista todos os pacientes de leucemia internados em 20 hospitais

seleccionados por sorteio com igual chance dentre todos os hospitais de um país
(j) A empresa 2M selecciona cada 200◦ garrafa de cerveja acabada de ser enchida numa
linha de produção entre 14 ás 16 horas de um dia para fazer teste de qualidade
(k) Um entrevistador entrevista cada 10◦ eleitor que deixa uma mesa de voto de uma
cidade entre as 8 e 17 horas de um dia de eleições
(l) Ao escalar um júri um tribunal de justiça decidiu seleccionar aleatoriamente 4 pessoas

brancas, 3 morenas e 4 negras
(m) Um delegado eleitoral escreve o nome de cada deputado de Moçambique, em cartões

separados, mistura e extrai 17 nomes
(n) Um administrador hospitalar faz uma pesquisa com as pessoas que estão na la de
espera para serem atendidas pelo Sistema Nacional de Saúde, entrevistando uma a
cada 15 pessoas na la
12. Suponha que no IF existem 250 estudantes, sendo 100 no 1◦ período, 70 no 2◦ e 80 no 3◦

período. Pretende-se extrair uma amostra de 40 estudantes. Qual método de amostragem
seria ideal para extração do 40 elementos?
13. Uma Faculdade abriga 124 estudantes. Sugira uma técnica de amostragem e obtenha
uma amostra representativa correspondendo a 15% da população

14. O director geral do IF, na qual estão matriculados 280 meninos e 320 meninas, desejoso de
conhecer as condições de vida extra-escolar dos seus estudantes e não dispondo de tempo
para entrevistar todas as famílias, resolveu fazer um levantamento, por amostragem, em
10% desses estudantes. Como estudante de estatística, obtenha para o director, o número
de elementos que compõem a amostra
15. Uma população encontra-se dividada em três estratos, com tamanhos, respectivamente:
N1 = 40, N2 = 100, e N3 = 60 . Sabendo que, ao ser realizada uma amostragem
estraticada proporcional, nove elementos da amostra foram do 3◦ estrato, determine o
n◦ total de elementos da amostra
16. Uma cidade possui N=200 zonas eleitorais. Uma empresa destinada a fazer pesquisa
eleitoral vai seleccionar aleatoriamente n = 15 zonas e entrevistar todos os elementos que
estão dentro dessas zonas eleitorais. Qual é a técnica de amostragem que vai ser usada?
17. Numa turma com N = 36 elementos, deseja-se retirar uma amostra de 5 elementos para
vericar uma característica de interesse, utilizando a técnica de amostragem sistemática
para retirar essa amostra quais os números dos alunos sorteados
18. Suponha duas amostras colhidas de uma mesma população, sendo que uma de tamanho
100 e outra de tamanho 200. Então, não há dúvida de que a amostra de tamanho maior
é mais representativa da população, certo? Porquê?
19. Se uma população se encontra dividida em quatro estratos, com tamanhos N1 = 90 ,

N2 = 120 , N3 = 60 e N4 = 480 e temos possibilidade de retirar no total 100 amostras,
quantas amostras devem ser retiradas de cada estrato?
20. Suponha que existem 1000 chas de pacientes das quais uma amostra aleatória de 20 deve
ser seleccionada. Determine que chas devem ser escolhidas na amostra de tamanho 20.
Diga que tipo de amostragem foi feito e como foram seleccionadas as chas
21. Para cada um dos estudos seguintes, justique a utilização de uma amostra
(a) Testar a eciência de um novo medicamento para a malária
(b) Estabelecer o conteúdo mineral da água potável fornecida pela empresa XYZ na
cidade de Maputo
(c) Estimar a taxa de desemprego em Moçambique

(d) Vericar a qualidade da água da Praia da Costa de Sol
(e) Parece que o único modo de eliminar os erros amostrais consiste em estudar toda
população em vez de uma amostra. No entanto, muitas indústrias e os governos
continuam a utilizar amostras. Porquê?
22. Para pesquisar o Desporto preferido dos estudantes de uma escola com 1.500 estudantes,
foram seleccionados, de modo imparcial, 900 estudantes. Com base nessas informações,
responda
(a) Quantas pessoas tem a população dessa pesquisa?
(b) A amostra dessa pesquisa é formada de quantas pessoas?
23. Classique as variáveis abaixo, em níveis de mensuração
(a) Número de computadores em um laboratório de informática;
(b) Grau de escolaridade;
(c) Peso de grãos exportados;
(d) Grau de satisfação com um produto alimentício;
(e) A cor da pele de pessoas (ex: branca, negra, amarela);
(f) O número de consultas médicas feitas por ano por um associado de certo plano de
saúde;
(g) O teor de gordura, medido em gramas por 24 horas, nas fezes de crianças de 1 a 3
anos de idade;
(h) Temperatura corporal;
(i) Salário de um prossional de saúde;
(j) O tipo de droga que os participantes de certo estudo tomaram;
(k) Sexo;
(l) Tempo que passa a ver televisão;
(m) Distância de casa ao hospital;
(n) Local de nascimento;
(o) Altura de um homem em cm ;

24. Das variáveis seguintes diga quais são discretas e quais são contínuas:
(a) Número de nascimentos por dia;
(b) A pressão intra-ocular, medida em mmHg, em pessoas;
(c) Duração de um noticiário;
(d) Temperatura da água do mar;
(e) Número de pontos obtidos num jogo de basquetbol;
25. Determine quais das seguintes variáveis são quantitativas ou qualitativas. Para as variá-
veis quantitativas diga se são contínuas ou discretas
(a) Número de telefone
(b) Tipo de telefone
(c) Número de chamadas por mês
(d) Duração da chamada mais longa de cada semana
(e) Cor do telefone da Neida Pinto
(f) Conta telefônica mensal
26. Classique as variáveis abaixo como Qualitativa (nominal ou ordinal) Quantitativa (dis-
creta ou contínua (razão/racio ou intervalar))
(a) Marca de carros (i) Largura da cabeça
(b) Cor dos olhos (j) Altura dos homens casados

(c) Idade de alunos do curso de Gestão
(k) Peso da Lola Sadia
(d) Números de lhos dos residentes de T3
(l) Número de carros de cada PCA
(e) Códigos de endereço postal
(m) Número de mulheres no HCM
(f) Número de NUIT
(g) Estado civil dos estudantes do IF (n) Marca de cerveja de Moçambique
(h) Comprimento da cabeça (o) Atitude do Professor N. Mulemba
27. Os itens a seguir aparecem em uma cha de emprego. Determine o nível de mensuração
dos dados.

(a) Graduação máxima atingida (c) Ano de graduação universitária
(b) Gênero (d) Número de anos no último emprego
28. Pretende-se realizar de um estudo sobre os hábitos de fumar dos jovens Moçambicanos
do ensino médio.
(a) Identique a população e a amostra.
(b) Na elaboração do questionário como é que formularia a questão sobre o consumo de

tabaco, de forma a obter uma variável medida numa escala:
i. Nominal ii. Ordinal iii. Quantitativa
29. Numa creche Don' Orio questionaram as crianças com mais de 3 anos relativamente ao
tipo preferido de bebidas. Das 160 crianças inquiridas, 30 indicaram o leite como a bebida
preferida, 10 referiram água, 40 disseram os sumos naturais e 80 referiram os refrigerantes.
(a) Dena e classique a variável em estudo.
(b) Construa a tabela de frequências.
(c) Qual é a frequência absoluta de crianças que preferem água?
(d) Qual é a frequência relativa de crianças que preferem refrigerantes?
(e) Represente gracamente a informação anterior.
30. Numa aula teórica de Bioestatística perguntou-se aos 50 alunos presentes quantos livros
ligados a saúde leram durante as férias, tendo-se obtido os seguintes resultados: 1 aluno
leu 4 livros, 8 leram 3 livros, 27 leram 2 livros, 12 leram apenas 1 livros e os restantes
alunos não leram qualquer livro.
(a) Identique a variável em estudo
(b) Construa a tabela de frequências
(c) Represente gracamente a informação anterior.
31. Os dados abaixo foram registados em vinte pacientes que foram submetidos a determinado
tratamento tendo-se vericado que melhoraram depois de terem alguns dias.
5, 2, 1, 3, 2, 3, 4, 5, 3, 1, 3, 2, 6, 4, 5, 6, 1, 3, 3, 12.
(a) Dena e classique a variável em estudo

(b) Disponha os dados numa tabela frequências
(c) Faça a representação gráca das frequências absolutas
(d) Interprete o valor obtido para uma frequência relativa
32. Apresente as tabelas e grácos de frequências para os seguintes casos:
(a) Teste de Paladar: Conjunto de dados: pontuações de 1 (mais baixa) a 10 (mais

alta) dadas por 24 pessoas após testar o sabor de um novo refrigerante:
5 7 4 5 7 8 10 6
9 5 7 6 8 2 9 7
8 1 3 10 8 8 7 9
(b) Anos de serviço: Conjunto de dados: Anos de serviço de 26 soldados Quartel
General:
12 7 9 8 9 8 12 10 9
10 6 8 13 12 10 11 7 14
12 9 8 10 9 11 13 8
(c) Gasto com livros: Quantias (em dólares) gastas em livros por um semestre:
91 471 279 249 530 376 188 341 266 199
142 273 189 130 489 266 248 101 375 486
190 398 188 269 43 30 127 354 84
33. O QUE FARIAS? Você trabalha em um banco e deve recomendar a quantia de dinheiro
que será colocada em uma ATM a cada dia. Você não quer colocar dinheiro em excesso
(por segurança) ou pouco dinheiro (por problemas com clientes). As quantias retiradas
diariamente (em milhares de meticais) em um período de 30 dias são mostradas a seguir:
72 84 61 76 104 76 87 92 80 88
98 76 97 82 84 67 70 81 82 89
74 73 86 81 85 78 82 80 91 83
(a) Construa um histograma de frequência relativa para os dados. Use 8 classes.
(b) Se você colocar 90.000mt na ATM a cada dia, qual é a percentagem de dias em um
mês que você espera car sem dinheiro? Explique.
(c) Se você está disposto a car sem dinheiro em 10% dos dias, quanto dinheiro você
deveria colocar na ATM a cada dia? Explique.
34. Considerando o conjunto dos dados

(a) 3, 5, 2, 6, 5, 9, 5, 2, 8, 6
(b) 20, 9, 7, 2, 12, 7, 20, 15, 7
(c) 51, 6, 48, 7, 50, 3, 49, 5, 48, 9
(d) 15, 18, 20, 13, 10, 16, 14
Calcule a média, mediana e moda em cada alínea
35. Os seguintes dados de 45 alunos, foram obtidos no 1◦ Teste duma turma do Saúde Pública
6 3 5 7 5 7 7 5 6 7
6 6 7 4 5 7 5 4 6 6
6 3 5 7 5 7 7 5 6 7
4 4 4 4 3 4 3 7 3 3
6 3 6 5 6
(a) Elabore uma tabela de distribuição de frequências
(b) Calcule as frequências absolutas, relativas
(c) Calcule a média, moda e mediana
(d) Calcular o 7◦ decil e o 80◦ percentil
(e) Qual é a nota máxima dos 25% com a nota mínima?
(f) Qual a nota mínima dos 25% com a nota máxima?
(g) Determine as notas mínima e máxima dos 50% com notas centrais
36. Considerando a distribuição abaixo: Calcule a média, mediana, a moda e o desvio padrão
Xi 3 4 5 6 7 8
fi 4 8 11 10 8 3
37. As notas de um candidato em seis provas de um concurso foram 8.4, 9.1, 7.2, 6.8, 8.7 e
7.2
Determine a nota média, a nota mediana, a nota modal, a variância e o desvio padrão
38. Em uma turma de 50 alunos, as notas obtidas formaram a seguinte distribuição:
(a) Calcule a nota média, nota modal, nota mediana

Notas 2 3 4 5 6 7 8 9 10
No de alunos 1 3 6 10 13 8 5 3 1
(b) Determinar o 1◦ , 2◦ , 3◦ quartil, 5◦ decil e o 50◦ percentil
39. Uma amostra de 68 enfermeiros mostrou os seguintes anos de serviço:

6 17 33 13 30 32 25 19 18 17
39 25 11 23 5 19 10 7 8 5
18 22 18 11 17 8 17 16 15 12
7 16 9 15 6 14 4 10 6 30
14 7 13 32 12 29 12 13 11 26
2 10 25 11 22 37 24 24 21
8 19 9 14 4 27 11 9 10
(a) Construir a tabela de frequências
(b) Calcular as frequências simples e acumuladas
(c) Apresente o histograma da distribuição de frequências
(d) Determine as medidas de tendência central
(e) Determine a percentagem dos enfermeiros com mais 17 anos de experiência
(f) Determine o ano mínimo dos 33% com mais anos de experiência
40. Considere os dados abaixo, faça um agrupamento em classes e construa uma tabela de
frequências.
4, 1 9, 8 5, 8 6, 1 6, 7 7, 0 7, 0 7, 5 7, 5 7, 5
7, 7 8, 2 8, 8 9, 0 9, 0 9, 1 9, 1 9, 1 9, 2 9, 2
9, 2 9, 2 9, 4 9, 4 9, 7 9, 8 10, 0 10, 0 10, 2 10, 2
10, 3 10, 6 10, 6 10, 8 10, 9 10, 9 11, 6 11, 7 11, 8 11, 8
11, 8 12, 0 12, 2 12, 2 12, 3 12, 5 12, 6 12, 7 8, 3 9, 4
11, 0 14, 0 8, 5 9, 5 11, 1 14, 2 8, 7 9, 5 11, 1 14, 8
(a) Calcule a média, moda e mediana
(b) Calcular o 3◦ quartil e o 60◦ percentil
(c) Determine o coeciente de variação
(d) Classique a distribuição quanto a assimetria

41. Retire a informção do gráco em tabela
42. Numa turma de um determinado ano estão matriculados 40 alunos. O levantamento das
chas biométricas revelou as seguintes estatuturas em centímetros
161 152 157 172 152 161 158 168 155 154
167 151 148 161 157 170 165 153 155 159
170 151 156 175 157 163 168 155 160 162
153 155 165 160 158 159 163 165 157 165
(a) Calcule o número de alunos com altura igual ou superior a 160 cm
(b) Determine a percentagem de alunos com pelo menos 160 cm de altura
(c) Determine a altura média, altura modal e altura mediana
(d) Encontre a percentagem de alunos com altura menor que 164 cm
(e) Represente o histograma referente a esta distribuição
43. A tabela abaixo, mostra a distribuição de frequências dos salários mensais, em meticais,
de 65 funcionários de uma do Ministério da Saúde. Determine:
(a) O limite inferior de sexta classe;
(b) O limite superior da quarta classe;
(c) O ponto médio da terceira classe;
(d) Os limites reais da quinta classe;
(e) A amplitude do quinto intervalo da classe;

(f) A frequência da terceira classe;
(g) A frequência relativa da terceira classe;
(h) O intervalo da classe com maior frequência
(i) A percentagem dos funcionários que ganham menos de 8.000, 00 meticais mensais
(j) A percentagem dos funcionários que ganham menos que 10.000, 00 e pelo menos
6.000, 00 mensais
Salários Funcionários
5.000`6.000 8
6.000`7.000 10
7.000`8.000 16
8.000`9.000 14
9.000`10.000 10
10.000`11.000 5
11.000`a12.000 2
Total 65
44. Obtenha a distribuição de frequências dos dados abaixo, que representam a quantidade
de autocarros estacionados no parque da HCM, durante o mês passado. Determinando a
mediana, moda e o desvio padrão.
14 12 11 13 14 13 12 14
12 14 10 13 15 11 15 13
13 14 11 12 16 17 14 14
45. Abaixo está apresentada a distribuição de frequências dos pesos de uma amostra de 79
alunos

Peso kg Frequência
40|-45 4
45|-50 10
50|-55 15
55|-60 21
60|-65 16
65|-70 8
70|-75 5
(a) Calcule as frequências em falta
(b) Determine o peso médio, variância e desvio padrão
(c) Determine peso modal e mediano
(d) Determine o peso mínimo dos 50% com pesos máximo
(e) Apresente um gráco da distribuição a sua escolha
46. O quadro seguinte representa as alturas (em cm) de 40 alunos de uma classe:
162 163 166 176 175 169 172 170 162 168
164 165 169 163 157 155 154 171 166 164
170 157 148 152 165 157 163 158 172 178
160 158 159 166 170 164 165 150 158 165
(a) Calcular a amplitude total
(b) Adimitindo-se 6 classes, qual a amplitude do intervalo de classe?
(c) Construir uma tabela de frequência das alturas dos alunos
(d) Determinar os pontos médios das classes
(e) Achar a altura média, altura modal e altura mediana.
47. Dado o rol de medidas das alturas (dadas em cm) de uma amostra de 100 estudantes de
uma Faculdade:

151 152 154 155 158 159 159 160 161 161
161 162 163 163 163 164 165 165 165 166
166 166 166 167 167 167 167 167 168 168
168 168 168 168 168 168 168 168 169 169
169 169 169 169 169 170 170 170 170 170
170 170 171 171 171 171 172 172 172 173
173 173 174 174 174 175 175 175 175 176
176 176 176 177 177 177 177 178 178 178
179 179 180 180 180 180 181 181 181 182
182 182 183 184 185 186 187 188 190 190
Calcule
(a) Amplitude amostral (e) As frequências absolutas de classes
(b) O número de classes (f) As frequências relativas
(c) Amplitude de classes (g) Os pontos médios das classes
(d) Os limites de classes (h) As frequências acumuladas
48. A tabela abaixo representa os salários pagos a 100 operários da empresa DoceModel
Lda:
Números de saláros mínimos 0-2 2-4 4-6 6-8 8-10

Números de operários 40 30 10 15 5
Determine
(a) Frequências acumuladas, relativas simpes e acumuladas
(b) Quantos operários ganham abaixo de dois salários mínimos
(c) Qual é a percentagem de operários com salário entre 6 e 10 salários mínimos?
(d) Qual é a percentagem de operários com salário inferior 6 salários mínimos?
(e) O salário médio
(f) O intervalo que contêm o valor da mediana
(g) O intervalo que contém a moda

(h) Determinar a moda e a mediana desta distribuição
49. Uma distribuidora de refrigerantes fez um levantamento sobre o consumo semanal (em
litros) por pessoa, em Janeiro de 2016, em uma cidade moçambicana, obtendo a tabela
abaixo:
Consumo 0.5-1.0 1.0-1.5 1.5-2.0 2.0-2.5 2.5-3.0

N◦ de pessoas 10 25 9 7 6
(a) Determine e interprete o consumo médio
(b) Qual é o percentual de pesoas que consomem menos de 1 litro por semana
(c) Determine os intervalos que contém o consumo modal e o consumo mediano
(d) Determine a moda e a mediana desta distribuição
50. Complete a tabela a seguir
Classes fi xp Fi fr
0, 02
12
62| − 65 0, 06
66, 5 84
126
36
225
0, 15
300
Total - -
51. A nota média dos alunos de uma turma foi 7 e das alunas foi 9. O número de alunos era
20 e das alunas 30. Qual é a nota média de toda turma?
52. Considere uma distribuição de 25 observações com x̄ = 23 , M oda = 28 e M ediana = 32 ,

respectivamente. Descobre-se que houve um erro no lançamento de dados: no lugar de
43 devia ser 34.

(a) Qual é o valor correcto de x̄ ?
(b) Será que o erro afecta a mediana e a moda?
53. Uma empresa possui dois serventes recebendo 600, 0mt cada um, quatro escriturários
recebendo 2.000, 0mt cada um, um chefe de escritório com salário de 3.500, 0mt e três
técnicos recebendo 6.000, 0mt cada um.
Determine o salário médio, mediano e modal da empresa.
54. Num quartel, constantou-se que o peso médio de 40 soldados era de 69 kg . Posteri-
ormente, vericou-se que a balança estava desregulada, ocasionando um peso indicado
superior em 1kg ao peso verdadeiro. Qual era a média verdadeira dos pesos dos soldados?
55. De entre as alternativas, assinale aquelas que contiverem uma armação verdadeira
(a) Reunindo-se dados brutos em classes pode-se obter o número de indivíduos perte-
centes a cada uma das classes, que é denominado frequência da classe
(b) Os intervalos de uma classe precisam ser necessariamente iguais, na elaboração de

ma tabela que apresente uma distribuição de freuência
(c) O limite supeior real da classe 150 − 155 é 155
(d) O limite inferior real da classe 150 ` 155 é 150
(e) A amplitude do intervalo da classe é calculada pela soma entre os limites reais inferior
e superior de uma classe
(f) Obtém-se o ponto médio de uma classe pela média aritmética dos limites inferior e
superior reais de uma classe
(g) Um intervalo de classe aberto em seus dois limites inclui ambos os números extremos
(h) Intervalos de classe fechados têm seus limites superior e inferior reais excluídos dos
números que os compoem
(i) 2 − 6 compreende todos os valores entre 2 e 6, inclusive os extremos
(j) 2| − |6 compreende todos os valores entre 2 e 6, exclusive os extremos
(k) 2| − 6 compreende todos os valores entre 2 e 6, exclusive 2 e inclusive 6
(l) 2 − |6 compreende todos os valores entre 2 e 6, inclusive 2 e exclusive 6
(m) 2 − 6 compreende todos os valores entre 2 e 6, exclusive os extremos

56. Para os seguintes casos: Primeiro decida se ambas têm desvios-padrão que são quase os
mesmos ou bastante diferentes. Se forem diferentes, indicar que distribuição tem o maior
desvio-padrão:
(a) As idades dos pacientes, em geral, num hospital ou as idades das crianças doentes
no mesmo hospital
(b) As médias de admissão á UEM reveladas por uma amostra representativa ou as do

universo dos estudantes concorrentes
(c) O rendimento dos deputados na Assembleia da República ou os rendimentos dos

PCAs dos bancos moçambicanos
(d) Os gastos entre duas cidades nas viagens de voo e transporte rodoviário
57. A seguir são mostrados os tempos de espera em la (em minutos) nas Farmácias de
Chimoio.
Farmac: 6.5 6.6 6.7 6.8 7.1 7.3 7.4 7.7 7.7 7.7
Vida: 4.2 5.4 5.8 6.2 6.7 7.7 7.7 8.5 9.3 10.0
(a) Calcule a amplitude total, o desvio padrão e o coeciente de variação de cada la
(b) Suponha que precisas levantar medicamentos em uma dessas farmácias, qua escolhe-
rias?
58. Uma pesquisa sobre o consumo de combustível nas viaturas dos directores dos hospitais
públicos deu os seguintes valores para a quilometragem percorrida por três marcas de
carro diferentes, em cinco testes com um tanque de 40 litros:
Ford Ranger: 400 397 401 389 403

Mark II: 403 401 390 378 395
Freightliner 399 389 403 387 401
Usando a medida mais adequada, qual dos carros é mais homogêneo?
59. Suponha que, numa particular cidade, tanto os comerciantes quanto os serventes tenham
uma renda anual de de 90.000mt . Será que essa informação indica que as duas distribui-
ções de renda são necessáriamente semelhantes?
O êxito na vida não se mede pelo que você conquistou, más sim pelas diculdades que
superou na caminhada .

Capı́tulo 7
Introdução à Análise Combinatória
A análise combintória visa desenvolver métodos que permitem contar número de elementos de
um conjunto, sendo esses elementos, agrupamentos formados sob certas condições.
A primeira vista pode parecer desnecessária a existência destes métodos. Isto de facto é ver-
dade, se o número de elementos que queremos contar for pequeno. Entretanto, se o número de
elementos a serem contados for grande, esse trabalho torna-se quase impossível, sem o uso de
métodos especiais.
Consideremos a questão abaixo:

Sabendo que os números de telefone são feito usando a combinação de dígitos 0 a 9. Qual é o
número máximo de clientes que a vodacom pode ter?
Antes de responder a questão anterior, consideremos oo seguinte exemplo:
Exemplo 7.0.3. Consideremos A é o conjunto de número com dois algarismos(dígitos) dife-
rentes (distintos) formados a partir dos dígitos {4; 5; 8} .
Como resposta temos: {45; 48; 54; 58; 84; 85} , logo #A = 6 , ou seja, podemos formar seis
números diferentes considerando os dígitos dados.
7.1 Princípio Fundamental de Contagem

Consideremos o seguinte exemplo:
Exemplo 7.1.1. Existem três cidades A, B e C. Existem quatro estradas que ligam a cidade
A com a cida B, e cinco que ligam a cidade B com a C. Partindo da cidade A e passando da
cidade B, de quantas vias ou formas podemos chegar até a cidade C?
69
Cada modo de efectuar a viagem de A para C pode ser considerada como um par de estradas
(ai , bj ) onde ai é uma das quatro vias de A para B e bj é uma das 5 vias de B para C. Vejamos
a seguir todas as vias que podem ser usadas.
De A para B temos 4 vias {a1 ; a2 ; a3 ; a4 } e de B para C temos 5 vias {b1 ; b2 ; b3 ; b4 ; b5 } .
a1 b 1 a2 b 1 a3 b 1 a4 b 1
a1 b 2 a2 b 2 a3 b 2 a4 b 2
a1 b 3 a2 b 3 a3 b 3 a4 b 3
a1 b 4 a2 b 4 a3 b 4 a4 b 4
a1 b 5 a2 b 5 a3 b 5 a4 b 5
Temos 20 possibilidades (caminhos) de sair da Cidade A até a Cidade C passando pela cidade
B.
Este número de caminhos podemos determinar facilmente, como de A até B temos 4 vias e de
B para C temos 5 vias, então de A para C teremos 4 × 5 = 20 caminhos.
Denição 7.1.1. Se determinado acontecimento ocorre em n etapas diferentes, e se a primeira

etapa pode ocorrer de k1 maneiras diferentes, a segunda de k2 maneiras diferentes, e assim
sucessivamente, então o número total N de maneiras de ocorrer o acontecimento n é dado
por: N = k1 × k2 × k3 × · · · kn ·
Exemplo 7.1.2. Sabendo que os números de telefone são feito usando a combinação de dígitos
0 a 9 (10 dígitos no total). Qual é o número máximo de clientes que a vodacom pode ter?
Um número de telefone na vodacom leva 9 dígitos mas os primeiros dois iniciais são xos,
ou seja, temos: 84 .
Cada quadrado corresponde a um dígito. São no total sete dígitos. Tomando em cosideração
que os dígitos que entram num número de telefone podem estar repetidos, então comecemos
assim:
No lugar do primeiro quadro pode estar qualquer dígito entre 0 a 9 então temos 10 possibilida-
des.
No lugar do segundo quadro pode estar qualquer dígito entre 0 a 9, também temos 10 possibi-
lidades e assim sucessivamente até o último (sétimo) quadrado.
Então teremos 10 × 10 × 10 × 10 × 10 × 10 × 10 = 107 = 10.000.000
Então 10.000.000 é o número máximo de clientes qua a vodacom pode ter com o prexo 84.

7.2 Factorial
Dado um número natural n , chama-se factorial de n ao produto dos n primeiros números
naturais.
Por denição, tem-se que: 0! = 1 e 1! = 1 .
Exemplo 7.2.1. (a) 3! = 3 × 2 × 1 = 6
(b) 5! = 5 × 4 × 3! = 20 × 3! = 20 × 6 = 120
(n + 1)! (n + 1)n(n − 1)!
(c) = = (n + 1)n = n2 + n
(n − 1)! (n − 1)!
7.3 Arranjos
Dado um conjunto, aos agrupamentos que podem ser formados a partir dos elementos do con-
junto dado denomina-se arranjos, esses agrupamentos diferem-se da ordem dos seus elemetos,
isto é, dado um arranjo se mudarmos a ordem dos elementos obtem-se um outro arranjo dife-
rente do arranjo dado.
7.3.1 Arranjos com repetição

Dado um conjunto com n elementos a todos agrupamentos que podem ser formados com k
elementos não necessariamente diferentes, denomina-se arranjos com repetição ou arranjo
completo. A quantidade de todos esses arranjos é determinada pela fórmula n A∗ k = nk .
Exemplo 7.3.1. Consideremos o seguinte problema. Quantos PINs com três dígitos podemos
formar com os números do conjunto B = {4; 5; 6; 7}
444 454 464 474 544 · · · 774

445 455 465 475 545 · · · 775
446 456 466 476 546 · · · 776
447 457 467 477 547 · · · 777
No total são 64 PINs diferentes que podem ser formados. Isso equivale a 43 = 64 .
Ou seja estamos perante um arranjo com repetição, onde n = 4 é o número de elementos
tomados 3 a 3 logo k = 3 é taxa de elementos: 4 A∗ 3 = 43 = 64.

7.3.2 Arranjos sem repetição
Dado um conjunto com n elementos a todos agrupamentos que podem ser formados com k ele-
mentos diferentes, denomina-se arranjos sem repetição ou arranjo simples. A quantidade
n!
de todos esses arranjos é determinada pela fórmula n Ak = .
(n − k)!
Exemplo 7.3.2. Consideremos o seguinte problema. Quantos números com três dígitos dife-
rentes podemos formar com os números do conjunto B = {4; 5; 6; 7}
456 475 564 645 674 754

457 476 567 647 675 756
465 546 574 654 745 764
467 547 576 657 746 765
No total são 24 números com algarismos diferentes que formamos.
4! 4! 24
4
A3 = = = = 24 . São 24 números diferentes com algarismos diferentes.
(4 − 3)! 1! 1
Também podemos notar que: Um número de três algarismos: . Temos 4 dígitos
para formar um número com três algarismos diferentes que precisamos ou preencher os espaços
(quadrados) em branco dados que correspondem a cada algarismo. Comecemos assim:
Para o primeiro quadrado, temos 4 alternativas entre os números dados podemos escolher 4
ou 5 ou 6 ou 7. Já para o segundo quadrado, restá-nos 3 alternativas pois o número usado no
primeiro quuadrado não pode ser usado (repetido) nos restantes quadrados. E por último, para
o lugar do último algarismo restá-nos 2 algarismos pois os dois escolhidos anteriormente já não
podem ser usados. Multiplicando as alternativas para cada quadrado, temos 4 × 3 × 2 = 24
números que podem ser formados com algarismos diferentes.
7.4 Permutações
Dado um conjunto, quando os agrupamentos feitos, ou seja, quando os arranjos desse conjunto
englobam todos elementos, esse tipo de arranjo denomina-se permutação
7.4.1 Permutações Simples

É um caso particular de arranjo simples. É o tipo de agrupamento ordenado onde entram todos
os elementos.

Chama-se Permutação ou permutação simples de n elementos do conjunto dado, a qualquer
arranjo que tenha todos elementos do conjunto dado, ou seja, a troca de posição dos elementos.
E designa-se por: Pn = n!
Exemplo 7.4.1. Quantas palavras com ou sem sentido (anagramas) podemos formar com as
letras da palavra OLA?
OLA OAL LAO LOA AOL ALO

No total são 6 palavras que podemos formar com as letras da palavra OLA.
Ou, como são 3 letras da palavra OLA, então n = 3 e P3 = 3! = 6 .
7.4.2 Permutações com repetições

Se entre os n elementos do conjunto dado, existem elementos repetidos a vezes, b vezes e c
vezes e assim sucessivamente, o número total de permutações que podemos formar é dado por:
n!
Pna,b,c = .
a!b!c!
Exemplo 7.4.2. Quantas anagramas podemos formar com as letras da palavra MATEMA-
TICA?
A palavra MATEMATICA tem 10 letras, então n = 10 , sendo que a letra M está repetida
duas vezes, a letra A repetida tres vezes e a letra T repetida duas vezes.
2,3,2 10!
Baseando-se na fórmula, temos que: n = 10; a = 2; b = 3; c = 2 , logo P10 = = 151.200
2!3!2!
Resposta: São 151.200 anagramas.
7.5 Combinações Simples

Dado um conjunto com n elementos, aos subconjuntos constituidos por k elementos que po-
dem ser formados a partir dos elementos do conjunto dado denomina-se combinações, as
combinações diferem-se dos seus elemetos, isto é, dado uma combinação se mudarmos a ordem
dos elementos continua a mesma da cominação dada. Para ser diferente, deve haver troca de
n!
elementos e não ordem. O número total de combinações é dado pela fórmula: n Ck = .
(n − k)!k!
Exemplo 7.5.1. Pretende-se formar uma comissão de três funcionários, sabendo que a empresa
têm dez funcionários. Quantas comissões podem ser formadas?

Podemos notar que cada comissão é um grupo de funcionários e dentro de cada comissão,
mesmo trocando a ordem dos elementos, a comisão não altera-se, então trata-se de combinação
de 10 elementos tomados 3 a 3:
10 10! 10!
C3 = = = 120.
(10 − 3)!3! 7!3!
Resposta: Podem ser formadas 120 comissões.

Capı́tulo 8
Introdução às Probabilidades
A Estatística consiste em trabalhar com o ao acaso e a incerteza. A teoria de probabilidade é

um importante instrumento analítico em uma sociedade que é forçada a medir incertezas. Tanto
nos negócios, nas avaliações como nas situações quotidianas da vida, temos nossa opinião, mas
não temos certeza dos resultados do que nos propomos a realizar. Podemos estar incertos se
podemos realizar ou não promover uma oferta de um certo produto, se existe congestionamento
no trânsito no roteiro do nosso caminho, se podemos investir num certo negócio com o sobe
desce do dolár, contratar um funcionário que nos parece ser promissor, etc.
Nesta secção veremos realmente como é que as incertezas podem ser medidas, como associa-
las números e como interpretar estes valores chamados de probabilidades, que vai nos permitir
a tomar decisões adequadas, auxiliar a desenvolver estratégias. O ponto principal é a possibi-
lidade de quanticar o quanto provável será a ocorrência de determinada situação.
8.1 Experimento aleatório

Em quase tudo, em maior ou menor grau, nos deparamos com o acaso. Assim da armção
É provável que os Mambas ganhem os Bafana Bafana no jogo de amanhã. Após o jogo pode
resultar em:
A: Que mesmo com o favoritismo, os Mambas percam diante dos Bafana Bafana
B: Que como pensamos, os Mambas ganhem
C: Ou que o jogo termine empatado.
75
Como vimos, o resultado depende de ao acaso, fenômenos como estes são denominados fenô-
menos aleatórios ou experimentos aleatórios.
Denição 8.1.1. Fenômenos ou experimentos aleatórios são aqueles que, mesmo repeti-
das várias vezes sob mesmas condições ou semelhantes, apresentam resultados imprevisíveis.
8.2 Espaço Amostral

A cada experimento correspondem, em geral, vários resultados possíveis.
Para podermos falar de probabilidades, temos de ter sempre um espaço amostral, que é o
conjunto de todos resultados possíveis de uma experiência (experimento). O termo experimento
sugere a incerteza do resultado.
Denição 8.2.1. Espaço Amostral é o conjunto de todos resultados possíveis de um experi-

mento, e representemos por U.
Exemplo 8.2.1.
1. Se lançarmos uma moeda no ar, os resultados esperados nesse experimento são cara (Ca)
ou coroa (Co). Então o espaço amostral U = {Ca, Co}
2. Se considerarmos os resultados de candidatura a uma vaga, o espaço amostral será dado

por: U = { Adnmitido, Não Admitido, Suplente } .
Do mesmo modo, como em dois lançamentos simultâneos de duas moedas, podemos ter cara
nas duas moedas, cara na primeira moeda e coroa na segunda, entre outros resultados de tal
modo que o seu espaço amostral será dado por:
U = { (Ca,Ca), (Ca,Co), (Co,Ca), (Co,Co)}.
8.3 Eventos
Denição 8.3.1. Chama-se evento a qualquer subconjunto do espaço amostral U. E reperesenta-
se pela letra maíscula.
Exemplo 8.3.1. Consideremos o seguinte experimento:

No lançamento de um dado, temos que U = { 1,2,3,4,5,6 } Consideremos os seguintes even-
tos referentes ao lançamento de um dado:
Evento A sair um número par. Temos que A = {2, 4, 6} ;
Evento B sair um número menor que 10. Temos que B = {1, 2, 3, 4, 5, 6} ; Evento C sair o
dobro de 2. C = {4} ; Evento D sair um nmero
maior que 6. D = ∅ .
Assim, qualquer que seja E , se E ⊂ U (E contido em U), então E é evento de U.
8.3.1 Classicação dos eventos

De acordo com a quantidade dos resultados pertecentes a um evento, os eventos podem ser
classicados em:
Denição 8.3.2. Evento Simples ou Elementar: é o evento formado por um elemento do
espaço amostral ( #A = 1 )
Exemplo 8.3.2. No lançamento de um dado, considere o evento G sair um número maior que
5.
Podemos notar que o único número maior que 5 no espaço amostral de lançamento de um dado
é o número 6, logo G = {6} . G é evento simples porque possui somente um elemento.
Denição 8.3.3. Evento Certo: é um evento que sempre ocorre, ou seja é igual ao espaço
amostral. (A = U )
Exemplo 8.3.3. No lançamento de um dado, considere o evento E sair um número menor ou
igual que 6.
Podemos notar que todos elementos do espaço amostral são menores ou igual a 6. Então o
evento E será dado por E = {1, 2, 3, 4, 5, 6} . E é evento certo porque possui todos elementos do
espaço amostral.
Denição 8.3.4. Evento Impossível: é um evento que nunca ocorre, ou seja (A = ∅) ou
ainda #A = 0.
Denição 8.3.5. No lançamento de um dado, considere o evento D sair um número negativo.
Podemos notar que no espaço amostral não temos nenhum número negativo, logo D = ∅ . D é
evento impossível porque é um conjunto vazio.

8.3.2 Operações com eventos
Dados dois eventos ou mais, pode-se criar a combinação destes eventos, originando outro evento
distinto dos originais.
Denição 8.3.6. Evento Complementar: O evento complementar (ou contrário) de A ,
denotado por A , é o conjunto de todos os elementos do espaço amostral U , que não pertencem
a A , ou seja, ocorre quando o evento A não ocorre.
Denição 8.3.7. Evento União ou Reunião: Consideremos dois eventos A e B . O evento
A ∪ B é um novo eventoe ocorre quando o evento A, ou o evento B, ou os dois eventos ocorrem.
Denição 8.3.8. Evento Interseção: Consideremos dois eventos de um espaço amostral A
e B do espaço amostral U . O evento interseção A ∩ B é um novo evento e ocorre quando os
eventos A e B ocorrem simultaneamente.
Exemplo 8.3.4. Ao lançar um dado e observar a face superior, considere os seguintes eventos:
Considere os eventos:
A: Ocorrência do número par: A = {2; 4; 6}
B: Ocorrência do número ímpar: B = {1; 3; 5}
C: Ocorrência do número menor que quatro: C = {1; 2; 3}
1. Obtenha os seguintes eventos:
(a) A ∪ B (b) A ∩ B (c) A ∩ C (d) A ∩ C
Resolução:
(a) A ∪ B = {1; 2; 3; 4; 5; 6} (c) A ∩ C = {2}
(b) A ∩ B = ∅
(d) A ∩ C =? Temos que: A = {1; 3; 5} e C = {4; 5; 6} , logo A ∩ C = {5}.
Denição 8.3.9. Eventos Mutuamente Exclusivos: Dois eventos A e B são denominados
mutuamente exclusivos, se não podem ocorrer simultaneamente, ou seja A ∩ B = ∅.

Assim, no lançamento de uma moeda, o evento sair cara e sair coroa são mutuamente exclusivos,
já que a realização de um deles impossibilita a realização do outro.
Denição 8.3.10. Eventos Independentes: Dois eventos são independentes quando a rea-
lização ou não-realização de um dos eventos não afecta a realização do outro ou vice-versa.
Exemplo 8.3.5. Sejam os eventos: A: Ter positiva na avaliação de Estatística e B: Estudar
no período laboral.
Olhando para esses dois eventos, podemos armar que são independentes, pois ter positiva não
depende do período de aulas, seja laboral ou pós-laboral.
8.4 Probabilidade
Dado um experimento aleatório, sendo U o seu espaço amostral, vamos admitir que que todos
os elementos de U tenham a mesma chande acontecer, ou seja, que U é um conjunto equi-
provável.
Chamamos de Probabilidade de um evento A , ( onde A ∈ U ) ao quociente entre a

quantidade de elementos de A pela quantidade de elementos de U , e designa-se por P (A) .
Analiticamente temos,
#A
P (A) = .
#U
Em outras palavras, podemos denir a probabilidade do evento A como sendo a frequência
relativa de A em relação a U . Sendo assim, temos a seguinte propriedade:
0 ≤ P (A) ≤ 1,
onde A é um evento qualquer.
Exemplo 8.4.1. 1. No lançamento de um dado. Determinar a probablidade de:
(a) A: Sair um número par
(b) B: Sair um número maior que 7
(c) C: Sair um número menor ou igual a 6
Resolução:
Temos que, o espaço amostral no lançamento de um dado é dado por: U = {1; 2; 3; 4; 5; 6} logo
#U = 6 .

#A 3
(a) O evento A é dado por A = {2; 4; 6} , e #A = 3 , logo P (A) = = = 0.5 ou 50% .
#U 6
Resposta: No lançamento de um dado há 50% de chance de sair um número par.
#B 0
(b) O evento B é dado por A = ∅ , e #B = 0 , logo P (B) = = = 0.
#U 6
Resposta: No lançamento de um dado há 0% de chance de sair um número par. (Evento
impossível)
#C 6
(c) O evento C é dado por C = {1; 2; 3; 4; 5; 6} , temos que #C = 6 , logo P (C) =
= = 1.
#U 6
Resposta: No lançamento de um dado há 100% de chance de sair um número menor ou
igual a 6. (Evento certo).
8.4.1 Propriedades de probabilidade

(a) A probabilidade de um evento certo é igual a 1: P (U ) = 1.
(b) A probabilidade de um evento impossível é igual a 0: P (A) = 0 , se A = ∅
(c) A soma das probabilidades de um evento e do seu complemento é igual a 1:
P (A) + P (A) = 1.
(d) A probabilidade de eventos mutuamente exclusivos é igual a zero: P (A ∩ B) = 0 , se

A e B são mutuamente exclusivos.
(e) A probabilidade de união: P (A ∪ B) = P (A) + P (B) − P (A ∩ B) .
(f) A probabilidade de eventos independentes: P (A ∩ B) = P (A) × P (B) , se A e B são

independentes.
8.4.2 Probabilidade Condicional

Sejam A e B dois eventos de um espaço amostral. A probabilidade do evento A condicionado
ao evento B, denotado por P (A/B) , isto é, a probabilidade de A visto que B já ocorreu é a
probabilidade do evento A tomando B como sendo o novo espaço amostral ao invés de U.
Dados dois eventos A e B associados ao mesmo espaço amostral U, se P (B) > 0 , então a pro-
babilidade de ocorrênciia do evento A condicionado a ocorrência do evento B ou probabilidade
de A visto que B ocorreu, é dada por
P (A ∩ B)
P (A/B) = , (8.1)
P (B)

em que P (A ∩ B) e P (B) são determinadas em relação ao espaço amostral U.
Exemplo 8.4.2. No lançamento de um dado, considere os seguintes eventos:
A: A face é um número ímpar B: A face é um número maior que 1. Qual é a probabilidade
de ter sido ímpar uma vez que o número era maior que 1?
Resolução:
Primeiro Método de Resolução:
O espaço amostral no lançamento de um dado é U = {1; 2; 3; 4; 5; 6} . E o evento sair ímpar é
dado por A = {1; 3; 5} .
Pelo exercício percebe-se que a face é de um número maior que 1. Então o nosso espaço amostral
transforma-se em U1 = {2; 3; 4; 5; 6} e o nosso evento A transforma-se em A1 = {3; 5} .
Logo, a probabilidade de ter sido ímpar uma vez que o número era maior que 1 é dada por
#A1 2
P (A/B) = = = 0, 4 ou 40%.
#U1 5
Segundo Método de Resolução:
Pelos eventos dados temos que: U = {1; 2; 3; 4; 5; 6} , A = {1; 3; 5} , e B número maior que 1,
B = {2; 3; 4; 5; 6} , então A ∩ B = {3; 5} A probabilidade de ter sido ímpar uma vez que o
número era maior que 1 é dada pela fórmula (8.1):
P (A ∩ B) #(A ∩ B) 2 #B 5
P (A/B) = =? P (A ∩ B) = = e P (B) = = , então:
P (B) #U 6 #U 6
2
P (A ∩ B) 2 6 2
P (A/B) = = 65 = × = = 0, 4 .
P (B) 6
6 5 5

Só para relaxar
1. Calcule:
(a) P4 (c) P7 (e) C410 (g) C35 − A42 (i) C25 · A53
P5
(b) A62 (d) C38 (f) A10 (h) (j) P3 · C47
4 P3
2. Quantos são os anagramas formados com as letras da palavra MULEMBA. Quantos destes
anagramas começam com a letra A? (ANAGRAMA: é a palavra obtida usando as mesmas
letras da palavra incial, invertendo a ordem, mesmo sem sentido)
3. Qual é o nímero de comissões de 3 alunos que se podem formar tirados em um conjunto

de 7 alunos?
4. Considere os conjuntos A = {a, b, c, d, e} e B = {r, s, t} . Escreva:
(a) Todos arranjos possíveis, de 2 elementos, formados pelos elementos do conjunto A
(b) Todas combinações possíveis, de 3 elementos, formados pelos elementos de A
(c) Todas permutações formadas pelos elementos do conjunto B
5. Um restaurante oferece no cardápio 2 saladas distintas, 4 tipos de pratos de carne, 5

variedades de bebidas e 3 sobremesas diferentes
(a) De quantas maneiras diferentes a Lizete Magaia poderia fazer um pedido contendo,
uma salada, um tipo de carne, e uma sobremesa?
(b) De quantas maneiras diferentes a Elisa poderia fazer um pedido contendo, uma
salada, um tipo de carne, e uma sobremesa e uma variedade das bebidas?
82
6. De quantos modos pode se vestir um homem que tem 2 pares de sapatos, 4 casacos e seis
calças diferentes, usando sempre uma calça, uma casaco e um par de sapatos?
7. Em uma prova composta de 20 questões envolvendo V ou F. A Mércia teve 12 valores,

de quantas maneiras distintas pode ter sido resolvido de modo a obter essa classifcação,
sabendo que a segunda correcção era tudo verdade?
8. Um inspector visita 6 farmácias. A m de evitar que os proprietários das farmácias

saibam quando ele os irá inspecionar, o inspector varia a ordem de suas visitas. De
quantas maneiras diferentes poderão ser feitas as visitas?
9. Sete alunos foram escolhidos para representar a turma de Contabilidade na televisão.

Se for necessário que os mesmos formem uma la para fotograa, de quantas maneiras
diferentes podem ser dispostos os alunos?
10. De uma sala de 25 alunos devem ser escolhidos 5 alunos para receberem prêmios. De
quantas maneiras diferentes poderão ser distribuidos os prêmios se:
(a) Se todos os prêmios forem iguais (b) Se os prêmios forem diferentes
11. Cinco pessoas decidem viajar num automóvel. De quantas maneiras diferentes eles podem
se assentar se:
(a) Todos sabem dirigir (b) Apenas um sabe dirigir
12. No Moçambola a equipa Saúde de Chimoio obteve 8 vitórias, 5 empates e 2 Derrotas, nos
15 jogos realizados. De quantas maneiras distintas esses resultados podem ter ocorrido?
13. Descreva o espaço de resultados para as seguintes experiências aleatórias:
(a) Lançar um dado e uma moeda uma vez e observar o resultado
(b) Um exame para ngressão no seu primeiro trabalho
(c) Nota a ser obtida nas avaliações de Estística Geral
4 2 √
14. Quais dos seguintes valores não podem ser probabilidades? 0 ; 0, 0001 ; −0, 2 ; ; ; 2 ;
√ 3 4
0, 2
15. Quais dos seguintes pares de acontecimentos são mutuamente exclusivos:

(a) Chover / Não chover (c) Nadar / Sentir frio
(b) Conduzir um carro / Andar a pé (d) Ganhar num jogo / Perder no mesmo jogo
16. Responda as questões seguintes:
(a) Se A é o evento Fevereiro tem 30 dias este ano. Determine P(A).
(b) Se B é o evento Novembro tem 30 dias este ano. Determine P(B)
(c) Um espaço amostral consiste em 200 eventos separados e igualmente prováveis. Qual
é a probabilidade de cada evento?
(d) Em um exame de admissão, cada questão tem 5 respostas possíveis. Respondendo

aleatoriamente a primeira questão, qual é a probabilidade de acertar?
17. São lançados dois dados. Qual é a probabilidade de:
(a) obter-se um par de pontos iguais
(b) um par de pontos diferentes
(c) um par em que o primeiro é menor que o segundo
(d) a soma dos pontos ser um número par
18. Um lote é formado por 10 peças boas, 4 com defeitos leves e 2 com defeitos graves. Uma
peça é retirada ao acaso deste lote. Calcule a probabilidade de que esta peça:
(a) seja boa (d) apresente defeito
(b) apresente defeito leve (e) não apresente defeito
(c) apresente defeito grave (f) não apresente defeito grave
19. Um estudo de 500 voos da LAM seleccionados aleatoriamente mostrou que 430 chegaram
no horário. Qual é a probabilidade de um voô da LAM chegar no horário? E de não
chegar no horário?
20. Qual é a probabilidade de acidentes de trabalho, por ano, em uma determinada indústria
se uma amostra aleatória de 10 rmas que empregam um total de 8.000 pessoas, mostrou
que ocorreram 400 acidentes de trabalho durante os últimos doze meses?

21. Em uma pesquisa entre estudantes dum Instituto, 1162 amaram que cabulavam nos
exames, enquanto 2468 armaram que não cabulavam. Selecionado aleatoriamente um
destes estudantes para o mercado de emprego, determine a probabilidade de ele ou ela
ter cabulado em um exame.
1 1
22. Se P (A) = e P (B) = e A e B são acontecimentos mutuamente exclusivos, calcule:
2 4
(a) P (A) (b) P (B) (c) P (A ∩ B) (d) P (A ∩ B)
23. Um grupo de 60 pessoas apresenta a segunte composição:
Designação: Homens Mulheres TOTAL

Menores: 15 17 32
Maiores: 18 10 28
TOTAL 33 27 60
Uma pessoa é escolhida ao acaso:
(a) Qual é a probabilidade de ser homem?
(b) Qual é a probabilidade de ser adulto?
(c) Qual é a probabilidade de ser menor e ser mulher?
(d) Sabendo-se que a pessoa escolhida é adulto, qual é a probabilidade de ser homem?
(e) Dado que a escolhida é mulher qual é a probabilidade de ser menor?

3 3
24. A probabilidade de uma mulher estar viva daui a 30 anos é e de seu marido é .
4 5
Calcule a probabilidade de:
(a) Apenas o homem estar vivo (c) Pelo menos um estar vivo
(b) Apenas a mulher estar viva (d) Ambos estarem vivos
25. Dados P (A) = 0, 3 ; P (B) = 0, 6 ; e P (A ∩ B) = 0, 15 , achar P (A/B) , P (B/A) , P (A) ,

P (A ∪ B) , P (B) e P (A ∪ B) .
26. Dados P (A) = 0, 9 ; P (B) = 0, 8 e P (A ∩ B) = 0, 75 , achar P (A ∪ B) , P (A ∩ B) ,

P (A ∩ B) , P (A ∪ B) e P (A ∩ B)
27. Melanie chega atrasada ao trabalho 25% das vezes, e esquece o material de trabalho 20%
das vezes. Admitindo que essas ocorrências sejam independentes, determine a probabili-
dade da Winny:

(a) Chegar atrasada 2 dias seguidos (c) Chegar na hora e com o material
(b) Chegar atrasada e sem o material (d) Chegar na hora e sem o material
1
28. A probabilidade de que você resolva correctamente a 1a questão duma prova é e de
3
2
seu colega resolva correctamente é , sendo que ambos tentam, sozinhos, resolvê-la.
5
Considere o experimento em que se verica se a questão foi resolvida correctamente ou
não pelos dois.
(a) Os eventos você resolver correctamente e seu colega resolver correctamente são:
mutuamente exclusivos? Justique. independentes? justique.
(b) Qual é a probabilidade de pelo menos um resolver a questão correctamente?
29. Das 100 pessoas que se candidatam ao emprego na área aduaneira e contabilística em
uma empresa, 40 possuíam experiência anterior, 30 curso superior, e destes 20 possuíam
ambos
(a) Qual a probabilidade de uma candidato escolhido aleatoriamente possuir curso su-
perior ou experiência anterior
(b) Qual a probabilidade de uma candidato escolhido aleatoriamente possuir curso su-
perior e experiência anterior
30. Sejam A e B dois eventos associados com um experimento E. Supondo que P (A) = 0.4 ,
P (A ∪ B) = 0.7 e P (B) = p , qual é o valor de p para que se tenha:
(a) A e B mutuamente exclusivos
(b) A e B não mutuamente exclusivos e independentes
31. Os arquivos da polícia revelam que, das vítimas de acidente automobilístico que utilizam
cinto de segurança, apenas 10% sofrem ferimentos graves, enquanto que essa incidêndia
é de 50% entre as vitímas que não utilizam o cinto de segurança. Estima-se em 60%
o percentual dos motoristas que usam o cinto de segurança. A polícia acaba de receber
uma chamada para investigar um acidente em que houve um indivíduo gravemente ferido.
Calcule a probabilidade de ele estar usando o cinto no momento do acidente. Se a pessoa
que dirigia o outro carro não sofreu ferimentos graves. Calcule a probabilidade de ela não
estar usando o cinto no momento do acidente.

32. A empresa Mana Lily Lda recentemente apresentou uma proposta para um projecto de
moda. Se seu principal concorrente apresenta uma proposta, há apenas 0, 25 chance da
2
empresa ganhar a concorrência. Se seu concorrente não apresentar a proposta, há de
3
chance da empresa ganhar. A chance de seu principal concorrente apresentar proposta é
de 50% .
(a) Qual a probalidade da empresa ganhar a concorrência?
(b) Qual a probalidade de seu concorrente ter apresentado proposta, dado que a empresa
ganhou a concorrência?
33. Um fazendeiro estima que quando uma pessoa experimentada planta árvores, 90% so-
brevivem, mas quando um novato as planta, apenas 50% sobrevivem. Se uma árvore
plantada não sobreviveu, determine a probabilidade de ela ter sido plantada por um
2
novato, sabendo que das árvores são plantadas por novatos.
3
34. Uma Companhia com três lojas A, B e C tem respectivamente 50, 75 e 100 empregados.
A percentagem de mulheres a trabalhar em cada uma dessas lojas é 50, 60 e 70, respecti-
vamente. No nal de cada mês é nomeado o empregado do mês. Qual é a probabilidade
desse empregado trabalhar na loja C, sabendo que é mulher?
35. Num centro de cópias existem três impressoras A, B e C que imprimem a velocidades
diferentes. A probabilidade de um cheiro ser enviado para as impressoras A, B e C
é respectivamente 0.6 , 0.3 e 0.1 . Ocasionalmente a impressora avaria-se e destroi a
impressão. As impressoras A, B ou C avariam-se, respectivamente, com probabilidades
0.01 , 0.05 e 0.04 . A impressão de um cheiro foi destruída! Qual é a probabilidade de
ter sido enviada para a impressora B?
36. No centro de inspecção dos medicamentos existêm três inspectores, Eugênio Jambo, Me-
lanie Mulemba e Amândio Ndlovu, cada um deles responsável pela vericação de 20% ,
30% e 50% dos artigos inspecionados. A probabilidade do inspector Eugênio deixar pas-
sar um artigo ilegalmente é 0.05 , a probabilidade da inspectora Melanie deixar passar
um artigo ilegalmente é 0.10 e probabilidade do inspector Amândio Ndlovu cometer o
mesmo erro é 0.15 . Escolhe-se ao acaso um artigo inspeccionado:
(a) Qual é a probabilidade de que seja um artigo ilegal?
(b) Sabendo que é ilegal, qual e a probabilidade de ter sido Melanie a inspecciona-lo?

37. Os senhores Sabune e Mulemba são os maiores criadores de ovelhas e cabritos, grandes
rivais e concorentes no Mercado Francisco Mayanga, na Cidade de Chimoio. O senhor
Sabune tem 45% do total dos animais enquanto que o senhor Mulemba detém 30% dos
animais. Sabe-se que dos animais do senhor Mulemba 60% são cabritos, dos do senhor
Sabune 70% são cabritos, enquanto que dos restantes criadores, 40% são cabritos. No
dia 24 de Dezembro, a polícia local neutralizou um grupo de assaltantes com um animal:
(a) Qual é a probabilidade de pertencer ao senhor Sabune?
(b) Qual é a probabilidade de ser uma ovelha?
(c) Qual é a probabilidade de ser uma ovelha e pertencer ao senhor Sabune?
(d) Sabendo que o animal roubado era uma ovelha, qual é a probabilidade de pertencer
ao Sr. Mulemba?
38. Num determinado curso, estão matriculados 100 estudantes, entre os quais 10 repetentes.
São escolhidos 4 estudantes ao acaso. Encontrar a probabilidade de que os 4 estudantes
sejam todos:
(a) Estudantes repetentes (b) Estudantes não repetentes
39. Três estudantes são escolhidos ao acaso de um grupo de 15 estudantes dos quais 5 são
mulheres. Calcular a probabilidade de que:
(a) Nenhum seja mulher (c) Pelo menos um seja mulher
(b) Exactamente um seja mulher
40. Uma companhia multinacional tem três fábricas que produzem o mesmo tipo de produto.
A fábrica I é responsável por 30% do total produzido, a fábrica II produz 45% do total, e
o restante vem da fábrica III. Cada uma das fábricas, no entanto, produz uma proporção
de produtos que não atendem aos padrões estabelecidos pelas normas internacionais. Tais
produtos são considerados defeituosos e correspondem a 1% , 2% e 1.5% , respectiva-
mente, dos totais produzidos por fábrica. No centro de distribuição, é feito o controle de
qualidade da produção combinada das fáricas. Qual é a probabilidade:
(a) De encontrar um produto defeituoso durante a inspecção de qualidade?
(b) Se durante a inspecção, encontramos um produto defeituoso, qual é a probabilidade

que ele tenha sido produzido na fábrica II?

(c) Se durante a inspecção, encontramos um produto não defeituoso, qual é a probabi-
lidade que ele tenha sido produzido na fábrica II?
Viver de aparências é querer fazer uma viagem com um carro sem combústivel . A. Huxley

Referências Bibliográcas
[1] CRESPO, António. (2002) Estatística fácil. 18rd Edição. Editora Saraiva. São Paulo.
[2] DO NASCIMENTO, Paulo Henrique Ribeiro. (2007) Estatística e Probabilidade. FTC-

EAD, Brasil 2007
[3] FARIAS, Ana. et all (2006) Estatística Descritiva Universidade Federal Fluminese. Brasil
[4] GRANZOTTO, António. (2002) Resumo de Estatística Básica.
[5] MULENGA, Alberto. (2007). Manual de Estatística. UEM-DMI, Maputo 2007
90

Manual BioEstatística Nelson Mulemba

Enviado por

Dados do documento

Descrição original:

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Manual BioEstatística Nelson Mulemba

Enviado por

Direitos autorais:

Formatos disponíveis

Manual de BioEstatística

|| IF - - 2018 - - Manual de BioEstatística Nelson Mulemba

4 Medidas de Posição de Dados 27

5 Medidas de localização e de assimetria 39

6 Medidas de Dispersão ou de Variabilidade 44

7 Introdução à Análise Combinatória 69

|| IF - - 2018 - - Manual de BioEstatística Nelson Mulemba

|| IF - - 2018 - - Manual de BioEstatística Nelson Mulemba

|| IF - - 2018 - - Manual de BioEstatística Nelson Mulemba

Bem Vindo à BioEstatística.

Todas as ciências têm as suas raízes da história do Homem.

As tabelas tornaram-se mais completas, surgiram as representações grácas e o cálculo de

As ferramentas descritivas são os muitos tipos de grácos e tabelas e as medidas de síntese,

3 || IF - - 2018 - - Manual de BioEstatística Nelson Mulemba

mesmos na tomada de decisões.

Denição 1.1.2. Bioestatística é o conjunto de conceitos e métodos cientícos usados no

tratatmento de variabilidade nas ciências médicas e biológicas.

A Biostatística fornece métodos para se tomar decisões óptima na presença de incerteza,

A Estatística está presente em diversas áreas e em diversas abordagens. Podemos citar

• Eleições: Anúncio prévio, em termos percentuais, de que o candidato A é o provável

• Indústria: Teste de lâmpadas ash ou lentes para máquinas fotográcas. O fabricante

• Instituições Bancárias/Crédito: Análise de crédito; seguro de vida e/ou de automóveis;

• Farmácia/Medicina: Analisar a entrada de um novo medicamento, vericando a sua

4 || IF - - 2018 - - Manual de BioEstatística Nelson Mulemba

• Experimentação Agrícola: Estudos de uma nova variedade de semente (modicação ge-

• Telecomunicações: A utilização da Internet gera informações preciosas de clientes; controle

• Experimentação Zootécnica: Estudo do desenvolvimento de um animal e análise de fac-

1.2 Divisões da Estatística

I: Estatística Descritiva: diz respeito aos métodos de recolha, apuração, apresentação e ao

1.3 Método Cientíco

Denição 1.3.1. Método é um conjunto de meios dispostos convenientemente para se chegar

Dos métodos cientícos vamos considerar os métodos:

5 || IF - - 2018 - - Manual de BioEstatística Nelson Mulemba

1.3.2 Método Estatístico

Denição 1.3.2. O Método estatístico, diante da impossibilidade de manter as causas cons-

determinar, no resultado nal, que inuências cabem a cada uma delas.

1.4 Fases de um Método Estatístico

6 || IF - - 2018 - - Manual de BioEstatística Nelson Mulemba

7 || IF - - 2018 - - Manual de BioEstatística Nelson Mulemba

2.1 População e Amostra

dade de todos os elementos da população.

Exemplo 2.1.1. Um estudo sobre as idades dos alunos do IF.

quantidade de todos os elementos da população.

Na maioria das vezes, por impossibilidade ou inviabilidade econômica ou temporal, limita-

com o propósito de levarmos conclusões sobre essa população.

LEMBRAR QUE: A quantidade dos elementos da população representa-se por N e para

determinada doença. É seleccionado um grupo de 20 doentes, administrando-se o medicamento

a esses doentes escolhidos ao acaso, e o medicamento habitual aos restantes.

População: Conjunto de todos os doentes com a doença especíca.

Denição 2.1.5. Censo ou Recenseamento: é um estudo estatístico de um universo de

pessoas, instituições ou objectos físicos com o propósito de adquirir conhecimentos, observando

Denição 2.1.6. Sondagem: é um estudo cientíco com o objectivo de melhor conhecer

atitudes , hábitos e preferências da população relativamente a aconteccircunstâncias e assuntos

Em resumo pode-se denir Recenseamento ou Censo como um estudo estatístico rea-

9 || IF - - 2018 - - Manual de BioEstatística Nelson Mulemba

população (amostra) com o propósito de avaliar certas características desta população.

2.2.1 Importância da Amostragem

• Denir cuidadosamente a população de interesse;

• Selecionar a característica que iremos pesquisar.

Para que serve e quando deve ser utilizada?

10 || IF - - 2018 - - Manual de BioEstatística Nelson Mulemba

3. Conabilidade de dados: Pesquisar um número menor de elementos ajuda na veri-

As tabelas tornaram-se mais completas, surgiram as representações grácas e o cálculo de

As ferramentas descritivas são os muitos tipos de grácos e tabelas e as medidas de síntese,

Denição 1.1.2. Bioestatística é o conjunto de conceitos e métodos cientícos usados no

• Indústria: Teste de lâmpadas ash ou lentes para máquinas fotográcas. O fabricante

• Farmácia/Medicina: Analisar a entrada de um novo medicamento, vericando a sua

• Experimentação Agrícola: Estudos de uma nova variedade de semente (modicação ge-

1.3 Método Cientíco

Denição 1.3.1. Método é um conjunto de meios dispostos convenientemente para se chegar

Dos métodos cientícos vamos considerar os métodos:

Denição 1.3.2. O Método estatístico, diante da impossibilidade de manter as causas cons-

determinar, no resultado nal, que inuências cabem a cada uma delas.

População: Conjunto de todos os doentes com a doença especíca.

Denição 2.1.5. Censo ou Recenseamento: é um estudo estatístico de um universo de

Denição 2.1.6. Sondagem: é um estudo cientíco com o objectivo de melhor conhecer

Em resumo pode-se denir Recenseamento ou Censo como um estudo estatístico rea-

• Denir cuidadosamente a população de interesse;

3. Conabilidade de dados: Pesquisar um número menor de elementos ajuda na veri-

3. Amostragem Estraticada (Proporcional)

3: Amostragem Estraticada (Proporcional)

A população é dividida sicamente em conglomerados (grupos). A seguir seleccionam-se ale-

• É preciso fazer entrevistas ou observações em grandes áreas geográcas;

2.3 Variável e suas classicações

Denição 2.3.1. Variável: é a característica de interesse que é medida em cada elemento da

Denição 2.3.2. Variável qualitativa: quando o resultado da observação é apresenatado na

como exemplo: sexo, cor dos olhos, categoria prossional, etc

Denição 2.3.3. Variável quantitativa: quando o resultado da observação é um número que

As variáveis numéricas, por sua vez classicam-se em:

Exemplo 3.1.3. Perguntou-se aos estudantes da turma de Contabilidade-Noite quantos lhos