Você está na página 1de 96

Manual de BioEstatística

Nelson Mulemba

Maputo, 2018
Nelson Mulemba

|| IF - - 2018 - - Manual de BioEstatística Nelson Mulemba


Índice

Introdução 1

1 A Natureza da Estatística 2
1.1 Estatística . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.2 Divisões da Estatística . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.3 Método Cientíco . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.3.1 Método Experimental . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.3.2 Método Estatístico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.4 Fases de um Método Estatístico . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

2 População e Amostra 8
2.1 População e Amostra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
2.2 Amostragem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.2.1 Importância da Amostragem . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.2.2 Tipos de Amostragens . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
2.3 Variável e suas classicações . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

3 Distribuição de Frequências 20
3.1 Tabelas de frequências . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
3.1.1 Tipos de Frequências . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
3.1.2 Tabelas de Frequências em Intervalos de Classes . . . . . . . . . . . . . . 23

4 Medidas de Posição de Dados 27


4.1 Medidas de tendência central . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
4.1.1 Média (X) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
4.1.2 Moda (M0 ) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
4.1.3 Mediana (M ed) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

5 Medidas de localização e de assimetria 39


5.1 Medidas de localização ou separatrizes . . . . . . . . . . . . . . . . . . . . . . . 39
5.1.1 Quartis (Qi ) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
5.1.2 Decis (Di ) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
5.1.3 Percentis (Pi ) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
5.1.4 Procedimentos para determinar separatrizes . . . . . . . . . . . . . . . . 40
5.2 Medidas de Assimetria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
5.2.1 Tipos de curvas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43

6 Medidas de Dispersão ou de Variabilidade 44


6.1 Amplitude Total ( At ) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
6.1.1 Restrições ao uso da Amplitude Total . . . . . . . . . . . . . . . . . . . . 46
6.2 Variância ( S 2 ) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
6.3 Desvio Padrão (S) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
6.4 Coeciente de Variação de Pearson (Cv) . . . . . . . . . . . . . . . . . . . . . . 48

Só para relaxar 50

7 Introdução à Análise Combinatória 69


7.1 Princípio Fundamental de Contagem . . . . . . . . . . . . . . . . . . . . . . . . 69
7.2 Factorial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
7.3 Arranjos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
7.3.1 Arranjos com repetição . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
7.3.2 Arranjos sem repetição . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
7.4 Permutações . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
7.4.1 Permutações Simples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
7.4.2 Permutações com repetições . . . . . . . . . . . . . . . . . . . . . . . . . 73
7.5 Combinações Simples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73

8 Introdução às Probabilidades 75
8.1 Experimento aleatório . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
8.2 Espaço Amostral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76

|| IF - - 2018 - - Manual de BioEstatística Nelson Mulemba


8.3 Eventos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
8.3.1 Classicação dos eventos . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
8.3.2 Operações com eventos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
8.4 Probabilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
8.4.1 Propriedades de probabilidade . . . . . . . . . . . . . . . . . . . . . . . . 80
8.4.2 Probabilidade Condicional . . . . . . . . . . . . . . . . . . . . . . . . . . 80

Só para relaxar 81

Referências Bibliográcas 90

|| IF - - 2018 - - Manual de BioEstatística Nelson Mulemba


Nelson Mulemba

|| IF - - 2018 - - Manual de BioEstatística Nelson Mulemba


Introdução

Bem Vindo à BioEstatística.


Caro aluno, este manual foi produzido com o objectivo de dar suporte aos estudantes do IF-
Instituto Foco, dos curos: Saúde Pública e Gestão Ambiental e Higiene e Segurança no Trabalho
na displina de BioEstatística.
O manual intitulado Manual de BioEstatística apresenta uma síntese dos assuntos que serão
abordados durante as aulas. O manual é composto por 8 (oito) capítulos teóricos e 2 (dois)
práticos. Os primeiros capítulos que antecedem a parte prática, fazem parte da estatística
descritiva. Utiliza-se métodos para organizar, resumir e descrever aspectos importantes de um
dado conjunto de dados. Após a primeira parte do bloco prático, encontramos contéudos que
compõem o campo das probabilidades para medidas de incerteza.
Nos capítulos práticos intitulados Só para relaxar estão patentes os exercícios que fundamen-
tam a parte teórica.

Todos os exercícios deverão ser resolvidos num caderno. Meu desejo é que aqueles que
zerem o bom uso deste manual, tenham um bom aproveitamento e conquistem linguagem
estatística para toda a vida.

Aproveitar agradecer todos aqueles que farão uso deste manual, e em especial aqueles que
farão críticas com intuito de melhoramento e aperfeiçoamento deste manual.
Em nelsonrafaelmulemba@gmail.com

DoceModel

1
Capı́tulo 1
A Natureza da Estatística

Todas as ciências têm as suas raízes da história do Homem.


A Matemática, que é considerada, a ciência que une à clareza do raciocínio a síntese da lingua-
gem, originou-se do convívio social, das trocas, de contagem, com carácter prático, utilitário,

empírico.
A Estatística, ramo da Matemática Aplicada, teve origem semelhante. Desde antiguidade, vá-
rios povos já registavam o número de habitantes, de nascimentos, de óbitos, faziam estimativas
de riqueza individual e social, distribuiam equitativamente terras ao povo, cobravam impostos
e realizavam inquéritos quantitativos por processo que, hoje chamariamos de "estatísticas".

A partir do século XVI começaram a surgir as primeiras análises de factos sociais, como ba-
tizados, casamentos, funerais, originando as primeiras tábuas e tabelas e os primeiiros números
relativos.
Ao longo da idade média e até ao século XVIII, a estatística foi puramente descritiva, coexistindo
duas escolas: a escola descritiva alemã, cujo representante mais conhecido é o economista Go-
dofredo Achenwall (1719-1772), professor na Universidade de Gottingen, considerado pelos
alemães como o pai da estatística, batizou a nova ciência (ou método) com o nome de Estatís-
tica, determinando o seu objectivo e suas relações com as ciências e a escola dos matemáticos

sociais, que procuravam traduzir por leis as regularidades observadas de certos fenômenos, de
carácter econômico e sociológico. Embora essa escola procurasse fundamentar a formulação de
previsões com base de leis sugeridas pela experiência, a estatística confundia-se, praticamente,
com a demograa à qual fornecia métodos sistemáticos de enumeração e organização. Na re-
alidade a necessidade sentida, em todas épocas, de conhecer numérica e quantitativamente, a

2
realidade política e social tornou análise demográca uma preocupação constante.

As tabelas tornaram-se mais completas, surgiram as representações grácas e o cálculo de


probabilidades, e a estatística deixou de ser simples catalogação de dados númericos colectivos
para se tornar o estudo de como chegar a conclusões sobre o todo partindo da observação de
partes desse todo.

Em todas as áreas da ciência, a colecta de dados se faz necessaria e com isso a Estatística tem
crescido muito nos últimos anos, especialmente com o advento de computadores e surgimento
de softwares cada vez mais sosticados. Observar uma extensa listagem de dados colectados
não nos permite chegar a uma conclusão concisa. Este facto se afasta se esse conjunto de dados,
possui muitas características que devem ser investigadas.
Os métodos descritivos são utilizados, portanto, para organizar, resumir e descrever aspectos
importantes de um conjunto de características observadas ou comparar tais características entre
dois ou mais conjuntos.

Ao se resumir ou condensar um conjunto de dados, informacões são perdidas, visto que, não
estamos mais trabalhando com as observações originais. Entretanto, esta perda de informação
é pequena se compararmos ao ganho que se tem com a clareza da interpretação proporcionada.
Não só nos artigos técnicos direcionados para pesquisadores mas também, nos artigos de jornais
e revistas escritos para o público leigo, é cada vez mais frequente a utilização dos recursos de
descrição para complementar a apresentação de um facto, justicar ou referendar um argu-
mento.

As ferramentas descritivas são os muitos tipos de grácos e tabelas e as medidas de síntese,


como os índices e as médias.

1.1 Estatística
A Estatística originou-se da colecta de dados e construção de tabelas de dados para o governo.
A situação foi evoluindo e esta colecta de dados representa somente um dos aspectos da Esta-
tística.
Exprimindo por meio de números as observaçoes que se fazem de elementos com, pelo menos,

3 || IF - - 2018 - - Manual de BioEstatística Nelson Mulemba


uma característica comum (por exemplo: os alunos do sexo masculino de uma escola), obtemos
os chamados dados referentes a esses elementos.

Sendo assim torna-se como objectivo principal da estatística, o auxílio na tomada de decisão
ou tirar conclusões en situações de incerteza, a partir de informações numéricas.

Denição 1.1.1. A Estatística é uma parte da Matemática Aplicada que fornece métodos

para a colecta, organização, descrição, análise e interpretação de dados e para a utilização dos

mesmos na tomada de decisões.

Denição 1.1.2. Bioestatística é o conjunto de conceitos e métodos cientícos usados no

tratatmento de variabilidade nas ciências médicas e biológicas.

A Biostatística fornece métodos para se tomar decisões óptima na presença de incerteza,


estabelecendo faixas de conança para a ecácia dos tratamentos e vericando a inuência de
factores de risco no aparecimento de doenças. Dentro da área biológica, compreende-se por
Biometria a ciência que estuda as medidas de seres vivos.

A Estatística está presente em diversas áreas e em diversas abordagens. Podemos citar


alguns exemplos de suas aplicações:

• Eleições: Anúncio prévio, em termos percentuais, de que o candidato A é o provável


vencedor. (A previsão pode ser feita após a contagem de 2% dos votos);

• Indústria: Teste de lâmpadas ash ou lentes para máquinas fotográcas. O fabricante


deve saber com antecedência se o lote fabricado pode ser colocado no mercado ou não
(pois pode estar sujeito a riscos!);

• Meteorologia: Informa que a chance de chuva para hoje é de 30% (utilização de métodos
estatísticos de previsão);

• Instituições Bancárias/Crédito: Análise de crédito; seguro de vida e/ou de automóveis;

• INE/Índices: Censo; taxa de desemprego; inação; custo de vida; valor do salário mínimo,
índices de preços; taxa de mortalidade/natalidade; índices de analfabetismo, etc.

• Farmácia/Medicina: Analisar a entrada de um novo medicamento, vericando a sua


ecácia. Deve-se tomar muito cuidado com a tomada de decisão;

4 || IF - - 2018 - - Manual de BioEstatística Nelson Mulemba


• Pesquisas: Estudo sobre hábitos migratórios de certo animal; estimação do tamanho
populacional de certas espécies;

• Experimentação Agrícola: Estudos de uma nova variedade de semente (modicação ge-


nética) ou de fertilizantes;

• Telecomunicações: A utilização da Internet gera informações preciosas de clientes; controle


de tráfego telefônico, chamadas e consumo, forçam a utilização de modelos estatísticos
complexos;

• Experimentação Zootécnica: Estudo do desenvolvimento de um animal e análise de fac-


tores que inuenciam neste desenvolvimento tais como, alimentação, cativeiro e outros;
melhoramento genético; pesquisas com vacinas animais entre outros.

1.2 Divisões da Estatística


A Estatística pode ser dividida em dois ramos:

I: Estatística Descritiva: diz respeito aos métodos de recolha, apuração, apresentação e ao


resumo dos dados,os quais podem ser apresentados sob a forma numérica ou gráca.

II: Estatística indutiva ou inferencal: é o ramo da estatística cujo objectivo é fazer ar-
mações a partir de um conjunto de valores representativo (amostra) sobre um universo,
fundamentado pela teoria da probabilidade.

1.3 Método Cientíco


Muitos dos conhecimentos que temos foram obtidos na Antiguidade por acaso e, outros, por
necessidades práticas, sem aplicação de um método.
Actualmente, quase todo acréscimo do conhecimento resulta da observação e do estudo. Se bem
que muito desse conhecimento possa ter sido observado essencialmente por acaso, a verdade é
que desenvolvemos processos cientícos para seu estudo e para adquirirmos tais conhecimentos.

Denição 1.3.1. Método é um conjunto de meios dispostos convenientemente para se chegar


a um m que se deseja ou a um determinado objectivo.

Dos métodos cientícos vamos considerar os métodos:

5 || IF - - 2018 - - Manual de BioEstatística Nelson Mulemba


1.3.1 Método Experimental
O Método experimental consiste em manter contantes todas as causas (factores) menos uma,
e variar esta causa de modo que o pesquisador possa descobrir seus efeitos, caso existam. É o
método mais preferido no estudo da Física e Química, etc.

1.3.2 Método Estatístico


Muitas vezes temos necessidade de descobrir factos em um campo em que o método experi-
mental não se aplica (nas ciências sociais), já que os vários factores que afectam o fenômeno
em estudo não podem permanecer constantes enquanto fazemos variar a causa que, naquele
momento nos interessa.
Como por exemplo, podemos citar a determinação das causas que denem o preço de uma
mercadoria. Para aplicarmos o método experimental, teriamos de fazer variar a quantidade da
mercadoria e vericar se tal afecto iria inuenciar seu preço.
Porém, seria necessário que não houvesse alterações nos outros factores. Assim, deveria existir,
no momento de uma uniformidade dos salários, o gosto dos consumidores deveria permanecer
constante, seria necessária a xação do nível geral de preços das outras necessidades, etc. Mas
isso tudo é impossível. Nestes casos, cosideramos um outro método, embora mais difícil e menos
preciso, denominado método estatístico.

Denição 1.3.2. O Método estatístico, diante da impossibilidade de manter as causas cons-


tantes, admite todas essas causas presentes variando-as, registando essas variações e procurando

determinar, no resultado nal, que inuências cabem a cada uma delas.

1.4 Fases de um Método Estatístico


I: Denição do problema: Saber exactamente aquilo que se pretende pesquisar é o mesmo
que denir correctamente o problema

II: Planeamento: Nesta fase temos a considerar os procedimentos necessários para o desen-
volvimento do trabalho, ou seja, Como levantar informações? Que dados deverão ser
obtidos? Que tipo de amostragem será usada? O cronograma das actividades e os custos
envolvidos, etc.

6 || IF - - 2018 - - Manual de BioEstatística Nelson Mulemba


III: Colecta de dados: É a fase operacional, a fase que consiste em adquirir as informações
necessárias eé feita através de um questionário e boletim

IV: Apuração dos Dados: Não nada mais do que o resumo dos dados através de sua conta-
gem e agrupamento. É a condensação e tabulação de dados.

V: Apresentação dos Resultados: Por mais diversa que seja a nalidade que se tenha
em vista, os dados devem ser apresentados sob forma adequada (tabelas ou grácos),
tornando mais fácil o exame daquilo que está sendo objecto de tratamento estatístico e
posterior obtenção de medidas típicas. As duas formas de apresentação, não se excluem
mutuamente. A apresentação tabular, ou seja é uma apresentação númerica de dados
em linhas e colunas distribuídas de modo ordenado. A apresentação gráca dos dados
númericos constitui uma apresentação geométrica permitindo uma visão rápida e clara
do fenómeno.

VI: Análise dos Resultados: O último objectivo da Estatística é de tirar conclusões sobre o
todo (população) a partir de uma parte representativa do todo (amostra). Sendo assim,
concluídas as fases anteriores (Estatística Descritiva), fazemos uma análise dos resul-
tados obtidos através dos métodos da Estatística Indutiva ou Inferencial, e tiramos
desses resultados conclusões e previsões. É a etapa mais delcada e importante, está liga
ao cálculo de medidas e coecientes. Aqui temos que tirar conclusões que servirão para
auxiliar o pesquisador a resolver o seu problema. Na estatística indutiva a interpretação
dos dados se fundamentam na teoria de probabilidade.
Actualmente a empresa é uma das vigas mestras da Economia dos povos. A direcção de
qualquer tipo de empresa, exige dos seu administrador a importante tarefa de tomar de-
cisões, e o conhecimento e o uso da Estatística facilitará seu tríplice trabalho de oganizar,
dirigir e controlar a empresa.

7 || IF - - 2018 - - Manual de BioEstatística Nelson Mulemba


Capı́tulo 2
População e Amostra

2.1 População e Amostra


Denição 2.1.1. População estatística ou Universo é o conjunto (nito ou innito) de

elementos que possuem pelo menos, uma característica em comum e com interesse para o estudo.

Denição 2.1.2. População nita: é aquela população em que é possível conhecer a quanti-

dade de todos os elementos da população.

Exemplo 2.1.1. Um estudo sobre as idades dos alunos do IF.

Denição 2.1.3. População innita: é aquela população em que não é possível conhecer a

quantidade de todos os elementos da população.

Exemplo 2.1.2. Um estudo sobre espécies de pássaros que frequentam uma certa zona.

Assim, os estudantes, por exemplo, constituem uma população, pois apresentam pelo menos
uma característica em comum: estudam.
Como em qualquer estudo estatístico temos em mente pesquisar uma ou mais características
dos elementos de alguma população, esta característica deve estar bem denida. É isso que se
dá quando, considerando um elemento qualquer, podemos armar, sem ambiguidade, se esse
elemento pertence ou não à população. É necessário, pois existir um critério de constituição da
população, válido para qualquer pessoa, no tempo ou no espaço.

Na maioria das vezes, por impossibilidade ou inviabilidade econômica ou temporal, limita-


mos as observaçoões referentes a uma determinada pesquisa a apenas uma parte da população.
A essa parte proveniente da população denominamos por amostra.

8
Denição 2.1.4. Amostra é um subconjunto (parte) nito da população que é examinada

com o propósito de levarmos conclusões sobre essa população.

LEMBRAR QUE: A quantidade dos elementos da população representa-se por N e para


a amostra por n .

Exemplo 2.1.3. Medicina: Pretende-se estudar o efeito de um novo medicamento para curar

determinada doença. É seleccionado um grupo de 20 doentes, administrando-se o medicamento

a esses doentes escolhidos ao acaso, e o medicamento habitual aos restantes.

População: Conjunto de todos os doentes com a doença especíca.


Amostra: Conjunto dos 20 doentes seleccionados.

Nos casos em que o estudo é feito a toda população, denomina-se por Censo.

Denição 2.1.5. Censo ou Recenseamento: é um estudo estatístico de um universo de

pessoas, instituições ou objectos físicos com o propósito de adquirir conhecimentos, observando

todos os seus elementos, e fazer juízos quantitativos acerca de características importantes desse

universo.

Denição 2.1.6. Sondagem: é um estudo cientíco com o objectivo de melhor conhecer

atitudes , hábitos e preferências da população relativamente a aconteccircunstâncias e assuntos

de interesse comum.

Em resumo pode-se denir Recenseamento ou Censo como um estudo estatístico rea-


lizado sobre toda a população, enquanto que Sondagem é um estudo estatístico realizado a
partir de uma amostra.
Dados consistem em informações provenientes de observações, contagens, medições ou res-
postas.
Estatística é a ciência que trata da colecta, organização, análise e interpretação dos dados
para a tomada de decisões.
Uma amostra é um subconjunto ou parte de uma população.
Um parâmetro é a descrição numérica de uma característica populacional.
Uma estatística é a descrição numérica de uma característica amostral.
Estatística descritiva é o ramo da estatística que envolve a organização, o resumo e a
representação dos dados.

9 || IF - - 2018 - - Manual de BioEstatística Nelson Mulemba


Estatística inferencial é o ramo da estatística que envolve o uso de uma amostra para
chegar a conclusões sobre uma população. Uma ferramenta básica no estudo da estatística
inferencial é a probabilidade.

2.2 Amostragem
Denição 2.2.1. Amostragem: é uma técnica estatística que signica extrair uma parte da

população (amostra) com o propósito de avaliar certas características desta população.

2.2.1 Importância da Amostragem


Na realização de qualquer estudo quase nunca é possível examinar todos os elementos da po-
pulação de interesse. Temos usualmente de trabalhar com uma amostra da população. A
inferência estatística nos dá elementos para generalizar, de maneira segura, as conclusões obti-
das da amostra para a população.
As vezes é enganoso pensar que, caso tivéssemos acesso a todos os elementos da população,
seríamos mais preciosos. Os erros de colecta de dados e manuseio de um grande número de
dados são maiores do que as imprecisões a que estamos sujeitos quando generalizamos, via
inferência, as conclusões de uma amostra bem selecionada.

Portanto, quando se trata de amostra, a preocupação central é que ela seja representativa.
Assim que decidimos obter informações através de um levantamento amostral, temos imedian-
tamente dois problemas:

• Denir cuidadosamente a população de interesse;

• Selecionar a característica que iremos pesquisar.

Para que serve e quando deve ser utilizada?


São apontadas algumas razões para o uso de amostragens:

1. Economia: Quando não houver recursos sucientes para estudar toda a população, é
bem mais económico estudar uma parte dela;

10 || IF - - 2018 - - Manual de BioEstatística Nelson Mulemba


2. Tempo: Quando não houver tempo, ou existem situações que não haveria tempo su-
ciente para pesquisar toda a população, por outro lado a característica a ser estudada é
muito variável , sujeita a alteração brusca em curto período de tempo;

3. Conabilidade de dados: Pesquisar um número menor de elementos ajuda na veri-


cação de erros;

4. Operacionalidade: a condução do estudo ca bem mais fácil com menor número de
elementos pesquisados.

Um plano de amostragem deve responder às seguintes questões: quem pesquisar (unidade


de amostragem), quantos pesquisar (tamanho da amostra) e como selecionar(o procedi-
mento da amostragem).

A decisão de quem pesquisar exige que o universo seja denido de modo que uma amostra
adequada possa ser selecionada. As entrevistas realizadas com o público correcto são factores
básicos para a validade do estudo. O tamanho da amostra depende do orçamento disponível e
do grau de conança que se quer alocar aos resultados.

A decisão de utilizar amostras ou utilizar a população total está directamente ligada ao

objectivo do estudo. Ora vejamos:

Se o objectivo do estudo for:

1. Avaliar a prevalência de malária entre as 45 crianças com necessidades especiais de uma


determinada comunidade da Província de Manica.
Neste caso, podemos utilizar a população total já que o número de participantes no estudo
é menor.

2. Avaliar a prevalência de malária entre as crianças moçambicanas em um determinado ano.


Neste caso torna-se impossível utilizar a populaçào total vistto que o número de partici-
pantes no estudo muito maior.

Quando não se deve utilizar amostragem?


Existem situações em quen não se deve fazer amostragem porque o resultado do estudo precisa
ser altamente preciso como é o caso do Censo demográco realizado a cada dez anos pelo INE

11 || IF - - 2018 - - Manual de BioEstatística Nelson Mulemba


no nosso país. O parâmetro número de habitantes residentes no país é fundamental para o
planeamento de políticas de governo e deve ser avaliado com grande precisão. Por isso, se deve
pesquisar toda a população.
Também não se deve fazer amostragem quando população do estudo é pequena, pois devemos
nos lembrar que, a validade está directamente ligada ao tamanho da amostra. Amostras pe-
quenas geram dados imprecisos.

2.2.2 Tipos de Amostragens


Com a utilização de amostragem, cada elemento da população passa a ter a mesma chance de
ser escolhido, o que garante o carácter de representatividade, e isto é muito importante, pois,
como vimos, nossas conclusões relativas à população vão estar baseadas nos resultados obtidos
nas amostras dessa população.
De seguida, apresentamos dois grupos de técnicas de amostragem:

• Amostragens Probabilísticas

1. Amostragem Aleatória Simples

2. Amostragem Sistemática

3. Amostragem Estraticada (Proporcional)

4. Amostragem por Conglomerados

• Amostragens não Probabilísticas

1. Amostragem por Convêniência ou Acidental

2. Amostragem Intencional

3. Amostragem por quotas

4. Bola de Neve

Amostragens Probabilísticas
Nesse tipo de amostragem, os elementos da amostra são seleccionados aleatoriamente e todos
eles possuem probabilidade conhecida de serem escolhidos. Tal selec ção ocorre através de uma
forma de sorteio não viciado, como o sorteio em uma urna por números gerados por computa-
dor. A amostragem probabilística é objectiva , pois não né inuenciada pela pessoa que está

12 || IF - - 2018 - - Manual de BioEstatística Nelson Mulemba


a conduzir a pesquisa. Enquanto que a amostragem não probabil±tica é subjcetiva, pois
baseia-se nas decisões pessoais do pesquisador.

1: Amostragem Aleatória Simples


Este tipo de amostragem é equivalente a um sorteio de lotaria.
Todos os elementos da população tem a mesma chance de ser pertencerem a amostra. Na
prática a amostragem aleatória simples é feita unidade por unidade. As unidades da população
são numeradas de 1 a N. Em seguida escolhe-se na tábua de números aleatórios, n números
compreendidos entre 1 e N . Esse processo é equivalente a um sorteio no qual se colocam todos
os números misturados dentro de uma amostra de uma urna. As unidades correspondentes aos
números escolhidos formarão a amostra.

Exemplo 2.2.1. Vamos obter uma amostra representativa de nove alunos para a pesquisa de

altura de noventa alunos de um curso.

Temos que: N = 90 e n = 9 .

a): Numeramos os alunos de 01 a 90.

b): Escrevemos os números de 01 a 90, com pedaços iguais de um mesmo papel, colocando-os

dentro de uma caixa. Agitamos sempre a caixa para misturar bem os pedaços de papel e

retiramos um a um, nove peda


os de papel com os números que formarão a nossa amostra.

2: Amostragem Sistemática

Quando os elementos da população já se encontram ordenados, não há necessidade de construir


o sistema de refrência. São exemplos as las de consultas médicas de um hospital, bichas
de depósitos, os prédios uma rua, os carros numa avenida (engarrafamento). Nestes casos, a
seleção dos elementos que constituirão a amostra pode ser feita por um sistema imposto pelo
pesquisador. A este tipo de amostragem denominamos sistemática.
Em geral, para se obter uma amostra sistemática de n elementos de uma população de tamanho
N
N , temos que determinar a constante K que deve ser menor ou igual a . Não é possível
n
determinar K precisamente quando o tamanho da população é desconhecido, mas pode-se
supor um valor de K de tal modo que seja possível obter uma amostra de tamanho n .
N
Caso o valor de K for decimal, temos que arredondar por defeito. K ≤ .
n

13 || IF - - 2018 - - Manual de BioEstatística Nelson Mulemba


Exemplo 2.2.2. Suponhamos uma rua contendo 900 prédios dos quais desejamos obter uam

amostra formada por cinquenta prédios. Podemos, neste caso, usar o seguinte procedimento:
900
Como N = 900 e n = 50 , determinemos o valor de K , dado por K = = 18 , escolhemos
50
aleatoriamente um número de 1 a 18, o qual será o primeiro elemento sorteado da amostra, os

demais elementos serão encontrados adicionando a constante K = 18 .

Assim, se o número escolhido fosse 5, tomariamos os prédios: 5◦ prédio, 23◦ prédio, 41◦ prédio,

etc...até completarmos 50 prédios seleccionados.

3: Amostragem Estraticada (Proporcional)

Muitas vezes a população se divide em subpopulações (estratos). Como é provável que a va-
riável em estudo apresente, de estrato em estrato, um comportamento heterogêneo (diferenças)
e, dentro de cada estrato, um comportamento homogêneo.
Quando a população se divide em estratos (sub-populações), convém que o sorteio dos ele-
mentos da amostra leve em consideração tais estratos, daí obtemos os elementos da amostra
proporcional ao número de elementos desses estratos. A esolha dos elementos amostrais dos
estratos pode ser feita aleatoriamente
O número de elementos a ser seleccionado em cada estrato deve ser proporcionalmente (regra
de três simples) ao tamanho do estrato, portanto, o processo do cálculo de número de elementos
a serem extraídos em cada estrato é:
N -número de elementos da população; n -número de elementos da amostra;
N1 -número de elementos 1◦ estrato; n1 -número de elementos da amostra de N1
N2 -número de elementos 2◦ estrato; n2 -número de elementos da amostra de N2 ; etc.
Então:
N1 n1 n
= , ou seja, n1 = N1 · ;
N n N

N2 n2 n
= , ou seja, n2 = N2 · ; etc.
N n N

Exemplo 2.2.3. Supondo uma turma de 90 alunos, sendo 54 meninos e 36 meninas. Pretende-

se estudar o tempo de ocupação pelas tarefas domésticas, com uma amostra representativa de

9 elementos.

Como a variável de estudo pode apresentar muita divergência em relação ao género, pois pode-

mos supor que as meninas gastam mais tempo em relação aos meninos nas tarefas domésticas,

então é recomendável uma amostra proporcional aos dois estratos (género masculino e género

14 || IF - - 2018 - - Manual de BioEstatística Nelson Mulemba


feminino).

Temos: N = 90 , n = 9

Género Masculino N1 = 54 e Género feminino N2 = 36 .

Temos que determinar as amostras por cada estrato:


n 9
Para o género masculino: n1 = N1 · = 54 · = 5, 4 ≈ 5 meninos.
N 90
n 9
Para o género masculino: n2 = N2 · = 36 · = 3, 6 ≈ 4 meninas.
N 90
Sendo assim, a amostra será composta por 5 meninos e 4 meninas, que ao todo são 9 alunos.

4: Amostragem por Conglomerados

A população é dividida sicamente em conglomerados (grupos). A seguir seleccionam-se ale-


atoriamente os conglomerados que farão parte da amostra. Depois todos os elementos dos(s)
conglomerados(s) seleccionados serão amostras.
Na amostragem por conglomerado, ao invés de seleccionar elementos, selecciona-se um grupo
(famílias, organizações, quarteirões, etc), ou seja, a unidade a ser sorteada inicialmente é um
conglomerado o qual é formado por elementos (pessoas). De cada um desses conglomerados
observa-se todos os seus elementos.
É muito utilizada quando há necessidade de se realizar entrevistas ou observações em grandes
áreas.
Uma amostragem por conglomerado é recomendável quando:

• Não se possui uma lista contendo todos os nomes dos elementos da população;

• Existe grande heterogeneidade entre os elementos da população;

• É preciso fazer entrevistas ou observações em grandes áreas geográcas;

• O custo de obtenção dos dados cresce com o aumento da distância entre os elementos.

Exemplo 2.2.4. Num levantamento da população de determinada cidade, podemos dispor do

mapa indicando cada quarteirão e não dispor de uma relação actualizada dos seus moradores.

Pode-se, então, colher uma amostra dos quarteirões e fazer a contagem completa de todos os

que residem naqueles quarteirões sorteados.

Então, quando utilizar um processo de amostragem não probabilística?


Atenção: Não é o pesquisador que dene o tipo de amostragem a utilizar.
São os objectivos do estudo que denem: Qual será o tipo de estudo, quem será a população e

15 || IF - - 2018 - - Manual de BioEstatística Nelson Mulemba


como ela deve ser seleccionada, assim como o local, a amostra, os procedimentos, as variáveis
e o cálculo dtamanho da amostra.

Supondo-se que o objectivo da pesquisa seja:


Avaliar o uso do preservativo masculino por adolescentes no início da vida sexual, alunos do

ensino médio em escolas de uma certa província.

Quem determina a amostra a ser utilizada? O pesquisador é quem irá determinar. Para isso
deverá estar atento, a pergunta da pesquisa, ao tipo de estudo e as variáveis estudadas. Com
este conjunto de informações é que o pesquisador determinará qual o método viável de análise
estatística a ser utilizado, ou seja, tipo de amostragem, etc.

As amostras não probabilísticas são muitas vezes a opção para alguns estudos devido á sua
simplicidade ou, como acontece na maioria das vezes, não é possível uma amostra tão denida
para se obterem amostras probablísticas. Principalmente quando não é objectivo do estudo,
fazer generalização dos resultados das análises estatísticas da amostra para a população de onde
a amostra foi retirada.

LEMBRAR QUE: É preciso car claro para os pesquisadores e para os usuários da pes-
quisa que essemétodo possui inúmeras limitações, sendo inferior à amostragem probabilística em
termos de precisão de resultados. Quando utilizar o processo de amostragem não probabil±tica
LEMBRAR QUE os resultados produzidos por este tipo de pesquisa devem ser interpretados
com cuidado.
O uso de amostragem não probabilística é uma das principais escolhas por alunos que desenvol-

vem um Trabalho dem do curso, uma monograa ou uma Tese de Mestrado, etc. Geralmente

esses estudos são exploratórios e não existe a necessidade de uma amostra altamente "precis"e

também não se pretende generalizar os dados obtidos para a população.

Amostragens não Probabilísticas

1: Amostragem por Convêniência ou Acidental

Trata-se de uma amostra formada por aqueles elementos que vão aparecendo, que são possíveis
de se obter até completar o número de elementos da amostra. É o pesquisador quem dene
quais são convenientes para a pesquisa.

16 || IF - - 2018 - - Manual de BioEstatística Nelson Mulemba


É adequada e frequentemente utilizada para geração de ideias em pesquisas exploratórias. É
utilizada quando se deseja obter informações de maneira rápida e barata. Geralmente utilizada
em pesquisas de opinião, em que os entrevistados são acidentalmente escolhidos, é possível
recrutar elementos para a amostra tais como; estudantes em sala de aula, mulheres no su-
permercado, alguns amigos e vizinhos, pesquisas de opinião em praças públicas ou em ruas
movimentadas de grandes cidades, etc.
Este método não permite que o pesquisador tenha qualquer controle de representatividade da
amostra. Ele só se justica se o pesquisador estudar as características das pessoas que passam
por uma esquina em um determinado ponto ou tempo ou se outros métodos de amostragem
não forem possíveis.

2: Amostragem Intencional

Amostragem intencional é acuja selecção é baseada no conhecimento sobre a população e o


propósito do estudo. O pesquisador corre o risco de entrevistar pessoas que não estão dentro
do assunto. De acordo com determinado critério, é escolhido intencionalmente um grupo de
elementos que irão compor a amostra. O investigador se dirige intencionalmente a grupos de
elementos dos quais deseja saber a opinião.
Este técnica é muito comum em pesquisas qualitativas.

Exemplo 2.2.5. Numa pesquisa sobre preferência por determinado cosmetível, o pesquisador

se dirige a um grande salão de beleza e entrevista as pessoas que ali se encontram.

3: Amostragem por quotas

A população é dividida em vários subgrupos, na realidade é comum dividir emum grande nú-
mero para compensar a falta de aleatoriedade, e selecciona-se uma quota de cada subgrupo,
proporcional ao tamanho. Por exemplo, em uma equipa de opinião eleitoral poderíamos dividir
a população de eleitores por sexo, nível de instrução, faixas de rendas entre outros aspectos,
e obter quotas proporcionais ao tamanho dos grupos (que poderia ser obtido através das in-
formações do INE). Na amostragem por quotas os elementos da amostra são escolhidos pelos
entrevistadores (de acordo comos critérios,...),geralmente em pontos de grande movimento,o
que sempre acarreta certa subjectividade (e impede que qualquer um que não esteja passando
pelo local no exacto momento da pesquisa possa ser seleccionado). Na prática muitas pesquisas
são realizadas utilizando amostragem por quotas.

17 || IF - - 2018 - - Manual de BioEstatística Nelson Mulemba


Parece semelhante a uma amostragem estraticada proporcional, da qual se diferencia por não
empregar sorteio na selecção dos elementos.

4: Bola de Neve
Um modelo de bola de neve é apropriadamente utilizado em pesquisa quando os membros da
população são difíceis de localizar, por exemplo: imigrantes sem visto de permanência no país.
Em uma amostragem bola de neve, o pesquisador colecta dados sobre um pequeno número
de membros da população alvo quue consegue localizar e solicita a estes que o auxiliem a
providenciar o contacto com outros membros dessa população.

Exemplo 2.2.6. Se o pesquisador quer entrevistar imigrantes de um país especíco, pode iniciar
buscando por pessoas que conhece e pedindo novos contactos de conterrâneos conhecidos a estes.

Esse processo continua até que o pesquisador tenha todas as entrevistas que necessita que sejam

atingidas.

2.3 Variável e suas classicações


A cada fenómeno característica corresponde um número de respostas possíveis. Assim, por
exemplo:
Para o fenómeno  sexo, os resultados possíveis são sexo masculino e sexo feminino;
Para o fenómeno  número de lhos há um número de resultados possíveis expresso através dos
números naturais... 0; 1; 2; 3;...; n ;...

Denição 2.3.1. Variável: é a característica de interesse que é medida em cada elemento da

amostra ou população. Como o nome diz, seus valores variam de elemento para elemento. As

variáveis podem ter valores númericos ou não númericos.

De acordo com a sua natureza, as variáveis podem ser classicadas como: variável quali-
tativa ou variável
 quantitativa
 .

  N ominal
Qualitativa




  Ordinal
Variável 

  Discreta
Quantitativa




  Continua

Denição 2.3.2. Variável qualitativa: quando o resultado da observação é apresenatado na

forma de qualidade ou atributo. Esses dados não podem ser operados algebricamente: Temos

como exemplo: sexo, cor dos olhos, categoria prossional, etc

18 || IF - - 2018 - - Manual de BioEstatística Nelson Mulemba


As variáveis categoricas, por sua vez classicam-se em:
Qualitativas nominais: indicam apenas os nomes e não existe uma certa ordenção entre os

resultados obtidos. Exemplo: Sexo, Cor dos olhos, etc.


Qualitativas ordinais: quando existe uma possível ordenação nos resultados obtidos nas obser-

vações. Exemplo: Classe social (baixa, média, alta), etc. Para além dos nomes, estas variáveis
permitem a sua organização numa certa ordem, lógica e objectiva, cerscente ou decrescente.

Denição 2.3.3. Variável quantitativa: quando o resultado da observação é um número que

resulta de uma contagem ou medição. Exemplo: número de lhos, salário semanal, agregado

familiar, etc.

As variáveis numéricas, por sua vez classicam-se em:


Quantitativas discretas: características mensuráveis que podem assumir apenas um número -

nito de valores e, assim, somente fazem sentido valores inteiros não negativos. Como exemplo,
temos: número de lhos, número de alunos presentes na aula, etc.
Quantitativas contínuas: resulta normalmente de uma medição, e a escala numérica de seus

possíveis valores corresponde ao conjunto de números reais. Temos como exemplo: Tempera-
tura, preço, altura, etc.

As variáveis contínuas podem ser medidas numa escala de razões (razão/Racio) ou de


intervalos (intervalar). O que diferencia essas duas classicações é o número zero.
Na escala razão, o zero signica ausência da magnitude em causa. Exemplo: peso, altura.
Na escala intervalar, o zero signica existência e não ausência. Exemplo: Temperatura.

19 || IF - - 2018 - - Manual de BioEstatística Nelson Mulemba


Capı́tulo 3
Distribuição de Frequências

Após a colecta de informações relativamente a uma variável dispomos dos dados de uma forma
desarumada e, naturamente devemos organizá-los. Essa organização facilita a interpretação
dos dados e condensa o número de informações. Não são raras as situações onde existem vários
valores repetidos. Denominamos frequência absoluta ou simplesmente frequência ao número de
vezes que um determinado valor da variável aparece. Somos capazes de observar muito mais
facilmente esses valores ordenados se os dispusermos em uma coluna e, ao lado de cada valor
a sua respectiva frequência. Esta tabela é denominada distribuição de frequências ou dados
agrupados.

3.1 Tabelas de frequências


É um tipo de tabela que condennsa uma coleção de dados conforme as frequências. Em ou-
tras palavras, tabela de frequências é uma forma de representação da frequência de cada
valor distinto da variável. Esta poderá incluir frequências relativas, frequências acumuladas e
frequências relativas acumuladas.

Dados Brutos: é uma tabela ou relação de elementos que não foram numericamente
organizados. Nela não é fácil formarmos uma ideia exacta do comportamento do grupo como
um todo, a partir de dados não agrupados ou ordenados.

Exemplo 3.1.1. 45; 41; 42; 41; 42; 43; 44; 41; 50; 46; 50; 46; 60; 54; 52; 58; 57; 58; 60; 51

Distribuição de Frequência Simples (Sem intervalos de classe): é a simples con-


densação dos dados conforme as repetições de seus valores.

20
3.1.1 Tipos de Frequências
Frequência absoluta fi : ou simplesmente frequência de um valor é o número de vezes que
uma determinada variável assume esse valor. A sima de todas frequências é igual ao número
de observações ou seja ao número de elemetos da população ou amostra. Em outras palavras

X
fi = n.

Frequência relativa fr é a razão (resultado da divisão) entre a frequência absoluta e o número


total de observações, ou seja
fi fi
fr = ou f r = P
n fi
(arrendodar a 3 casas decimas se necessário) e a soma de todas frequências relativas da distri-
buição deve ser igual a 1. Ou seja,
X
fr = 1.

De modo a facilitar a comparação de grupos diferentes, a frequência relativa na maioria das


vezes é expresso em percentagem ( % ).

A Frequência relativa percentual f r% obtem-se multiplicando a frequência relativa por


100. Ou, seja
X
f r(%) = fr × 100 e fr % = 100%.

Frequência acumulada de um valor: (usada para variável quantitativas ou qualitativa


ordinal), é a soma das frequências dos valores menores ou iguais ao referido valor, ou por outra, é
o número de vezes que uma dada resposta duma variável assume um valor inferior ou igual a esse
valor. Em outras palavras, é a soma das frequências de cada valor com as frequências de todos
os valores anteriores. Podem ser tanto das frequências absolutas (fi ) , como das frequências
relativas (fr ) ou (fr (%)) . Representaremos por Fi para Frequencia absoluta acumulada e Fr
ou Fr % para Frequência relativa ou percentual, respectivamente.

Exemplo 3.1.2. Considere a seguinte amostra que resultou na observação da variável "Cor

dos Olhos"em 20 estudantes da turma de Gestão Financeira e Bancária: Castanho, Preto,

Castanho, Azul, Castanho, Castanho, Preto, Castanho, Verde, Castanho, Preto, Castanho,

Azul, Castanho, Castanho, Preto, Preto, Castanho, Preto, Preto.

21 || IF - - 2018 - - Manual de BioEstatística Nelson Mulemba


A informação acima pode ser resumida na tabela de frequências:
Cor dos Olhos fi fr fr % Freq. absoluta acumulada (Fi %) Freq. relativa acumulada (Fr %)
Azul 2 0.1 10 2 10
Castanho 10 0.5 50 12 60
Preto 7 0.35 35 19 95
Verde 1 0.05 5 20 100
Total 20 1 100  

Exemplo 3.1.3. Perguntou-se aos estudantes da turma de Contabilidade-Noite quantos lhos

tinham. Obtiveram-se as seguintes respostas:


1 2 3 3 2 4 2 3 7 0
3 2 6 4 2 2 1 2 0 2

As respostas são os dados observados de umavariável estatística, número de lhos por cada
estudante, e não estão agrupados. Olhando para eles será difícil tirar conclusões.
Os valores que a variável estatística assumiu durante o inquérito são: 0, 1, 2, 3, 4, 6, 7.
Pode-se representar a tabela dos resultados obtidos, fazendo a contagem. Passará se a ter os
dados agrupados a partir dos avalores que a variável estatística pode assumir:
Números de lhos por estudante (Xi ) Número de estudantes (fi )
0 2
1 2
2 8
3 4
4 2
6 1
7 1
Total n=20
Em contrapartida com os dados recolhidos com esta tabela já se podem tirar algumas con-
clusões , como por exemplo, que a maioria dos estudantes inquiridos têm dois lhos.
No entanto, se acrescentar á atabela anterior duas colunas, uma com a frequência relativa fr
e a outra a frequência relativa percentual fr % , pode-se tirar mais conclusões e comparar os
resultados com estudos semelhantes em outras populações, ou seja, a frequência relativa do
valor de (3 lhos) é 0.2, que é o mesmo que dizer 20%. Isto quer dizer que, em cada 100 alunos,
20 têm lhos.

22 || IF - - 2018 - - Manual de BioEstatística Nelson Mulemba


Xi fi fr fr %
0 2 0.1 10
1 2 0.1 10
2 8 0.4 40
3 4 0.2 20
4 2 0.1 10
6 1 0.05 5
7 1 0.05 5
Total n=20
P P
fr = 1 f r% = 100
Se a tabela incidisse sobre um grande número de dados seria útil acrescentar mais duas colunas
à tabela para apresentar as frequências acumuladas, ou melhor:

Xi fi Fi fr fr % Fr %
0 2 2 0.1 10 10
1 2 4 0.1 10 20
2 8 12 0.4 40 60
3 4 16 0.2 20 80
4 2 18 0.1 10 90
6 1 19 0.05 5 95
7 1 20 0.05 5 100
Total n=20  
P P
fr = 1 f r% = 100

3.1.2 Tabelas de Frequências em Intervalos de Classes


Quando os dados do conjunto apresentada variáveis qantitativas contínuas, existe uma neces-
sidade de organizar os dados originais em uma distribuição de frequências na qual os valores
agrupados são agrupados em classe de valores.
As tabelas de frequências em classes são tabelas frequentemente usadas para resumir um con-
junto de dados de natureza contínuos ou discretos com valores muito distintos.

Elementos de uma distribuição de frequências em classe


Quando o tamanho da amostra é elevado, é mais racional efetuar o agrupamento dos valores
em vários intervalos de classe.

23 || IF - - 2018 - - Manual de BioEstatística Nelson Mulemba


i Classes Frequência
1 41 ` 45 7
2 45 ` 49 3
3 49 ` 53 4
4 53 ` 57 1
5 57 ` 61 5
Total 20

Classe- são os intervalos de variação da variável e é simbolizada por i e o número total de


classes simbolizada por K .

Exemplo 3.1.4. Na tabela anterior K = 5 e 49 ` 53 é a 3a classe, onde i = 3.

Limites de classe: são os extremos de cada classe. O menor número é o limite inferior de
classe (Li ) e o maior número, limite superior de classe (Ls ) .

Exemplo 3.1.5. Em 49 ` 53 , temos que Li = 49 e Ls = 53 . O símbolo ` representa um

intervalo fechado à esquerda e aberto á direita. O dado 53 da distribuição não pertence a 3a

classe e sim a 4a classe representada por 53 ` 57.

Ponto médio da classe (xp ) : é o ponto que divide o intervalo de classe em duas partes
Li + Ls
iguais. É denido pela expressão xp = .
2

Exemplo 3.1.6. Em 49 ` 53 , o ponto médio é xp = 49+53


2
= 51 .

Portanto, para a construção de uma distribuição de frequência por intervalo de classe, é


necessário o seguinte procedimento:

Primeiro Passo: Identicar o valor máximo ( Xmax ) e valor mínimo (Xmin ) para determinar
a Amplitude Total (At ) : onde At = Xmax − Xmin .


Segundo Passo: Determinar o número de classes ou intervalos (K) : K ∼
= n (aproximação
em excesso), onde n é o número de observações e deve ser maior ou igual a 30. Para n
menor que 30 podemos adoptar como K = 5 .

At
Terceiro Passo: Determinar a amplitude da classe (a) : a ∼
= (aproximação em excesso).
K
Em princípio a amplitude da classe deve ser igual em todas classes.

24 || IF - - 2018 - - Manual de BioEstatística Nelson Mulemba


Quarto Passo: Temos então o menor valor da amostra (Xmin ) , o número de classes (K) e
a amplitude do intervalo (a) . Podemos montar a tabela, O limite inferior da primeira
classe é o Xmin e o limite superior para a primeira classe é o resultado da soma do Xmin
e amplitude (a) . Para as classes seguintes, o limite inferior é o limite superior da classe
anterior.

Quinto Passo: Fazer a contagem (senecessário) e preencher a respectiva frequência para cada
classe, determinando o seu ponto médio (xp ) pois este representa a classe.

Sexto Passo: A determinação do tamanho e das quantidades de classes deve obedecer as


seguintes condições:

1. Todos os dados devem ser abrangidos na contagem sem repetir;

2. Não deve existir classe com frequência nula, caso existir deve ser eliminada;

3. Cada dado ou valor deve ser enquadrado em apenas uma classe.

4. O número de classes de um modo geral, não deve ser menor que 5 ou maior que 25.

Exemplo 3.1.7. Os seguintes dados referem-se aos gastos totais (em dólar) em bebidas e

petiscos consumidos por 36 grupos dem um domingo no Campo da Costa do Sol durante o Jogo

Costa do Sol vs Textáfrica de Chimoio.


5 21 26 13 14 29 12 31 5 47 18 33

23 22 37 32 7 17 15 38 20 11 26 25

27 8 24 12 39 28 9 47 19 22 42 18
Representemos os dados em uma tabela de frequência em classe.

Nos dados apresentados temos que o valor máximo é Xmax = 47 e o valor mínimo é
Xmin = 5 .
Determinando a Amplitude total, tem-se que: At = Xmax − Xmin = 47 − 5 = 42.

Número de classes (K) , é dado por K ∼ = n , pode-se notar que trata-se de dados relacionados

a 36 observações logo n = 36 . Então K ∼ = 36 = 6.
At 42
Amplitude da classe (a) : a = = = 7. Agora vamos fazer a tabela de frequência com 6
K 6
classes a amplitude de classe a = 7 .

25 || IF - - 2018 - - Manual de BioEstatística Nelson Mulemba


i Classe fi xp Fi fr f r%
1 5 ` 12 6 8.5 6 0.167 16.7
2 12 ` 19 8 15.5 14 0.222 22.2
3 19 ` 26 8 22.5 22 0.222 22.2
4 26 ` 33 7 29.5 29 0.194 19.4
5 33 ` 40 4 36.5 33 0.111 11.1
6 40 ` |47 3 43.5 36 0.083 8.3
 Total 36   1 100

Onde xp é o ponto médio de cada classe.

26 || IF - - 2018 - - Manual de BioEstatística Nelson Mulemba


Capı́tulo 4
Medidas de Posição de Dados

O tratamento e interpretação torna-se difícil para quem pretende colocar uma informação como
um todo, razão pela qual costuma-se calcular algumas medidas que resumidamente traduzem
as importantes características das distribuições de frequências.
O estudo que zemos sobre distribuições de frequências, até agora, permite-nos descrever, de
um modo geral, os grupos de valores que uma variável pode assumir. Dessa forma, podemos
localizar a maior concentração de valores de uma dada distribuição, isto é, se ela se localiza
no início, no meio ou no nal, ou ainda, se há distribuição por igual.
porém, para ressaltar as tendências características de cada distribuição, isoladamente, ou
em confronto com outras, necessitamos introduzir coneitos que se expressem através de números,
que nos premitam traduzir essas tendências. Esses conceitos denominam-se elementos típicos
da distribuição, que são:

• Medidas de posição • Medidas de assimetria

• Medidas de dispersão ou variabilidade • Medidas de curtose

As Medidas de posição tem como objectivo descrever um conjunto de dados de forma or-
ganizada e compacta que possibilita a visualização do conjunto estudado por meio de suas
estatísticas, o que não signica que estes cálculos e conclusões possam ser levados para a po-
pulação.
As medidas de posição mais usadas são as medidas de tendência central, que recebem tal
denomição pelo facto de os dados observados tenderem, em geral, a se agrupar em torno dos
valores centrais tenderem. Dentre as medidas de tendência central, destacamos:

27
• Média aritmética ou simplesmente Média • Moda

• Mediana

As outras medidas de posição, são as separatrizes, que englobam:

• Mediana • Decis

• Quartis • Percentis ou Centis

4.1 Medidas de tendência central


Uma medida de tendência central de um conjunto de dados mostra o valor em torno do qual
se agrupam as observações. Dentre as medidas de tendência central as mais importantes são:
média, mediana e moda.

4.1.1 Média (X)


Representa o centro de gravidade da distribuição da variável, sendo obtida por meio da soma
de todos os valores observados dividida pelo número de observações. A sua aplicação requer
uma variável quantitativa. As variações nos valores centrais afectam muito pouco o seu valor,
porém é muito inuenciado pelos valores extremos da variável.
Em um conjunto de dados, podemos denir vários tipos de média. Porém em nosso estudo
iremos nos limitar à mais usada e universal: a média aritmética ou simplesmente média.
A média aritmética (X) é obtida pela divisão da soma de todos os valores observados pelo
número de observações. A fórmula de cálculo é dada por:
P
Xi
X= . (4.1)
n

Exemplo 4.1.1. Sabendo que a produção diária de leite de uma vaca, durante uma semana foi

de 10; 14; 13; 15; 16; 18; e 12 litros.

Então, para a produção média semanal (n = 7) temos:

10 + 14 + 13 + 15 + 16 + 18 + 12 98
X= = = 14.
7 7

Nota: A média tanto como outras medidas de tendência central encontram-se sempre entre o
Xmin e Xmax , ou seja não deve ser menor que Xmin nem maior que Xmax .

28 || IF - - 2018 - - Manual de BioEstatística Nelson Mulemba


A média é a principal medida de tendência central. Algumas das razões para que seja a medida
de posição mais recomendada são:

• É denida rigorosamente, ou seja sempre existe e pode ser interpretada sem ambiguidades;

• Leva em consideração toas as observações efectuadas;

• Calcula-se com facilidade.

Entretanto, esta medida leva consigo alguns inconvenientes como o facto de ser muito sensível
a valores extremos, isto é a valores excessivamente menores ou excessivamente maiores em
relação às demais observações do conjunto de dados. Por exemplo: Se estivermos interessados
em conhecer o salário médio dos funcionários de uma certa empresa com cinco funcionários e
obtivermos o seguinte conjunto de dados, em meticais:
1.230; 1.450; 2.100; 2.250; 25.000;
Podemos observar quatro dos cinco funcionários recebem entre 1.230 e 2.250 meticais e um
deles (talvez o Director) recebe 25.000 , porém calculando o salário médio:

1.230 + 1.450 + 2.100 + 2.250 + 25.000 32.030


X= = = 6.406 meticais.
5 5

Pode-se concluir que em média cada funcionário dessa empresa recebe 6.0406 meticais, o que
difere-se tanto aos demais valores do conjunto, isso pela inuência do salário 25.000 meticais
que puxou o salário médio para cima.

Média para Dados Agrupados

Podemos observar que a fórmula da média dada na equação (4.1) apenas é válida para dados
brutos ou não agrupados.
Consideremos a distribuição relacionada a 34 famílias, tomando como variável o número de
lhos por família:
Número de lhos 0 1 2 3 4
Número de famílias 2 6 10 12 4
Neste caso, como as frequências são números que indicam repetições de cada valor da variável,
elas funcionam como factores de repetições, o que nos leva a calcular a média ponderada ou
média para dados agrupados, dada pela seguinte fórmula:
P
(Xi · fi )
X= (4.2)
n

29 || IF - - 2018 - - Manual de BioEstatística Nelson Mulemba


O modo mais prático e recomendável de obter a média em dados agrupados consiste em adici-
onar na tabela, uma coluna correspondente aos produtos Xi · fi . Para a tabela relacionada a
númerode lhos por família, temos:

Exemplo 4.1.2.

N ◦ de lhos (Xi ) N ◦ de famílias (fi ) Xi · f i


0 2 0
1 6 6
2 10 20
3 12 36
4 4 16
Total 34 78

Pela tabela, temos que: (Xi · fi ) = 78 , n = 34 .


P

Logo, a média será dada por


P
(Xi · fi ) 78
X= = = 2, 294...
n 34

Isto é X = 2.294 ∼
= 2.3 , como iremos interpretar o resultado de 2 lhos e 3 décimos de lhos?
Caso isso aconteça é recomendável o arredondamento da medida em questão para um valor
discreto, ou seja X = 2, 294... ∼
= 2. O que signica que em média cada família tem dois lhos.

Média para Dados em Classe


Neste caso, consideramos que os pontos médios são os valores que melhor representam cada
classe, ou seja, que todos os valores incluídos em um determinado intervalo de classe coincidem
com o seu ponto médio, e determinamos a média por meio da fórmula:
P
(xp · f i)
X= , (4.3)
n

onde xp é o ponto médio de cada classe.

Exemplo 4.1.3. Os seguintes dados referem-se aos gastos totais (em dólar) em bebidas e

petiscos consumidos por 36 grupos dem um domingo no Campo da Costa do Sol durante o Jogo

Costa do Sol vs Textáfrica de Chimoio.

30 || IF - - 2018 - - Manual de BioEstatística Nelson Mulemba


i Gastos N ◦ de Grupos (fi )
1 5 ` 12 6
2 12 ` 19 8
3 19 ` 26 8
4 26 ` 33 7
5 33 ` 40 4
6 40 ` |47 3
 Total 36

Pela mesma razão do caso anterior de dados agrupados, vamos adicionar uma coluna dos pontos
médios e outra para os produtos xp · fi

i Gastos fi xp xp · f i
1 5 ` 12 6 8.5 51
2 12 ` 19 8 15.5 124
3 19 ` 26 8 22.5 180
4 26 ` 33 7 29.5 206.5
5 33 ` 40 4 36.5 146
6 40 ` |47 3 43.5 130.5
 Total 36  838

Como, neste caso: (xp · fi ) = 838 e n = 36 , então a média


P

P
(xp · fi ) 838
X= = = 23, 278.
n 36

Podemos interpretar este resultado como sendo o gasto médio por grupo foi de 23 doláres e 28
centavos, ou seja, 23, 278 dolares

4.1.2 Moda (M0)


O termo Moda (valor frequente de um conjunto) foi introduzido por Karl Pearon em 1895 e
originou-se talvez na maneira de se falar tal coisa está na moda, tal coisa é mais frequente.

Portanto dene-se Moda como sendo o valor da variável que ocorre com maior frequência.
Desse modo, o salário modal dos empregados de uma fábrica é o salário mais comum, isto é, o
salário recebido pelo maior número de empregados dessa fábrica.

31 || IF - - 2018 - - Manual de BioEstatística Nelson Mulemba


Da mesma maneira, podemos armar que a cor modal das camisas dos estudantes do Insti-
tuto Foco é vermelho ou a cor mais frequente nas camisas dos estudantes do Instituto Foco é
vermelho.

A moda é uma das medidas de tendência central das mais simples, sendo aplicável a qualquer
variável, seja quantitativa ou qualitativa. A moda pode não existir, e mesmo que exista, pode
não ser única. Assim, um conjunto de dados ou uma distribuição de frequência pode ter várias
modas. De acordo com as frequências de cada valor observado, é possível que um conjunto de
dados seja:

• Amodal: quando não possui nenhum valor modal;

• Unimodal: quando possui uma única moda;

• Bimodal: quando possui duas modas para o conjunto;

• Trimodal: quando possui três modas para o conjunto;

• Multimodal: quando possui muitas modas.

Moda para Dados brutos ou não Agrupados


Quando lidamos com dados não agrupados, a moda é facilmente reconhecida, de acordo com a
denição, procurar a observação da variável que aparece mais repetida.

Exemplo 4.1.4. O conjuntoo dos dados:

12; 9; 7; 8; 10; 10; 10; 11; 12; 13; 15

tem moda igual a 10 .

Podemos, entretanto, encontrar conjunto de dados, nas quais não exista observação modal:

Exemplo 4.1.5. A: {10; 12; 21; 17; 32} , não existe moda. A distribuição é amodal

B: {5; 2; 2; 5; 7; 7} , não existe moda. A distribuição é amodal

C: {azul; verde; azul; azul; vermelho; preto; preto; vermelho; verde; vermelho; cinzento; verde}.

Existêm três modas, a distibuição é trimodal, onde M01 = azul , M02 = vermelho e

M03 = verde .

32 || IF - - 2018 - - Manual de BioEstatística Nelson Mulemba


Moda para Dados Agrupados
Uma vez agrupados os dados, é possível determinar imediatamente a moda: basta xar a
observação da variável de maior frequência.

Exemplo 4.1.6.

N ◦ de lhos (Xi ) N ◦ de famílias (fi )


0 2
1 6
2 10
3 12
4 4
Total 34

Através da tabela podemos observar que a maior frquência é 12 que corresponde a observação
 3  logo M0 = 3 ou seja, a maioria das famílias têm 3 lhos.

Moda para Dados em Classe


Nas distribuições de frequências em classe, não temos o valor que se repete e sim a classe que
possui a maior frequência. Nestas condições, é dita classe modal, que é a classe com maior
frequência.

Quando temos dados agrupados em classe, a moda é calculada por aproximação, começando
por localizar a classe modal (aquela que tiver maior frequência absoluta).

Existêm várias fórmulas para determinar a moda. De entre elas, para nosso estudo iremos
usar a fórmula de Czuber, que é uma das alternativas para calcular o valor da moda com apro-
ximação.
neste processo considera-se a inuência, sobre a classe modal, das frequências das classes adja-
centes (vizinhas), anterior e superior, assim como da frequência da classe modal.

fimo − fia
M0 = Li + · a, (4.4)
2fimo − (fia + fip )

onde

• Li - Limite inferior da classe modal;

33 || IF - - 2018 - - Manual de BioEstatística Nelson Mulemba


• fimo - frequência absoluta da classe modal;

• fia - frequência absoluta anterior à classe modal;

• fip - frequência absoluta posterior à classe modal;

• a - amplitude da classe modal.

Nota: A moda deve percenter a classe modal, ou seja Li ≤ M0 < Ls , onde Li e Ls são os
limites inferior e superior da classe modal, respectivamente.

Exemplo 4.1.7. Consideremos a tabela seguinte referente as distâncias percorridas diaria-

mente em km , por estudantes do IF:

Determine a Moda.

i Classes (Km) xp fi
1 10 ` 20 15 10

2 20 ` 30 25 20

3 30 ` 40 35 35

4 40`50 45 40
5 50 ` 60 55 25

6 60 ` 70 65 15

7 70 ` 80 75 5

 Total  150

Resolução:
Pela tabela, podemos notar que a classe com maior frequência é 4a classe, isto é, a classe modal
é de 40 ` 50 , onde Li = 40 ; fimo = 40 ; fia = 35 ; fip = 25 ; a = 10 . Usando a fórmula dada na
equação (4.4), de moda para dados em classes, temos que:

fimo − fia 40 − 35 5 5 50
M0 = Li + ·a = 40+ ·10 = 40+ ·10 = 40+ ·10 = 40+
2fimo − (fia + fip ) 2 · 40 − (35 + 35) 80 − 60 20 20

M0 = 40 + 2, 5 = 42, 5.

Sendo assim, podemos interpretar M0 = 42, 5 como: A maioria dos estudantes do IF percerro-
rem diariamente 42, 5km .

34 || IF - - 2018 - - Manual de BioEstatística Nelson Mulemba


4.1.3 Mediana (M ed)
Mediana é outra medida de posição denida como o número que se encontra no centro de
um conjunto de dados, quando estes estão disposto seguindo uma ordem ( crescente ou decres-
cente). Em outras palavras, a mediana de um conjunto de valores, ordenados segundo a sua
ordem de grandeza, é o valor situado de tal forma que separa o conjunto em dois subconjuntos
de mesmo número de elementos.

Exemplo 4.1.8. Dado o conjunto de valores, como por exemplo: 5 13 10 2 18 15 6 16 9


De acordo com a denição da mediana, o primeiro passo a ser dado é o da ordenação (cres-
cente ou decrescente) dos valores:
2 5 6 9 10 13 15 16 18
Em seguida tomamos aquele valor que separa a mesma quantidade de elementos á direita e á
esquerda. Em nosso exemplo, esse valor é 10. Já que no conjunto temos 4 elementos tanto á
esquerda como á direita.
Temos, então que: Med = 10 .

Se porém, o conjunto tiver um número par de elementos, a mediana será a média aritmética
dos dois valores centrais.

Exemplo 4.1.9. O conjunto de valores (já ordenado crescentemente)

2 6 7 10 12 13 18 21
Tem para a mediana a média aritmética de 10 e 12.
10+12 22
Med = 2
= 2
= 11.

Conhecendo o número de elementos do nosso conjunto de observações é possível determinar


a posição da mediana do conjunto ordenado.
Se o conjunto de observações tiver n elementos, então a posição da mediana determina-se pela
fórmula a seguir:

 X n+1 ,
( 2 ) se n f or ímpar;
Med = X( n ) +X( n +1) (4.5)
 2
2
2
, se n f or par.
Exemplo 4.1.10. Os dados que se seguem representam as percentagens do valor total de 15

credores do Minllenium Bim que retornaram ao banco durante 3 trimestres.

32.2 29.5 29.9 32.4 30.1 32.1 35.2 10.0 20.6 28.6 30.5 38.0 33.0 29.4 37.1

35 || IF - - 2018 - - Manual de BioEstatística Nelson Mulemba


Para localizar o valor mediano, primeiro, vamos ordenar os dados em ordem crescente. Como
o n é ímpar (n = 15) , a posição em que se encontra o valor mediano será:
X( n+1 ) = X( 15+1 ) = X( 16 ) = X8 , portanto o valor mediano está na posição 8, vejamos:
2 2 2

1◦ 2◦ 3◦ 4◦ 5◦ 6◦ 7◦ 8◦ 9◦ 10◦ 11◦ 12◦ 13◦ 14◦ 15◦


10.0 20.6 28.6 29.4 29.5 29.9 30.1 30.5 32.1 32.2 32.4 33 35.2 37.2 38.0

Assim, a mediana é 30.5. Isto signica que 50% das pessoas (ou a metade) pagaram menos
de 30.5% do valor que receberam quanto pediram empréstimo e outra metade (das pessoas)
devoveram igual ou maior que 30.5% do total.

Mediana para Dados Agrupados

Se os dados se agrupam em uma distribuição de frequências, o cálculo da mediana se processa


de modo muito semelhante áquele de dados não agrupados, implicando, a prévia determinação
de frequências acumuladas. Neste caso, é bastante determinar a posição da mediana usando a
fórmula (4.5) e de seguida achar o valor mediano com aux
'ilio da Frequência acumulada (que indica a posição) encontrando a frequência (no Fi ) igual ou
superior a posição da mediana.

Exemplo 4.1.11. Consideremos o seguinte exemplo, relacionado ao número de irmãos da

turma de Jornalismo do IF com 34 estudantes:

Xi fi Fi
0 2 2

1 6 8

2 10 18

3 12 30

4 4 34

Total 34 

Temos que, n = 34 (par) então n


2
= 34
2
= 17 . Na frequência acumulada procuramos as
observações que ocupam as posições 17a e 18a posição.
A mediana será dada por Med = X17 +X18
2
= 2+2
2
= 2.
Sendo assim o valor mediano é de 2 irmãos.

36 || IF - - 2018 - - Manual de BioEstatística Nelson Mulemba


Mediana para Dados em Classe
Neste caso, o problema consiste em determinar o intervalo em que encontra-se contida a medi-
ana. Para tal, temos que determinar a classe mediana, tal classe será aquela que apresentara
frequência acumulada imediatamente igual ou superior a n
2
.
De seguida, determinar a mediana, usando a fórmula:
n
− Fia
Med = Li + 2
· a, (4.6)
fi
onde:
n
2
-identicador da classe mediana (na Fi )

Li -Limite inferior da classe mediana

Fia -Frequência absoluta anterior á classe mediana

fi -frequência absoluta da classe mediana

a -amplitude da classe mediana

Exemplo 4.1.12. Consideremos a tabela seguinte referente as distâncias percorridas diaria-

mente em km , por estudantes do IF:

Determine a Mediana.

i Classes (Km) xp fi Fi
1 10 ` 20 15 10 10

2 20 ` 30 25 20 30

3 30 ` 40 35 35 65

4 40 ` 50 45 40 105

5 50 ` 60 55 25 130

6 60 ` 70 65 15 145

7 70 ` 80 75 5 150

 Total  150
n 150
Antes determinemos o identicador da classe mediana. Temos que n = 150 , então = = 75.
2 2
Na coluna de frequência absoluta acumulada é possível notar que a posição pertence a 4a classe
(classe mediana).
Outros dados referentes a classe mediana são: Li = 40; Fia = 65; fi = 40 e a = 10 . Então:
n
2
− Fia 75 − 65 10 100
Med = Li + · a = 40 + · 10 = 40 + · 10 = 40 + = 40 + 2.5 = 42.5.
fi 40 40 40

37 || IF - - 2018 - - Manual de BioEstatística Nelson Mulemba


Interpretação: 50% dos estudantes do IF percorrem diariamente abaixo ou igual a 42.5km, ou
também podemos dizer que"
50% dos estudantes do IF percorrem diariamente acima ou igual a 42.5km.

38 || IF - - 2018 - - Manual de BioEstatística Nelson Mulemba


Capı́tulo 5
Medidas de localização e de assimetria

Além das medidas de posição que estudamos, há outras que, consideradas individualmente, não
são medidas de tendência central, mas estão ligadas à mediana relativamente à sua característica
de separar o conjunto em duas partes que apresentam o mesmo número de valores.

5.1 Medidas de localização ou separatrizes


Denição 5.1.1. Separatrizes: são números que dividem um conjunto ordenado de dados

em partes que contêm a mesma quantidade de elementos do conjunto.

Desta forma, a mediana que divide o conjunto ordenado em dois grupos, cada um deles
contendo 50% dos valores do conjunto, é também uma medida separatriz. Além da mediana,
as outras medidas separatrizes são: Quartis (Qi ) , Decis (Di ) e Percentis (Pi ) .

Como foi referido anteriormente, para além das medidas de tendência central, os quartis,
decis e percentis são outras medidas conhecidas por separatrizes utilizados como medidas de
posição.

5.1.1 Quartis (Qi)


Denição 5.1.2. Quartis: são medidas númericas que dividem o conjunto de dados ou dis-

tribuições de frequências em 4(quatro) partes iguais.

Assim, o primeiro quartil, que é indicado por Q1 , separa o conjunto ordenado deixando
25% de seus valores abaixo (ou à esquerda) e 75% dos seus valores acima (ou a direita.)
O segundo quartil, que é indicado por Q2 , separa o conjunto ordenado deixando 50% dos seus

39
valores abaixo e 50% dos seus valores acima.
O terceiro quartil Q3 obedece a mesma regra dos anteriores, ísto é, um valor tal que 75% das
observações são menores e 25% são maiores que este.

5.1.2 Decis (Di)


Denição 5.1.3. Decis: são separactrizes que dividem as observações em 10 (dez) partes

iguais.

Assim, o primeiro decil, indicado por D1 , separa o conjunto ordenado deixando 10% dos
seus valores abaixo e 90% dos seus valores acima. De modo análogo são denidos e interpretados
os outros decis.
Nos decis, a distribuição é dividida em 10 partes iguais (D1 ; D2 ; D3 ; · · · ; D9 ) .

5.1.3 Percentis (Pi)


Denição 5.1.4. Percentis: são separactrizes que dividem as observações em 100 (cem)

partes iguais.

Assim, o primeiro percentil, indicado por P1 , separa o conjunto ordenado deixando 1% dos
seus valores abaixo e 99% dos seus valores acima.
Nos percentis, a distribuição é dividida em 100 partes iguais (P1 ; P2 ; P3 ; · · · ; P99 ) .
P1 : é o primeiro percentil, corresponde à separação do primeiro 1% de elementos do conjunto.
P50 : é o quinquagésimo percentil, coincide com a mediana (P50 = D5 = Q2 ) .

5.1.4 Procedimentos para determinar separatrizes


A determinação de separatrizes requerer o conhecimento de como determinar a mediana, ou
seja, é análogo.

Primeiro: Determinar a o posição p da separatriz:

Tanto para variáveis discretas ou contínuas, ou seja, para dados agrupados ou em classes, o
procedimento para determinar a posição da separatriz é feito usando a fórmula:
n


 · i, Qi onde i = 1; 2; 3
 4


n·i
p= , Di onde i = 1; 2; · · · ; 9
 10
 n · i,

Pi onde i = 1; 2; · · · ; 99


100

40 || IF - - 2018 - - Manual de BioEstatística Nelson Mulemba


Segundo: Determinar a separatriz no conjunto de dados ordenados ou agrupados

Para Dados agrupados simples

O Quartil Qi , o Decil Di e o Percentil Pi de ordem i numa distribuição ordenada de dados, é


determinado por:


 X[p] , se p for decimal;
Qi ; Di ; Pi =
 Xp + Xp+1 , se p não for decimal.
2

, onde [p] representa aproximação em excesso.

Para Dados agrupados em Classe

O Quartil Qi , o Decil Di e o Percentil Pi de ordem i numa distribuição ordenada de dados, é


determinado por:
p − Fia
Qi ; Di ; Pi = Li + ·a
fi

, onde:

• p é a posição do quantil;

• Li é o limite inferior da classe quantílica;

• Fia é a frequência absoluta acumulada anterior à classequantílica;

• fi é a frequência absoluta à classe quantílica;

• a é a amplitude da classe quantílica.

Exemplo 5.1.1. Consideremos a tabela seguinte referente as distâncias percorridas diaria-

mente em km , por estudantes do IF:

Determine Quartil 3 e interprete.

41 || IF - - 2018 - - Manual de BioEstatística Nelson Mulemba


i Classes (Km) xp fi Fi
1 10 ` 20 15 10 10

2 20 ` 30 25 20 30

3 30 ` 40 35 35 65

4 40 ` 50 45 40 105

5 50 ` 60 55 25 130

6 60 ` 70 65 15 145

7 70 ` 80 75 5 150

 Total  150

Antes determinemos a posição p da classe quantílica. Temos que n = 150 , e por ser Q3 i = 3 ,
n 150
então p · i = · 3 = 112, 5.
4 4
Na coluna de frequência absoluta acumulada é possível notar que a posição pertence a 5a classe
(classe quantílica).
Outros dados referentes a classe quantílica são: Li = 50; Fia = 105; fi = 25 e a = 10 . Então:

p − Fia 112, 5 − 105 7.5 75


Q3 = Li + · a = 50 + · 10 = 50 + · 10 = 50 + = 50 + 3 = 53.
fi 25 25 25

Interpretação: 75% dos estudantes do IF percorrem diariamente abaixo ou igual a 53km, ou


também podemos dizer que"
25% dos estudantes do IF percorrem diariamente acima ou igual a 53km.

5.2 Medidas de Assimetria


Agora trataremos que são as medidas de assimetria. Elas referem-se à forma da curva de uma
distribuição de frequência, mais especicamente do polígono de frequência ou do histograma.

Denição 5.2.1. Medidas de assimetria: é o grau de afastamento de uma distribuição da

unidade de simetria.

Destacamos que as distribuições de frequências não diferem apenas quanto ao valor médio
e a variabilidade, como também quanto a sua forma.

42 || IF - - 2018 - - Manual de BioEstatística Nelson Mulemba


5.2.1 Tipos de curvas
Simétrica
Quando a média, mediana e a moda são iguais, isto é, apresentam o mesmo valor, ou seja,
X = Me = Mo .

Assimetria Positiva
Neste caso, a média aritmética apresentará um valor maior do que a mediana, e esta, por sua
vez, apresentará um valor maior do que a moda.
Em outras palavras, Mo < Me < X .
Nas distribuições assimétricas á direita, h'a uma predomin
ncia de valores superiores a moda.

Assimetria Negativa
Neste caso a média aritmética ser'a menor do que a mediana, e esta, por sua vez, é menor do
que a moda.
Nas distribuições assimétricas negativas, predominam valores inferiores á moda.

43 || IF - - 2018 - - Manual de BioEstatística Nelson Mulemba


Capı́tulo 6
Medidas de Dispersão ou de Variabilidade

Nas aulas anteriores, vimos que um conjunto de observações pode ser sintetizado ou resumido,
por meios de procedimentos matemáticos, em poucos representativos: (medidas de tendência
central) a média, moda e mediana. Tais valores podem servir de comparação para dar a posição
de qualquer elemento do conjunto. A análise de um conjunto de observações com base numa
medida de tendência central não nos fornece informaç oes sucientes para o conjunto de valores.

Por vezes não é suciente usar apenas uma das medidas de posição para caracterizar perfei-
tamente um conjunto de valores , pois, mesmo sabendo, por exemplo, que a temperatura média
entre duas cidades (Por exemplo: Chimoio e Lichinga) é a mesma, e igual a 24◦ C , ainda somos
levados a pensar a respeito do clima dessas cidades. Em uma delas a temperatura poderá variar
em limites de muito calor e de muito frio e haver, ainda, uma temperatura média de 24◦ C . A
outra poderá ter uma variação pequena de temperatura, mas mantendo uma média de 24◦ C .

Consideremos os seguintes conjuntos de valores referentes a avaliações de três estudantes


(E1, E2 e E3) :

E1: 15; 15; 15; 15; 15 E2: 13; 14; 15; 16; 17 E3: 7; 12; 17; 19; 20

Calculando a média aritmética de cada um dos estudantes, obtemos:


P
Xi 15 + 15 + 15 + 15 + 15 75
E1: X = = = = 15
n 5 5
P
Xi 13 + 14 + 15 + 16 + 17 75
E2: X = = = = 15
n 5 5
P
Xi 7 + 12 + 17 + 19 + 20 75
E3: X = = = = 15
n 5 5

44
Vemos, então, que os três estudantes apresentam a mesma média aritmética de 15valores. En-
tranto, é fácil notar que o Estudante E1 é o mais homogêneo que os estudantes E2 e E3, já que
todos os valores são iguais a média. O estudante E2, por sua vez, é mais homogêneo que o estu-
dante E3, pois há menor diversicação entre cada um de seus valores e a média é representativa.

Vemos, então que a média ainda que considerada como um número de que tema facili-
dade de representar um conjunto de observações, não pode, por si mesma, destacar o grau de
homogenidade ou heterogeneidade que existem entre os valores que compoem um conjunto.
A análise de um conjunto de observações com base numa medida de tendência central não
nos fornece informações sucientes para o conjunto de dados. Em outras palavras, as medidas
de tendência central são úteis em identicar um valor típico numa distribuição de frequência,
porém, estes não apresentam a disparidade existentes na distribuição.
Portanto, as medidas de dispersão são utilizadas para avaliar o grau de variabilidade ou de
dispersão dos valores da distribuição em torno da média. Estas medidas permitem estabelecer
comparações entre fenômenos de mesma natureza ou de natureza distinta e, em geral, essa
disparidade(variabilidade) é observada em torno de uma medida de tendência central (média).

Chamamos de dispersão ou de variabilidade a maior ou menor diversicação dos valores de


uma váriavel em torno deum valor de tendência central,tomando como ponto de comparação.
Assim podemos dizer que o estudante E1 apresenta dispersão ou variabilidade nula e que o
estudante E2 apresenta variabilidade menor que do estudante E3.

• Entre duas amostras com a mesma média, será mais representativa aquela que apresentar
menor dispersão.

Portanto, para qualicar os valores de uma dada variável , ressaltando a maior ou menor
dispersão ou variabilidade entre esses valores e a sua medida de posição, a Estatística recorre ás
medidasde dispersão ou de variabilidade. Dessas medidas, serão descritas: Amplitude total,
Variância, Desvio padrão e Coeciente de variação de Pearson.

6.1 Amplitude Total ( At )


A amplitude total de um conjunto de observações é a diferença entre o maior e o menor valor
da distribuição. Para calcular basta subtrair o maior valor ( Xmax ) pelo menor valor ( Xmin ).

45 || IF - - 2018 - - Manual de BioEstatística Nelson Mulemba


At = Xmax − Xmin .
Quanto maor for a a amplitude total de um conjuto de dados, maior é a dispersão ou variabi-
lidade dos valores.

Exemplo 6.1.1. Consideremos as notas do Estudante E3 dadas por: 7; 12; 17; 19; 20.

At = 20 − 7 = 13 .

Se os dados (já) estiverem dispostos em uma tabela de frequências,com os valores agrupados


em classes, aamplitude total pode ser dada por:
At = ponto médio da última classe-ponto médio da primeira classe.

6.1.1 Restrições ao uso da Amplitude Total


A aplitude total éa mais simples medida de dispersão, há uma forte restrição ao seu uso em
virtude de sua grande instabilidade, uma vez que ela leva em conta apenas os valores extremos
do conjunto de observações. Vejamos o seguinte caso:

Conjunto de observações Média Ampitude Total At


A: 10; 12; 13; 15; 20; 25; 45 x = 20 At = 35
B: 17; 18; 19; 20; 21; 22; 23 x = 20 At = 6

A média aritmética de cada um desses conjuntos é igual a 20. Portanto , no que diz respeito a
uma medida de posição, ambos os conjuntos podem ser considerados idênticos. Ao calcularmos
a amolitude total, vericamos que as observações do conjunto A apresentam maior dispersão.
Todavia, no cálculo da amplitude não são considerados os valores do conjunto que se encon-
tram entre os extremos,o que poderia conduxir o analista a interpretações equivocadas. Muitas
vezes,um valor particularmente anormal poderá afectar de maneira acentuada a medida. Ocon-
junto A, por exemplo, apresenta o último valor (45) sensivelmente distante do penúltimo (25),
facto que talvez tenha provocado uma amplitude total de (35) magnitude.

6.2 Variância ( S 2 )
Como vimos que a amplitude é uma medida que se deixa inuenciar pelos valores extremos,
que em grande maioria são devidos ao acaso.

46 || IF - - 2018 - - Manual de BioEstatística Nelson Mulemba


A variância é uma medida que leva em consideração valores extremos e os valores interme-
diários, isto é expressa melhor os resultados obtidos. A variância relaciona os desvios em torno
da média.

Quanto menor é a variância, mais próximos os valores estão da média, mas quanto maior
for a variância, mais os valores estão distantes da média.

A variância amostral é denida como:


(xi − x)2
P
2
• S = , para dados brutos;
n−1
[(xi − x)2 · fi ]
P
2
• S = , para dados agrupados;
n−1
[(xp − x)2 · fi ]
P
2
• S = , para dados em classes;
n−1
onde: x é a média amostral, xi é cada elemento do conjunto de observações, xp é o ponto
médio e n é o número total das observações.
(xi − µ)2
P
Quando se trabalha com toda população, a variância populacional é dada por: σ =2
,
N
onde µ é a média populacional e N é o tamanho da população.
Observação: É mais comum na estatística trabalhar com a amostra e não com a população.
Neste caso o denominador do cálculo da variância amostral passa a ser (n − 1) em vez de n .

6.3 Desvio Padrão (S)


A amplitude total é uma medida instável, pois se deixa inuenciar pelos valores, que são, na
sua maioria, devido aom acaso. O desvio-padrão e a variância são medidas que fogem essa
falha, pois levam em consideração a totalidade dos valores da varíavel em estudo, o que faz com
que estes serem considerados índices de variabilidade bastante estáveis e, por isso, são os mais
geralmente usados ou empregados.

O desvio-padrão é uma das medidas de variação mais utilizadas de um conjunto de obser-


vações. A vantagem que apresenta sobre a variância é de permitir uma interpretação directa
da variação do conjunto de dados, pois o desvio padrão é expresso na mesma unidade que a
variável em estudo (kg, cm, ◦ C, atm, · · · ).

47 || IF - - 2018 - - Manual de BioEstatística Nelson Mulemba


Assim, podemos denir o desvio-padrão como uma medida da magnitude do espalhamento
ou dispersão dos dados em relação á medida do conjunto.
A expressão para o cálculo do desvio-padrão amostral (S) é:
rP
(xi − x)2
• S= , para dados brutos;
n−1
rP
[(xi − x)2 · fi ]
• S= , para dados agrupados;
n−1
rP
[(xp − x)2 · fi ]
• S= , para dados em classes;
n−1

Observação: Podemos denir o desvio-padrão como sendo a raiz quadrada da variância



S = S2 .

6.4 Coeciente de Variação de Pearson (Cv)


O desvio-padrão por si só não revela muita coisa. Assim, um desvio padrão pode ser considerado
pequeno para uma média e para outra é extremamente grande. Por exemplo, um desvio-padrão
de 40 pode ser considerado pequeno para uma média de 350, entretanto, se a média for 4, este
se torna muito grande.

Quando precisamos comparar duas ou mais conjuntos de valores quanto à sua dispersão e
variabilidade e esses conjuntoos estão expressos em natureza diferentes ou em grandezas difren-
tes é preciso dispor de outra medida. Para contornar essas diculdades e limitações, podemos
caracterizar a dispersão ou variabilidade dos dados de maneira relativa ao seu valor médio.
Essa medida que mede o grau de concentração dos valores em torno da média é denominada
de Coeciente de variação.

Coeciente de variação é uma medida relativa para estimar a precisão de experimentos e


representa o desvio-padrão expresso como percentagem da média. Sua principal qualidade é a
capacidade de comparação de distribuições diferentes, portanto, o coeciente de variação pode
ser útil para se comparar a variabilidade de diferentes conjuntos de dados em duas situações:

1. Médias muito diferentes, mas provenientes de uma mesma variável

2. Comparar a homogeneidade de variáveis diferentes

48 || IF - - 2018 - - Manual de BioEstatística Nelson Mulemba


O coeciente de variação (Cv) é denido por:
S
Cv = desvio padrao
media
× 100 ou Cv = × 100
x

O uso do coeciente de variação é usualmente recomendável para variáveis quantitativas


do tipo razão, tais como (altura, peso, etc) e se a variável for quantitativa do tipo intervalar
(temperatura), o Cv pode assumir valores negativos devido a média que pode ser negativa (isso
diculta a interpretação).

O coeciente de variação pode ser interpretado das seguintes maneiras:

• Cv ≤ 20% trata-se de distribuição homogênea

• Cv > 20% trata-se de distribuição heterogênea.

Por outro lado, podemos considerar os seguintes casos também:

• Cv ≤ 15% trata-se distribuição com uma dispersão fraca;

• 15% < Cv ≤ 30% trata-se distribuição com uma dispersão média ou moderada;

• Cv > 30% trata-se de uma dispersão alta

Em todo caso, mquanto maior for o valor do coeciente de variação, maior é a dispersão dos
valores do conjunto e quanto menor é o coeciente de variação, mais homogêneo é a distribuição.

Exemplo 6.4.1. Considere os dados da tabela abaixo e determine: amplitude total, variância,

desvio-padrão e coeciente de variação.

xi fi xi · f i (xi − x)2 (xi − x)2 · fi


17 3 51 3,386 10,157
18 18 324 0,706 12,701
19 17 323 0,026 0,435
20 8 160 1,346 10,765
21 4 84 4,666 18,662
Total ( 50 942  52,72
P
)

Amplitude total
P At = Xmax − Xmin = 21 − 17 = 4
(xi · fi ) 942
Média: x = = = 18, 84
n 50

49 || IF - - 2018 - - Manual de BioEstatística Nelson Mulemba


[(xi − x)2 · fi ]
P
52, 72 52, 72
Variância: S =
2
= = = 1, 0759
rnP−1 50 − 1 r 49 r
[(xi − x)2 · fi ] 52, 72 52, 72 p
Desvio-padrão: S = = = = 1, 0759 = 1, 04
n−1 50 − 1 49
S 1, 04
Coeciente de variação de Pearson: Cv = × 100 = × 100 = 5, 52% , logo a distribuição
x 18, 84
tem dispersão fraca porque é menor que 15%

Exemplo 6.4.2. Considera os dados na tabela, calcule o desvio-padrão da distribuição de

frequências do consumo de energia (Kwh)

Consumo (Kwh) Número de úsuarios (fi ) xp xp · f i (xp − x)2 · fi


5 ` 25 4 15 60 16641,0
25 ` 45 6 35 210 11881,5
45 ` 65 14 55 770 8403,5
65 ` 85 26 75 1950 526,5
85 ` 105 14 95 1330 3363,5
105 ` 125 8 115 920 10082,0
125 ` 145 6 135 810 18481,5
145 ` 165 2 155 310 11400,5
Total ( ) 80  6360 80780
P

P
(xp · fi ) 6360
A média aritmética calculada anteriormente foi: x = = = 79, 5
rP r rn 80
[(xp − x)2 · fi ] 80780 80780 p
Desvio-padrão: S = = = = 1022, 53 = 31, 98
n−1 80 − 1 79
Então S = 31, 98 . O desvio padrão do consumo de energia elétrica é 31, 98Kwh .

50 || IF - - 2018 - - Manual de BioEstatística Nelson Mulemba


Só para relaxar

1. As principais fases do método estatístico são:

(a) colecta de dados, amostragem, apresentação tabular, representação gráca e deni-


ção do problema

(b) amostragem, apresentação tabular, apuração dos resultados, interpretação de dados


e planeamento

(c) denição do problema, planeamento, colecta de dados, apuração, apresentação dos


resultados, análise e interpretação de dados

(d) colecta de dados, apuração de dados, análise e interpretação de dados, apresentação


de dados

2. População ou Universo é:

(a) Conjunto de pessoas

(b) Conjunto de indivíduos que apresentam características especiais.

(c) Conjunto de elementos que apresentam uma característica comum.

(d) Subconjunto conável para um estudo qualquer.

3. Qual é a diferença entre um Bioestatística e uma Estatística?

4. Quais são as duas ramicações principais da estatística?

5. Como uma amostra é relacionada a uma população?

6. Qual é a diferença entre um parâmetro e uma estatística?

7. Das armaçoes abaixo, indique as verdadeiras (V) ou as falsas (F):

51
(a) Uma estatística é um valor numérico que descreve uma característica da população;

(b) Uma amostra é um subconjunto de uma população;

(c) É impossível para o INE obter todos os dados censitários sobre a população moçam-
bicana;

(d) A estatística inferencial envolve o uso de uma população para chegar a conclusões
sobre a amostra correspondente;

8. Para as situações descritas a seguir, identique a população e a amostra correspondente:

(a) Para vericar a audiência de um programa de TV em Maputo, indivíduos foram


entrevistados com relação ao canal em que estavam sintonizados;

(b) Para coletar informação sobre os salários iniciais de empresas listadas entre as 500
ações mais importantes do mercado nanceiro levantadas pela KPMG, um pesqui-
sador abordou 65 das 500 empresas.

(c) A m de avaliar a intenção de voto para presidente do Moçambique, pessoas foram


entrevistadas em cidades moçambicanas;

(d) Uma pesquisa com 500 espectadores em um estádio com 42.000 espectadores;

(e) Para saber as intenções de voto dos portugueses nas eleições passadas, uma empresa
entrevistou 2.000 cidadãos representativos da população portuguesa com mais de 18
anos;

(f) Uma pesquisa com 496 estudantes da Faculdade de Economia descobriu que 10%
planejavam viajar para fora do país durante o recesso escolar.

(g) Avaliou-se os níveis de colesterol de 20 pacientes em um hospital com 100 pacientes;

(h) Um estudo sobre o tempo gasto, em segundos, por 100 atletas na corrida dos 400
metros obstáculos, registou-se o tempo gasto por 16 desses atletas;

(i) Uma pesquisa com 2018 alunos do ensino médio descobriu que eles dedicam uma
média de 7 horas e 38 minutos por dia usando mídias de entretenimento.

(j) Desejando-se saber a hora a que se deitam e que se levantam os alunos do IF,
realizou-se um estudo em que participaram 250 alunos, de entre os 1.000 alunos do
IF;

(k) Uma pesquisa com 961 consumidores que adquiriram eletrodomésticos descobriu que
23% contrataram a garantia estendida.

52 || IF - - 2018 - - Manual de BioEstatística Nelson Mulemba


9. Determine se o valor numérico é um parâmetro ou uma estatística. Explique seu raciocínio

(a) O salário médio anual para 35 dos 1.200 Gestores das empresas é de 31.000, 0mt ;

(b) Uma pesquisa com 514 membros do conselho dos institutos descobriu que 38% acham
que o ensino médio tem custo justo relativamente ao seu valor;

(c) Sessenta e dois dos 97 passageiros a bordo da aeronave Boeing sobreviveram á sua
explosão.

(d) Em uma pesquisa com 300 usuários de computador, 8% disseram que seus compu-
tadores tinham mau funcionamento e requeriam reparos técnicos.

(e) Em um ano recente, a nota média de Estatística para todos os graduandos no IF era
14.5.

10. Uma pesquisa educacional procura determinar a ecácia de um novo método de alfabe-
tização de adultos. Terminado o período de ensino, o rendimento é medido através dos
resultados obtidos pelos alunos na leitura de um texto

(a) Descreva a população de interesse

(b) Deve-se usar amostragem neste caso? Por quê?

11. Identique qual destes tipos de amostragem é usado: aleatória simples, sistemática, es-
traticada, por conglomerados ou por conveniência e indicando a população e amostra

(a) Notícias de televisão- Um repórter de noticiário da STV analisa a reação a uma


história impressionante entrevistando pessoas que passam em frente ao seu estúdio

(b) Seleção de Júri- O comissário de jurados de Condado de Dutches obtêm uma lista
de 42.763 proprietários de carros e obtêm um conjunto de jurados seleccionando cada
centésimo nome da lista

(c) Pesquisa de carro- Uma pesquisadora da Ronil-Auto dividiu todos os carros re-
gistados em categorias de subcompacto, compacto, médio, intermédio e grande. Ele
está pesquisando 200 proprietários de carro de cada categoria

(d) Bebida entre estudantes- Movido pelo facto de um estudante ter morrido por
excesso de bebida, o IF fez um estudo do hábito de bebida dos estudantes, selecci-
onando aleatoriamente 5 turmas diferentes e entrevistando todos os estudantes em
cada uma dessas turmas

53 || IF - - 2018 - - Manual de BioEstatística Nelson Mulemba


(e) Pesquisa de Boca da Urna- Uma rede de notícias está planejando uma pesquisa na
qual 100 seções eleitorias serão seleccionadas e todos os eleitores serão entrevistados
ao deixarem o local

(f) Educação e Sálario- Um economista está estudando o efeito da educação sobre o


salário e realiza uma pesquisa com 150 trabalhadores seleccionados aleatoriamente
de cada uma das seguintes categorias: menos do que Ensino Médio, Ensino Médio,
mais do que Ensino Médio

(g) Pesquisa de TV- Um especialista de Marketing para a TVM está planejando uma
pesquisa na qual 500 pessoas serão seleccionadas aleatoriamente de cada faixa etária
de 10-19, 20-29, e assim por diante

(h) Um jornal escreve, em cartões separados, o nome de cada um dos seus 250 deputados
da Assembleia da República, mistura-os e extrai 10 deles para uma entrevista sobre
a situação político-militar no país

(i) Um médico entrevista todos os pacientes de leucemia internados em 20 hospitais


seleccionados por sorteio com igual chance dentre todos os hospitais de um país

(j) A empresa 2M selecciona cada 200◦ garrafa de cerveja acabada de ser enchida numa
linha de produção entre 14 ás 16 horas de um dia para fazer teste de qualidade

(k) Um entrevistador entrevista cada 10◦ eleitor que deixa uma mesa de voto de uma
cidade entre as 8 e 17 horas de um dia de eleições

(l) Ao escalar um júri um tribunal de justiça decidiu seleccionar aleatoriamente 4 pessoas


brancas, 3 morenas e 4 negras

(m) Um delegado eleitoral escreve o nome de cada deputado de Moçambique, em cartões


separados, mistura e extrai 17 nomes

(n) Um administrador hospitalar faz uma pesquisa com as pessoas que estão na la de
espera para serem atendidas pelo Sistema Nacional de Saúde, entrevistando uma a
cada 15 pessoas na la

12. Suponha que no IF existem 250 estudantes, sendo 100 no 1◦ período, 70 no 2◦ e 80 no 3◦


período. Pretende-se extrair uma amostra de 40 estudantes. Qual método de amostragem
seria ideal para extração do 40 elementos?

13. Uma Faculdade abriga 124 estudantes. Sugira uma técnica de amostragem e obtenha
uma amostra representativa correspondendo a 15% da população

54 || IF - - 2018 - - Manual de BioEstatística Nelson Mulemba


14. O director geral do IF, na qual estão matriculados 280 meninos e 320 meninas, desejoso de
conhecer as condições de vida extra-escolar dos seus estudantes e não dispondo de tempo
para entrevistar todas as famílias, resolveu fazer um levantamento, por amostragem, em
10% desses estudantes. Como estudante de estatística, obtenha para o director, o número
de elementos que compõem a amostra

15. Uma população encontra-se dividada em três estratos, com tamanhos, respectivamente:
N1 = 40, N2 = 100, e N3 = 60 . Sabendo que, ao ser realizada uma amostragem
estraticada proporcional, nove elementos da amostra foram do 3◦ estrato, determine o
n◦ total de elementos da amostra

16. Uma cidade possui N=200 zonas eleitorais. Uma empresa destinada a fazer pesquisa
eleitoral vai seleccionar aleatoriamente n = 15 zonas e entrevistar todos os elementos que
estão dentro dessas zonas eleitorais. Qual é a técnica de amostragem que vai ser usada?

17. Numa turma com N = 36 elementos, deseja-se retirar uma amostra de 5 elementos para
vericar uma característica de interesse, utilizando a técnica de amostragem sistemática
para retirar essa amostra quais os números dos alunos sorteados

18. Suponha duas amostras colhidas de uma mesma população, sendo que uma de tamanho
100 e outra de tamanho 200. Então, não há dúvida de que a amostra de tamanho maior
é mais representativa da população, certo? Porquê?

19. Se uma população se encontra dividida em quatro estratos, com tamanhos N1 = 90 ,


N2 = 120 , N3 = 60 e N4 = 480 e temos possibilidade de retirar no total 100 amostras,
quantas amostras devem ser retiradas de cada estrato?

20. Suponha que existem 1000 chas de pacientes das quais uma amostra aleatória de 20 deve
ser seleccionada. Determine que chas devem ser escolhidas na amostra de tamanho 20.
Diga que tipo de amostragem foi feito e como foram seleccionadas as chas

21. Para cada um dos estudos seguintes, justique a utilização de uma amostra

(a) Testar a eciência de um novo medicamento para a malária

(b) Estabelecer o conteúdo mineral da água potável fornecida pela empresa XYZ na
cidade de Maputo

(c) Estimar a taxa de desemprego em Moçambique

55 || IF - - 2018 - - Manual de BioEstatística Nelson Mulemba


(d) Vericar a qualidade da água da Praia da Costa de Sol

(e) Parece que o único modo de eliminar os erros amostrais consiste em estudar toda
população em vez de uma amostra. No entanto, muitas indústrias e os governos
continuam a utilizar amostras. Porquê?

22. Para pesquisar o Desporto preferido dos estudantes de uma escola com 1.500 estudantes,
foram seleccionados, de modo imparcial, 900 estudantes. Com base nessas informações,
responda

(a) Quantas pessoas tem a população dessa pesquisa?

(b) A amostra dessa pesquisa é formada de quantas pessoas?

23. Classique as variáveis abaixo, em níveis de mensuração

(a) Número de computadores em um laboratório de informática;

(b) Grau de escolaridade;

(c) Peso de grãos exportados;

(d) Grau de satisfação com um produto alimentício;

(e) A cor da pele de pessoas (ex: branca, negra, amarela);

(f) O número de consultas médicas feitas por ano por um associado de certo plano de
saúde;

(g) O teor de gordura, medido em gramas por 24 horas, nas fezes de crianças de 1 a 3
anos de idade;

(h) Temperatura corporal;

(i) Salário de um prossional de saúde;

(j) O tipo de droga que os participantes de certo estudo tomaram;

(k) Sexo;

(l) Tempo que passa a ver televisão;

(m) Distância de casa ao hospital;

(n) Local de nascimento;

(o) Altura de um homem em cm ;

56 || IF - - 2018 - - Manual de BioEstatística Nelson Mulemba


24. Das variáveis seguintes diga quais são discretas e quais são contínuas:

(a) Número de nascimentos por dia;

(b) A pressão intra-ocular, medida em mmHg, em pessoas;

(c) Duração de um noticiário;

(d) Temperatura da água do mar;

(e) Número de pontos obtidos num jogo de basquetbol;

25. Determine quais das seguintes variáveis são quantitativas ou qualitativas. Para as variá-
veis quantitativas diga se são contínuas ou discretas

(a) Número de telefone

(b) Tipo de telefone

(c) Número de chamadas por mês

(d) Duração da chamada mais longa de cada semana

(e) Cor do telefone da Neida Pinto

(f) Conta telefônica mensal

26. Classique as variáveis abaixo como Qualitativa (nominal ou ordinal) Quantitativa (dis-
creta ou contínua (razão/racio ou intervalar))

(a) Marca de carros (i) Largura da cabeça

(b) Cor dos olhos (j) Altura dos homens casados


(c) Idade de alunos do curso de Gestão
(k) Peso da Lola Sadia
(d) Números de lhos dos residentes de T3
(l) Número de carros de cada PCA
(e) Códigos de endereço postal
(m) Número de mulheres no HCM
(f) Número de NUIT

(g) Estado civil dos estudantes do IF (n) Marca de cerveja de Moçambique

(h) Comprimento da cabeça (o) Atitude do Professor N. Mulemba

27. Os itens a seguir aparecem em uma cha de emprego. Determine o nível de mensuração
dos dados.

57 || IF - - 2018 - - Manual de BioEstatística Nelson Mulemba


(a) Graduação máxima atingida (c) Ano de graduação universitária

(b) Gênero (d) Número de anos no último emprego

28. Pretende-se realizar de um estudo sobre os hábitos de fumar dos jovens Moçambicanos
do ensino médio.

(a) Identique a população e a amostra.

(b) Na elaboração do questionário como é que formularia a questão sobre o consumo de


tabaco, de forma a obter uma variável medida numa escala:

i. Nominal ii. Ordinal iii. Quantitativa

29. Numa creche Don' Orio questionaram as crianças com mais de 3 anos relativamente ao
tipo preferido de bebidas. Das 160 crianças inquiridas, 30 indicaram o leite como a bebida
preferida, 10 referiram água, 40 disseram os sumos naturais e 80 referiram os refrigerantes.

(a) Dena e classique a variável em estudo.

(b) Construa a tabela de frequências.

(c) Qual é a frequência absoluta de crianças que preferem água?

(d) Qual é a frequência relativa de crianças que preferem refrigerantes?

(e) Represente gracamente a informação anterior.

30. Numa aula teórica de Bioestatística perguntou-se aos 50 alunos presentes quantos livros
ligados a saúde leram durante as férias, tendo-se obtido os seguintes resultados: 1 aluno
leu 4 livros, 8 leram 3 livros, 27 leram 2 livros, 12 leram apenas 1 livros e os restantes
alunos não leram qualquer livro.

(a) Identique a variável em estudo

(b) Construa a tabela de frequências

(c) Represente gracamente a informação anterior.

31. Os dados abaixo foram registados em vinte pacientes que foram submetidos a determinado
tratamento tendo-se vericado que melhoraram depois de terem alguns dias.
5, 2, 1, 3, 2, 3, 4, 5, 3, 1, 3, 2, 6, 4, 5, 6, 1, 3, 3, 12.

(a) Dena e classique a variável em estudo

58 || IF - - 2018 - - Manual de BioEstatística Nelson Mulemba


(b) Disponha os dados numa tabela frequências

(c) Faça a representação gráca das frequências absolutas

(d) Interprete o valor obtido para uma frequência relativa

32. Apresente as tabelas e grácos de frequências para os seguintes casos:

(a) Teste de Paladar: Conjunto de dados: pontuações de 1 (mais baixa) a 10 (mais


alta) dadas por 24 pessoas após testar o sabor de um novo refrigerante:
5 7 4 5 7 8 10 6
9 5 7 6 8 2 9 7
8 1 3 10 8 8 7 9
(b) Anos de serviço: Conjunto de dados: Anos de serviço de 26 soldados Quartel
General:
12 7 9 8 9 8 12 10 9
10 6 8 13 12 10 11 7 14
12 9 8 10 9 11 13 8
(c) Gasto com livros: Quantias (em dólares) gastas em livros por um semestre:
91 471 279 249 530 376 188 341 266 199
142 273 189 130 489 266 248 101 375 486
190 398 188 269 43 30 127 354 84

33. O QUE FARIAS? Você trabalha em um banco e deve recomendar a quantia de dinheiro
que será colocada em uma ATM a cada dia. Você não quer colocar dinheiro em excesso
(por segurança) ou pouco dinheiro (por problemas com clientes). As quantias retiradas
diariamente (em milhares de meticais) em um período de 30 dias são mostradas a seguir:
72 84 61 76 104 76 87 92 80 88
98 76 97 82 84 67 70 81 82 89
74 73 86 81 85 78 82 80 91 83

(a) Construa um histograma de frequência relativa para os dados. Use 8 classes.

(b) Se você colocar 90.000mt na ATM a cada dia, qual é a percentagem de dias em um
mês que você espera car sem dinheiro? Explique.

(c) Se você está disposto a car sem dinheiro em 10% dos dias, quanto dinheiro você
deveria colocar na ATM a cada dia? Explique.

34. Considerando o conjunto dos dados

59 || IF - - 2018 - - Manual de BioEstatística Nelson Mulemba


(a) 3, 5, 2, 6, 5, 9, 5, 2, 8, 6

(b) 20, 9, 7, 2, 12, 7, 20, 15, 7

(c) 51, 6, 48, 7, 50, 3, 49, 5, 48, 9

(d) 15, 18, 20, 13, 10, 16, 14

Calcule a média, mediana e moda em cada alínea

35. Os seguintes dados de 45 alunos, foram obtidos no 1◦ Teste duma turma do Saúde Pública
6 3 5 7 5 7 7 5 6 7
6 6 7 4 5 7 5 4 6 6
6 3 5 7 5 7 7 5 6 7
4 4 4 4 3 4 3 7 3 3
6 3 6 5 6

(a) Elabore uma tabela de distribuição de frequências

(b) Calcule as frequências absolutas, relativas

(c) Calcule a média, moda e mediana

(d) Calcular o 7◦ decil e o 80◦ percentil

(e) Qual é a nota máxima dos 25% com a nota mínima?

(f) Qual a nota mínima dos 25% com a nota máxima?

(g) Determine as notas mínima e máxima dos 50% com notas centrais

36. Considerando a distribuição abaixo: Calcule a média, mediana, a moda e o desvio padrão

Xi 3 4 5 6 7 8
fi 4 8 11 10 8 3

37. As notas de um candidato em seis provas de um concurso foram 8.4, 9.1, 7.2, 6.8, 8.7 e
7.2
Determine a nota média, a nota mediana, a nota modal, a variância e o desvio padrão

38. Em uma turma de 50 alunos, as notas obtidas formaram a seguinte distribuição:

(a) Calcule a nota média, nota modal, nota mediana

60 || IF - - 2018 - - Manual de BioEstatística Nelson Mulemba


Notas 2 3 4 5 6 7 8 9 10
No de alunos 1 3 6 10 13 8 5 3 1

(b) Determinar o 1◦ , 2◦ , 3◦ quartil, 5◦ decil e o 50◦ percentil

39. Uma amostra de 68 enfermeiros mostrou os seguintes anos de serviço:


6 17 33 13 30 32 25 19 18 17
39 25 11 23 5 19 10 7 8 5
18 22 18 11 17 8 17 16 15 12
7 16 9 15 6 14 4 10 6 30
14 7 13 32 12 29 12 13 11 26
2 10 25 11 22 37 24 24 21
8 19 9 14 4 27 11 9 10

(a) Construir a tabela de frequências

(b) Calcular as frequências simples e acumuladas

(c) Apresente o histograma da distribuição de frequências

(d) Determine as medidas de tendência central

(e) Determine a percentagem dos enfermeiros com mais 17 anos de experiência

(f) Determine o ano mínimo dos 33% com mais anos de experiência

40. Considere os dados abaixo, faça um agrupamento em classes e construa uma tabela de
frequências.
4, 1 9, 8 5, 8 6, 1 6, 7 7, 0 7, 0 7, 5 7, 5 7, 5
7, 7 8, 2 8, 8 9, 0 9, 0 9, 1 9, 1 9, 1 9, 2 9, 2
9, 2 9, 2 9, 4 9, 4 9, 7 9, 8 10, 0 10, 0 10, 2 10, 2
10, 3 10, 6 10, 6 10, 8 10, 9 10, 9 11, 6 11, 7 11, 8 11, 8
11, 8 12, 0 12, 2 12, 2 12, 3 12, 5 12, 6 12, 7 8, 3 9, 4
11, 0 14, 0 8, 5 9, 5 11, 1 14, 2 8, 7 9, 5 11, 1 14, 8

(a) Calcule a média, moda e mediana

(b) Calcular o 3◦ quartil e o 60◦ percentil

(c) Determine o coeciente de variação

(d) Classique a distribuição quanto a assimetria

61 || IF - - 2018 - - Manual de BioEstatística Nelson Mulemba


41. Retire a informção do gráco em tabela

42. Numa turma de um determinado ano estão matriculados 40 alunos. O levantamento das
chas biométricas revelou as seguintes estatuturas em centímetros
161 152 157 172 152 161 158 168 155 154
167 151 148 161 157 170 165 153 155 159
170 151 156 175 157 163 168 155 160 162
153 155 165 160 158 159 163 165 157 165

(a) Calcule o número de alunos com altura igual ou superior a 160 cm

(b) Determine a percentagem de alunos com pelo menos 160 cm de altura

(c) Determine a altura média, altura modal e altura mediana

(d) Encontre a percentagem de alunos com altura menor que 164 cm

(e) Represente o histograma referente a esta distribuição

43. A tabela abaixo, mostra a distribuição de frequências dos salários mensais, em meticais,
de 65 funcionários de uma do Ministério da Saúde. Determine:

(a) O limite inferior de sexta classe;

(b) O limite superior da quarta classe;

(c) O ponto médio da terceira classe;

(d) Os limites reais da quinta classe;

(e) A amplitude do quinto intervalo da classe;

62 || IF - - 2018 - - Manual de BioEstatística Nelson Mulemba


(f) A frequência da terceira classe;

(g) A frequência relativa da terceira classe;

(h) O intervalo da classe com maior frequência

(i) A percentagem dos funcionários que ganham menos de 8.000, 00 meticais mensais

(j) A percentagem dos funcionários que ganham menos que 10.000, 00 e pelo menos
6.000, 00 mensais

Salários Funcionários
5.000`6.000 8
6.000`7.000 10
7.000`8.000 16
8.000`9.000 14
9.000`10.000 10
10.000`11.000 5
11.000`a12.000 2
Total 65

44. Obtenha a distribuição de frequências dos dados abaixo, que representam a quantidade
de autocarros estacionados no parque da HCM, durante o mês passado. Determinando a
mediana, moda e o desvio padrão.
14 12 11 13 14 13 12 14
12 14 10 13 15 11 15 13
13 14 11 12 16 17 14 14

45. Abaixo está apresentada a distribuição de frequências dos pesos de uma amostra de 79
alunos

63 || IF - - 2018 - - Manual de BioEstatística Nelson Mulemba


Peso kg Frequência
40|-45 4
45|-50 10
50|-55 15
55|-60 21
60|-65 16
65|-70 8
70|-75 5

(a) Calcule as frequências em falta

(b) Determine o peso médio, variância e desvio padrão

(c) Determine peso modal e mediano

(d) Determine o peso mínimo dos 50% com pesos máximo

(e) Apresente um gráco da distribuição a sua escolha

46. O quadro seguinte representa as alturas (em cm) de 40 alunos de uma classe:
162 163 166 176 175 169 172 170 162 168
164 165 169 163 157 155 154 171 166 164
170 157 148 152 165 157 163 158 172 178
160 158 159 166 170 164 165 150 158 165

(a) Calcular a amplitude total

(b) Adimitindo-se 6 classes, qual a amplitude do intervalo de classe?

(c) Construir uma tabela de frequência das alturas dos alunos

(d) Determinar os pontos médios das classes

(e) Achar a altura média, altura modal e altura mediana.

47. Dado o rol de medidas das alturas (dadas em cm) de uma amostra de 100 estudantes de
uma Faculdade:

64 || IF - - 2018 - - Manual de BioEstatística Nelson Mulemba


151 152 154 155 158 159 159 160 161 161
161 162 163 163 163 164 165 165 165 166
166 166 166 167 167 167 167 167 168 168
168 168 168 168 168 168 168 168 169 169
169 169 169 169 169 170 170 170 170 170
170 170 171 171 171 171 172 172 172 173
173 173 174 174 174 175 175 175 175 176
176 176 176 177 177 177 177 178 178 178
179 179 180 180 180 180 181 181 181 182
182 182 183 184 185 186 187 188 190 190
Calcule

(a) Amplitude amostral (e) As frequências absolutas de classes

(b) O número de classes (f) As frequências relativas

(c) Amplitude de classes (g) Os pontos médios das classes

(d) Os limites de classes (h) As frequências acumuladas

48. A tabela abaixo representa os salários pagos a 100 operários da empresa DoceModel
Lda:

Números de saláros mínimos 0-2 2-4 4-6 6-8 8-10


Números de operários 40 30 10 15 5

Determine

(a) Frequências acumuladas, relativas simpes e acumuladas

(b) Quantos operários ganham abaixo de dois salários mínimos

(c) Qual é a percentagem de operários com salário entre 6 e 10 salários mínimos?

(d) Qual é a percentagem de operários com salário inferior 6 salários mínimos?

(e) O salário médio

(f) O intervalo que contêm o valor da mediana

(g) O intervalo que contém a moda

65 || IF - - 2018 - - Manual de BioEstatística Nelson Mulemba


(h) Determinar a moda e a mediana desta distribuição

49. Uma distribuidora de refrigerantes fez um levantamento sobre o consumo semanal (em
litros) por pessoa, em Janeiro de 2016, em uma cidade moçambicana, obtendo a tabela
abaixo:

Consumo 0.5-1.0 1.0-1.5 1.5-2.0 2.0-2.5 2.5-3.0


N◦ de pessoas 10 25 9 7 6

(a) Determine e interprete o consumo médio

(b) Qual é o percentual de pesoas que consomem menos de 1 litro por semana

(c) Determine os intervalos que contém o consumo modal e o consumo mediano

(d) Determine a moda e a mediana desta distribuição

50. Complete a tabela a seguir

Classes fi xp Fi fr
0, 02
12
62| − 65 0, 06
66, 5 84
126
36
225
0, 15
300
Total - -

51. A nota média dos alunos de uma turma foi 7 e das alunas foi 9. O número de alunos era
20 e das alunas 30. Qual é a nota média de toda turma?

52. Considere uma distribuição de 25 observações com x̄ = 23 , M oda = 28 e M ediana = 32 ,


respectivamente. Descobre-se que houve um erro no lançamento de dados: no lugar de
43 devia ser 34.

66 || IF - - 2018 - - Manual de BioEstatística Nelson Mulemba


(a) Qual é o valor correcto de x̄ ?

(b) Será que o erro afecta a mediana e a moda?

53. Uma empresa possui dois serventes recebendo 600, 0mt cada um, quatro escriturários
recebendo 2.000, 0mt cada um, um chefe de escritório com salário de 3.500, 0mt e três
técnicos recebendo 6.000, 0mt cada um.
Determine o salário médio, mediano e modal da empresa.

54. Num quartel, constantou-se que o peso médio de 40 soldados era de 69 kg . Posteri-
ormente, vericou-se que a balança estava desregulada, ocasionando um peso indicado
superior em 1kg ao peso verdadeiro. Qual era a média verdadeira dos pesos dos soldados?

55. De entre as alternativas, assinale aquelas que contiverem uma armação verdadeira

(a) Reunindo-se dados brutos em classes pode-se obter o número de indivíduos perte-
centes a cada uma das classes, que é denominado frequência da classe

(b) Os intervalos de uma classe precisam ser necessariamente iguais, na elaboração de


ma tabela que apresente uma distribuição de freuência

(c) O limite supeior real da classe 150 − 155 é 155

(d) O limite inferior real da classe 150 ` 155 é 150

(e) A amplitude do intervalo da classe é calculada pela soma entre os limites reais inferior
e superior de uma classe

(f) Obtém-se o ponto médio de uma classe pela média aritmética dos limites inferior e
superior reais de uma classe

(g) Um intervalo de classe aberto em seus dois limites inclui ambos os números extremos

(h) Intervalos de classe fechados têm seus limites superior e inferior reais excluídos dos
números que os compoem

(i) 2 − 6 compreende todos os valores entre 2 e 6, inclusive os extremos

(j) 2| − |6 compreende todos os valores entre 2 e 6, exclusive os extremos

(k) 2| − 6 compreende todos os valores entre 2 e 6, exclusive 2 e inclusive 6

(l) 2 − |6 compreende todos os valores entre 2 e 6, inclusive 2 e exclusive 6

(m) 2 − 6 compreende todos os valores entre 2 e 6, exclusive os extremos

67 || IF - - 2018 - - Manual de BioEstatística Nelson Mulemba


56. Para os seguintes casos: Primeiro decida se ambas têm desvios-padrão que são quase os
mesmos ou bastante diferentes. Se forem diferentes, indicar que distribuição tem o maior
desvio-padrão:

(a) As idades dos pacientes, em geral, num hospital ou as idades das crianças doentes
no mesmo hospital

(b) As médias de admissão á UEM reveladas por uma amostra representativa ou as do


universo dos estudantes concorrentes

(c) O rendimento dos deputados na Assembleia da República ou os rendimentos dos


PCAs dos bancos moçambicanos

(d) Os gastos entre duas cidades nas viagens de voo e transporte rodoviário

57. A seguir são mostrados os tempos de espera em la (em minutos) nas Farmácias de
Chimoio.

Farmac: 6.5 6.6 6.7 6.8 7.1 7.3 7.4 7.7 7.7 7.7
Vida: 4.2 5.4 5.8 6.2 6.7 7.7 7.7 8.5 9.3 10.0

(a) Calcule a amplitude total, o desvio padrão e o coeciente de variação de cada la

(b) Suponha que precisas levantar medicamentos em uma dessas farmácias, qua escolhe-
rias?

58. Uma pesquisa sobre o consumo de combustível nas viaturas dos directores dos hospitais
públicos deu os seguintes valores para a quilometragem percorrida por três marcas de
carro diferentes, em cinco testes com um tanque de 40 litros:

Ford Ranger: 400 397 401 389 403


Mark II: 403 401 390 378 395
Freightliner 399 389 403 387 401

Usando a medida mais adequada, qual dos carros é mais homogêneo?

59. Suponha que, numa particular cidade, tanto os comerciantes quanto os serventes tenham
uma renda anual de de 90.000mt . Será que essa informação indica que as duas distribui-
ções de renda são necessáriamente semelhantes?

O êxito na vida não se mede pelo que você conquistou, más sim pelas diculdades que

superou na caminhada .

68 || IF - - 2018 - - Manual de BioEstatística Nelson Mulemba


Capı́tulo 7
Introdução à Análise Combinatória

A análise combintória visa desenvolver métodos que permitem contar número de elementos de
um conjunto, sendo esses elementos, agrupamentos formados sob certas condições.
A primeira vista pode parecer desnecessária a existência destes métodos. Isto de facto é ver-
dade, se o número de elementos que queremos contar for pequeno. Entretanto, se o número de
elementos a serem contados for grande, esse trabalho torna-se quase impossível, sem o uso de
métodos especiais.

Consideremos a questão abaixo:


Sabendo que os números de telefone são feito usando a combinação de dígitos 0 a 9. Qual é o
número máximo de clientes que a vodacom pode ter?
Antes de responder a questão anterior, consideremos oo seguinte exemplo:

Exemplo 7.0.3. Consideremos A é o conjunto de número com dois algarismos(dígitos) dife-

rentes (distintos) formados a partir dos dígitos {4; 5; 8} .

Como resposta temos: {45; 48; 54; 58; 84; 85} , logo #A = 6 , ou seja, podemos formar seis
números diferentes considerando os dígitos dados.

7.1 Princípio Fundamental de Contagem


Consideremos o seguinte exemplo:

Exemplo 7.1.1. Existem três cidades A, B e C. Existem quatro estradas que ligam a cidade

A com a cida B, e cinco que ligam a cidade B com a C. Partindo da cidade A e passando da

cidade B, de quantas vias ou formas podemos chegar até a cidade C?

69
Cada modo de efectuar a viagem de A para C pode ser considerada como um par de estradas
(ai , bj ) onde ai é uma das quatro vias de A para B e bj é uma das 5 vias de B para C. Vejamos
a seguir todas as vias que podem ser usadas.
De A para B temos 4 vias {a1 ; a2 ; a3 ; a4 } e de B para C temos 5 vias {b1 ; b2 ; b3 ; b4 ; b5 } .

a1 b 1 a2 b 1 a3 b 1 a4 b 1
a1 b 2 a2 b 2 a3 b 2 a4 b 2
a1 b 3 a2 b 3 a3 b 3 a4 b 3
a1 b 4 a2 b 4 a3 b 4 a4 b 4
a1 b 5 a2 b 5 a3 b 5 a4 b 5

Temos 20 possibilidades (caminhos) de sair da Cidade A até a Cidade C passando pela cidade
B.
Este número de caminhos podemos determinar facilmente, como de A até B temos 4 vias e de
B para C temos 5 vias, então de A para C teremos 4 × 5 = 20 caminhos.

Denição 7.1.1. Se determinado acontecimento ocorre em n etapas diferentes, e se a primeira


etapa pode ocorrer de k1 maneiras diferentes, a segunda de k2 maneiras diferentes, e assim

sucessivamente, então o número total N de maneiras de ocorrer o acontecimento n é dado

por: N = k1 × k2 × k3 × · · · kn ·

Exemplo 7.1.2. Sabendo que os números de telefone são feito usando a combinação de dígitos

0 a 9 (10 dígitos no total). Qual é o número máximo de clientes que a vodacom pode ter?

Um número de telefone na vodacom leva 9 dígitos mas os primeiros dois iniciais são xos,
ou seja, temos: 84 .
Cada quadrado corresponde a um dígito. São no total sete dígitos. Tomando em cosideração
que os dígitos que entram num número de telefone podem estar repetidos, então comecemos
assim:
No lugar do primeiro quadro pode estar qualquer dígito entre 0 a 9 então temos 10 possibilida-
des.
No lugar do segundo quadro pode estar qualquer dígito entre 0 a 9, também temos 10 possibi-
lidades e assim sucessivamente até o último (sétimo) quadrado.
Então teremos 10 × 10 × 10 × 10 × 10 × 10 × 10 = 107 = 10.000.000
Então 10.000.000 é o número máximo de clientes qua a vodacom pode ter com o prexo 84.

70 || IF - - 2018 - - Manual de BioEstatística Nelson Mulemba


7.2 Factorial
Dado um número natural n , chama-se factorial de n ao produto dos n primeiros números
naturais.
Por denição, tem-se que: 0! = 1 e 1! = 1 .

Exemplo 7.2.1. (a) 3! = 3 × 2 × 1 = 6

(b) 5! = 5 × 4 × 3! = 20 × 3! = 20 × 6 = 120
(n + 1)! (n + 1)n(n − 1)!
(c) = = (n + 1)n = n2 + n
(n − 1)! (n − 1)!

7.3 Arranjos
Dado um conjunto, aos agrupamentos que podem ser formados a partir dos elementos do con-
junto dado denomina-se arranjos, esses agrupamentos diferem-se da ordem dos seus elemetos,
isto é, dado um arranjo se mudarmos a ordem dos elementos obtem-se um outro arranjo dife-
rente do arranjo dado.

7.3.1 Arranjos com repetição


Dado um conjunto com n elementos a todos agrupamentos que podem ser formados com k
elementos não necessariamente diferentes, denomina-se arranjos com repetição ou arranjo
completo. A quantidade de todos esses arranjos é determinada pela fórmula n A∗ k = nk .

Exemplo 7.3.1. Consideremos o seguinte problema. Quantos PINs com três dígitos podemos

formar com os números do conjunto B = {4; 5; 6; 7}

444 454 464 474 544 · · · 774


445 455 465 475 545 · · · 775
446 456 466 476 546 · · · 776
447 457 467 477 547 · · · 777
No total são 64 PINs diferentes que podem ser formados. Isso equivale a 43 = 64 .
Ou seja estamos perante um arranjo com repetição, onde n = 4 é o número de elementos
tomados 3 a 3 logo k = 3 é taxa de elementos: 4 A∗ 3 = 43 = 64.

71 || IF - - 2018 - - Manual de BioEstatística Nelson Mulemba


7.3.2 Arranjos sem repetição
Dado um conjunto com n elementos a todos agrupamentos que podem ser formados com k ele-
mentos diferentes, denomina-se arranjos sem repetição ou arranjo simples. A quantidade
n!
de todos esses arranjos é determinada pela fórmula n Ak = .
(n − k)!

Exemplo 7.3.2. Consideremos o seguinte problema. Quantos números com três dígitos dife-

rentes podemos formar com os números do conjunto B = {4; 5; 6; 7}

456 475 564 645 674 754


457 476 567 647 675 756
465 546 574 654 745 764
467 547 576 657 746 765
No total são 24 números com algarismos diferentes que formamos.
4! 4! 24
4
A3 = = = = 24 . São 24 números diferentes com algarismos diferentes.
(4 − 3)! 1! 1

Também podemos notar que: Um número de três algarismos:  . Temos 4 dígitos
para formar um número com três algarismos diferentes que precisamos ou preencher os espaços
(quadrados) em branco dados que correspondem a cada algarismo. Comecemos assim:
Para o primeiro quadrado, temos 4 alternativas entre os números dados podemos escolher 4
ou 5 ou 6 ou 7. Já para o segundo quadrado, restá-nos 3 alternativas pois o número usado no
primeiro quuadrado não pode ser usado (repetido) nos restantes quadrados. E por último, para
o lugar do último algarismo restá-nos 2 algarismos pois os dois escolhidos anteriormente já não
podem ser usados. Multiplicando as alternativas para cada quadrado, temos 4 × 3 × 2 = 24
números que podem ser formados com algarismos diferentes.

7.4 Permutações
Dado um conjunto, quando os agrupamentos feitos, ou seja, quando os arranjos desse conjunto
englobam todos elementos, esse tipo de arranjo denomina-se permutação

7.4.1 Permutações Simples


É um caso particular de arranjo simples. É o tipo de agrupamento ordenado onde entram todos
os elementos.

72 || IF - - 2018 - - Manual de BioEstatística Nelson Mulemba


Chama-se Permutação ou permutação simples de n elementos do conjunto dado, a qualquer
arranjo que tenha todos elementos do conjunto dado, ou seja, a troca de posição dos elementos.
E designa-se por: Pn = n!

Exemplo 7.4.1. Quantas palavras com ou sem sentido (anagramas) podemos formar com as

letras da palavra OLA?

OLA OAL LAO LOA AOL ALO


No total são 6 palavras que podemos formar com as letras da palavra OLA.
Ou, como são 3 letras da palavra OLA, então n = 3 e P3 = 3! = 6 .

7.4.2 Permutações com repetições


Se entre os n elementos do conjunto dado, existem elementos repetidos a vezes, b vezes e c
vezes e assim sucessivamente, o número total de permutações que podemos formar é dado por:
n!
Pna,b,c = .
a!b!c!

Exemplo 7.4.2. Quantas anagramas podemos formar com as letras da palavra MATEMA-

TICA?

A palavra MATEMATICA tem 10 letras, então n = 10 , sendo que a letra M está repetida
duas vezes, a letra A repetida tres vezes e a letra T repetida duas vezes.
2,3,2 10!
Baseando-se na fórmula, temos que: n = 10; a = 2; b = 3; c = 2 , logo P10 = = 151.200
2!3!2!
Resposta: São 151.200 anagramas.

7.5 Combinações Simples


Dado um conjunto com n elementos, aos subconjuntos constituidos por k elementos que po-
dem ser formados a partir dos elementos do conjunto dado denomina-se combinações, as
combinações diferem-se dos seus elemetos, isto é, dado uma combinação se mudarmos a ordem
dos elementos continua a mesma da cominação dada. Para ser diferente, deve haver troca de
n!
elementos e não ordem. O número total de combinações é dado pela fórmula: n Ck = .
(n − k)!k!

Exemplo 7.5.1. Pretende-se formar uma comissão de três funcionários, sabendo que a empresa
têm dez funcionários. Quantas comissões podem ser formadas?

73 || IF - - 2018 - - Manual de BioEstatística Nelson Mulemba


Podemos notar que cada comissão é um grupo de funcionários e dentro de cada comissão,
mesmo trocando a ordem dos elementos, a comisão não altera-se, então trata-se de combinação
de 10 elementos tomados 3 a 3:
10 10! 10!
C3 = = = 120.
(10 − 3)!3! 7!3!
Resposta: Podem ser formadas 120 comissões.

74 || IF - - 2018 - - Manual de BioEstatística Nelson Mulemba


Capı́tulo 8
Introdução às Probabilidades

A Estatística consiste em trabalhar com o ao acaso e a incerteza. A teoria de probabilidade é


um importante instrumento analítico em uma sociedade que é forçada a medir incertezas. Tanto
nos negócios, nas avaliações como nas situações quotidianas da vida, temos nossa opinião, mas
não temos certeza dos resultados do que nos propomos a realizar. Podemos estar incertos se
podemos realizar ou não promover uma oferta de um certo produto, se existe congestionamento
no trânsito no roteiro do nosso caminho, se podemos investir num certo negócio com o sobe
desce do dolár, contratar um funcionário que nos parece ser promissor, etc.

Nesta secção veremos realmente como é que as incertezas podem ser medidas, como associa-
las números e como interpretar estes valores chamados de probabilidades, que vai nos permitir
a tomar decisões adequadas, auxiliar a desenvolver estratégias. O ponto principal é a possibi-
lidade de quanticar o quanto provável será a ocorrência de determinada situação.

8.1 Experimento aleatório


Em quase tudo, em maior ou menor grau, nos deparamos com o acaso. Assim da armção
 É provável que os Mambas ganhem os Bafana Bafana no jogo de amanhã. Após o jogo pode
resultar em:

A: Que mesmo com o favoritismo, os Mambas percam diante dos Bafana Bafana

B: Que como pensamos, os Mambas ganhem

C: Ou que o jogo termine empatado.

75
Como vimos, o resultado depende de ao acaso, fenômenos como estes são denominados fenô-
menos aleatórios ou experimentos aleatórios.

Denição 8.1.1. Fenômenos ou experimentos aleatórios são aqueles que, mesmo repeti-
das várias vezes sob mesmas condições ou semelhantes, apresentam resultados imprevisíveis.

8.2 Espaço Amostral


A cada experimento correspondem, em geral, vários resultados possíveis.
Para podermos falar de probabilidades, temos de ter sempre um espaço amostral, que é o
conjunto de todos resultados possíveis de uma experiência (experimento). O termo experimento
sugere a incerteza do resultado.

Denição 8.2.1. Espaço Amostral é o conjunto de todos resultados possíveis de um experi-


mento, e representemos por U.

Exemplo 8.2.1.

1. Se lançarmos uma moeda no ar, os resultados esperados nesse experimento são cara (Ca)
ou coroa (Co). Então o espaço amostral U = {Ca, Co}

2. Se considerarmos os resultados de candidatura a uma vaga, o espaço amostral será dado


por: U = { Adnmitido, Não Admitido, Suplente } .

Do mesmo modo, como em dois lançamentos simultâneos de duas moedas, podemos ter cara
nas duas moedas, cara na primeira moeda e coroa na segunda, entre outros resultados de tal
modo que o seu espaço amostral será dado por:
U = { (Ca,Ca), (Ca,Co), (Co,Ca), (Co,Co)}.

8.3 Eventos
Denição 8.3.1. Chama-se evento a qualquer subconjunto do espaço amostral U. E reperesenta-
se pela letra maíscula.

Exemplo 8.3.1. Consideremos o seguinte experimento:

76 || IF - - 2018 - - Manual de BioEstatística Nelson Mulemba


No lançamento de um dado, temos que U = { 1,2,3,4,5,6 } Consideremos os seguintes even-
tos referentes ao lançamento de um dado:
Evento A sair um número par. Temos que A = {2, 4, 6} ;
Evento B sair um número menor que 10. Temos que B = {1, 2, 3, 4, 5, 6} ; Evento C sair o
dobro de 2. C = {4} ; Evento D sair um nmero
 maior que 6. D = ∅ .

Assim, qualquer que seja E , se E ⊂ U (E contido em U), então E é evento de U.

8.3.1 Classicação dos eventos


De acordo com a quantidade dos resultados pertecentes a um evento, os eventos podem ser
classicados em:

Denição 8.3.2. Evento Simples ou Elementar: é o evento formado por um elemento do

espaço amostral ( #A = 1 )

Exemplo 8.3.2. No lançamento de um dado, considere o evento G sair um número maior que

5.

Podemos notar que o único número maior que 5 no espaço amostral de lançamento de um dado

é o número 6, logo G = {6} . G é evento simples porque possui somente um elemento.

Denição 8.3.3. Evento Certo: é um evento que sempre ocorre, ou seja é igual ao espaço

amostral. (A = U )

Exemplo 8.3.3. No lançamento de um dado, considere o evento E sair um número menor ou

igual que 6.

Podemos notar que todos elementos do espaço amostral são menores ou igual a 6. Então o

evento E será dado por E = {1, 2, 3, 4, 5, 6} . E é evento certo porque possui todos elementos do

espaço amostral.

Denição 8.3.4. Evento Impossível: é um evento que nunca ocorre, ou seja (A = ∅) ou

ainda #A = 0.

Denição 8.3.5. No lançamento de um dado, considere o evento D sair um número negativo.

Podemos notar que no espaço amostral não temos nenhum número negativo, logo D = ∅ . D é

evento impossível porque é um conjunto vazio.

77 || IF - - 2018 - - Manual de BioEstatística Nelson Mulemba


8.3.2 Operações com eventos
Dados dois eventos ou mais, pode-se criar a combinação destes eventos, originando outro evento
distinto dos originais.

Denição 8.3.6. Evento Complementar: O evento complementar (ou contrário) de A ,

denotado por A , é o conjunto de todos os elementos do espaço amostral U , que não pertencem

a A , ou seja, ocorre quando o evento A não ocorre.

Denição 8.3.7. Evento União ou Reunião: Consideremos dois eventos A e B . O evento

A ∪ B é um novo eventoe ocorre quando o evento A, ou o evento B, ou os dois eventos ocorrem.

Denição 8.3.8. Evento Interseção: Consideremos dois eventos de um espaço amostral A

e B do espaço amostral U . O evento interseção A ∩ B é um novo evento e ocorre quando os

eventos A e B ocorrem simultaneamente.

Exemplo 8.3.4. Ao lançar um dado e observar a face superior, considere os seguintes eventos:
Considere os eventos:

A: Ocorrência do número par: A = {2; 4; 6}

B: Ocorrência do número ímpar: B = {1; 3; 5}

C: Ocorrência do número menor que quatro: C = {1; 2; 3}

1. Obtenha os seguintes eventos:

(a) A ∪ B (b) A ∩ B (c) A ∩ C (d) A ∩ C

Resolução:

(a) A ∪ B = {1; 2; 3; 4; 5; 6} (c) A ∩ C = {2}

(b) A ∩ B = ∅

(d) A ∩ C =? Temos que: A = {1; 3; 5} e C = {4; 5; 6} , logo A ∩ C = {5}.

Denição 8.3.9. Eventos Mutuamente Exclusivos: Dois eventos A e B são denominados

mutuamente exclusivos, se não podem ocorrer simultaneamente, ou seja A ∩ B = ∅.

78 || IF - - 2018 - - Manual de BioEstatística Nelson Mulemba


Assim, no lançamento de uma moeda, o evento sair cara e sair coroa são mutuamente exclusivos,
já que a realização de um deles impossibilita a realização do outro.

Denição 8.3.10. Eventos Independentes: Dois eventos são independentes quando a rea-

lização ou não-realização de um dos eventos não afecta a realização do outro ou vice-versa.

Exemplo 8.3.5. Sejam os eventos: A: Ter positiva na avaliação de Estatística e B: Estudar

no período laboral.

Olhando para esses dois eventos, podemos armar que são independentes, pois ter positiva não

depende do período de aulas, seja laboral ou pós-laboral.

8.4 Probabilidade
Dado um experimento aleatório, sendo U o seu espaço amostral, vamos admitir que que todos
os elementos de U tenham a mesma chande acontecer, ou seja, que U é um conjunto equi-
provável.

Chamamos de Probabilidade de um evento A , ( onde A ∈ U ) ao quociente entre a


quantidade de elementos de A pela quantidade de elementos de U , e designa-se por P (A) .
Analiticamente temos,
#A
P (A) = .
#U
Em outras palavras, podemos denir a probabilidade do evento A como sendo a frequência
relativa de A em relação a U . Sendo assim, temos a seguinte propriedade:

0 ≤ P (A) ≤ 1,

onde A é um evento qualquer.

Exemplo 8.4.1. 1. No lançamento de um dado. Determinar a probablidade de:

(a) A: Sair um número par

(b) B: Sair um número maior que 7

(c) C: Sair um número menor ou igual a 6

Resolução:
Temos que, o espaço amostral no lançamento de um dado é dado por: U = {1; 2; 3; 4; 5; 6} logo
#U = 6 .

79 || IF - - 2018 - - Manual de BioEstatística Nelson Mulemba


#A 3
(a) O evento A é dado por A = {2; 4; 6} , e #A = 3 , logo P (A) = = = 0.5 ou 50% .
#U 6
Resposta: No lançamento de um dado há 50% de chance de sair um número par.
#B 0
(b) O evento B é dado por A = ∅ , e #B = 0 , logo P (B) = = = 0.
#U 6
Resposta: No lançamento de um dado há 0% de chance de sair um número par. (Evento
impossível)
#C 6
(c) O evento C é dado por C = {1; 2; 3; 4; 5; 6} , temos que #C = 6 , logo P (C) =
= = 1.
#U 6
Resposta: No lançamento de um dado há 100% de chance de sair um número menor ou
igual a 6. (Evento certo).

8.4.1 Propriedades de probabilidade


(a) A probabilidade de um evento certo é igual a 1: P (U ) = 1.
(b) A probabilidade de um evento impossível é igual a 0: P (A) = 0 , se A = ∅
(c) A soma das probabilidades de um evento e do seu complemento é igual a 1:
P (A) + P (A) = 1.

(d) A probabilidade de eventos mutuamente exclusivos é igual a zero: P (A ∩ B) = 0 , se


A e B são mutuamente exclusivos.

(e) A probabilidade de união: P (A ∪ B) = P (A) + P (B) − P (A ∩ B) .

(f) A probabilidade de eventos independentes: P (A ∩ B) = P (A) × P (B) , se A e B são


independentes.

8.4.2 Probabilidade Condicional


Sejam A e B dois eventos de um espaço amostral. A probabilidade do evento A condicionado
ao evento B, denotado por P (A/B) , isto é, a probabilidade de A visto que B já ocorreu é a
probabilidade do evento A tomando B como sendo o novo espaço amostral ao invés de U.

Dados dois eventos A e B associados ao mesmo espaço amostral U, se P (B) > 0 , então a pro-
babilidade de ocorrênciia do evento A condicionado a ocorrência do evento B ou probabilidade
de A visto que B ocorreu, é dada por
P (A ∩ B)
P (A/B) = , (8.1)
P (B)

80 || IF - - 2018 - - Manual de BioEstatística Nelson Mulemba


em que P (A ∩ B) e P (B) são determinadas em relação ao espaço amostral U.

Exemplo 8.4.2. No lançamento de um dado, considere os seguintes eventos:

A: A face é um número ímpar B: A face é um número maior que 1. Qual é a probabilidade

de ter sido ímpar uma vez que o número era maior que 1?

Resolução:
Primeiro Método de Resolução:
O espaço amostral no lançamento de um dado é U = {1; 2; 3; 4; 5; 6} . E o evento sair ímpar é
dado por A = {1; 3; 5} .
Pelo exercício percebe-se que a face é de um número maior que 1. Então o nosso espaço amostral
transforma-se em U1 = {2; 3; 4; 5; 6} e o nosso evento A transforma-se em A1 = {3; 5} .
Logo, a probabilidade de ter sido ímpar uma vez que o número era maior que 1 é dada por
#A1 2
P (A/B) = = = 0, 4 ou 40%.
#U1 5
Segundo Método de Resolução:
Pelos eventos dados temos que: U = {1; 2; 3; 4; 5; 6} , A = {1; 3; 5} , e B número maior que 1,
B = {2; 3; 4; 5; 6} , então A ∩ B = {3; 5} A probabilidade de ter sido ímpar uma vez que o
número era maior que 1 é dada pela fórmula (8.1):
P (A ∩ B) #(A ∩ B) 2 #B 5
P (A/B) = =? P (A ∩ B) = = e P (B) = = , então:
P (B) #U 6 #U 6
2
P (A ∩ B) 2 6 2
P (A/B) = = 65 = × = = 0, 4 .
P (B) 6
6 5 5

81 || IF - - 2018 - - Manual de BioEstatística Nelson Mulemba


Só para relaxar

1. Calcule:

(a) P4 (c) P7 (e) C410 (g) C35 − A42 (i) C25 · A53
P5
(b) A62 (d) C38 (f) A10 (h) (j) P3 · C47
4 P3

2. Quantos são os anagramas formados com as letras da palavra MULEMBA. Quantos destes
anagramas começam com a letra A? (ANAGRAMA: é a palavra obtida usando as mesmas
letras da palavra incial, invertendo a ordem, mesmo sem sentido)

3. Qual é o nímero de comissões de 3 alunos que se podem formar tirados em um conjunto


de 7 alunos?

4. Considere os conjuntos A = {a, b, c, d, e} e B = {r, s, t} . Escreva:

(a) Todos arranjos possíveis, de 2 elementos, formados pelos elementos do conjunto A

(b) Todas combinações possíveis, de 3 elementos, formados pelos elementos de A

(c) Todas permutações formadas pelos elementos do conjunto B

5. Um restaurante oferece no cardápio 2 saladas distintas, 4 tipos de pratos de carne, 5


variedades de bebidas e 3 sobremesas diferentes

(a) De quantas maneiras diferentes a Lizete Magaia poderia fazer um pedido contendo,
uma salada, um tipo de carne, e uma sobremesa?

(b) De quantas maneiras diferentes a Elisa poderia fazer um pedido contendo, uma
salada, um tipo de carne, e uma sobremesa e uma variedade das bebidas?

82
6. De quantos modos pode se vestir um homem que tem 2 pares de sapatos, 4 casacos e seis
calças diferentes, usando sempre uma calça, uma casaco e um par de sapatos?

7. Em uma prova composta de 20 questões envolvendo V ou F. A Mércia teve 12 valores,


de quantas maneiras distintas pode ter sido resolvido de modo a obter essa classifcação,
sabendo que a segunda correcção era tudo verdade?

8. Um inspector visita 6 farmácias. A m de evitar que os proprietários das farmácias


saibam quando ele os irá inspecionar, o inspector varia a ordem de suas visitas. De
quantas maneiras diferentes poderão ser feitas as visitas?

9. Sete alunos foram escolhidos para representar a turma de Contabilidade na televisão.


Se for necessário que os mesmos formem uma la para fotograa, de quantas maneiras
diferentes podem ser dispostos os alunos?

10. De uma sala de 25 alunos devem ser escolhidos 5 alunos para receberem prêmios. De
quantas maneiras diferentes poderão ser distribuidos os prêmios se:

(a) Se todos os prêmios forem iguais (b) Se os prêmios forem diferentes

11. Cinco pessoas decidem viajar num automóvel. De quantas maneiras diferentes eles podem
se assentar se:

(a) Todos sabem dirigir (b) Apenas um sabe dirigir

12. No Moçambola a equipa Saúde de Chimoio obteve 8 vitórias, 5 empates e 2 Derrotas, nos
15 jogos realizados. De quantas maneiras distintas esses resultados podem ter ocorrido?

13. Descreva o espaço de resultados para as seguintes experiências aleatórias:

(a) Lançar um dado e uma moeda uma vez e observar o resultado

(b) Um exame para ngressão no seu primeiro trabalho

(c) Nota a ser obtida nas avaliações de Estística Geral

4 2 √
14. Quais dos seguintes valores não podem ser probabilidades? 0 ; 0, 0001 ; −0, 2 ; ; ; 2 ;
√ 3 4
0, 2

15. Quais dos seguintes pares de acontecimentos são mutuamente exclusivos:

83 || IF - - 2018 - - Manual de BioEstatística Nelson Mulemba


(a) Chover / Não chover (c) Nadar / Sentir frio

(b) Conduzir um carro / Andar a pé (d) Ganhar num jogo / Perder no mesmo jogo

16. Responda as questões seguintes:

(a) Se A é o evento Fevereiro tem 30 dias este ano. Determine P(A).

(b) Se B é o evento Novembro tem 30 dias este ano. Determine P(B)

(c) Um espaço amostral consiste em 200 eventos separados e igualmente prováveis. Qual
é a probabilidade de cada evento?

(d) Em um exame de admissão, cada questão tem 5 respostas possíveis. Respondendo


aleatoriamente a primeira questão, qual é a probabilidade de acertar?

17. São lançados dois dados. Qual é a probabilidade de:

(a) obter-se um par de pontos iguais

(b) um par de pontos diferentes

(c) um par em que o primeiro é menor que o segundo

(d) a soma dos pontos ser um número par

18. Um lote é formado por 10 peças boas, 4 com defeitos leves e 2 com defeitos graves. Uma
peça é retirada ao acaso deste lote. Calcule a probabilidade de que esta peça:

(a) seja boa (d) apresente defeito

(b) apresente defeito leve (e) não apresente defeito

(c) apresente defeito grave (f) não apresente defeito grave

19. Um estudo de 500 voos da LAM seleccionados aleatoriamente mostrou que 430 chegaram
no horário. Qual é a probabilidade de um voô da LAM chegar no horário? E de não
chegar no horário?

20. Qual é a probabilidade de acidentes de trabalho, por ano, em uma determinada indústria
se uma amostra aleatória de 10 rmas que empregam um total de 8.000 pessoas, mostrou
que ocorreram 400 acidentes de trabalho durante os últimos doze meses?

84 || IF - - 2018 - - Manual de BioEstatística Nelson Mulemba


21. Em uma pesquisa entre estudantes dum Instituto, 1162 amaram que cabulavam nos
exames, enquanto 2468 armaram que não cabulavam. Selecionado aleatoriamente um
destes estudantes para o mercado de emprego, determine a probabilidade de ele ou ela
ter cabulado em um exame.
1 1
22. Se P (A) = e P (B) = e A e B são acontecimentos mutuamente exclusivos, calcule:
2 4
(a) P (A) (b) P (B) (c) P (A ∩ B) (d) P (A ∩ B)

23. Um grupo de 60 pessoas apresenta a segunte composição:

Designação: Homens Mulheres TOTAL


Menores: 15 17 32
Maiores: 18 10 28
TOTAL 33 27 60

Uma pessoa é escolhida ao acaso:

(a) Qual é a probabilidade de ser homem?

(b) Qual é a probabilidade de ser adulto?

(c) Qual é a probabilidade de ser menor e ser mulher?

(d) Sabendo-se que a pessoa escolhida é adulto, qual é a probabilidade de ser homem?

(e) Dado que a escolhida é mulher qual é a probabilidade de ser menor?


3 3
24. A probabilidade de uma mulher estar viva daui a 30 anos é e de seu marido é .
4 5
Calcule a probabilidade de:

(a) Apenas o homem estar vivo (c) Pelo menos um estar vivo

(b) Apenas a mulher estar viva (d) Ambos estarem vivos

25. Dados P (A) = 0, 3 ; P (B) = 0, 6 ; e P (A ∩ B) = 0, 15 , achar P (A/B) , P (B/A) , P (A) ,


P (A ∪ B) , P (B) e P (A ∪ B) .

26. Dados P (A) = 0, 9 ; P (B) = 0, 8 e P (A ∩ B) = 0, 75 , achar P (A ∪ B) , P (A ∩ B) ,


P (A ∩ B) , P (A ∪ B) e P (A ∩ B)

27. Melanie chega atrasada ao trabalho 25% das vezes, e esquece o material de trabalho 20%
das vezes. Admitindo que essas ocorrências sejam independentes, determine a probabili-
dade da Winny:

85 || IF - - 2018 - - Manual de BioEstatística Nelson Mulemba


(a) Chegar atrasada 2 dias seguidos (c) Chegar na hora e com o material

(b) Chegar atrasada e sem o material (d) Chegar na hora e sem o material

1
28. A probabilidade de que você resolva correctamente a 1a questão duma prova é e de
3
2
seu colega resolva correctamente é , sendo que ambos tentam, sozinhos, resolvê-la.
5
Considere o experimento em que se verica se a questão foi resolvida correctamente ou
não pelos dois.

(a) Os eventos você resolver correctamente e seu colega resolver correctamente são:
mutuamente exclusivos? Justique. independentes? justique.

(b) Qual é a probabilidade de pelo menos um resolver a questão correctamente?

29. Das 100 pessoas que se candidatam ao emprego na área aduaneira e contabilística em
uma empresa, 40 possuíam experiência anterior, 30 curso superior, e destes 20 possuíam
ambos

(a) Qual a probabilidade de uma candidato escolhido aleatoriamente possuir curso su-
perior ou experiência anterior

(b) Qual a probabilidade de uma candidato escolhido aleatoriamente possuir curso su-
perior e experiência anterior

30. Sejam A e B dois eventos associados com um experimento E. Supondo que P (A) = 0.4 ,
P (A ∪ B) = 0.7 e P (B) = p , qual é o valor de p para que se tenha:

(a) A e B mutuamente exclusivos

(b) A e B não mutuamente exclusivos e independentes

31. Os arquivos da polícia revelam que, das vítimas de acidente automobilístico que utilizam
cinto de segurança, apenas 10% sofrem ferimentos graves, enquanto que essa incidêndia
é de 50% entre as vitímas que não utilizam o cinto de segurança. Estima-se em 60%
o percentual dos motoristas que usam o cinto de segurança. A polícia acaba de receber
uma chamada para investigar um acidente em que houve um indivíduo gravemente ferido.
Calcule a probabilidade de ele estar usando o cinto no momento do acidente. Se a pessoa
que dirigia o outro carro não sofreu ferimentos graves. Calcule a probabilidade de ela não
estar usando o cinto no momento do acidente.

86 || IF - - 2018 - - Manual de BioEstatística Nelson Mulemba


32. A empresa Mana Lily Lda recentemente apresentou uma proposta para um projecto de
moda. Se seu principal concorrente apresenta uma proposta, há apenas 0, 25 chance da
2
empresa ganhar a concorrência. Se seu concorrente não apresentar a proposta, há de
3
chance da empresa ganhar. A chance de seu principal concorrente apresentar proposta é
de 50% .

(a) Qual a probalidade da empresa ganhar a concorrência?

(b) Qual a probalidade de seu concorrente ter apresentado proposta, dado que a empresa
ganhou a concorrência?

33. Um fazendeiro estima que quando uma pessoa experimentada planta árvores, 90% so-
brevivem, mas quando um novato as planta, apenas 50% sobrevivem. Se uma árvore
plantada não sobreviveu, determine a probabilidade de ela ter sido plantada por um
2
novato, sabendo que das árvores são plantadas por novatos.
3
34. Uma Companhia com três lojas A, B e C tem respectivamente 50, 75 e 100 empregados.
A percentagem de mulheres a trabalhar em cada uma dessas lojas é 50, 60 e 70, respecti-
vamente. No nal de cada mês é nomeado o empregado do mês. Qual é a probabilidade
desse empregado trabalhar na loja C, sabendo que é mulher?

35. Num centro de cópias existem três impressoras A, B e C que imprimem a velocidades
diferentes. A probabilidade de um cheiro ser enviado para as impressoras A, B e C
é respectivamente 0.6 , 0.3 e 0.1 . Ocasionalmente a impressora avaria-se e destroi a
impressão. As impressoras A, B ou C avariam-se, respectivamente, com probabilidades
0.01 , 0.05 e 0.04 . A impressão de um cheiro foi destruída! Qual é a probabilidade de
ter sido enviada para a impressora B?

36. No centro de inspecção dos medicamentos existêm três inspectores, Eugênio Jambo, Me-
lanie Mulemba e Amândio Ndlovu, cada um deles responsável pela vericação de 20% ,
30% e 50% dos artigos inspecionados. A probabilidade do inspector Eugênio deixar pas-
sar um artigo ilegalmente é 0.05 , a probabilidade da inspectora Melanie deixar passar
um artigo ilegalmente é 0.10 e probabilidade do inspector Amândio Ndlovu cometer o
mesmo erro é 0.15 . Escolhe-se ao acaso um artigo inspeccionado:

(a) Qual é a probabilidade de que seja um artigo ilegal?

(b) Sabendo que é ilegal, qual e a probabilidade de ter sido Melanie a inspecciona-lo?

87 || IF - - 2018 - - Manual de BioEstatística Nelson Mulemba


37. Os senhores Sabune e Mulemba são os maiores criadores de ovelhas e cabritos, grandes
rivais e concorentes no Mercado Francisco Mayanga, na Cidade de Chimoio. O senhor
Sabune tem 45% do total dos animais enquanto que o senhor Mulemba detém 30% dos
animais. Sabe-se que dos animais do senhor Mulemba 60% são cabritos, dos do senhor
Sabune 70% são cabritos, enquanto que dos restantes criadores, 40% são cabritos. No
dia 24 de Dezembro, a polícia local neutralizou um grupo de assaltantes com um animal:

(a) Qual é a probabilidade de pertencer ao senhor Sabune?

(b) Qual é a probabilidade de ser uma ovelha?

(c) Qual é a probabilidade de ser uma ovelha e pertencer ao senhor Sabune?

(d) Sabendo que o animal roubado era uma ovelha, qual é a probabilidade de pertencer
ao Sr. Mulemba?

38. Num determinado curso, estão matriculados 100 estudantes, entre os quais 10 repetentes.
São escolhidos 4 estudantes ao acaso. Encontrar a probabilidade de que os 4 estudantes
sejam todos:

(a) Estudantes repetentes (b) Estudantes não repetentes

39. Três estudantes são escolhidos ao acaso de um grupo de 15 estudantes dos quais 5 são
mulheres. Calcular a probabilidade de que:

(a) Nenhum seja mulher (c) Pelo menos um seja mulher

(b) Exactamente um seja mulher

40. Uma companhia multinacional tem três fábricas que produzem o mesmo tipo de produto.
A fábrica I é responsável por 30% do total produzido, a fábrica II produz 45% do total, e
o restante vem da fábrica III. Cada uma das fábricas, no entanto, produz uma proporção
de produtos que não atendem aos padrões estabelecidos pelas normas internacionais. Tais
produtos são considerados defeituosos e correspondem a 1% , 2% e 1.5% , respectiva-
mente, dos totais produzidos por fábrica. No centro de distribuição, é feito o controle de
qualidade da produção combinada das fáricas. Qual é a probabilidade:

(a) De encontrar um produto defeituoso durante a inspecção de qualidade?

(b) Se durante a inspecção, encontramos um produto defeituoso, qual é a probabilidade


que ele tenha sido produzido na fábrica II?

88 || IF - - 2018 - - Manual de BioEstatística Nelson Mulemba


(c) Se durante a inspecção, encontramos um produto não defeituoso, qual é a probabi-
lidade que ele tenha sido produzido na fábrica II?

Viver de aparências é querer fazer uma viagem com um carro sem combústivel . A. Huxley

89 || IF - - 2018 - - Manual de BioEstatística Nelson Mulemba


Referências Bibliográcas

[1] CRESPO, António. (2002) Estatística fácil. 18rd Edição. Editora Saraiva. São Paulo.

[2] DO NASCIMENTO, Paulo Henrique Ribeiro. (2007) Estatística e Probabilidade. FTC-


EAD, Brasil 2007

[3] FARIAS, Ana. et all (2006) Estatística Descritiva Universidade Federal Fluminese. Brasil

[4] GRANZOTTO, António. (2002) Resumo de Estatística Básica.

[5] MULENGA, Alberto. (2007). Manual de Estatística. UEM-DMI, Maputo 2007

90