Escolar Documentos
Profissional Documentos
Cultura Documentos
Introdução a Estatística
1
Notas de Estatística I-FEC/UJES Huambo/2016 Alcides Onésimo Nunda
O estudo estatístico inicia-se com o planeamento da pesquisa, que representa a organização do plano geral
do trabalho que estabelece os objectivos e a utilização dos meios estatísticos.
A coleta de dados vai obter informações sobre a realidade a ser estudada. Em algumas áreas, os instrumentos
de uso mais frequentes para a coleta são os questionários e as entrevistas.
Após a coleta dos dados, é necessário classificá-los; isso significa estabelecer categorias que permitam a
reunião das informações coletadas.
Pesquisa População
Febre aviária aves
Acidentes do trabalho numa empresa funcionários da empresa
Espécies arbóreas das formações vegetais árvores
Treinamento de resistência física atletas
Fiscalização de velocidade numa estrada principal veículos
Concentração de monóxido de carbono ar
Em grandes populações, torna-se interessante a realização de uma amostragem, que ocorre na impos-
sibilidade de colher informações sobre a população total.
1.5.2 Amostra
A amostra é um subconjunto da população, ou seja, é um conjunto de elementos extráidos da população.
Embora seja constituída por uma parte da população em estudo, a amostra deve permitir a obtenção de
dados representativos dessa população.
A amostra permite que se trabalhe com uma parte dos elementos de uma população, quando existe
dificuldade de fazer a pesquisa com todos os elementos da população.
1.5.3 Variáveis
São as características que podem ser observadas ou medidas em cada elemento da população, ou, ainda, é
um conjunto de resultados possíveis de um fenómeno.
Na população caracetrizada pelos funcionários de uma empresa, podemos definir variáveis como: tempode
serviço, idade, estado cívil, sexo, etc.
A variável pode ser:
1. Qualitativa: quando expressa uma qualidade ou atributo. Por exemplo, sexo, cor da pele, estado
cívil, cidade natal, fruta preferida etc.
Example 1.1. Qual é o seu estado cívil? Divorciada (estado cívil é a variável qualitativa)
2. Quantitativa: quando os valores são expressos por números. Por exemplo, idade, salários, notas da
avaliação, comprimentos, número de sinistros, etc.
Example 1.2. Qual é a idade da sua filha? 8 anos. (idade é variável quantitativa.)
2. Foram entrevistadas 140 pessoas para verificar a intenção de voto para o petro atlético do Huambo.
Identifique a variável, população e o número de elementos da amostra.
Especifique se a variável é qualitativa, quantitaiva discreta ou contínua.
3. Suponhamos que a faculdade de economia do Huambo da UJES tem 300 estudantes no 1o ano. Foi
realizada uma pesquisa com 30% dos estudantes da faculdade com o objectivo de verificar qual o tempo
gasto na Internet para atender a suas necessidades de estudo, pesquisa e trabalhos escolares.
Identifique a variável, população e o número de elementos da amostra. Especifique se a variável é
qualitativa, quantitaiva discreta ou contínua.
4. Uma empresa pesquisou a qualidade do atendimento dos seus funcionários; para tal, seleccionou alea-
toriamente uma amostra de 32 clientes.
Identifique a variável, população e o número de elementos da amostra. Especifique se a variável é
qualitativa, quantitaiva discreta ou contínua.
5. Visando o planeamento estratégico, o director de uma empresa fabricante de pneus realizou uma pes-
quisa sobre a distribuição salarial de seus funcionários. Para tal, o director seleccionou 30 funcionários
de um total de 780 que trabalhavam para a empresa, para responder a sua pesquisa. Responda às
seguintes questões:
a) Qual é a variável em estudo? Classifique-a (em qualitativa, quantitativa contínua ou discreta).
b) Quantos elementos constituem a população desse estudo? E a amostra?
6. Será aplicado um teste de soletração aos 540 alunos da oitava classe de 6 escolas privadas.
Identifique a variável, população e o número de elementos da amostra. Especifique se a variável é
qualitativa, quantitaiva discreta ou contínua.
7. Escreva cada número com arredondamento para décimos.
Distribuição de Frequências e
Representações Gráficas
Este cápitulo é totalmente dedicado ao estudo detalhado da distribuição de frequência, dada a sua im-
portância na estatística. Após a realização de uma pesquisa em que os dados foram coletados, é necessário
organizá-los e classificá-los. Isto pode ser feito mediante tabelas e gráficos, em geral construímos inicialmente
uma tabela que contemple as informações coletadas em função dos respectivos parámetros.
• Rol: é a ordenação dos valorews obtidos (dados brutos) em ordem crescente ou decrescente de grandeza
númerica ou qualitativa;
• Classe: ao organizar os dados coletados, estes são subdivididos convenientemente em categorias. Cada
uma destas subdivisões recebe o nome de classe;
• Frequência (fi ): é o número de vezes que o elemento aparece na amostra, ou o número de elementos
pertencentes a uma classe. A frequência (fi ) também pode ser chamada de frequência simples ou
frequência absoluta;
• Frequência Relativa(fri ) de uma classe é o quociente entre a frequência absoluta (fi ) da classe
considerada e o número total de dados (n) coletados na pesquisa. A frequência relativa representa a
proporção de observações de um valor (ou de uma classe) em relação ao número total de observações,
o que facilita as comparações:
fi
f ri = ;
n
• Frequência Relativa Percentual (fri %): de uma classe é o produto da frequência relativa por 100:
• Frequência Acumulada(F aci ) de uma classe é a soma da frequência absoluta desta classe com as
frequências absolutas das classes anteriores:
i
X
F aci = f1 + f2 + f3 + ... + fi =⇒ F aci = fi ;
1
• Frequência Relativa Acumulada(F raci ) de uma classe é a soma da frequência relativa dessa classe
com as frequências relativas das classes anteriores. A frequência relativa acumulada (F raci ) de uma
7
Notas de Estatística I-FEC/UJES Huambo/2016 Alcides Onésimo Nunda
classe também pode ser calculada pela razão entre a frequência acumulada da classe considerada e o
número total de dados (n) coletados na pesquisa:
i
X
F raci = fr1 + fr2 + fr3 + ... + fn =⇒ F raci = f ri
1
ou
F aci
F raci = ;
n
• Frequência Relativa Acumulada Percentual(F raci %) de uma classe é o produto da frequência
relativa acumulada por 100:
F raci % = F raci × 100.
2 1 1 0 2 0 0 0 1 0
1 0 0 2 1 1 0 0 1 1
0 1 2 0 0 1 2 1 0 0
k = 1 + 3, 322 × log n
Example 2.3. a) Qual é o número de classes sugerido na √ fórmula de Sturges quando n = 30?
b) Calcule o número de classes utilizando a formula k = n, sendo n = 30.
√ quando n = 120?
c) Qual o número de classes sugerido na fórmula de Sturges
d) Calcule o número de classes utilizando a formula k = 120
AA = Xmax − Xmin .
Amplitude Total
A amplitude total (AT) é calculada levando-se em conta os valores dos intervalos de classe da tabela de
distribuição de frequência. A amplitude total é expressa pela diferença entre o maior e o menor valor
observado nos intervalos de classe da tabela de distribuição de frequência. Isso corresponde à diferença entre
o limite superior do último intervalo de classe e o limite inferior do primeiro intervalo de classe.
Amplitude Total = (limite superior do último intervalo de classe)-(limite inferior do primeiro
intervalo de classe)
1.800 960 1.220 950 1.410 1.600 1.450 1.510 1.060 980
1.330 1.190 1.130 1.800 1.390 1.740 1.660 1.400 1.760 1840
1.270 990 1.380 1.550 1.020 1.730 1.210 1.100 1.000 1.580
980 1.650 1.500 950 1.800 1.620 1.280 1.300 1.220 1440
1.510 1.660 1.200 1.330 1.700 980 1.050 1.340 1.850 1.000
2.4.1 Histograma
O histograma é uma representação estatística do gráfico da distribuição de frequência. O histograma é um
diagrama de colunas em que cada retângulo está relacionado com uma classe da distribuição de frequência.
Pode-se destacar como diferença entre o gráfico de coluna e o histograma, o distanciamento entre as
colunas. No histgrma, não há separação entre os retângulos adjacentes.
Propriedades dos histograma:
• a área do histograma é proporcional à soma das frequências;
• utilizando as frequências relativas obtemos um gráfico de área unitária (A=1);
O eixo das abscissas corresponde ao eixo dos pontos médios dos intervalos de classe, e o eixo das ordenadas
representa o eixo das freqências.
1. Um supermercado colheu a opinião de 60 clientes; sendo que uma determinada questão sobre a quali-
dade de atendimento deveria ser respondida mediante a utilização das opções: Óptimo, Bom, Regular
e Ruim. Para esta questão foram encontradas as respostas constantes da tabela abaixo.
Ruim Bom Óptimo Bom Bom Regular Óptimo Bom Regular Bom
Regular Óptimo Ruim Óptimo Bom Bom Bom Óptimo Bom Bom
Óptimo Bom Bom Ruim Bom Bom Regular Regular Óptimo Regular
Óptimo Óptimo Bom Bom Regular Bom Bom Ruim Bom Regular
Ruim Regular Óptimo Regular Bom Bom Bom Bom Bom Bom
Bom Regular Óptimo Bom Ruim Bom Bom Óptimo Regular Óptimo
2. Na tabela abaixo estão os dados que representam o número de filhos por família de 30 famílias entre-
vistadas no bairro do kapango
2 0 4 1 2 3 2 3 1 0
3 1 2 3 1 2 1 0 3 2
1 2 2 0 1 3 2 2 4 1
3. A cromoterapia é uma ciência que usa a cor para estabelecer o equilíbrio e a harmonia do corpo, da
mente e das emoçoes. Não há cor melhor ou pior, mais nobre ou menos nobre, o que pode haver é
a cor errada para determinado momento. Uma pesquisa visa estabelecer qual cor traz mais calma e
tranquilidade para a pessoa entrevistada. A tabela abaixo registra as opiniões de uma amostra de 30
pessoas.
azul rosa branco azul branco bege amarelo rosa branco amarelo
branco bege amarelo branco rosa azul amarelo azul bege branco
amarelo amarelo azul bege azul amarelo branco bege branco azul
R C R R R C B N I N C N R C B N C N
N R R N B R N N R R N R B R N B C R
B R R N I R B N R R R N B N I R B C
a) Calcule os valores de frequência, frequência relativa, frequência relativa percentual, frequência acu-
mulada, frequência relativa acumulada, frequência percentual acumulada e preencha uma tabela;
b) Identifique a variável em estudo. É qualitativa ou quantitativa? É contínua ou discreta?
c) Qual é o número de classes na tabela de distribuição de frequências?
d) Qual é o número de dados da pesquisa?
e) Qual é o percentual de fabricante que já estão certificados?
f) Qual é o percentual de fabricantes que estão indecisos ou não buscarão certificados?
5. Com o objectivo de acompanhar a evolução das estaturas de adolescentes, foram coletadas as alturas
de 50 adolescentes num posto de saúde; os dados brutos encontram-se na tabela abaixo
142 157 150 158 156 159 160 157 160 158
156 148 156 147 151 154 149 159 148 150
161 153 144 154 145 152 154 152 153 154
149 155 152 160 154 157 156 155 156 143
155 161 162 155 159 153 145 149 152 157
a) Faça o rol;
b) Identifique a variável em estudo. É qualitativa ou quantitativa? É contínua ou discreta?
c) Qual é a menor altura?
d) Qual é a maior altura?
230 232 244 245 248 249 250 255 257 260 264 271 278 280 280
280 281 284 289 292 292 293 294 294 296 299 299 299 302 305
308 309 309 310 311 312 314 315 316 318 318 320 321 324 326
333 335 335 337 337 339 341 342 342 342 348 356 360 365 369
8. A administração municipal do Huambo realizou uma pesquisa entre as empresas da região para verificar
o número de operários alocados por empresa. O objectivo é verificar se há equilíbrio entre o crescimento
do número de empresas e o aumento do número de postos de trabalho. Os dados coletados constam
da tabela a seguir
A análise dos dados coletados pode ser feita sob diferentes aspectos, em que cada foco verifica um tipo de
informação a respeito do comportamento ou da tendência do fenómeno em exame. Isto está de acordo com
a estatística, pois um de seus objectivos é buscar leis de comportamento para o conjunto de dados coletados.
Medidas de uma distribuição (em função de suas tendências características):
• medidas de posição;
• medidas de variabilidade ou dispersão;
• medidas de assimetria;
• medidas de curtose
As medidas de posição mais importantes são as medidas de tendência central, as outras medidas de posição
são as medidas separatrizes.
• Medidas de posição de tendência central (ou promédios): média aritmética, moda, medi-
ana
19
Notas de Estatística I-FEC/UJES Huambo/2016 Alcides Onésimo Nunda
di = xi − x
Propriedade do desvio em relação a média: a soma de todos os desvios em relação ao valor médio
é igual a ZERO.
Xn
=0
i=1
Baseando-se no exemplo 3.1 efectuando o rol (ordem crescente) ao mesmo pode-se exemplificar esta propri-
edade.
• média aritmética simples: todas as variáveis têm a mesma importância ou seja, o mesmo peso;
• média aritmética ponderada: as variáveis têm diferentes importâncias relativas, ou, ainda, diferentes
pesos relativos.
A média aritmética ponderada também é chamada de média ponderada. Um dos significados da palavra
ponderar é "pesar".
No cálculo da média ponderada, cada valor coletado na série tem uma participação proporcional ao seu
peso, isto é, proporcional à sua importância relativa no conjunto.
Média ponderada é a soma das variáveis multiplicadas pelos seus pesos, dividida pela soma dos pesos de
cada variável.
p1 × x1 + p2 × x2 + p3 × x3 + p4 × x4 + .... + pn × xn
x=
p1 + p2 + p3 + p4 + ... + pn
Sendo que
x=média aritmética ponderada;
xi =variável em estudo;
pi =peso de variável
Example 3.3. Na equipe de vôlei de um club, 8% dos atletas têm altura 1,75 m, 26% têm a altura 1,80 m,
30% têm a altura 1,85 m, 20% têm altura 1,90 m, 12% têm altura 1,95 m e 4% têm altura 2,00 m. Calcule
a altura média do time.
x=média aritmética;
xi =variável em estudo;
fi =frequência (peso de variável).
Example 3.4. Foi realizada uma pesquisa em 50 residências do São João com o objectivo de saber qual o
número de computadores em cada casa. Na tabela abaixo representamos o resultado da pesquisa. Calcule a
média aritmética ponderada dessa distribuição.
No de computadores No de residências
(xi ) (fi )
0 4
1 19
2 16
3 9
4 2
Total n=50
3.2 Moda Mo
Moda: é o valor que ocorre com maior frequência nos dados obtidos numa coleta (este valor é denominado
valor modal).
A série pode ser classificada em função da quantidade de valores modais.
Definition 1. Moda é o valor da variável que corresponde à classe de maior frequência (classe modal).
Para a determinação da moda, numa tabela de distribuição de frequência com os dados agrupados
sem intervalo de classe, devem-se executar os passos a seguir:
• primeiro passo: localizar a classe modal, ou seja, aquela que contém o maior valor de frequência;
• localizar a classe modal, ou seja, a classe que contém o maior valor de frequência;
• sabemos que a moda é um valor contido no intervalo de classe modal.
Para o cálculo da moda aplicamos a fórmula de Czuber, tomando como base os valores da classe modal:
d1
Mo = lMo + · hMo
d1 + d2
Sendo:
lMo = limite inferior da classe modal;
d1 = diferença entre a frequência da classe modal e a frequência da classe anterior à classe modal;
d2 = diferença entre a frequência da classe modal e a frequência da classe posterior à classe modal;
hMo = amplitude da classe modal.
Sendo que:
hMo = LMo − lMo d1 = fMo − fant e d2 = fMo − fpost
3.3 Mediana Md
A mediana é uma medida de posição, é também uma separatriz, pois divide o conjunto de dados coletados
em duas partes iguais, com o mesmo número de elementos.
O valor da mediana se encontra no centro da série estatística, organizada de tal forma que o número
de elementos situados antes deste valor é igual ao número de elementos que se encontram após este mesmo
valor.
A mediana é conveniente para séries estatísticas onde existem valores extremos, em que valores grandes
e pequenos coexistem dentro da mesma série, ou ainda nos casos em que a série seja aberta nos extremos.
para estes casos, a mediana caracteriza o promédio mais confiável.
Example 3.10. Considere um conjunto de valores de uma série estatística.
29, 23, 14, 25, 31, 26, 18, 17, 22, 13, 27
41, 32, 66, 49, 35, 57, 39, 54, 44, 48, 51, 56, 59, 36, 63
Para uma série com número par de termos: não há termo central único, e sim dois termos
centrais. Convecionamos que a mediana seja a média aritmética entre os dois termos centrais; neste caso, a
mediana é um valor que não pertence à série e está localizado entre entre os dois termos centrais. A posição
do termo central pode ser localizada pela expressão n2 .
Example 3.12. Considere um conjunto de valores de uma série estatística.
48, 60, 33, 42, 36, 40, 53, 43, 46, 52, 55, 45, 58, 65
De forma mais simplificada: devemos calcular a mediana de uma série de n termos levando-se em conta
o facto de n ser par ou ímpar.
n+1
• a) para n ímpar, a mediana será o termo de ordem: 2 ;
n n
• b) para n par, a mediana será a média aritmética entre os termos de ordem: 2 e 2 +1 .
2. localizar a classe mediana: tendo o resultado do quociente n2 , observe na coluna da frequência acumu-
lada em que intervalo de valores acumulados esse valor se enquadra. A classe mediana é estabelecida
na coluna da frequência acumulada; sendo assim, convém acrescentar uma coluna para os valores da
frequência acumulada;
Example 3.14. Suponha que no Exemplo (3.13) as opiniões das famílias, sobre o número de quartos em
uma residência, fossem alterados para os valores que constam na tabela abaixo.
No de Quartos por residência No de Opiniões F aci Intervalos da Frequência Acumulada
(xi ) (fi )
1 32 32 do 1o ao 32o termo
2 78 110 do 32o ao 110o termo
3 64 174 do 110o ao 174o termo
4 38 212 do 174o ao 212o termo
5 8 220 do 212o ao 220o termo
Total 220
2. localizar a mediana;
3. Determinar a Mediana.
Localizada a classe mediana, ainda resta verificar qual o ponto, dentro do intervalo desta classe, que corres-
ponde à mediana. Isto pode ser resolvido por interpolação, utilizando-se a fórmula a seguir.
n
− Fant
Md = lMd + 2 · hMd
fM d
Sendo:
lMd = limite inferior do intervalo de classe mediana;
Fant = frequência acumulada da classe anterior à classe mediana;
fMd = frequência (simples) da classe mediana;
n = número de elementos coletados na pesquisa;
hMd = LMd − lMd = amplitude do intervalo de classe mediana;
LMd = limite superior do intervalo de classe mediana.
Example 3.15. A tabela a seguir, corresponde ao tempo (em minutos) que 50 assinantes da Internet gas-
taram durante sua conexão mais recente. Determine a mediana dos minutos gastos na conexão.
Tempo gasto na Internet na última conexão Pessoas que utilizaram a Internet
(xi ) (fi )
5 ` 15 26
15 ` 25 33
25 ` 35 42
35 ` 45 48
45 ` 55 39
55 ` 65 18
65 ` 75 7
Total 213