Escolar Documentos
Profissional Documentos
Cultura Documentos
28-04-2024 1
Breve historial da Estatística
A origem da palavra Estatística provem do latim (status) Sig. estado
A origem da estatística, não se sabe com exactidão quando se
começou a utilizar, mas há indícios que pode estar ligados Babilonia,
China, Egipto como o censo que se realizaram 3000 anos A.C.
Os romanos foram considerados como maestros da organização
politica, que melhor souberam utilizar a estatística. Em cada 5 anos
realizavam um censo populacional, de dados de nascimento, mortes e
matrimónios que eram essenciais para estudar os avanços do imperio.
28-04-2024 2
Definição da Estatística
decisões.
28-04-2024 3
Métodos Estatísticos
Um processo para se obter, apresentar e
analisar características ou valores
numéricos para uma melhor tomada de
decisão em situações de incerteza
28-04-2024 4
Fases do Método Estatístico
Definição do problema;
Planificação do processo de resolução;
Colecta de dados;
Organização dos dados;
Apresentação dos dados;
Análise e Interpretação dos dados.
Obs. Estas fases descritas englobam a Estatística
Descritiva e Inferencial
28-04-2024 5
ÁREAS DA ESTATÍSTICA
28-04-2024 6
IMPORTÂNCIA DA ESTATÍSTICA
Podemos aplicar em diferentes áreas como: na
matemática, na física, na biologia, na psicologia,
sociologia, educação, saúde, administração, economia,
engenharia, etc.
28-04-2024 7
28-04-2024 8
Conceitos Básicos da Estatística
População, amostra, censo, sondagem, unidade estatistica,
parâmetros, estatística, variáveis quantitativas e variáveis
qualitativas (variáveis discretas e variáveis contínuas).
28-04-2024 9
População:conjunto de todos os elementos (pessoas, objetos, etc) que
possuem uma característica em comum, das quais se deseja fazer um
estudo.
Exemplo: Se o objectivo de um estudo é pesquisar o nível de renda familiar
da Cidade de Quelimane, a população seria todas as famílias desta cidade.
Mas, se o objectivo fosse pesquisar apenas a renda mensal do chefe da
família, a população a ser pesquisada seria composta por todos os chefes
de família da Cidade.
28-04-2024 10
A População pode ser:
Finita - quando o número de unidades de observação pode ser contado e é
limitado;
Exemplo: (i) O conjunto formado pelos estudantes que frequentam o Curso
de PSICOLOGIA num determinado semestre e ano da UP;
(ii) Os Educadores de Infância; (iii) Conjunto formado pelos professores de
Educação fisica das escolas da cidade de Quelimane.
28-04-2024 13
Amostragem: processo de extracção das amostras, isto é, a técnica que
permite seleccionar da população os elementos que devem pertencer a
amostra..
Motivos que levam a observar apenas uma parte da população de interesse
(amostra): a falta de tempo, recursos financeiros e humanos.
Para tal usam-se as Técnicas de amostragem, cujo objectivo principal
garantir a representatividade da população, isto é, fazer com que a amostra
seja um retrato fiel da população.
28-04-2024 14
Para estimar o tamanho da amostra exige formulas matemáticas
das quais, não vamos apresenta-las nesta abordagem, mas sim
na inferência estatística. Para o efeito, consideraremos que o
tamanho da amostra não deve ser inferior a 10% do tamanho da
população, o que pressupõe ter uma probabilidade aceitável de
ser representativa (MULENGA).
28-04-2024 15
Tecnicas de amostragem
Probabilisticas: os indivíduos a serem seleccionados da população todos
devem ter as mesmas chances de participar/ pertencer a amostra.
Aleatória simples, sistemática, estratificada e por conglomerados.
28-04-2024 17
Sistemática: é uma variação da amostragem aleatória simples, sua
aplicação requere que a população seja ordenada segundo um
determinado critério de modo que cada elemento seja identificado pela
posição. O processo de extracção dos elementos consiste em escolher
ao acaso o primeiro e os restantes são obtidos mecanicamente
mediante uma progresso aritmética de razão k.
Determinamos k = int(N/n) é o inteiro mais próximo (k é a razão dos
elementos que compõem a amostra). Se N=60 e n=10; k=6
Sortear um numero x entre 1 a k (a ordem do elementos). Os
elementos da amostra serão os correspondentes aos números: x
(coincide com o 1º escolhido entre 1 a k); x+k; x+2k;…
Se o sorteado for 3=x; 9; 15; 21; 27; 33; 39; 45; 51; 57 compõem n
28-04-2024 18
Estratificada: é aplicado no caso em que se tem a certeza de que a
população é heterogénea em relação as características a estudar. Neste
caso, deve proceder-se a uma previa decomposição da população em
estratos homogéneos. Exemplos: cidades pequenas e grandes, área
urbana e rural, sexo, faixa etária, faixa de renda, etc
N = N1 + N2 + N3 + N4 + N5 + N6 + N7 + N8
n = n1 + n2 + n3 + n4 + n5 + n6 + n7 + n8
28-04-2024 19
Por conglomerados: é conveniente quando a população não permite ou
torna extremamente difícil que se identifiquem os seus elementos ou
porque esta geometricamente dispersa ou por outra razão qualquer,
entretanto pode-se identificar alguns subgrupos da população e estudar as
características destes grupos para depois inferir na população. Exemplos:
quarterões, famílias, organizações, agencias, edifícios, etc
28-04-2024 21
Intencional: consiste em usar um determinado critério, e escolhido
intencionalmente um grupo de elementos que irão compor a amostra.
O investigador se dirige intencionalmente a grupos de elementos dos
quais deseja saber a opinião.
Exemplo: Numa pesquisa de um professor de Português pretende
perceber as causas da dificuldade na escrita dos estudantes da 10a
classe da Escola 25 de Setembro da cidade de Quelimane.
Para o estudo, se supõe a existência de dificuldade na escrita. E,
logicamente, aos indivíduos com tais dificuldades esta dirigida a
pesquisa. Através de um critério (assistência as aulas, verificação dos
cadernos de apontamentos,...) apenas os estudantes com tais
dificuldades poderiam ser entrevistados.
28-04-2024 22
Por quotas: método mais utilizado do que os dois mencionados
anteriormente, pois apresenta uma ideia intuitiva da representatividade
dos grupos na amostra, para tal numa pesquisa abrange três fases:
Classificar a população em termos de propriedades ou modalidades
que se parecem relevantes para a característica a estudar;
Determinar as proporções N1, N2, …, Nk que constituem as
partições da população N segundo as características que a
população apresenta; e
Calcular as quotas (ni) a seleccionar no grupo Ni para pertencer na
amostra ni=(nNi)/N.
28-04-2024 23
Tarefa: Identificar as possíveis técnicas de amostragem a aplicar para
cada situação
Um pesquisador médico da Faculdade de Medicina da UEM
entrevista todos portadores de leucemia em cada um de 20 hospitais
seleccionados aleatoriamente da Cidade de Maputo; Cong
Um docente sociólogo na UP-Quelimane selecciona 12 homens e 18
mulheres de cada uma das quatro turmas do curso de Historia; Estra
STAE escreve o nome de cada Presidente Municipal da Província da
Zambézia, em cartões separados, mistura-os e extrai 10 nomes. Simp
28-04-2024 24
Tarefa: Descreva de forma detalhada um método que poderia ser
usado para cada situação de modo a obter uma amostra
representativa:
De 10% de uma população de 200 estudantes de uma Escola
Secundaria da Cidade de Quelimane;
De 10% de uma população de 300 estudantes em que há 220
raparigas e 80 rapazes;
De 40 casas de uma rua do Bairro Sampene que contém 1000
casas.
28-04-2024 25
28-04-2024 26
Exemplo: Se pretendemos fazer um estudo sobre as três
simpatias preferidas de 16500 rapazes e 18500
raparigas.
Qual é a população?
Como eleger uma amostra representativa formada por
2000 rapazes e raparigas?
28-04-2024 27
Qual é a população?
A população é o numero total de rapazes e raparigas, isto é, 35000.
28-04-2024 28
Variáveis e classificação
Para MAROCO, J. 2007, p.27 afirma que o processo de
análise estatística, o investigador depara-se sempre com
‘’algo’’ que precisa medir, controlar ou manipular durante o
processo de investigação<<variável>>. Ainda enfatiza que
objecto estatístico são as variáveis e informação.
28-04-2024 29
Variável: qualquer quantidade (valores distintos ou mensurações) ou
característica que se deseja observar, medir, controlar, manipular para se
tirar algum tipo de conclusão da amostra ou população. No geral
apresentam-se por letras maiúsculas: X, Y, Z, etc.
Antes de realizar qualquer tratamento estatístico de um conjunto de dados,
é importante identificar o tipo de variável que será analisado , pois, é
mediante a este conhecimento que o pesquisador poderá ou não adpotar
determinadas técnicas estatísticas para solucionar problemas.
28-04-2024 30
Tipos de Variáveis
Normalmente, as variáveis podem ser classificadas: Qualitativas ou
Quantitativas.
Variáveis Qualitativas: quando os valores que elas podem receber são
referentes à qualidade, atributo ou categoria.
Exemplos:
Raça: podendo assumir os valores Branco ou Negro;
Estado cívil de um indivíduo: podendo assumir as categorias: solteiro,
casado, viúvo e divorciado
28-04-2024 31
As variáveis qualitativas podem, ainda, ser classificadas como:
Nominais ou Ordinais.
As nominais: são caracterizadas por dados que se apresentam apenas
sob o aspecto qualitativo sem nenhuma ordenacao.
Exemplo: Raça; Resultado de um teste; etc
As ordinais: são caracterizadas por categorias que apresentam uma
ordenação natural (crescente ou descrescente).
Exemplo: Conceito de qualidade de um produto; Consumo de sumo.
28-04-2024 32
As Variáveis Quantitativas - quando os valores que ela pode
assumir são numéricos, os quais podem ser obtidos através de
uma contagem ou mensuração.
As variáveis quantitativas podem ser classificadas de acordo com
o processo de obtenção; podendo ser: Discreta ou Contínua.
28-04-2024 33
As discretas: variáveis numéricas obtidas a partir de procedimento de
contagem.
Exemplo: Quantidade de pessoas numa família; Quantidade de acidentes
numa indústria; etc.
As contínuas: variáveis numéricas cujos valores são obtidos por um
procedimento de mensuração, podendo assumir quaisquer valores num
intervalo dos números reais
Exemplo: a temperatura, altura, salário, velocidade de um atleta, etc
28-04-2024 34
Tarefa:
Classifique as variáveis estatísticas:
Diâmetro de um rolamento; (VQC)
Números de equipamento defeituosos; (VQD)
Montante de vendas, em dólares; (VQD)
Habilitações literárias; (VQO)
28-04-2024 35
Números de inscrição do INSS (VQN)
Idade das crianças com dificuldades de aprendizagem; (VQC)
Religião de um individuo; (VQN)
Renda anual de enfermeiras; (VQC)
Comportamento de um estudante; (VQO)
Rendimento Pedagógico de estudantes numa disciplina.
(VQC)
28-04-2024 36
Para quê se constroem as tabelas de distribuição de
frequências? Ordenar, agrupar e resumir informação.
28-04-2024 37
Distribuição de Frequências:conjunto de todos os pares de
valores, referentes a cada dado observado e sua
respectiva frequência.
Titulo:
Ordem (i) Nome da Variável Frequências
(Xi)
Fonte:
Corpo
28-04-2024 39
Os procedimentos para apresentação das distribuições de freqüências:
Dados brutos: dados originais, que ainda não se encontram prontos para análise,
por não estarem numericamente organizados.
Dados em Rol: são os dados brutos, organizados em ordem crescente ou
decrescente.
Amplitude total ou Range (R): é a diferença entre o maior e menor valor observados,
cuja, a expressão é
28-04-2024 40
Exemplo: Número de irmãos de alguns 20 estudantes do curso de
AGE, 1º ano do 1º semestre/2013 da UP-Quelimane
2 324 3 5 5 4 4 5 1 1 1 2 2 3 3 4 4 4
6 866 1 1 5 1 7 4 5 5 5 5 5 6 6 6 7 8
28-04-2024 41
Frequência absoluta ou simples (Fi): número de vezes que o elemento aparece na
amostra, ou o número de elementos pertencentes a uma classe. Normalmente, a .
28-04-2024 42
Representação gráfica de dados
28-04-2024 44
Comportamento de Mau Suf Bom Muito Total
estudante bom
Fi 10 25 43 12 90
28-04-2024 45
Desde somente referimos casos em que a variável é
quantitativa discreta, mas há casos em que a variável é
quantitativa contínua e os dados são poucos, podemos
construir gráficos de barras não adjacentes (separação entre
as barras) e tabelas de distribuição de frequências (sem
classes). O que acontecería se tivessimos muitos dados para
uma variável quantitativa contínua?
28-04-2024 46
Número de classe (k): Amplitude das classes (h):
Ponto médio das classes ( ou : é o ponto que divide o intervalo de classe em duas
partes iguais, ou seja .
28-04-2024 47
Tabela: Tabela de distribuição de frequências das alturas dos estudantes
28-04-2024 48
Medidas de Estatística Descritiva
Medidas de Estatística Descritiva: Medidas que permitem resumir informação
proveniente de uma população: medidas de posição, medidas de dispersão e
medidas de forma.
Medidas de tendência Central (dados não agrupados e agrupados): são bastante
utilizadas e representam o centro ou o meio de um conjunto de dados. Entretanto,
essas medidas são: a mediana, a moda e média. Também, podemos encontrar
outras medidas relacionadas com centro como: média geral, média harmônica,
média geométrica, decis, percentis e quartis.
28-04-2024 49
Mediana (Md ou ): o valor que divide o conjunto de dados ordenados em duas partes iguais, isto e,
50% das unidades observadas possuem valores menores ou iguais ao valor mediano e as demais
50% possuem valores acima da mediana. Para se obter o valor da mediana é necessário os
seguintes passos:
Ordenar o conjunto de dados em ordem crescente ou decrescente;
Identificar a posição central do conjunto de dados, isto é, a posição onde se encontra o valor da
mediana. Esta(s) posição (ões) pode(m) ser encontrada(s) utilizando-se o seguinte:
{
Obs. Para dados grupados, a Md é localizada a
𝑿 𝒔𝒆 𝒏 é 𝒊𝒎𝒑𝒂𝒓
𝑷= (
𝒏+ 𝟏
𝟐 ) partir Fiac, isto é, localizar a célula nas Fiac
𝑴𝒅= 𝑿 +𝑿 onde se encontram os dados acumulados, partir
𝑷=
𝒏
𝟐( ) 𝒏′
𝑷 = +𝟏
𝟐 ( )
𝒔𝒆 𝒏 𝒑𝒂𝒓 das condições supra indicadas para determinar
𝟐
28-04-2024 as posições das medianas. 50
Além do destacado acima, quando as variáveis são continuas. A mediana é calculada pela
28-04-2024 51
Moda (Mo): valor (ou os valores) no conjunto de dados que ocorre(m) com maior frequência. Em
certo (s) caso (s), a moda podem ser uimodal, bimodal, três ou mais é multimodal.
Para dados agrupados, a moda é localizada a partir das frequências absolutas (Fi), isto é,
localizar em que célula a Fi é maior em relação as restantes.
Além do destacado acima, quando as variáveis são continuas. A moda é calculada pela
seguinte fórmula de CZUBER: , onde:
: limite inferior da classe modal
: diferença entre as frequências absolutas da classe modal e a imediatamente anterior
: diferença entre as frequências absolutas da classe modal e a imediatamente posterior
: amplitude da classe modal
28-04-2024 52
Obs. Quando as amplitudes das classes não são iguais, a moda é encontrada através das
densidades das classes (). Esta densidade serve para identificar qual a classe modal (aquela
com maior densidade) e a fórmula de CZUBER será , aqui admite - se que e .
Exemplo: a) 2; 3; 3; 3; ; 10; 11; 11; 16. Os dados assim dispostos, a mediana é 8 e a moda é 3.
b) Use os mesmos dados e agrupe, na tabela de distribuicao de frequencias. Depois
aplique os conhecimentos aprendidos e localize as Md e Mo.
c) O peso de 26 alunos de uma determinada ESG do Distrito M, na Província da
Zambézia. Forneça a mediana e a moda dos pesos de 26 alunos, dessa Escola.
28-04-2024 53
𝑖 Peso de alunos (g) 𝐹𝑖 Fiac
𝒏 𝟐𝟔
em classes −𝑭 𝒊𝒂𝒄−𝟏 −𝟏𝟏
𝟐 𝟐
1 10 ⊢ 20 4 4 𝑴𝒅=𝒍𝒊𝒏𝒇𝑴𝒅 + 𝒙𝒉=𝟑𝟎+ 𝒙𝟏𝟎=𝟑𝟔,𝟔
𝑭 𝒊𝑴𝒅 𝟑
2 20 ⊢ 30 7 11
Classe Mediana
3 30 ⊢ 40 3 14
4 40 ⊢ 50 9 23 Classe Modal
5 50 ⊢ 60 2 25
60 ⊢ 70
6 1 26
∆𝟏 (𝟗−𝟑)
𝑛𝑖 𝑛 = 26 𝑴𝒐=𝒍𝒊𝒏𝒇𝑴𝒐+ 𝒙𝒉=𝟒𝟎+ 𝒙𝟏𝟎=𝟒𝟒, 𝟔
∆𝟏+∆𝟐 (𝟗−𝟑)+(𝟗−𝟐)
28-04-2024 54
Média Aritmética ou Média ( obtida a partir da razão entre a soma dos valores observados e o
total de observações:
Para dados não agrupados, a média é calculada por , onde: , , são valores distintos da
variável X .
Para dados agrupados, a média é calculada por , onde: : , , e , , ..., são as freqüências
absolutas de valores da variável X.
Dados agrupados, para a variável contínua, deve-se achar os pontos médios de cada classe ,
e aplicar a seguinte fórmula , onde: : , , e , , ..., são as frequências absolutas de valores da
variável X de cada valor representativo das classes.
28-04-2024 55
Exemplo: a) 2; 3; 3; 3; 8; 10; 11; 11; 16. Os dados assim dispostos, a média é 8
Xi Fi
2 1
3 3
8 1
10 1
11 2
16 1
n=9
28-04-2024 56
Peso de alunos (g) ci ci Fi
em classes
1 4 15 60
2 7 25 175
3 3 35 105
4 9 45 405
5 2 55 110
6 1 65 65
920
28-04-2024 57
Média Geral ():
Sejam as médias aritméticas de séries (grupos) e os números de termos destas séries,
recpectivamente. A média aritmética da série formada pelos termos das séries é dada pela fórmula:
Exemplo: a partir da tabela. Determinar a média geral, das médias aritméticas das 4 séries e os
números de termos destas séries.
28-04-2024 58
Média Geométrica (Mg): Dados agrupados e não agrupados em classes
Sejam valores da variável , associadas as frequências absolutas , aa média geométrica é a raiz de
ordem do produto desses números pela suas frequências absolutas:
Dados não agrupados:
Dados agrupado:
28-04-2024 59
Media Harmônica (Mh): Dados agrupados e não agrupados em classes
Sejam valores da variável , associadas as frequências absolutas , assim a média harmônica é o
quociente de ordem pelo somatório do quociente das frequências absolutas pelas sues
respectivos valores:
28-04-2024 60
Separatrizes: Quartis, Decis e Percentis: são medidas que representam valores que
ocupam determinados lugares na distribuição de frequências.
Quartis: são medidas de separatrizes que dividem as distribuição de
𝑄1
frequências em 4 partes iguais.
0% 25% 50% 75% 100%
Qi = quartil i=1,2,3
Q1 = 1º quartil, valor situado de tal modo na série que uma quarta parte (25%) dos
dados é menor que ele e as três quartas partes restantes (75%) são maiores.
Q2 = 2º quartil, evidentemente, coincide com a Mediana (Q2 = Md).
Q3 = 3º quartil, valor situado de tal modo que as três quartas partes (75 %) dos termos
são menores que ele e uma quarta parte 25 % é maior.
28-04-2024 61
Para variáveis continuas, os quartis são determinados pela seguinte expressão:
(Qi = quartil i=1, 2, 3)
Onde temos:
: limite inferior da classe do quartil considerado
h: amplitude de classe do quartil considerado
: frequência absoluta do quartil considerado
: frequência acumulada anterior à classe do quartil considerado
28-04-2024 62
Decis: são medidas de separatrizes que dividem a distribuição de frequência em 10 partes
iguais.
𝐷1 𝐷 2 𝐷 3 𝐷 4 𝐷5 𝐷 6 𝐷7 𝐷 8 𝐷 9
10% 20% 30% 40% 50% 60% 70% 80% 90%
Os decis são determinados pela seguinte expressão (Di = decil i=1, 2, 3, 4, 5, 6, 7, 8, 9)
Onde temos:
: limite inferior da classe do decil considerado
h: amplitude de classe do decil considerado
: frequência absoluta do decil considerado
: frequência acumulada anterior à classe do decil considerado
28-04-2024 63
Percentis: são medidas de separatrizes que dividem a distribuição de frequência em 100%
de partes iguais.
Os percentis são determinados pela seguinte expressão
(Pi = percentil i=1, 2, 3, ..., 97, 98, 99)
Onde temos:
: limite inferior da classe do percentil considerado
h: amplitude de classe do percentil considerado
: frequência absoluta do percentil considerado
: frequência acumulada anterior à classe do percentil considerado
28-04-2024 64