Escolar Documentos
Profissional Documentos
Cultura Documentos
Aplicada a
Psicologia
UNIDADE I
NOTAS INTRODUTÓRIAS E
ESTATÍSTICA DESCRITIVA
2022
Ficha Técnica:
Título: Estatística aplicada a Psicologia - Notas Introdutórias e Estatística Descritiva
Autor: Odete Omar e Didian Natividade
Revisor 1: Abiba Mamade e Amélia Mungoi
Revisor 2: Emílio Muchanga
Execução gráfica e paginação: Instituto Superior Monitor
2ª Edição: 2022
Adaptação por Instituto Superior Monitor Março de 2022
© Instituto Superior Monitor
Nenhuma parte desta publicação pode ser reproduzida ou transmitida por qualquer forma ou
por qualquer processo, electrónico, mecânico ou fotográfico, incluindo fotocópia ou gravação,
sem autorização prévia e escrita do Instituto Superior Monitor. Exceptua-se a transcrição de
pequenos textos ou passagens para apresentação ou crítica do livro. Esta excepção não deve de
modo nenhum ser interpretada como sendo extensiva à transcrição de textos em recolhas
antológicas ou similares, de onde resulte prejuízo para o interesse pela obra. Os transgressores
são passíveis de procedimento judicial.
ÍNDICE
ACERCA DESTA DISCPLINA ...................................................................................... 4
PRECISA DE AJUDA ........................................................................................................ 5
TRABALHOS ..................................................................................................................... 6
DURAÇÃO ......................................................................................................................... 6
TÉCNICAS DE ESTUDO .................................................................................................. 6
RESULTADO DE APRENDIZAGEM .............................................................................. 7
ESTRUTURA DA UNIDADE I ....................................................................................... 8
CAPÍTULO I – INTRODUÇÃO À ESTATÍSTICA APLICADA A PSICOLOGIA . 9
OBJECTIVOS DO CAPÍTULO .................................................................................. 9
1.1 CONSIDERAÇÕES GERAIS ...................................................................................... 9
1.2 CONCEITOS BÁSICOS ............................................................................................ 10
1.3 O MÉTODO ESTATÍSTICO ..................................................................................... 14
CAPÍTULO II – ESTATÍSTICA DESCRITIVA......................................................... 18
2.1 DISTRIBUIÇÃO DE FREQUÊNCIA ................................................................. 18
2.2. COMO ELABORAR UMA DISTRIBUIÇÃO FREQUÊNCIA ............................... 20
2.3 MEDIDAS DE TENDÊNCIA CENTRAL .......................................................... 25
2.4. TIPOS DE MÉDIAS .................................................................................................. 26
2.5 MEDIDAS SEPARATRIZES............................................................................... 47
2.6 OUTRAS MEDIDAS DE DISPERSÃO .............................................................. 58
QUADRO SINÓPTICO.................................................................................................. 67
SUGESTÕES DE LEITURA ............................................................................................. 68
ACERCA DESTA DISCPLINA
Na segunda unidade falaremos das Probabilidades, onde daremos atenção a teoria das
probabilidades, álgebra dos acontecimentos, probabilidade condicional e independencia bem
como o teorema de probabilidade total e fórmula de Bayes. Por outro lado, veremos os testes
de Hipoteses onde iremos aprender a distinguir a hipotese nula da hipotese alternativa, os
tipos de erros e nível de significância quando se pretende analisar e intrepretar os dados,
testes de média em amostras independentes ou relacionadas e testes de proporção , ainda
nesta unidade falar-se-á da amostragem, dando atenção a teoria de amostragem, a teoria da
estimação e a amostragem aleatória simples.
PRECISA DE AJUDA
No caso de dúvidas sobre os conteúdos desta unidade, por favor contacte o respectivo tutor.
O número do tutor será disponibilizado pela sua Faculdade, podendo também consultar os
contactos e horários do tutor através do site: https://www.ismonitor.ac.mz/ ou através da
página facebook: https://www.facebook.com/ismonitor/.
Uma vez que é um estudante universitário, as suas técnicas de aprendizagem deverão ser
distintas das que utilizava durante o ensino secundário, em regime presencial.
Nesta licenciatura, o aluno deverá assumir uma maior autonomia, isto é, uma maior
capacidade de gestão responsável do seu tempo.
Por este motivo, importa que construa um programa de estudos realista e que o cumpra
rigorosamente, seleccionando horários e locais tranquilos para estudar.
Depois de estudar cada capítulo desta unidade o estudante deve resolver todos os exercícios
de aplicação como forma de consolidação das matérias nela vertidas. Os exercícios de
aplicação não serão submetidos ao Instituto Superior Monitor.
DURAÇÃO
Tempo para leitura da unidade: 23 horas
Tempo para trabalhaos de pesquisa 11 horas
Tempo para a realização de exercícios práticos: 14 horas
Tempo para a realização de avaliação: 2 horas
TÉCNICAS DE ESTUDO
Por você ser um estudante universitário as suas técnicas de aprendizagem serão diferentes
das que usava nos tempos da escola secundária e na presença de um professor.
Neste curso você terá uma grande autonomia, isto é, RESPONSABILIDADE. Acima de
tudo, você fará uma gestão responsável do seu tempo.
Faça um programa de estudos realista e cumpra-o rigorosamente. Escolha horas e locais
tranquilos para os seus estudos.
Faça uso dos demais recursos referenciados na unidade e mobilize a sua motivação
profissional e/ou pessoal para adequar as suas actividades de estudo a outras
responsabilidades profissionais, sociais e pessoais. Partilhe as suas aprendizagens com os
outros.
É boa prática submeter os testes de cada disciplina de forma gradual, isso possibilitará-te a
avaliação do seu aproveitamento pedagógico, isto é, é sempre melhor conhecer a nota do
primeiro teste antes de submeter o segundo para em casos de insucesso saber redobrar o
esforço que lhe fará obter uma nota melhor. Contudo entregando todos os testes ao mesmo
tempo já anula a possibilidade de acompanhar o desempenho académico.
ESTRUTURA DA UNIDADE I
A presente unidade é composta por dois capítulos e visam propiciar aos estudantes os
elementos indispensáveis para a concepção de trabalhos de pesquisa que utilizam o método
estatístico para a recolha tratamento e interpretação de resultados.
OBJECTIVOS DO CAPÍTULO
Actualmente tem-se discutido muito sobre a Estatística nos seguintes âmbitos: Estatística na
educação, saúde, na pesquisa, na política, e etc. Perante esta situação levantamos uma
questão. Afinal qual será a importância da Estatística na Psicologia?
A prática da Psicologia é feita muitas vezes de investigação e estudos que requerem a análise
de dados.
Quando o psicólogo faz uma intervenção não é, só, pela percepção, pela interpretação, ou
pelo tacto que possa ter para a situação em causa; ele baseia-se num conjunto de estudos
científicos, empíricos, suportados pela evidência e observação experimental, baseada no
método científico. O psicólogo trabalha a dimensão destas emoções, com um suporte teórico
baseado na observação cuidada e na fundamentação empírica. Portanto, a Psicologia é uma
ciência porque o conhecimento é baseado no método científico, tendo por suporte
observações empíricas, isto exige que os psicólogos e os investigadores em psicologia
dominem o método científico e saibam analisar apropriadamente os dados, quer de natureza
experimental ou correlacional, nos quais se irão basear as teorias psicológicas. É exactamente
aqui, na análise dos dados e da informação, que entra a Estatística.
A Psicometria é a aplicação de técnicas estatísticas aos testes psicológicos. Quando falamos
por exemplo de validação de uma escala ou da fiabilidade da medida, que é uma componente
importante da Psicometria exige um profundo conhecimento de técnicas estatísticas. Por
ESTATÍSTICA
Estatística pode ser definida como o ramo da Matemática aplicada que fornece um conjunto
de métodos científicos de colecta, organização, resumo, descrição, análise e interpretação
de dados visando estudar e medir os fenómenos colectivos, bem como a utilização dos
mesmos na tomada de decisões.
A Estatística é uma área do conhecimento que utiliza teorias probabilísticas para explicação
de eventos, estudos e experimentos, que tem por objectivo obter, organizar e analisar dados,
determinar as correlações que apresentem, tirando delas suas consequências para descrição e
explicação do que passou e previsão e organização do futuro.
O estudo da estatística subdivide-se em: estatística descritiva e estatística inferencial
ESTATÍSTICA DESCRITIVA
É a parte da estatística que se preocupa com a recolha, classificação, apresentação, análise e
interpretação de dados estatísticos de fenómenos da mesma natureza, sem tirar conclusões
sobre um grupo maior.
Exemplo: O estudo da infecção pelo HIV numa determinada região.
ESTATÍSTICA INFERENCIAL
OBSERVAÇÃO ESTATÍSTICA
É um processo sistemático cientificamente argumentado de dados em massa com uma
característica comum e objecto de estudo.
POPULAÇÃO (UNIVERSO)
Conjunto de todos os valores que descrevem o fenómeno que interessa ao investigador. A
população pode ser finita ou infinita.
AMOSTRA
É o subconjunto ou parte representativa da população (ou universo), seleccionada para o
estudo.
Atenção! A amostra é utilizada quando não é possível ou é difícil estudar toda a população.
A partir das conclusões ou características tiradas desta, faz-se um juízo ou uma inferência
para as características da população.
DADO ESTATÍSTICO
É sempre um número real.
a- Primitivo ou Bruto: é aquele que não sofreu nenhuma transformação Matemática. Ex:
Número directo.
b- Elaborado ou secundário: é aquele que sofreu transformação Matemática. Ex.
Percentagem, média, etc.
VARIÁVEIS
São as características que podem ser observadas (ou medidas) em cada elemento da
população, é um conjunto de resultados possíveis de um fenómeno.
VARIÁVEIS DISCRETAS
São aquelas que só podem assumir valores inteiros não negativos inclusive o zero, num
intervalo finito ou infinito.
Exemplo:
• Número de estudantes que frequentam a disciplina de Estatística Aplicada à
Psicologia;
• O número de filhos numa determinada família.
VARIÁVEIS CONTÍNUAS
São aquelas que podem assumir qualquer valor real dentro do intervalo finito ou infinito:
Exemplo:
• O peso de cada remessa de manuais de Estatística Aplicada a Psicologia;
• A temperatura dentro de uma escala.
São aquelas que separam os atributos em categorias diferentes, não forçando uma ordem em
termos de hierarquia
Exemplo:
Sexo, cor dos olhos, fumante/não fumante, doente/sadio.
INFORMAÇÃO ESTATÍSTICA
É um meio e não um fim, porque é um instrumento ao serviço do desenvolvimento de uma
realidade (servindo aos utilizadores de dados estatísticos – governantes, gestores, homens de
negócios, sociólogos, investigadores, etc.). A informação estatística deve obedecer as
seguintes características:
• Qualidade: os dados estatísticos devem traduzir uma realidade de forma simples clara,
para permitir a apreensão e compreensão dos aspectos mais relevantes;
• Actualidade: a informação estatística que se apresenta deve estar disponível de forma
atempada aos utilizadores desta no momento necessário;
• Utilidade (dependentes das anteriores): a informação estatística serve de meio para o
desenvolvimento das sociedades, porque é um instrumento de tomada de decisão.
Recolha de Dados
A recolha de toda a informação necessária pode ser:
Directa (Dados primários) - quando os dados são obtidos da fonte originária é possível
encontrar em ficheiros ou registos (certidão de nascimento, casamento e óbito, importação e
exportação de mercadorias);
Indirecta (Dados secundários) - quando é deduzida de elementos conhecidos (recolha
directa) e/ou do conhecimento de outros fenómenos relacionados com o fenómeno em estudo.
Como exemplo, podemos citar
A pesquisa sobre a mortalidade infantil, que é feita através de dados colhidos por uma colecta
directa.
A recolha directa de dados pode ser classificada relativamente ao factor tempo em:
Apresentação de Dados
Uma vez recolhidos os dados é feita a revisão crítica, convém organizar os dados de uma
forma prática e racional, para um melhor entendimento do fenómeno que se pretende estudar.
O principal objectivo da Estatística Descritiva é então criar os instrumentos,
(tabelas ou gráficos) necessários para classificar e apresentar conjuntos de dados numéricos
de tal modo que a informação neles contida seja apreendida de forma eficiente e eficaz.
EXERCÍCIOS
Exemplo:
A altura de 100 estudantes tirado de uma lista alfabética dos Registos Académicos do ISM.
ROL: é o conjunto de dados numéricos brutos dispostos em ordem crescente ou decrescente
de grandeza.
AMPLITUDE TOTAL DO ROL (At) é a diferença entre o maior e o menor número do rol
AT = X máx − X min
INTERVALO DE CLASSE: é a diferença entre o limite Superior (Ls) limite inferior (Li) é a
amplitude de classe (At).
INTERVALO TOTAL (IT): é a diferença entre o maior limite superior e o menor limite
inferior de todas as classes do intervalo considerado.
PONTO MÉDIO DE UMA CLASSE (XI): É igual a soma do limite inferior e o limite
superior do intervalo de classe
X min( i ) + X max( i )
xi =
2
Frequências de Dados não agrupados em classes: distribuição usada para o caso em que
se tem poucos dados e um número de valores ou modalidades apresenta repetições.
1. Construção do Rol (na posse dos dados brutos que pode ou não ser construído);
2. Determinação da Amplitude Total (Diferença entre o maior e menor valor do Rol);
At = X máx − X min
Método 3: K = n
At
A icl =
k
K = número de classes
Observação:
Por vezes esta divisão não fornece números inteiros devendo-se para o efeito arredondar o
número correspondente da amplitude do intervalo de classe a que se chegou, para um
número mais adequado que facilite os cálculos (arredondamento arbitrário).
Exemplo:
Para representar dados não agrupados em classes (variável discreta), provenientes de uma
tabela de distribuição de frequências use:
Histograma: é um diagrama de áreas formado por rectângulos de tal forma que a área de
cada um dos rectângulos seja proporcional à frequência de classe. O histograma é
representado para dados agrupados em classes.
Com base nestes dados vamos elaborar uma tabela de distribuição de frequências absolutas,
e determinar os pontos médios da classe.
RESOLUÇÃO:
159 .... .... .... .... .... .... .... .... ....
160 .... .... .... .... .... .... .... .... ....
162 .... .... .... .... .... .... .... .... ....
162 .... .... .... .... .... .... .... .... ....
164 .... .... .... .... .... .... .... .... ....
K= 5,8 6 K 6
ou
Método 3: K = n
K = n= 30 =K = 5,4772256
K 5
ATotal 41
Aicl = Aicl = = 8,2 8
K 5
- 30 -
12
10
0
159 |– 167 167 |– 175 175 |– 183 183 |– 191 191 | – 199
EXERCÍCIOS DE APLICAÇÃO
Depois de ter lido com atenção o capítulo I, procure agora responder às seguintes questões:
1. Quais as formas da apresentação da informação estatísticas? Indique as vantagens
e desvantagens de cada uma delas.
• Medidas de posição;
• Medidas de variabilidade ou dispersão;
• Medidas de assimetria;
• Medidas de curtose.
As medidas de posição mais importantes são as medidas de tendência central. E que tal
denominação deve-se ao facto destas tenderem a localizar-se no centro de uma série de dados.
Assim, de modo geral, se houver a necessidade ou interesse em apresentar informações de
um conjunto de dados na forma resumida devemos apresentá-los em forma de medidas de
tendência central.
Dentre elas destacam-se:
• A média aritmética;
• A mediana;
• A moda.
É a média usada para o caso em que se pretende conhecer a média dos dados não agrupados.
Na soma de todos os valores observados atribui-se o mesmo peso.
n
x + x 2 + .... + x n x i
X = 1 = i =1
n n
RESOLUÇÃO
Nota: Esta média será representativa da série de valores apresentada, embora o resultado
obtido não esteja representado nos dados. O que significa que a média obtida não tem
existência concreta
8-7,56 0,44
5,5-7,56 -2,06
6-7,56 -1,56
6,5-7,56 -1,06
8,5-7,56 0,94
9-7,56 1,44
10-7,56 2,44
Total 0,0
MÉDIA PONDERADA ( X P ):
f .x1 + f 2 .x 2 + .... + f n .x n ( f .x ) i i
Xp = n
= i =1
n
i =1
fi fi =1
i
0 2 0
1 4 4
2 8 16
3 10 30
4 4 16
Total 24 66
RESOULUÇÃO
Classes de fi xi fi . xi
alturas
Total 24 - 4.520
2. Somando-se (ou subtraindo-se) uma constante (c) de todos os valores de uma variável, a
média do conjunto fica aumentada (ou diminuída) dessa constante.
MÉDIA GEOMÉTRICA
n
X g = ( x1 )( x2 ).......( xn ) X g =
n n
x i
i =1
Onde:
n
= ( pi)
i =1
- É o símbolo que indica o produto de valores da variável
n = Número de observações
n n
Em suma tem-se:
1 n
log X g = log xi
n i =1
A expressão acima mostra que o logaritmo da média geométrica é igual à média aritmética
dos logaritmos dos valores da série.
Atenção! Recorde-se que a média geométrica somente tem significado quando todos os
valores da série são positivos
k
X gp = n ( x1f1 )( x 2f 2 ).....(. x j j ) X gp = n
f
x
fj
j
j =1
Onde:
k
n = i = f i = Número de observações
i =1
1 k
X gp = anti log ( f j * log x j )
n j =1
2. Séries que apresentam o mesmo número de elementos com o mesmo produto têm a
mesma média geométrica;
6. Quanto maior for a diferença entre os valores originais maior será a diferença entre as
médias aritmética e geométrica
x
2
i
Xq = i =1
Onde:
X q = Valor genérico da observação
n = Número de observações
xj * f j
2
j =1
X qp = k
f j =1
j
Onde:
k
n =
j = f j = Número de observações
j =1
n
Xh = n
1
i =1 x i
Onde:
X h = Valor genérico da observação
n = Número de observações
n
H p = X hp = k fj
x
j =1 j
Onde:
k
n= j = fj = Número de observações
j =1
A média harmónica é menor que a média geométrica para valores da variável diferentes de
NOTA:
1) A média harmónica não aceita valores iguais a zero como dados de uma série;
2) A igualdade X h = X g = X . Só ocorrerá quando todos os valores da série forem iguais;
3) Quando os valores da variável não forem muito diferentes, verifica-se aproximadamente
a seguinte relação:
(X + X h )
Xg =
2
2 1
xi xi log xi
xi
x i
36
a) Média aritmética: X = i =1
= =6 X =6
n 6
b) Média geométrica:
1 n 1 1 n
X g = log X g =
n i =1
log xi = (4,20758) = 0,70126
6
X g = anti log log xi =
n i =1
anti log 0,70126 = 5,02636 5,03 X g 5,03
c) Média quadrática:
n
x
2
i
Xq = i =1
= 47,66 6,903 Q = X q 6,903
n
n 6
Xh = n
= 4,183 H = X h 4,183
1
x
1,434523809
i =1 i
MEDIANA ( M e )
Você deve estar recordado que, a mediana é um valor central de um rol, ou seja, a mediana
de um conjunto de valores ordenados (crescente ou decrescente) é a medida que divide este
conjunto em duas partes iguais, cujo valor está sucedido de 50% e antecedido de 50% desse
conjunto.
Onde:
Em = elemento mediano
n = número de elementos do conjunto
Exemplo:
n +1 7 +1
Em = = =4
2 2
“4”, Indica a posição do elemento mediano no conjunto dado. No caso concreto corresponde
ao valor “9”, que antecede de {2;5;6} e sucede de {10;12;16} respectivamente.
• Se número de elementos for par
2n + 2
Em =
4
Exemplo:
Dado o conjunto X= {2;5;7;9;9;10;16} encontre o elemento mediano em:
RESOLUÇÃO:
1º) Os valores já estão ordenados em ordem crescente.
2º) O número de elementos que compõem este conjunto é par.
2n + 2 (2).(6) + 2
Em = Em = = 3,5 Em = 3,5
4 4
“3,5”, indica a posição do elemento mediano dentro deste rol. Portanto, a mediana
7 + 9 16
corresponde à média aritmética entre os valores centrais “7” e “9”, ou seja = = 8.
2 2
Notas:
• Quando o número de elementos da série estatística for ímpar, haverá coincidência da
mediana com um dos elementos da série.
• Quando o número de elementos da série estatística for par, nunca haverá coincidência da
mediana com um dos elementos da série. A mediana será sempre a média aritmética dos
2 elementos centrais da série.
• Em uma série a mediana, a média e a moda não têm, necessariamente, o mesmo valor.
Caro estudante, recorde-se que quando aparecem repetições de valores o cálculo da mediana
passa a ter um procedimento análogo, lembre -se que temos as frequências correspondentes
para cada uma das varáveis dadas.
Comece por acumular as frequências absolutas de formas a poder localizar o elemento que
divide esta observação, em duas partes iguais.
De seguida verifique se o número de observações é impar ou par, e para cada caso aplique
os procedimentos anteriormente vistos.
xi fi Fa
2 2 2
4 5 7
5 8 15
7 6 21
8 4 25
- 5 -
f
i =1
i = 25
n +1 25 + 1
a) Em = Em = = 13 Em = 13º Elemento é o mediano
2 2
b) X= {2; 2; 4; 4; 4; 4; 4; 5; 5; 5; 5; 5; 5 ; 5; 5; 7; 7; 7; 7; 7; 7; 8; 8; 8; 8}
xi fi fac
3 5 5
5 4 9
6 6 15
7 8 23
9 3 26
- 5 -
f
i =1
i = 26
RESOLUÇÃO:
2n + 2 (2).( 26) + 2
a) Em = Em = = 13,5 Em = 13,5º Elemento é o mediano
4 4
c) X= {3; 3; 3; 3; 3; 5; 5; 5; 5; 6; 6; 6; 6, 6; 6; 7;7;7;7;7;7;7;7;9;9;9}
Em − fac ant
Me = li + *h
f i classe
Onde:
• li = Limite inferior da classe mediana
n
f i
• Em = i =1
= Elemento mediano
2
• fac ant = Frequência acumulada até a classe anterior à classe mediana
• f i = Frequência simples ou absoluta da classe mediana
• h = Amplitude do intervalo da classe mediana
Nota importante:
• Para dados agrupados em classe não se toma em consideração as observações pares ou
ímpares.
Dada a tabela
xi fi fac
0|- 2 27 27
2|- 4 16 43
4|- 6 34 77
6|- 8 17 94
8|- 10 16 110
- 5 -
f
i =1
i = 110
Em = 55
l = 4; (4 | − − −6)
Em − fac ant i
Me = li + * h ; fac ant = 43 Me = 4,7
f i classe fclasse = 34
h = 2
Nota:
1. Processo: “Interpolação”.
Neste processo admite-se uma distribuição de frequências contínua, onde a mediana será
aquela que antecede e sucede respectivamente, em 50% dos valores observados.
Exemplo:
Com base nos dados do exemplo anterior o Em (elemento mediano) usando o processo de
interpolação seria:
110
1º) Em = = 55
2
2. Processo: “Gráfico”
Neste processo deverão ser seguidos os critérios seguintes:
a) Construir no primeiro quadrante de um sistema de coordenadas um diagrama de linha tal
que, em Y (vertical) seja representada as frequências absolutas acumuladas, e em x
(horizontal) as classes correspondentes à variável.
n
f i
b) A partir do E m = i =1
, trace uma paralela ao eixo x até que esta se intercepte com a
2
linha do diagrama.
c) Deste ponto de intersecção da paralela com a linha do diagrama, projecte
d) Uma perpendicular ao eixo x, e no ponto onde ela se interceptar ler-se a mediana. Assim,
para o exemplo anterior
Exemplo:
Use os dados do exemplo anterior e obtenha a mediana pelo processo gráfico
MODA ( M o )
Valor que ocorrem com maior frequência em um rol.
EXEMPLO:
Estatura ( m ) Número de
xi estudantes
1,60 03
1,62 08
1,64 12
1,70 20
1,73 10
1,80 07
- 6
f
i =1
i = 60
Na tabela, o valor modal é de 1,70m porque e o resultado que apresenta maior número de
estudantes 25
MODA BRUTA
Toma o ponto médio da classe modal, aquela que contém a maior frequência.
1 ( fmáx − fant
Moc = li + * h Moc = li + *h
1 + 2 2 * fmáx − ( fant + fpost )
Neste processo é considerada a influência sobre a classe modal das frequências das classes
anterior e posterior, fazendo com que a moda se destaque dentro do intervalo de classe para
um ponto tal que as distâncias deste ponto aos limites da classe sejam inversamente
proporcionais as frequências anteriores e posterior.
Assim,
f post
Mo k = li + *h
f ant − f ant
onde:
•
f ant = Frequência absoluta simples anterior a classe modal
Nota:
Este processo tem 0 inconveniência de não levar em consideração a frequência máxima e a
frequência da classe modal
2 x p = 3M e − Mo p - Relação de Pearson
Donde:
3M e − Mo p
xp = ;
2
Mo p = 3M e − 2 x p ;
2 x p + Mo p
Me =
3
Nota:
Existem algumas considerações a serem satisfeitas para que a relação proposta por Pearson
se verifique com maior aproximação:
• A distribuição (curva) de frequência deve ser unimodal;
• A distribuição de frequências deve ser fracamente assimétrica; e
• O número de observações deve ser suficientemente grande e pequeno a escala de
unidades que divide a distribuição.
EXEMPLO
Classes de notas fi
0 |----2 27
2|----4 16
4|----6 34
6|----8 17
8|----10 16
- 5
f
i =1
i = 110
RESOLUÇÃO:
a) A moda bruta
a.1) A moda está na classe 4|-----6 (classe modal). Porque, é a classe com o maior número
de observações;
4+6
a.2) Ponto médio da classe modal = =5
2
a.3) Mobruta = 5
b) A moda Czuber ( Mo c )
1 18
Moc = li + * h Moc = 4 + * 2 5,03
1 + 2 18 + 17
Moc 5,03
ou
( fmáx − fant) 34 − 16
Moc = li + * h Moc = 4 + * 2 5,03
2 * fmáx − ( fant + fpost ) 2 * 34 − (16 + 17
Moc 5,03
2 + 2 2 + 4 4+ 6 6 + 8 8 + 10
* 27 + *16 + * 34 + *17 + *16
x= 2
2 2 2 2
= 4,62 x = 4,62
110
Mo k = 3 * M e − 2 * x
Os quartis, decis e os percentis - são, juntamente com a mediana, conhecidas pelo nome
genérico de separatrizes.
As separatrizes - como o próprio nome sugere - são aquelas medidas que "separam" ou que
dividem o conjunto em um certo número de partes iguais.
• Mediana ( M e )
• Decil ( Di )
• Percentil ( Pi ) ou Centil ( C i )
QUARTIS ( Q i )
Divide a distribuição em quatro partes iguais quanto ao número de elementos de cada uma.
Calculam-se apenas 3 quartis, nomeadamente, Q1 , Q2 e Q3
Q1 Q2 Q3
Formula:
i ( N + 1)
Eqi =
4
RESOLUÇÃO:
1º quartil
i ( N + 1) 1(8 + 1)
Eqi = Eq1 = =2,25 (posição do1º elemento quartil) Q1 = 12
4 4
Nota:
2,25 Corresponde (a 2ª posição =12 e a 3ª posição=12) i.é, a 25% da diferença entre 12 e 12
cujo resultado é adicionado ao valor que ocupa a 2ª posição.
12 – 12 = 0
0*0,25 =
Qi = 12 + 0 = 12
(2ª posição)
2º quartil
i ( N + 1) 3(8 + 1)
Eqi Eq3 = =6,75 (posição do 3º elemento quartil) Q3 = 24,5
4 4
Nota:
6,75 Corresponde (a 6ª posição =23 e a 7ª posição=25) i.é, a 75% da diferença entre 25 e 23
cujo resultado é adicionado ao valor que ocupa a 6ª posição.
25 – 23 = 2
2*0,75 =1,5
Qi = 23 + 1,5 = 24,5
(6ª posição)
Exemplo:
Dado o conjunto X = 185;196;207;305;574;597;612. Calcule o 1º e 3º quartil.
RESOLUÇÃO:
i ( N + 1) 1(7 + 1)
Eqi = Eq1 = =2,0 (posição do 1º elemento quartil) Q1 = 196
4 4
i ( N + 1) 3(7 + 1)
Eqi = Eq3 = =6,0 (posição do 3º elemento quartil) Q3 = 597
4 4
Onde:
• Eq i = Elemento quartil (localizado através da coluna das frequências acumuladas);
0 |– 2 27
2|–4 16
4 |– 6 34
6|–8 17
8 | - 10 16
- 5
f
i =1
i = 110
RESOLUÇÃO:
i*n Eq − fac ant
Eqi = e Qi = li + i *h
4 fclasse
Classes de notas fi f ac ant.
0 |– 2 27 27
2|–4 16 43
4 |– 6 34 77
6|–8 17 94
8 | - 10 16 110
- 5 -
f
i =1
i = 110
Eq1 = 27,5
l = 2;
i
1 * 110
Eq1 = =27,5ª Posição (27º+0,5ºtermo 2 |– 4); fac ant = 27 Q1 =2,06
4 fclasse = 16
h = 2
DECIL ( Di )
São valores que dividem o conjunto de dados ordenados (rol) em 10(dez) partes iguais.
D1 D2 D3 D4 D5 D6 D7 D8 D9
in Ed − fac ant
Ed i = e Di = li + i *h
10 fclasse
Onde:
Ed i = Elemento decil
l i = Limite inferior da posição onde se encontra o elemento decil previamente calculado
Exemplo:
Calcule D2 e D5 . Use a tabela do exemplo anterior das classes de notas
RESOLUÇÃO:
Ed 2 = 22
l = 0;
i
2 * 110
Ed 2 = =22,0ª Posição (22º termo 0 – 2); fac ant = 0 D2 =1,63
10 fclasse = 27
h = 2
Ed 5 = 55
l = 4;
i
5 * 110
Ed 5 = =55,0ª Posição (43º+12ºtermo 4| –6) ; fac ant = 43 D5 =4,70
10 fclasse = 27
h = 2
CENTIL ( C i )
São valores que dividem o conjunto de dados ordenados (rol) em 100 (cem) partes iguais.
Onde:
Eci = Elemento centil
l i = Limite inferior da posição onde se encontra o elemento centil previamente calculado
Exemplo:
Calcule C 2 5 ;C5 0 e C75 a partir da tabela do exemplo das notas de classe
RESOLUÇÃO:
Ec25 = 27,5
l = 2
i
25 * 110
Ec25 = =27,5ª Posição (27º+0,5ºtermo 2|–4) ; fac ant = 27 C 25 =2,06
100 fclasse = 16
h = 2
Ec50 = 55
l = 4
i
50 *110
Ec50 = =55,0ª Posição (43º+12º termo 4|–6) ; fac ant = 43 C50 =4,71
100 fclasse = 34
h = 2
EXERCÍCIOS DE APLICAÇÃO
Depois de ter lido com atenção, e apoiando-se nos conhecimentos adquiridos na disciplina
de Estatística I procure agora responder às seguintes questões:
1. “As vezes, a média pode ser um número diferente de todos os dados da série de dados
que ela representa”. Explique por palavras suas, em que circunstâncias é que acontecem.
2. A Federação de FUTSAL organizou jantar (Take Away) para 12 atletas. A cada atleta
cabia 1 frango. Dez dos atletas comeram a dose definida pela Federação ( 1 frango cada
um) e 2 dos atletas comeram 2 frangos inteiros cada um. Após o jantar, o Treinador
pergunta: Qual foi a média de frangos que os jogadores comeram. Qual deve ser a
resposta a dar ao Treinador.
Nº horas de estudo fi fi . xi
realizadas (por dia) pelos
Estudantes do 1 º ano de
Psicologia
1 3
2 4
3 5
4 8
5 2
6 1
Subsídio mensal de xi fi fi . xi
estudantes/ estagiários
Finalistas do ISM nas
Empresas Unid: (10^3)
4,5 |- 6,5 2
6,5 |- 8,5 6
8,5 |- 10,5 5
10,5 |- 12,5 10
12,5 |- 14,5 12
.
14,5 |- 16,5 4
Total - 39
Calcule a média:
a) Aritmética;
b) Geométrica;
c) Quadrática;
d) Harmónica;
Usando a relação entre médias compare as médias das alinhas anteriores e, tire as suas
conclusões
6. Você deve estar recordado que, na disciplina Estatística I – unidade III foi abordada a
relação entre a média, mediana e moda.
a) A média é uma medida de tendência central mais usada, que a mediana. Entretanto
facilmente influenciada. Explique porquê usando palavras suas?
b) “A mediana não é tão influenciada pelos valores extremos”. Interprete a afirmação.
7. Dada a tabela:
Classes de fi
notas
0 |----2 27
2|----4 16
4|----6 34
6|----8 17
8|----10 16
- 5
f
i =1
i = 110
b) D7 ;
c) C75 .
TEOREMA DE TCHEBICHEV
Teorema que utiliza o desvio padrão para dar informação sobre uma distribuição de dados.
O teorema vai fornecer o valor da Média, e o valor do Desvio-Padrão (S), também irá
fornecer dois limites, os quais vão definir um intervalo qualquer.
Qual a proporção máxima de elementos do conjunto que está fora desse intervalo?
Desenhando a questão, teremos:
70 100 130
70 100 130
D D
1ª) Qual a proporção máxima dos elementos do conjunto fora do intervalo 70 a 130? Essa
pergunta seria representada ilustrativamente assim:
70 100 130
2ª) Qual a proporção mínima dos elementos do conjunto dentro do intervalo 70 a 130?
Essa pergunta seria representada ilustrativamente assim:
70 100 130
D D
1
2
PMÁXIMA= K
1 1
2
= = 0,1111
→ PMÁXIMA= 3 9 =11,11%
Ou seja: 11,11% é a proporção máxima dos elementos do conjunto que estão fora daquele
intervalo (70 a 130).
Uma vez conhecedores da PMÁXIMA fora do intervalo estabelecido, sem maiores problemas
chegaremos à pmínima dos elementos dentro do mesmo intervalo.
→ pmínima = 1 – PMÁXIMA
1º Passo) Calculamos o valor D que é a diferença entre qualquer dos limites do intervalo e a
média do conjunto.
D D
Daí, teremos que: D=1.800
1
2
PMÁXIMA= K
1 1
2
=
→ PMÁXIMA= 1,5 2,25 → Resposta!
EXERCICIOS DE APLICAÇÃO
a) Pelo menos 95% das observações de X diferem de x em valor absoluto por menos que
2S.
b) Pelo menos 99% das observações de X diferem de x em valor absoluto por menos que
2S.
c) Pelo menos 75% das observações de X diferem de x em valor absoluto por menos que
2S.
d) Pelo menos 80% das observações de X diferem de x em valor absoluto por menos que
2S.
e) Pelo menos 90% das observações de X diferem de x em valor absoluto por menos que
2S.
OUTLIERS
Outliers são observações que apresentam um grande afastamento das restantes, são também
designados por observações anormais, contaminantes ou extremas. A preocupação com o
tratamento deste tipo de observações e antiga e as opiniões quanto ao seu tratamento não são
unânimes, uns acreditam que a melhor forma de lidar com outliers seria a sua eliminação da
análise, enquanto outros defendem que todas as observações devem contribuir com igual
peso para o resultado final.
As principais causas do aparecimento dos outlies são:
• Erros de medição;
• Erros de execução;
• Variabilidade inerente dos elementos da população.
Web Sites
http://www.somatematica.com.br/estat/basica/exercicios1.php, acedido a 07/03/2011
https://online.isegi.unl.pt/Classificacoes/Parciais/23_2009261822.pdf acedido a
07/03/2011