Você está na página 1de 36

UNIVERSIDADE RAINHA NJINGA A MBANDE

INSTITUTO POLITÉCNICO
DEPARTAMENTO DE CIÊNCIAS DA EDUCAÇÃO

MATERIAL DE APOIO À CADEIRA DE ESTATÍSTICA

Elaborado por:
Manuel Augusto Tomás Gomes
Mestre em Matemática e Aplicações

Tel. 923 723 734 | E-mail: manuelaugustomg7@gmail.com


manuel.gomes@ua.pt

Malanje, 2023
MALANJE, 2021
INTRODUÇÃO

O que é a Estatística?
A Estatística é a ciência que se ocupa da
obtenção de informação, seu tratamento inicial,
com a finalidade de, através de modelos
probabilísticos adequados, inferir de uma
amostra para a população, e eventualmente
mesmo prever a evolução futura de um
fenómeno.
A Estatística encontra-se subdividida em duas
grandes áreas: Estatística Descritiva e
Estatística Indutiva ou Inferencial.
- Estatística Descritiva: conjunto de métodos
estatísticos que visam sumariar e descrever os atributos
mais proeminentes dos dados.

- Estatística Inferencial: conjunto de métodos


estatísticos que visam caracterizar uma população a
partir de uma amostra.

Organização;
Estatítica Descritiva
Descrição.

Análises;

Estatítica Inferencial
Interpretações.
Utilidade da Estatística

A utilidade da Estatística pode ser resumida do seguinte


modo:
● Permite descrever e compreender relações entre
variáveis. Numa época em que a quantidade de informações
aumenta tão rapidamente, os centros de decisão têm
necessidade de se manterem actualizados e controlarem as
grandes massas de dos com que são inundados quase
diariamente; para tal, é necessário que a informação lhes seja
representada da forma a possibilitar a sua interpretação
imediata e a identificação das relações mais importantes;
● Permite a tomada de melhores e mais rápidas decisões:
porque é possível controlar mais informações nummais curto
espaço de tempo;
● Facilita a tomada de decisões para fazer face à mudança:
num mundo em constante mudança, a planificação e a tomada
de decisões deverá apoiar-se em bases sólidas, no
conhecimento profyundo das situações passadas e presentes e
numa previsão fundamentada da evolução futura.
Método Estatístico
O Método Estatístico, segundo a teoria de Cramer, pressupõe as
seguintes fases:
- Identificação do problema: conhecimento do problema a se
analisar, pois, uma vez conhecido, qual o tipo de decisões que se
pretendem tomar. Uma identificação incorrecta do problema torna
todas as seguintes inúteis.
- Recolha de dados: obtenção da amostra a partir da população,
devendo depurar e rectificar os dados estatísticos, que no seu
conjunto são denominados série estatística.
- Apresentação dos dados: conjunto de operações, numéricas ou
gráficas, efectuadas sobre os dados estatísticos determinando a sua
distribuição; procede-se à sua ordenação (organização), codificação
e representação por meio de quadros e tabelas.
- Análise e interpretação: consiste em tirar conclusões sobre a
distribuição da população, determinar o seu grau de confiança e
ainda formular hipóteses, tentando verificá-las, quanto ao
fenómeno em estudo.
- Predição: é uma previsão do comportamento do fenómeno em
estudo, tendo em conta a definição da distribuição estatística.
Origens da Informação (Estatística)

Necessário avaliar a
qualidade da informação Fontes
fornecida – requer uma documentais
“perspectiva crítica”

Análise documental
Observação
• Validade interna: requer
a capacidade de utilizar Experimentação
medidas credíveis da
realidade face aos
conceitos adoptados Inquéritos
(Questionários)
• Validade externa: requer
processos de amostragem
válidos para garantir a
generalização dos
resultados
Algumas ideias iniciais mas fundamentais
A realidade é normalmente complexa e “silenciosa” …
… mas queremos “decisões informadas”, o que não é fácil!
Ex.: estudar a mudança do perfil do aluno do Ensino Médio em Angola (no
Instituto Técnico de Saúde de Malanje), à medida que o acesso ao Ensino
Médio Técnico-Profissional se massifica!
… é raro podermos “medir” com total exactidão toda a população em estudo!
Ex.: será que podemos medir a altura de todos os angolanos se quisermos
saber se a altura média é maior nas gerações mais jovens? Ou usamos uma
amostra?
Ex.: será que podemos entrevistar todas as famílias angolanas para saber a
percentagem de famílias “com uma renda mensal abaixo dos 20.000
kwanzas”? Esta informação existe nos censos populacionais.
… mesmo que possamos entrevistar toda a população nem sempre é fácil
fazer a “realidade falar” (operacionalizar)!
… conceitos (ex.: classe social) vs. variáveis (rendimento, ocupação, nível de
educação) vs. indicadores (classes de rendimento).
… associação entre variáveis ou causalidade: variáveis dependentes
vs. Independentes

Ex.: satisfação com o curso vs. nota média


Ex.: satisfação no emprego vs. salários
População, Amostra, Censos
População: conjunto de todas as observações potenciais sobre determinado
fenómeno ou sobre um conjunto de indivíduos (possuindo esses pelo menos
uma característica comum). A população é o conjunto Universo, podendo ser
finita ou infinita.
Ex.: Conjunto de estudantes do 1º ano do curso de Matemática do Instituto
Politécnico, admitidos no exame de acesso em 2023.

Amostra: selecção de elementos (indivíduos, famílias, empresas,


localidades, ...) de uma população-alvo que é usada para gerar ‘afirmações
informadas’ ou de carácter científico sobre essa mesma população.
Subconjunto de elementos extraídos da população.

Ex.: conjunto de 20 estudantes seleccionados ao acaso do conjunto de


estudantes do 3º ano do curso de Matemática do Instituto Politécnico.

A amostra ideal deverá ser tão representativa quanto possível dessa mesma
população-alvo, sendo que gerar uma “cópia em miniatura” da realidade nem
sempre é fácil. Normalmente assegura-se que a probabilidade de fazer parte
da amostra é igual ou conhecida para todos os membros da população.
Amostragem: é o procedimento pelo qual um grupo de pessoas ou um
subconjunto de uma população é escolhido com vista a obter informações
relacionadas com um fenómeno, e de tal forma que a população inteira que
nos interessa esteja representada.
Censos: estudo exaustivo das principais características de uma determinada
população que muitas vezes serve de base para os métodos de amostragem.
Censos:

Estudo exaustivo das principais características de uma determinada população que



muitas vezes serve de base para os métodos de amostragem

●Útil em casos de necessidade de alta precisão, de populações pequenas ou


variáveis fáceis de medir vs. caro, moroso ou muitas vezes impossível

Por definição a informação recolhida num exercício de censos além de ser descrita

e sumarizada não necessita de ser extrapolada ou “generalizada”
A aplicação de técnicas de inferência estatística só se aplica nos casos de

programas de amostragem.
Será possível utilizar uma lista telefónica como base da amostragem…
• … se quisermos inquirir sobre a localização ideal de um novo equipamento cultural
(concertos musicais) e quisermos prever a sua procura futura?

• … se pretendermos estudar diferenças entre grupos etários no padrão de utilização


da internet como meio de comunicação?

• … se quisermos fazer uma sondagem das intenções de voto?

• Podemos ligar a qualquer hora do dia para fazer o nosso inquérito?

• Devemos necessariamente entrevistar o titular da conta telefónica?

• Devemos usar critérios/métodos de selecção estatisticamente


independentes (não correlacionados) com as variáveis em análise.
Etapas da Análise Estatística

Técnicas de Amostragem

Modelagem do
Fenómeno em Estudo
(Caracterização da Obtenção de Amostra(s)
População)

Análise Descritiva
Formulação de Novas
Hipóteses

Levantamento de Informações
Inferência Estatística na Amostra

Conclusões sobre
Características específicas
do Fenómeno em Estudo
Tipos de Amostras
● Probabilísticas ou Aleatórias
- A probabilidade de cada elemento da população fazer parte da
amostra é igual para todos os elementos (ou então conhecida) e
diferente de zero.
- A importância da aleatoriedade baseia-se sobretudo na tentativa
de diminuir a existência de “erros de amostragem” (segmentos
específicos da população sobre-representados)
● Não-Probabilísticas ou Não-Aleatórias
- Probabilidade de cada elemento da população fazer parte da
amostra não é igual para todos os elementos.
- Limites na generalização dos resultados
- Representatividade estatística vs. teórica, sociológica, práctica, ...
– » Escolha de método depende de natureza e objectivos de
investigação, existência de informação sobre a população,
custos.
– » As técnicas de inferência estatística e generalização dadas em
Estatística assentam em processos de amostragem aleatória.
Amostras aleatórias

Exs.:» Os métodos de amostragem aleatória de eleitores de uma certa


região, utentes de um sub-serviço de saúde - baseado numa escolha
aleatória efectuada pelo computador.

Os métodos de inferência não fazem a ponte entre a amostra e a população-


alvo por magia, mas antes com base na probabilidade de ocorrência de
determinada situação e em pressupostos sobre a distribuição (na população)
das variáveis relevantes.

» Inferência Estatística baseia-se em estimar intervalos de confiança para


parâmetros das variáveis e estimativas de erro de amostragem.

… no caso de amostras aleatórias, um maior número de casos na


amostra necessariamente diminui a probabilidade de existência de
uma amostra significativamente enviesada (ex.: Só estudantes com
famílias de alto rendimento ou elevado capital cultural num estudo
sobre as determinantes na escolha de curso superior ou tipo de
instituição baseado numa amostra relativamente pequena).
Amostragem Aleatória
Cada elemento da população
tem a mesma chance de ser
escolhido.

Amostragem Estratificada
Classificar a população em,
ao menos dois estratos e
extrair uma amostra de cada
um.

Amostragem Sistemática
Escolher cada elemento de
ordem k.
Métodos probabilísticos
● Amostragem Aleatória - Todos os elementos da amostra são
seleccionados ao acaso.
- Obriga a que sejam conhecidos todos os elementos que constituem a
população (base de amostragem).
- Os elementos podem ser seleccionados segundo dois procedimentos:
- Lotaria (cada elemento da população é representado por uma ficha
que é colocada numa urna. As fichas são misturadas na urna e
depois extraem-se tantas fichas quantos os elementos que devem
constituir a amostra.
- Números aleatórios (urna ou tômbola é substituído pela
utilização de uma tabela de números aleatórios ou são extraídas
por um sistema qualquer informatizado automático).
Como fazer? (população n – amostra m)
• 1. Numerar consecutivamente os elementos da população de 1 a n.
• 2. Escolher m elementos mediante o uso de um procedimento aleatório –
tabelas de números aleatórios
• 3. Escolhidos os números, os elementos da população que lhes
correspondem constituirão a amostra.
Amostragem (aleatória) sistemática - Os elementos são
seleccionados da população sempre do mesmo modo, segundo
uma lei ou regra (K), que dê a cada um dos elementos igual
probabilidade de ser seleccionado.
Como fazer?
1. Calcular o intervalo 𝐾 da amostra.
2. Escolher aleatoriamente um número 𝑗 entre 1 a 𝐾.
3. Partindo desse n.º, adiciona-se sucessivamente o valor
𝑲 (𝒋; 𝒋 + 𝑲; 𝒋 + 𝟐𝑲; 𝒋 + 𝟑𝑲; … )
Exemplo: – População constituída por 5000 indivíduos, onde
se pretende seleccionar aleatoriamente 100.
– 1. Calcular o intervalo da amostra
K=(5000/100)=50
– 2. Seleccionar aleatoriamente um n.º entre 1 e 50
– 3. Somar a esse n.º o intervalo da amostra Ex.: 2;
52; 102; 152; …
Amostragem estratificada (aleatória) – quando se
conseguem identificar subgrupos/estratos homogéneos.
Aqui, em vez de se seleccionar um elemento, selecciona-se um
grupo.

Como fazer?
1. Dividir a população segundo grupos que nela efectivamente
existem (exs.: sexo, idade, área de formação superior, área
geográfica ou de qualquer outra característica que se possa
considerar relevante).
2. Dentro de cada grupo faz-se uma amostragem aleatória ou
sistemática.
Exemplo: pretende-se conhecer a avaliação que a população
de um bairro faz de um determinado serviço comunitário.
Composição étnica: 80% songos; 18% malengues; 2% outras
etnias.
Uma amostra aleatória simples poderia não incluir nenhum
elemento de outras etnias (2%)
→ Solução?
1. Realizar uma amostra aleatória simples de grandes
dimensões
2. Realizar uma amostra estratificada (estudar cada
subgrupo separadamente)
Amostragem por agrupamentos/clusters/ – semelhante à
amostra estratificada, mas neste caso, os grupos definidos são
heterogéneos (entidade que ocorre naturalmente associada a
uma realidade: universidade; cidade; país, comuna…)
Como fazer?
1.Especificar o agrupamento/cluster.
2. Seleccionar uma amostra de cluster aleatoriamente
3. Entrevistar todos os elementos de cada cluster.
Exemplo: seleccionar alunos do II Ciclo do Ensino
Secundário.

– As escolas são os agrupamentos (unidades amostrais


primárias);

– Os alunos são os elementos amostrais (unidades


amostrais secundárias).

Deste modo, seleccionam-se aleatoriamente as escolas


(com igual probabilidade ou com probabilidade
proporcional ao número de alunos) e todos os alunos das
escolas escolhidas entram na amostra.
Diferença entre

Amostragem estratificada Amostragem por


agrupamentos/clusters

→Alunos das escolas da → Cinco escolas da


Província são agrupados de província são seleccionadas
acordo com o ano em que em 10 possíveis.
estão matriculados.

seleccionam-se de forma seleccionam-se todos os


aleatória alunos de cada alunos dessas 5 escolas.
ano.
Amostragem itinerária (random walk) - É um tipo de
amostragem bastante utilizado em estudos locais, que
consiste no entrevistador partir de um local dado e seguir
um itinerário a partir de regras simples, seleccionando
pelo caminho os elementos da amostra.

Como fazer?

1. Escolher o local de partida

2. Escolher casas alternadas de forma aleatória, sempre


do mesmo lado ou alternadamente.
(problemas: organização de casas numa cidade não
aleatória e possível enviesamento da regra de
amostragem).
Amostragem multi-etapas – Bastante comum em Ciências
Sociais – por razões práticas, e é uma combinação de dois ou
mais métodos definidos anteriormente.
Exemplo: conhecer as características/opiniões dos alunos do
Ensino Secundário em Malanje.
1. Fazia-se uma primeira amostragem por agrupamentos,
considerando a escola.
2. Mas depois e por que as escolas são ainda muito grandes,
fazia-se uma amostragem por agrupamentos, de turmas e
só então é que se inquiriam todos os elementos das turmas.
Teríamos assim uma amostragem por agrupamentos/clusters
em duas etapas, na primeira seleccionando escolas e na
segunda escolhendo turmas.
3. Se dentro de cada turma, um número de alunos fosse
seleccionado aleatoriamente por um processo simples,
teríamos então três etapas.
Exemplo: Inquérito à Situação Perante o Emprego
Métodos não-probabilísticos

● A probablilidade de todos os elementos de um determinado


universo serem incluídos na amostra não é a mesma nem
conhecida.
● A única maneira de ter alguma noção sobre a qualidade da
amostra é comparar a sua distribuição com a da população
mas...
... não é possível generalizar/inferir da amostra para a
população (em termos estatísticos) ainda que a amostra possa
ter significado prático (ou teórico) relevante. (ex.: Testes de
questionários, teorização).
métodos de amostragem: métodos não-probabilísticos

Amostragem acidental ou por conveniência – consiste num grupo de


indivíduos que se encontram disponíveis no momento da investigação
(voluntariado ou acidental).
Exemplo: estudo sobre a qualidade de vida de determinada cidade feito
com recurso a 5 investigadores colocados em frente a supermercados,
igrejas, hospitais, etc.
Problemas:
» perfis tipo (vs. arbitrariedade do investigador).
» só responde quem quer.
Amostragem bola de neve – faz-se quando se pretende incluir na
amostra, sujeitos pouco acessíveis ou com determinado atributo difícil de
encontrar
Como fazer?
1. A selecção dos indivíduos a inquirir é feita por indicação de anterior
inquiridos.
Exemplo: estudo sobre toxicodependentes. Como não se tem nenhuma
lista…
– Neste método corre-se o risco de os primeiros inquiridos, os que
dão origem à bola de neve, enviesarem a amostra, canalizando a
sequência de entrevistas para a sua rede de relacionamento.
– (indicado para universos relativamente pequenos)
métodos de amostragem: métodos não-probabilísticos

Amostragem por quotas – idêntica à amostragem aleatória


estratificada, as amostras são constituídos respeitando as quotas
(proporções) de uma determinada característica de uma população.
-A selecção das quotas é uma selecção não aleatória de estratos,
realizada pelo julgamento e em pressupostos que não podem ser
mensurados objectivamente.
Como fazer?
– 1. Definir as quotas, i.e., dividir a população em categorias
– 2. Seleccionar os elementos respeitando as quotas
Exemplo
– Na universidade a população estudantil é 70% masculina e
30% feminina
– 1. Uma a amostra por quotas de 50 sujeitos deveria ter 35
estudantes (homens) e 15 estudantes (mulheres)
– Exemplo de discussão: questionário on-line a estudantes do
Ensino Superior.
Método/descrição Vantagens Desvantagens
Métodos Probabilísticos
Amostragem Aleatória Simples Utilização fácil Os membros de alguns grupos
(Qualquer conjunto de n de interesse menos
elementos tem a mesma representativos podem não
probabilidade de ser ocorrer nas proporções
seleccionado) desejadas.
Amostragem Estratificada Conduz a análises por Caro e moroso quando existem
(a população estudada é subgrupos com variâncias muitos estratos
agrupada de acordo com inferiores do que na
características de interesse ou amostragem simples
estratos)
Amostragem Sistemática Conveniente quando existe uma Dever-se-á ter em conta os
(todo o x-ésimo elemento da listagem de nomes como padrões de repetição que
população é seleccionado até suporte da amostra. podem enviesar a amostra.
perfazer o tamanho da amostra,
de acordo com um passo fixo -.
dividindo o tamanho da
população pelo tamanho da
amostra desejado).

Amostragem por Clusters Utilização conveniente quando


(Dos grupos formados existem unidades estatísticas
naturalmente e que fazem parte que correspondem aos grupos
da amostra serão inquiridos desejados (escolas, hospitais,
todos os seus elementos). etc.)

Amostragem multi-etapas
(Muito comum em ciências
sociais e utilizam-se
combinações de dois ou mais
métodos definidos
anteriormente).
Método/descrição Vantagens Desvantagens
Métodos não Probabilísticos
Amostragem por Método prático, pois a Devido ao carácter
Conveniência investigação recai em “oportunista” da amostra,
unidades já disponíveis os seus elementos podem
(utilização de indivíduos (estudantes nas escolas, não ser representativos
que se encontram doentes na sala de da população.
disponíveis e que espera, clientes de um
possuem características supermercado, etc.).
próprias para a pesquisa)
Amostragem “Bola de Útil quando não existem A amostra pode resultar
neve” referências sobre a bastante enviesada (dar
(Elementos previamente população ou essas uma ideia errada).
identificados identificam referências são muito
outros membros da difíceis de obter.
população)
Especialmente útil e
defensável em populações
pequenas
Amostragem por Torna-se prático quando Neste processo o
quotas existe informação fiável entrevistador pode
(A população é dividida sobre as proporções dos conferir involuntariamente
em grupos, com base em atributos que interessam enviesamentos na
características que só são na população. selecção dos inquiridos.
identificáveis através da
Amostras independentes
Se não existe nenhum elemento unificador (probabilidade
teórica de um sujeito pertencer a mais do que uma amostra é
nula).
Amostras dependentes
Se existe alguma relação (amostra em que a mesma variável é
medida antes e depois).
O exemplo das experiências “antes e depois” e a existência de
efeitos fixos…
(… associados ao facto das unidades de análise se manterem
as mesmas em dois momentos de análise – antes e depois).
Variáveis
Variável – característica mensurável ou atributo de
interesse para estudo na população. Conjunto de resultados possíveis
de um fenómeno.
Ex.: Nota de admissão no exame de acesso no 1º do curso de
Matemática, no Instituto Politécnico, no ano académico 2022-
2023.
Obs.: Uma amostra pode conter mais de uma característica de
interesse para cada uma das unidades observadas. Com duas
características temos uma amostra bivariada; com mais do que
duas temos uma amostra multivariada.

Ex.: Na população de estudantes admitidos no exame de


acesso, no 1º do curso de Matemática, no Instituto
Politécnico, no ano académico 2022-2023, pode interessar
a análise de várias características em simultâneo como, por
exemplo, nota de ingresso, região ou zona de proveniência,
área de formação, instituição de proveniência, etc.
Natureza da Variável
Escalas de medida de variáveis

Qualitativas
(nominal ou ordinal)

Quantitativas
(intervalo ou de razão)

Fonte: Levine et al (2000).


QUALITATIVAS

Os valores apenas identificam alguma qualidade, categoria ou característica - não


é susceptível de medida.

os valores não têm uma relação de ordem entre


Nominal eles, apenas se podem estabelecer relações de
igualdade ou diferença. Ex.: Sexo, estado civil, cor
de pele, grau de satisfação, etc.

os valores não são métricos mas incluem relações


Ordinal de ordem, idêntico, maior ou menor. Ex.: classe
social, habilitações literárias, etc.
QUANTITATIVAS

Os valores são medidos numa escala métrica permitindo


uma ordenação e quantificação das diferenças

Mede o fenómeno em termos da sua intensidade


específica, ou seja, posicionando-o em relação a
Intervalo
um valor conhecido arbitrariamente denominado
como ponto zero. Ex: temperatura em ºC.

É o nível mais elevado de escalas de


representação. Tem um zero absoluto não
Razão arbitrário (ao contrário da escala de
intervalo). Ex.: altura, peso, etc.
NOTAS:

Por vezes, os dados de uma variável contínua são


registados com precisão finita sendo, na prática, tomados
como de natureza discreta.
Ex.: A idade de uma pessoa, em anos.

Os valores possíveis que uma variável discreta pode


assumir representam uma gama de valores tão dispersos
que, na prática, os dados observados para a variável são
tratados como se fosse de natureza contínua agrupando os
valores em intervalos (classes).
Ex: O n.º de habitações familiares por bairros.
ESTATÍSTICA DESCRITIVA

Fases de uma Análise Exploratória de Dados

A organização dos dados colectados é fundamental para que


não hajam erros de processamento e perda de informações. Por
esta razão existem três etapas cruciais para a análise
exploratória de dados:
1. A organização dos dados através da construção de tabelas de
frequências (absolutas ou relativas, acumuladas ou não
acumuladas).
2. Descrição numérica e gráfica dos dados através do cálculo de
medidas amostrais e elaboração de gráficos de funções
estatísticas.
3. Análise e interpretação das medidas numéricas e dos gráficos
obtidos.
Continua…
Malanje, 2023

“É no problema da educação que assenta o


grande segredo do aperfeiçoamento da
humanidade, pois, o homem não é nada além
daquilo que a educação faz dele” (Kant).

Por Manuel Augusto,


Professor e Investigador.

Você também pode gostar