Você está na página 1de 29

UNIVERSIDADE FEDERAL DO PARÁ – UFPA

INSTITUTO DE CIÊNCIAS SOCIAIS APLICADAS


FACULDADE DE SERVIÇO SOCIAL
DISCIPLINA: OFICINA DE ESTATÍSTICA APLICADA AO SERVIÇO SOCIAL
PROFESSOR: Dr. WELSON DE SOUSA CARDOSO

TEMA 1:

1 - ESTATÍSTICA E MÉTODOS ESTATÍSTICOS

• A ESTATÍSTICA
Fornece métodos para a coleta, organização, descrição, análise e interpretação de dados.
Os resultados podem ser utilizados para planejamentos, tomadas de decisões ou
formulação de soluções.
• O MÉTODO ESTATÍSTICO
Pode ser entendido como um conjunto de meios que, conduzidos e dispostos
convenientemente, permitem que se canalizem as informações para determinado objetivo.

O estudo estatístico inicia-se com o planejamento da pesquisa, que representa a


organização do plano geral do trabalho que estabelece os objetivos e a utilização dos meios
estatísticos.

2 – POPULAÇÃO OU UNIVERSO ESTATÍSTICO

É o conjunto da totalidade de indivíduos, objetos, elementos, itens ou eventos com


características ou propriedades comuns ou relacionadas ao tema de estudo.

Quanto ao número de elementos, a população pode ser finita ou infinita.

Em grandes populações, torna-se interessante a realização de uma amostragem, que


ocorre na impossibilidade de colher informações sobre a população total.

3 – AMOSTRA

É qualquer um dos possíveis subconjuntos de uma população. A menor amostra possível


dá-se o nome de unidade amostral.

4 – CENSO E AMOSTRAGEM

O estudo que considera todos elementos da população é chamado de censo ou


recenseamento; o que toma uma amostra da população, amostragem.
Decidir entre censo ou amostragem depende de vários fatores – como custo, tempo, nível
de precisão desejado e facilidade de acesso aos elementos da população.

5 - PARÂMETRO

Descrição numérica de uma característica da população.

Ex: A renda média bruta de todos os brasileiros em 2002.

6 - ESTATÍSTICA

Descrição numérica de uma característica da amostra.

Ex: Renda bruta, em 2002, de uma amostra formada pelos habitantes de três estados brasileiros

7 – VARIÁVEIS

São as características que podem ser observadas (ou medidas) em cada elemento da
população, ou, ainda, é um conjunto de resultados possíveis de um fenômeno.

Na população caracterizada pelos funcionário de um hotel, podemos definir variáveis


como: tempo de serviço, idade, estado civil, sexo, etc.

A variável pode ser:

• QUALITATIVA: Quando os valores são expressos por uma qualidade ou atributo. Ex:
Gênero, cor da pele, estado civil, etc.
• QUANTITATIVA: Quando os valores são expressos por números. Ex: idade, renda,
notas de avaliação, estatura, etc.

A Variável quantitativa pode ser contínua ou discreta:

• VARIÁVEL CONTÍNUA: Assume inúmeros valores entre dois limites. Exemplo:


peso das crianças auferidos na consultório de pediatria, este conjunto pode assumir
qualquer valor como 5,30kg, 5,34 kg ou 5,38kg, etc.
• VARIÁVEL DISCRETA: Assume apenas valores de um conjunto enumerável, assume
valores inteiros positivos. Exemplo: número de pessoas atendidas no CRAS da
Cremação, este conjunto pode assumir qualquer um dos valores do conjunto {0,1,2,3,...}.
8 – NÍVEIS DE MENSURAÇÃO: Os níveis de mensuração são classificados em NOMINAL,
ORDINAL, INTERVALAR E RACIONAL.

NOMINAL: É o nível de mensuração mais rudimentar, a base, o fundamento para atribuição dos
números é de natureza qualitativa, distintiva.

Ex: Numa sala há 8 alunos, 5 dos quais do sexo masculino. Convencionando que os homens serão
designados por 1 e as mulheres designadas por 2, tudo o que se pode fazer é dizer que há 5 x 1 e
3 x 2, isto é, 5 homens e 3 mulheres. Não há sentido matemático fazer operações com estes
números pois representam categorias.

ORDINAL: Este nível é um pouco mais elaborado que o anterior, corresponde ao que
popularmente se designa por ordenação. Essas grandezas podem ser avaliadas em termos de “mais
que” e “menos que” embora a quantificação precisa seja impossível.

Ex: Notas escolares resultantes de provas subjetivas. Se João tirou 8 e Maria tirou 4, é possível
concluir que João sabe mais que Maria. Embora não se possa dizer que João saiba o dobro que
Maria.

INTERVALAR: Caracterizada pela existência de uma unidade de medida arbitrária e fixa e um


zero relativo ou convencional.

Ex: as escalas termométricas. O zero é convencional em todas, bem como a distância entre dois
traços contíguos – os chamados graus.

RACIONAL: A chamada escala da razão, se diferencia da intervalar pela origem, o zero é


absoluto, isto é, é zero mesmo, portanto todas as operações aritméticas passam a ter sentido, então
não calculo que não possa ser feito.

9 – ERROS DE MEDIÇÃO

Como todo processo de medição está sujeito a erros, o valor anotado nem sempre
corresponde à medida efetiva da variável. Em termos estatísticos, temos os seguintes tipos de
erro:

9.1 – Aleatório: decorrente do puro acaso, isto é, de fatos desconhecidos e de atuação acidental,
temporária e imprevisível.

9.2 – Sistemático: deriva de problemas nos instrumentos de coleta e nas metodologias de medidas.

9.3 – Grosseiro: decorre de desatenção, distração ou imperícia do observador.


9.4 – Amostral: definido como a diferença entre o comportamento efetivo da população e aquele
revelado pela amostra dela extraída.

A relevância do erro amostral é função de dois fatores:

• Tamanho da amostra (quanto maior a amostra, mas ela se assemelha à


população);
• Quantidade de variação inerente à população.

Pode-se minimizar a possibilidade de erro melhorando a qualidade dos instrumentos de


coleta, a perícia dos pesquisadores e o tamanho da amostra.

9.5 – Outros tipos de erros:

9.5.1 - Redação e sequência impróprias das questões;


9.5.2 - Layout e extensão do questionário;
9.5.3 - Implementação, receptividade e índice de respostas;
9.5.4 - Resumo e processamento das informações;
9.5.5 - Nas entrevistas pessoais, por exemplo, entrevistadores mal treinados podem
induzir os respondentes a uma das respostas e até omitir o essencial à solução do
problema em pauta.

10 – ARREDONDAMENTO DE NÚMEROS

A norma NBR 5891 da Associação Brasileira de Normas Técnicas (ABNT) estabelece as


regras fixas de arredondamento na numeração decimal, em uso na atualidade. Essas regras estão
de acordo com a resolução 886/66 do IBGE.

a) Quando o primeiro algarismo a ser abandonado no arredondamento é 0, 1, 2, 3 ou 4, fica


inalterado o último algarismo a permanecer.
Ex.: 25,32 → 25,3 409,04 → 409,0 3,021 → 3,02

b) Quando o primeiro algarismo a ser abandonado no arredondamento é 6, 7, 8 ou 9,


aumenta-se uma unidade ao último algarismo a permanecer.
Ex.: 19,417 → 19,42 2,09 → 2,1 2,99 → 3,0

c) Quando o primeiro algarismo a ser abandonado no arredondamento é 5 há dois


procedimentos:
• Se após o algarismo 5 seguir em qualquer casa um número diferente de zero,
aumenta-se em uma unidade o algarismo que antecede o 5;
Ex.: 237,85001 → 237,9 5,5256 → 5,53

• Se após o algarismo 5 não seguir (em qualquer casa) um número diferente de


zero, ao algarismo que antecede o 5 será acrescentada uma unidade, se for ímpar,
e permanecerá como está, se for par.
Ex.: 246,35 → 246,4 246,85 → 246,8 12,1250 → 12,12

OBS: Nos softwares de computadores (como o Excel) e calculadoras científicas, porém,


não é aplicado o critério indicado no item c. Nesses casos, se o primeiro algarismo a
ser abandonado for o algarismo 5, o arredondamento será feito com o aumento de
uma unidade ao algarismo que antecede o 5.
Ex.: 246,35 → 246,4 246,85 → 246,9 12,1250 → 12,13

TEMA 2: SÉRIES ESTATÍSTICAS

Um dos objetivos da estatística é permitir uma visão geral dos valores assumidos
pelas variáveis dentro de certos parâmetros. Para tanto, recorre-se ao uso de tabelas e
gráficos.

TABELA: Um conjunto de observações organizadas e distribuídas em linhas e


colunas.

É chamada série estatística toda tabela que apresenta um conjunto de dados


estatísticos distribuídos em função da época, do local e da espécie.

As séries estatísticas classificam-se:


• Cronológicas
• Geográficas
• Específicas

1) Cronológicas, Temporal, histórica: descrevem o modo de ser dos dados em função


do tempo (data, época, período), sendo elementos fixos: espaço e categoria.
Elemento variável: tempo.
Exportação no Brasil - 2011/2016
Anos U$ 1.000.000
2011 1.500,00
2012 1.800,00
2013 2.100,00
2014 2.300,00
2015 2.500,00
2016 2.700,00
Fonte: IBGE

Outro exemplo:

NÚMERO DE FAMÍLIAS QUE RECEBEM O BENEFÍCIO


BOLSA FAMÍLIA NO BRASIL 2015 A 2017
ANO Nº DE FAMÍLIAS
2015 787.117
2016 1.467.922
2017 1.548.571
FONTE: MDS

2) Espaciais, geográficas, territoriais, de lugar: descrevem os dados em relação a um


ou mais lugares, sendo elementos fixos: tempo e categoria. Elemento variável:
Espaço.
Criança em situação de trabalho infantil no Brasil em 2018
Unidade Número de Crianças
da Federação
Alagoas 1.578
Sergipe 1.595
Bahia 6.662
Espírito Santo 2.690
Fonte: MDS

3) Estruturais, categóricas, especificativas: descrevem os dados em relação a uma


determinada categoria ou característica. Sendo elementos fixos: espaço e tempo.
Elemento variável: categoria.

Número de pessoas atendidas nos serviços oferecidos pela FUNPAPA em Belém em


2017
Serviços Número de pessoas
atendidas
CRAS 59.234
CREAS 25.368
Espaço de Acolhimento 5.403
Infantil
Espaço de Acolhimento 9.211
Adolescente
Fonte: FUNPAPA
4) Conjugadas, mistas ou de dupla entrada:
Podem variar simultaneamente o tempo, o lugar e o fato

Número de pessoas atendidas nos serviços oferecidos pela FUNPAPA Em Belém em


2015/2018
Ano
Serviços 2015 2016 2017 2018
CRAS 48.182 51.432 55.823 59.234
CREAS 18.045 20.123 22.624 25.368
E. Acolhimento 3.105 3.955 4.213 5.403
Infantil
E. Acolhimento 3.968 5.835 7.522 9.211
Adolescente
Fonte: FUNPAPA

EXERCÍCIOS:

Classifique as séries estatísticas:

a) A temperatura no campo (período 4 a 10 de dezembro de 2016)

Cidades Temperatura média da semana (ºc)


Adamantina 26,9
Assis 24,3
Campinas 24,2
Jaú 25,3
Mococa 25,1
Ribeirão Preto 25,3
Fonte: Instituto Agronômico de Campinas (IAC)

b) Inflação no Brasil 1977 – 1983 (Índice Geral de Preços)

Ano Taxa Inflacionára (em %)


1977 38,8
1978 40,8
1979 77,2
1980 110,2
1981 95,2
1982 99,7
1983 211,0
Fonte: BARBOSA, F. de Holanda. A Inflação Brasileira no Pós-Guerra: Monetarismo versus
estruturalismo. Rio de Janeiro: Ipea, 1983
c) Países mais populosos do mundo (1999)

Países População (em milhões)


China 1.280
Índia 1.010
EUA 275
Indonésia 225
Brasil 170
Fonte: IBGE

d) Avicultura brasileira (1992)

Espécies Número (1.000 cabeças)


Galinhas 204.160
Galos, frangos(as) e pintos 435.465
Codornas 2.488
Fonte: IBGE

e) Famílias beneficiadas do Bolsa Família, segundo bairro em Belém (2015 – 2018)

Bairro 2015 2016 2017 2018


Cremação 4.800 4.400 4.900 5.200
Jurunas 9.400 9.900 9.800 10.100
Terra Firme 8.500 9.200 8.900 10.300
Guamá 12.100 11.500 12.300 12.700
Fonte: FUNPAPA

FREQUÊNCIAS
CONCEITO: Frequência é o número que indica a repetição de um caso. Isto quer dizer
que há que se anotar as repetições de um caso, soma-las ao final, para se obter quantas
vezes o caso está frequente, existe, acontece.

CLASSIFICAÇÃO:

1) Absoluta: São frequências observadas ou contadas e consideradas no todo ou


como parte deste.
2) Relativas: São frequências obtidas como uma razão entre as frequências de cada
classe e o somatório das frequências. O somatório das frequências relativas é igual
à unidade. As frequências relativas podem ser expressas também em
porcentagens, basta multiplicar a razão por 100. O somatório dessas frequências
relativas percentuais é igual a 100 porcento.
3) Acumuladas:
• Crescente: É a soma sucessiva das frequências em cada classe respectiva.
• Decrescente: É a subtração sucessiva das frequências, em cada classe, partindo
do somatório das mesmas, na primeira classe.
DISTRIBUIÇÃO DE FREQUÊNCIAS

CONCEITO: Basicamente se resume na maneira de ordenar os dados estatísticos em


colunas ou linhas, tornando possível sua leitura tanto no sentido horizontal quanto
vertical.
Exemplo:

Estaturas dos alunos da matriculados no curso de Serviço Social/ICSA/UFPA em 2015


Estaturas Freqüência Freq Ac Ferq Ac Dc Freq Rel Freq Rel %
150 ⊢ 156 5 5 72 0,07 7
156 ⊢ 162 4 9 67 0,06 6
162 ⊢ 168 19 28 63 0,26 26
168 ⊢ 174 17 45 44 0,24 24
174 ⊢ 180 13 58 27 0,18 18
180 ⊢ 186 11 69 14 0,15 15
186 ⊢ 192 3 72 3 0,04 4
Total 72 - - 1 100
Fonte: FASS/ICSA/UFPA

Distribuição dos salários dos funcionários da Secretaria Municipal de Assistência Social


Salários Funcionários Frequência Frequência Frequência Frequência
mínimos crescente decrescente relativa relativa %
1⊢3 9
3⊢5 6
5⊢7 4
7⊢9 3
9 ⊢ 11 2
Total 24

Agrupando dados em classes:

 Na Estatística existem algumas regrinhas de agrupamento …


 Qual o tamanho da amostra (n)?
 n ≤ 25 : use 5 classes
 n > 25: use raiz (n) classes. Ou seja, k= √n
Outro modo de cálculo do n:
Na prática e com o uso do bom senso, podemos cria de 5 à 10 classes.

Por exemplo:

Análise da variável “Renda mensal” em uma amostra de 20 famílias:

1. Tamanho da amostra n = 20 → n ≤ 25 → usa-se 5 classes


2. Começamos a construção da classe pelo menor elemento
3. Qual será a amplitude de cada classe?
4. A amplitude de cada uma das classes, chamamos de h
h = (Maior valor – Menor valor) / k
h = (2000 - 1000) / 5 = 200

Convenção de limites:

Resposta …
TEMA 3: APRESENTAÇÃO GRÁFICA DE DADOS

Introdução

A apresentação gráfica dos dados é um complemento importante da apresentação tabular,


pois permite conseguir uma visualização da distribuição dos valores observados,
propiciando uma idéia preliminar de sua concentração e dispersão, uma vez que, através
deles os dados estatísticos se apresentam em termos de grandezas visualmente
interpretáveis.

A representação gráfica de um fenômeno deve obedecer três requisitos


fundamentais:

SIMPLICIDADE: O gráfico deve ser destituído de detalhes de importância secundária,


como traços desnecessário que possam levar o observador à uma análise morosa ou com
erros.

CLAREZA: O gráfico deve possibilitar uma correta interpretação dos valores


representativos do fenômeno em estudo.

VERACIDADE: O gráfico deve expressar a verdade sobre o fenômeno em estudo.

CLASSIFICAÇÃO DOS GRÁFICOS SEGUNDO A FORMA:

DIAGRAMAS: São gráficos geométricos dispostos em duas dimensões. São os mais


usados para representar séries estatísticas, para construí-los, em geral, faz-se uso do
sistema cartesiano e se apresentam através de uma grande variedade de tipos.

CARTOGRAMAS: São ilustrações relativas a cartas geográficas, largamente difundidas


em Geografia, História e Demografia.

PICTOGRAMAS: É um processo gráfico que mais fala ao público, pela sua forma
sugestiva através de figuras.

CLASSIFICAÇÃO DOS GRÁFICOS SEGUNDO O OBJETIVO:

GRÁFICOS DE INFORMAÇÃO: São gráficos destinados principalmente ao público em


geral, objetivando proporcionar uma visualização rápida e clara da intensidade das
modalidades e dos valores relativos ao fenômeno observado.

GRÁFICO DE ANÁLISE: Usados para representar resultados de uma análise, vêm em


geral, acompanhados de uma tabela e um texto dissertativo. Fornecem elementos úteis à
fase de análise dos dados, sem deixar de ser também informativos.
DIAGRAMAS: Principais tipos de gráficos:
Gráfico de Colunas

Exportação no Brasil 2011/2016 em (U$


1.000.000)
3.000,00

2.500,00

2.000,00

1.500,00

1.000,00

500,00

0,00
2011 2012 2013 2014 2015 2016

Gráfico de Barras

Número de Crianças em situação de trabalho


infantil

Espírito Santo

Bahia

Sergipe

Alagoas

0 1.000 2.000 3.000 4.000 5.000 6.000 7.000


Gráfico de Setores ou Setograma

Número de pessoas atendidas nos Serviços


oferecidos pela SMAS Belém 2017
9%
5%

26%
60%

CRAS CREAS Abrigo Infantil Abrigo Adolescente

Gráfico de Linha

Exortação no Brasil de 1995 a 2000


2.800,00
2.600,00
2.400,00
2.200,00
em U$ 1.000.000

2.000,00
1.800,00
1.600,00
1.400,00
1.200,00
1.000,00
1995 1996 1997 1998 1999 2000
Colunas Superpostas

Produção de Veículos em Belém de 2001 a 2004


140.000
120.000
100.000
80.000
60.000
40.000
20.000
0
Automóveis Caminhões leves Caminhões Ônibus
pesados
2001 2002

Polígono de Frequências

Estaturas dos alunos da UFPA – Ano 2005


20
18
16
14
12
Freqüências

10
8
6
4
2
0
150 ⊢ 156156 ⊢ 162162 ⊢ 168168 ⊢ 174174 ⊢ 180180 ⊢ 186186 ⊢ 192
Estaturas em cm
Histograma

Estaturas dos Alunos da UFPA - 2005


20
18
16
14
12
10
8
6
4
2
0
Estaturas
150 ⊢ 156 ///// 156 ⊢ 162 //// 162 ⊢ 168 ///////////////////

GRÁFICO DE ÁREA
TEMA 4: ALGUMAS MEDIDAS ESTATÍSTICAS - MEDIDAS DE POSIÇÃO OU
DE TENDÊNCIA CENTRAL

São medidas que possibilitam representar um conjunto de dados relativos a um


determinado fenômeno de forma resumida. São assim denominadas em virtude da
tendência de os dados observados se agruparem em torno desses valores centrais.

A Média

A média aritmética é a ideia que ocorre à maioria das pessoas quando se fala em
“média”. E como ela possui certas propriedades matemáticas convenientes, é a mais
importante entre as medidas de posição.

• Média Aritmética simples:


Calcula-se a média aritmética determinando-se a soma dos valores do conjunto e
dividindo-se esta soma pelo número de valores no conjunto. Assim, a média dos valores

70+80+120 270
= = 90
3 3
Ex: Se um estudante fez quatro provas e obteve as notas 83, 94, 95 e 86, sua nota média
é

83+94+95+86 358
= = 89,5
4 4

A média de uma amostra é representada pelo símbolo x (leia-se “x barra”), e seu


cálculo pode expressar-se em notação sigma como segue.

X = Ʃ x ÷ N ou X = Ʃ x

Ex: Suponha que uma Secretaria Municipal tenha um setor de planejamento e neste
contenha três funcionários que recebem os seguintes salários mensais R$ 1.200,00, R$
1.500,00 R$ 1.600,00. A média aritmética dos salários ou salário médio mensal dos
funcionários deste setor é R$ 1.433,33 de acordo com a definição.

X = (1.200,00 + 1.500,00 + 1.600,00) = 4.300,00 = 1.433,33

3 3
• Média Aritmética ponderada:
Calcula-se a média ponderada quando os dados estiverem agrupados em uma
distribuição de frequências, utilizamos a média dos valores x₁ x₂ x₃ ...xn
ponderados pelas respectivas frequências absolutas f₁ f₂ f₃ ...fn, isto é,

X = Ʃ x.F N= Ʃ F

ou X = Ʃ x .F

ƩF

Ex: Dada a seguinte distribuição:

X 1 2 3 4 6 Total

F 1 3 5 2 1 12

X.F 1 6 15 8 6 36

Determine a média aritmética

X = Ʃ x .F X = 36 = 3

ƩF 12

Determinar a média aritmética das distribuições abaixo:

Classes Frequência Ponto médio (X) X.F


2⊢4 5 3 15
4⊢6 10 5 50
6⊢8 14 7 98
8 ⊢ 10 8 9 72
10 ⊢ 12 3 11 33
Total 40 - 268

X = Ʃ x .F X = 268 = 6,7

ƩF 40
Estaturas dos alunos da Faculdade de Serviço Social – turma A

Estaturas(cm) Ponto médio (X) Frequência X.F


150 ⊢ 156 153 5 765
156 ⊢ 162 159 4 636
162 ⊢ 168 165 19 3.135
168 ⊢ 174 171 17 2.907
174 ⊢ 180 177 13 2.301
180 ⊢ 186 183 11 2.013
186 ⊢ 192 189 3 567
Total - 72 12.324

X = Ʃ x .F X = 12.324 = 171,17

ƩF 72

Resposta:

Estatura média dos alunos 1,71 m

A Mediana

É a medida que está situada exatamente no centro da série, dividindo a mesma em duas
partes iguais, ficando 50% dos dados abaixo dessa medida.

Para dados não agrupados a mediana será encontrada de duas formas: quando se
tem um nº par de dados a mediana será a média aritmética entre os termos n/2 e n/2 + 1,
e quando for ímpar, a mediana será o termo de ordem (n+1)/2 , sendo que n é o nº total
de dados.

Ex:

Para uma série com nº par de valores:

X={15,15, 16, 16, 16; 17, 19, 20, 21, 21} calculamos os dois termos centrais: n/2=10/2=5
e n/2 + 1 = 10/2 + 1 = 6. Logo, a mediana será a média aritmética entre o 5º e o 6º valor
da série Md=(16+17)/2 isto é, Md= 16,5.

Para uma série com nº ímpar de valores:

X={15 ,15, 16, 16, 16, 17, 19, 20, 21, 21, 22}., Md=(n+1)/2 = (11+1)/2 = 12/2= 6º valor
da série, logo Md= 17.
Para dados agrupados em classe, determinamos primeiro a classe que contém o
termo mediano, a identificação é feita por meio do termo da ordem O, calculada pala
expressão O = /2, este termo está localizado numa classe que recebe o nome de classe
mediana.

Localizada a classe mediana, ainda resta verificar qual o ponto dentro do


intervalo dessa classe, que corresponde à mediana.

(
 O − FAC l 
Md = li +  .h
)
 fS 

l = Limite inferior da classe mediana

FAC = Frequência acumulada anterior à classe mediana

h = Amplitude do intervalo da classe mediana

 = Frequência simples da classe mediana.

Ex: Na distribuição de frequências abaixo, calcular a renda mediana.

Renda (R$) FREQ. FAC %


100 ⊢ 200 4 4 7,14
200 ⊢ 300 10 14 17,86
300 ⊢ 400 17 31 30,36
400 ⊢ 500 12 43 21,43
500 ⊢ 600 8 51 14,29
600 ⊢ 700 4 55 7,14
700 ⊢ 800 1 56 1,79
TOTAL 56 100,00

𝑛 𝑓
1ºpasso: Calcular o nº de ordem: 𝑂 = ou 𝑂 =
2 2

n=

56
𝑂= = 28 (28º valor da série);
2

2º passo: Cálculo da mediana:

Renda mediana (Md) = li + 


(
 O − FAC l  )  (28 − 14 )
.h = 300 + 

.100  = Md = 382,35
 fS   17 
14
𝑀𝑑 = 300 + [17.100]

1400
𝑀𝑑 = 300 + 17

𝑀𝑑 = 300 + 82,35

isso significa que 50% das pessoas auferem renda até ou abaixo de R$ 382,40.

MODA: Pode ser definida como o valor que ocorre mais vezes em um conjunto de dados
ou que ocorre com maior frequência.

Quando os dados não estão agrupados em classes, o valor modal é determinado


pela comparação entre as frequências dos valores. Ex: X = nº de filhos X={0, 0, 1, 1, 1,
1, 1, 2, 2, 2, 2, 3, 3, 3, 4, 5, 5, 6}. Pode-se verificar que o 1 possui a maior frequência,
sendo, portanto, o nº modal de filhos.

Quando os dados estão agrupados em classes, o valor modal é determinado pela



M o = li + 
( fs − f a )l

.h , onde:
 ( f s − f a ) + ( f s − f p ) 
equação:

li=limite inferior da classe modal;

h= Amplitude do intervalo de classe;

fs=frequência simples da classe modal;

fa=frequência simples anterior à classe modal;

fp=frequência simples posterior à classe modal.

OBS: CLASSE MODAL = CLASSE QUE POSSUI A MAIOR FREQUÊNCIA.

Ex: Calcular o consumo modal da distrib. De freq. dada anteriormente.

CLASSE MODAL: 3ª CLASSE


M o = li + 
( )
fs − f a
l
 
.h = 300 + 
(17 − 10 ) 
.100  = 358,30
 ( f s − f a ) + ( f s − f p )   (17 − 10 ) + (17 − 12 ) 
Significa dizer que a renda mais frequente foi de R$ 358,30

A moda é uma medida que não é muito utilizada, pois não serve para cálculos
posteriores.

TEMA 4: ESTATÍSTICA DESCRITIVA - MEDIDAS DE DISPERSÃO OU


VARIABILIDADE

Numa série de dados numéricos, os valores em torno de um valor médio


apresentam-se mais ou menos dispersos e, o grau dessa tendência chama-se: grau de
dispersão ou variação ou variabilidade. Um dos mais usados é o desvio-padrão.

Desvio-padrão

É a medida mais usada, quando se trata de conhecer a dispersão ou variabilidade


de uma série, quer seja agrupada ou não, porque atende a todas as características de uma
medida estatística, razão pela qual é de maior confiança.

O desvio padrão mede o grau de afastamento dos dados em relação à média.


Quanto maior for esse grau, menor será a representatividade da média. Ainda assim,
com o resultado do desvio padrão, é difícil de se analisar essa medida. Para contornar
esse problema existe uma outra medida conhecida como coeficiente de variação.

O desvio-padrão de uma amostra é definido como:

Dados não agrupados:

(𝑥)2
√𝑥 2 −
s = √∑ x² - (∑ x) ²/n ou 𝑠 = 𝑛
𝑛−1

n-1

Dados agrupados:

(𝑓𝑥)2
√𝑓𝑥 2 −
𝑓
s = √∑ f x² - (∑f x)²/ ∑ F ou 𝑠= 𝑛−1

n–1

Ex. 1: no exemplo do salário dos funcionários do Setor de Planejamento da Secretaria


Municipal, temos a média salarial de R$ 1.433,33

X = (1.200,00 + 1.500,00 + 1.600,00) = 4.300,00 = 1.433,33

3 3
O desvio padrão será:

s = √∑ x² - (∑ x) ²/n = √∑ (1.200² + 1.500² + 1.600²) – (4.300)² / 3 =

n-1 3–1

S= √(1.440.000+2.250.000+2.560.000) – (18.490.000)/3

S= √6.250.000 – 6.163.333,33 = √86.666,70/2 = √43.333,35 = 208,17

Ex. 2: Desvio-padrão para dados agrupados:

Classes Frequência Ponto médio (X) F .X X² F .X²


2⊢4 5 3 15 9 45
4⊢6 10 5 50 25 250
6⊢8 14 7 98 49 686
8 ⊢ 10 8 9 72 81 648
10 ⊢ 12 3 11 33 121 363
Total 40 - 268 - 1992

Então o desvio-padrão será:

s = √∑ f x² - (∑f x)²/ ∑ F = √ 1992 - 268² / 40 = √ 1992 – 1.795,60 =

n–1 40 – 1 39

s= √1.992 – (71.824/40) = √1.992 - 1,795,60 = √ 196,40 = √5,0358 = 2,24


40-1 39 39

s = √ 196,40 / 39 = √5,04 = 2,24

x = ∑f x = 268 = 6,7
∑F 40
Estaturas dos alunos da Faculdade de Serviço Social – turma A

Estaturas Ponto médio (X) Frequência X.F X² X². F


150 ⊢ 156 153 5 765 23.409 117.045
156 ⊢ 162 159 4 636 25.281 101.124
162 ⊢ 168 165 19 3.135 27.225 517.275
168 ⊢ 174 171 17 2.907 29.241 497.097
174 ⊢ 180 177 13 2.301 31.329 407.277
180 ⊢ 186 183 11 2.013 33.489 368.379
186 ⊢ 192 189 3 567 35.721 107.163
Total - 72 12.324 2.115.360

s = √∑ f x² - (∑f x)²/ ∑ F = √ 2.115.360 – (12.324)² / 72 =

n–1 72 – 1

s = √ 2.115.360 – 2.109.458 = √5.902 = √83,13 = 9,12

71 71

Coeficiente de Variação (CV)

O coeficiente de variação vem facilitar a análise do desvio padrão e da média. É dado


por:
s
CV = *100 , onde s é o desvio padrão e x , a média. De acordo com alguns autores, se
x
o CV ≥ 30%, temos alta dispersão dos dados e consequentemente uma média
pouco representativa. O inverso é verdadeiro.

O CV  30%, temos uma baixa dispersão dos dados e consequentemente uma


média representativa.

Ex: Coeficiente de variação do exemplo anterior:

9,12
CV = . 100 = 5,33 %
171,17

CV = 208,17 / 1.433,33 * 100 = 14,5%,

14,5%,  30%, existe uma baixa dispersão nos dados então a média de 1.433,33 é
representativa

CV = 2, 24 . 100 = 33,4 %

6,7
33,4 %  30%, existe uma alta dispersão nos dados então a média de 6,7 é pouco
representativa.

CV = 2,24 / 6,7 * 100 = 33,4%

EXERCÍCIO:

Dada a distribuição de frequências abaixo, determine:

i. Média aritmética
ii. O desvio padrão
iii. O coeficiente de variação

RENDA DE 56 PESSOAS ENTREVISTADAS NO CRAS DO GUAMÁ/BELÉM


JUNHO 2018
Renda (R$) Frequência X
simples F F.X X² F.X²
100 ⊢200 4 150 600 22.500 90.000
200⊢300 10 250 2.500 62.500 625.000
300 ⊢400 17 350 5.950 122.500 2.082.500
400 ⊢500 12 450 5.400 202.500 2.430.000
500 ⊢600 8 550 4.400 302.500 2.420.000
600 ⊢700 4 650 2.600 422.500 1.690.000
700⊢800 1 750 750 562.500 562.500
Total 56 - 22.200 - 9.900.000
FONTE: FUNPAPA – CRAS/GUAMÁ

Média

x = ∑f x = 22.200 = 396,43
∑F 56

Desvio Padrão

s = √∑ f x² - (∑f x)²/ ∑ F = √ 9.900.000 – (22.200)² / 56 =

n–1 56 – 1

s = √ 9.900.000 – (492.840.000/56) =

55

s = √ 9.900.000 – 8.800.714,29 = √1.099.285,71 = √19.987,01 = 141,38

55 55
Coeficiente de variação do exemplo anterior:

141,38
CV = . 100 = 35,67 %
396,43
35,67 %  30%, existe uma alta dispersão nos dados então a média de 396,43 é pouco
representativa.

TEMA 5: Noções de Amostragem

Amostra

É a porção de uma população, geralmente aceita como representativa da mesma


(KERLINGER, 1980, p. 90).

É uma porção ou parcela, convenientemente selecionada do universo (população). É um


subconjunto deste universo (MARCONI e LAKATOS, 1996, p. 37).

Amostragem

Processo de seleção de uma amostra, quando é definido um subconjunto de uma


população que seja representativo da mesma (FOWLER, 1993, p. 04).

O problema da amostragem é escolher uma parte da população (amostra), de tal forma


que ela seja representativa do todo e, a partir dos resultados obtidos, relativos a essa parte,
poder inferir, o mais legitimamente possível, os resultados da população total
(MARCONI e LAKATOS, 1996, p. 37).

Aspectos críticos da amostragem

Escolha do uso de uma amostra aleatória ou não: a escolha do tipo de amostragem


depende dos objetivos do estudo, do esquema de pesquisa e da contribuição que se pensa
fazer com este estudo (SAMPIERI, COLLADO e LUCIO, 1991, p. 210);

• estrutura da amostra;
• tamanho da amostra;
• desenho da amostra (pessoas/famílias);
• taxa de resposta.

Processo de planejamento de amostragem

Definir a população-alvo

• Elemento, unidade amostral, alcance e tempo

Determinar arcabouço amostral

• ex: mapas, cadastro institucional, etc.

Escolher a(s) técnica(s) amostral(ais)


• Amostra com reposição e sem reposição
• Amostra aleatória e não aleatória

Determinar o tamanho da amostra

• Fatores qualitativos e quantitativos


• Quanto maior, melhor; porém, de um certo ponto em diante as respostas começam
a se repetir, não sendo necessária a continuidade (pensar na relação custo-
benefício)

Executar o processo de amostragem

Classificação das técnicas amostrais

Amostragem não aleatória

• Técnica de amostragem que não utiliza seleção aleatória (a escolha dos elementos
não depende de probabilidade). Ao contrário, confia no julgamento pessoal do
pesquisador (relacionadas com suas características desejáveis).

• As estimativas obtidas NÃO são estatisticamente projetáveis sobre a população.

Amostragem aleatória

• Processo de amostragem em que cada elemento da população tem uma chance


fixa de ser incluído na amostra.

Sua característica é poder ser submetida a tratamento estatístico, que permite compensar
erros amostrais para a representatividade e significância da amostra (MARCONI e
LAKATOS, 1996, p. 37).

Permite fazer inferências ou projeções sobre a população-alvo da qual se extraiu a


amostra.

Neste curso estudaremos as Técnicas de Amostragem Probabilísticas (Aleatórias)

Aleatória: aleatória simples

Quando cada elemento da população tem uma probabilidade conhecida e igual de seleção
e cada elemento é selecionado independentemente de qualquer outro.
• Operacionalmente, a definição de uma amostra aleatória simples requer uma lista
numerada da população.
• Por simplicidade, assume-se que cada elemento da população aparece uma vez e
somente uma
• Resultados podem ser projetados para população alvo (alta validade externa)
Desvantagens
• Difícil construir um arcabouço amostral que permita a extração de uma amostra aleatória
simples
• Pode resultar em amostras muito grandes ou dispersas geograficamente
Aleatória: sistemática

É uma variação da amostra aleatória simples com precisão equivalente, sendo menos
trabalhosa a sua definição, pois utiliza frações da população.
• A amostra é escolhida selecionando-se um ponto de partida aleatório e tomando-
se em conta cada i-ésimo elemento sucessivamente do arcabouço amostral.
• Se a ordenação está relacionada com a característica de interesse, pode ser mais
representativa do que a amostra aleatória simples.
• Mais barata e mais simples do que a amostra aleatória simples.
• Pode ser utilizada mesmo sem o conhecimento de toda a população.
Ex.: entrevistas com pessoas que saem de um shopping

Aleatória: estratificada

É a identificação de algumas características de uma população durante o processo de


amostragem. Com isso, é possível reduzir as variações normais de uma amostragem e
produzir uma amostra que represente melhor a população total.
• Usa processo de dois estágios para dividir a população em subpopulações ou
estratos. Ex: por gênero, idade, classe social, etc.
• Escolhem-se os elementos de cada estrato por um processo aleatório.
• Pode ser proporcionada ou desproporcionada
• Proporcionada: o tamanho da amostra extraída de cada extrato é proporcional ao
tamanho relativo do estrato da população total.
• Desproporcionada: o tamanho de cada estrato é proporcional ao tamanho relativo
do estrato e do desvio-padrão da distribuição da característica de interesse entre
todos os elementos daquele estrato.

Aleatória: por conglomerados

Primeiro, a população-alvo é dividida em subpopulações mutuamente excludentes e


coletivamente exaustivas, chamadas conglomerados.
• Escolhem-se então uma amostra aleatória de conglomerados com base em uma
técnica de amostragem aleatória (ex: amostra aleatória simples);
• Amostragem por Conglomerado de 1 estágio - todos os elementos incluídos da
amostra;
• Amostragem por Conglomerado de 2 estágios – extrai aleatóriamente uma
amostra de cada conglomerado selecionado.

Determinação do tamanho da amostra

A amostra é determinada muito mais por fatores qualitativos do que quantitativos.

• natureza da pesquisa
• número das variáveis
• natureza da análise
• restrição de recursos
• técnica de amostragem
• [...]
• Dificuldade pera determinar estatisticamente a amostra
• rigorosamente, os cálculos valem apenas para amostras aleatórias simples é difícil
prever antecipadamente o desvio-padrão da população

Segundo Richardson (1999), a definição do tamanho da amostra depende dos seguintes


fatores:

• Amplitude do universo: número de clientes, por exemplo.


• Nível de confiança estabelecido: a escolha do pesquisador, geralmente 95% ou
99%.
• Erro de estimação permitido: quanto menor o erro, maior deverá ser o tamanho da
amostra. A escolha do pesquisador, sendo comum erros de 4% ou 5%.
• Proporção que a característica pesquisada apresenta no universo (p e q).

Fórmula do tamanho da amostra

populações infinitas e amostras aleatórias simples

𝜎² . p . q
𝑛=
𝜖²
(aqui n = tamanho da amostra)

populações finitas e amostras aleatórias simples

𝑁. 𝜎² . 𝑝. 𝑞
𝑛=
𝜖 2 (𝑁 − 1) + 𝜎². 𝑝. 𝑞

N = tamanho da população
σ = nível de confiança: escolhido, em número de desvios – sigmas, por exemplo 95% =
2 sigmas
p = % de sucesso: por exemplo do cliente escolhido ser representativo da população =
50%
q = % insucesso: por exemplo do cliente escolhido ser representativo da população) =
50% (=100 – p)
E = erro de estimação = utiliza-se 4% ou 5%

Fórmula utilizada quando não temos informações sobre a população.

1
𝑛₀ =
∈ ₀²

onde:

N: Tamanho (número de elementos) da população;


n: Tamanho (número de elementos) da amostra;
n₀: uma primeira aproximação para o tamanho da amostra;
E₀: erro amostral tolerável

Se a população for muito grande (digamos mais que vinte vezes o valor calculado de n₀)
então n₀ já pode ser adotado como tamanho da amostra.
Caso contrário é sugerida a seguinte correção:

𝑁. 𝑛₀
𝑛=
𝑁 + 𝑛₀

Fontes de erros: validade e confiabilidade

Erro de amostragem aleatória

• O erro acontece porque a amostra selecionada é uma representação imperfeita da


população de interesse
Pode ser definido como a variação entre o valor médio real para a amostra e o
valor médio real da população
• Erro de falta de resposta
Ocorre quando pessoas incluídas na amostra não respondem.
Solução: realização de análise de não-respondentes
• Erro de resposta
Quando os entrevistados dão respostas imprecisas ou cujas respostas são
registradas ou analisadas erroneamente.

Fontes de erros 2

• Erro de substituição de informações


variação entre as informações necessárias para o problema de pesquisa e as
informações buscadas pelo pesquisador
• Erro de medição
variação entre as informações buscadas e aquelas geradas pelo processo de
medição pelo pesquisador.
• Erro de definição da população
variação entre a população real relevante para o problema em pauta e a população
definida pelo pesquisador
• Erro de análise de dados
ocorrem quando os dados brutos dos questionários são transformados em
constatações de pesquisa.

Você também pode gostar