Escolar Documentos
Profissional Documentos
Cultura Documentos
Estatística
Estatística é um ramo da matemática que visa coletar, analisar e interpretar dados, usando
como ferramentas tabelas e gráficos para analisar fenômenos.
A Estatística Descritiva trabalha com conjuntos de dados oriundos de algo “certo”, que já
aconteceu, que “pertence ao passado”.
Exemplo:
Se soubermos a idade de três pessoas e quisermos calcular a idade média desse grupo, não
há incerteza associada a tal cálculo.
Estatística Indutiva
A Estatística Indutiva trabalha com uma amostra a fim de que, com o uso de técnicas e
métodos adequados, seja possível obter informações a respeito da população que tal
amostra representa.
Nesse caso, para dado intervalo de confiança, temos um erro associado.
Exemplo:
Se uma pesquisa eleitoral diz que certo candidato tem 60% dos votos, com margem de erro
de 3% e confiança de 95%.
Isso significa que ele tem 95% de chance de ter entre 57% e
63% dos votos na data da pesquisa.
Vale destacar que nem sempre a máxima “amostra boa é
amostra grande” é verdadeira, pois amostra boa é amostra
que fornece todas as características presentes na população
e na proporção em que ocorrem na população.
Conceitos fundamentais para o estudo da Estatística
População e amostra
Podemos definir população (ou universo) como um conjunto completo de elementos com um
parâmetro comum.
A população finita tem um número determinado de elementos, enquanto a população infinita
não tem.
Exemplo:
A população brasileira é formada pelo conjunto de pessoas nascidas no Brasil ou com
nacionalidade brasileira, então a população pode ser classificada em finita ou infinita.
Dados Estatísticos
Os Dados Estatísticos são os elementos fundamentais a partir dos quais a estatística é feita.
Variáveis Quantitativas
Variáveis Qualitativas
Contêm informações não numéricas relativas a categorias, como gênero, cargo e endereço,
ao tratarmos de pessoas, ou cor, volume e peso, ao tratarmos de produtos.
1) Definição do problema.
2) Delimitação do problema.
3) Planejamento para a obtenção dos dados.
4) Coleta dos dados.
5) Apuração dos dados.
6) Apresentação dos dados.
7) Análise dos dados.
8) Interpretação dos dados.
Dados Brutos
Chamamos de Dados Brutos os dados exatamente da forma como são obtidos, sem
tratamento nem organização.
Por exemplo: em uma pesquisa de cargos e salários, o conjunto de dados com
cargo do funcionário e o seu salário são Dados Brutos se não passaram por nenhuma
forma de organização.
Não é incomum que Dados Brutos, isto é, dados sem nenhum tipo de tratamento –,
apresentem incompatibilidades que precisam ser resolvidas.
Um exemplo clássico está nos dados envolvendo datas, que
podem ser escritas em diversos formatos; esses formatos
precisam ser uniformizados para que a análise dos dados seja
feita de forma correta. Outro exemplo de incompatibilidade
é a frequência de nomes de cidades com diversas grafias
possíveis, como São Paulo, S.Paulo ou, ainda, SP, que se
referem à mesma cidade e devem ter a grafia uniformizada.
Rol
Dessa forma, é possível analisar a distribuição de notas dos alunos com mais facilidade, mas
a informação ainda não está apresentada da melhor maneira, o que pode ser feito a partir de
um estudo de frequências (que veremos mais adiante).
A tabela 2 também apresenta informações sob a forma de nomes, que são classificados
como dados alfanuméricos.
Um estudo estatístico completo de uma população deve basear-se no método estatístico, que é
composto por uma Série de Etapas. Qual alternativa a seguir pode ser classificada como uma
das etapas?
a) Entrevista.
b) Reunião.
c) Gráfico.
d) Coleta dos dados.
e) Exclusão de dados.
Resposta
Um estudo estatístico completo de uma população deve basear-se no método estatístico, que é
composto por uma Série de Etapas. Qual alternativa a seguir pode ser classificada como uma
das etapas?
Ano População
1991 146.815.815
2000 169.872.856
2010 190.755.799
Fonte: IBGE (c2022b).
Séries Geográficas
Norte 15.864.454
Nordeste 53.081.950
Sudeste 80.364.410
Sul 27.386.891
Centro-Oeste 14.058.094
Fonte: IBGE (c2022b).
Séries Especificas
Sexo População
Homens 93.406.990
Mulheres 97.348.809
Ano
Grande Região
1991 2000 2010
Norte 10.027.373 12.911.170 15.864.454
Nordeste 42.494.112 47.782.487 53.081.950
Sudeste 62.740.146 72.430.193 80.364.410
Sul 22.129.131 25.119.348 27.386.891
Centro-Oeste 9.425.053 11.638.658 14.058.094
Fonte: IBGE (c2022b).
Apresentação de Dados Estatísticos
O título localiza-se na parte superior da tabela (ABNT, 2011) e especifica o assunto dos
dados da tabela e, se for o caso, o período ao qual os dados se referem. Todas as tabelas
devem ter título.
O cabeçalho é a parte superior da tabela, normalmente destacado do corpo da tabela.
O cabeçalho deve indicar os conteúdos de cada coluna.
A coluna indicadora é, normalmente, a primeira coluna à esquerda da tabela e especifica o
conteúdo das linhas.
Na tabela 5, a coluna indicadora é o sexo. Abaixo do cabeçalho e à direita da coluna
indicadora, temos o corpo da tabela.
No corpo da tabela temos as linhas, que disponibilizam a
informação no sentido horizontal.
Cada elemento do corpo da tabela, obtido pelo cruzamento
de uma linha com uma coluna, é chamado de célula.
Distribuição de Frequência – Variável Discreta
Aqui será discutido como apresentar dados usando uma Distribuição de Frequência (f).
A primeira etapa trata-se de Variáveis Discretas.
Figura 1 – Dados mostrando cada uma das 6 faces Imagine que esse dado tenha sido lançado 14
vezes e que tenham sido obtidos os seguintes
resultados: 4 2 5 1 3 5 2 6 1 6 2 2 3 1.
Tabela 7 – Frequência de resultados obtidos pelo
lançamento de um dado
Face do dado Frequência
Disponível em: https://cutt.ly/bMxBZzD
1 3
2 4
3 2
4 1
5 2
6 2
Na Frequência Relativa dividimos a frequência de cada valor pelo número total de dados na
amostra ou população.
Na tabela 8 a seguir são expostas as Frequências Relativas para o resultado do lançamento
do dado estudado no exemplo anterior.
Tabela 8 – Frequência relativa de resultados
obtidos por 14 lançamentos de um dado
Face do dado Frequência Frequência relativa
1 3 3/14 = 0,21
2 4 4/14 = 0,29
3 2 2/14 = 0,14
4 1 1/14 = 0,08
5 2 2/14 = 0,14
6 2 2/14 = 0,14
Nesse caso, é fundamental que os dados sejam agrupados em classes ou intervalos, como
foi feito com as Variáveis Discretas.
Todas as observações sobre a distribuição de Frequência para as Variáveis Discretas
aplicam-se também à distribuição de Frequências das Variáveis Contínuas.
Salário Número de
(em salários mínimos) funcionários
0├ 1 0
1├ 2 5
2├ 3 23
3├ 4 53
4├ 5 12
Durante sua fase inicial, um aplicativo recebeu as seguintes avaliações dos seus primeiros
200 usuários:
Estrelas
Frequência a) Esse aplicativo tem boa aceitação, pois a frequência relativa
absoluta das 5 estrelas é igual a 50%.
1 estrela 20
b) Esse aplicativo tem boa aceitação, pois a frequência relativa
2 estrelas 8
das 5 estrelas é maior que 50%.
3 estrelas 10
4 estrelas 7 c) Esse aplicativo não tem boa aceitação, pois a frequência
5 estrelas 55 relativa das 5 estrelas é menor que 50%.
Não avaliam 100 d) Esse aplicativo não tem boa aceitação, pois a frequência
relativa das 5 estrelas é igual a 50%.
e) Esse aplicativo não tem boa aceitação, pois a frequência
relativa das 5 estrelas é igual a 500%.
Resposta
A alternativa correta é a B.
Primeiramente, calcularemos a frequência relativa das 5 estrelas. Porém, note que havia 200
usuários, sendo que 100 deles não avaliaram, e queremos a frequência relativa somente
daqueles que avaliaram, ou seja,
200 – 100 = 100 usuários
Desses 100 usuários, 55 avaliaram com 5 estrelas, então temos:
55 : 100 = 0,55 = 55%
Logo, podemos afirmar que o aplicativo tem boa aceitação, pois a frequência relativa de 5
estrelas é maior que 50%.
Representação Gráfica de Séries Estatísticas
40
PIB per capita (US$)
0 20K 40K 60K 80K 100K 120K 140K
Sul
Centro-Oeste
8.000.000
6.000.000
4.000.000
2.000.000
Grande região
Figura 8 – Exemplo de gráfico de colunas representando o número de pessoas
analfabetas, por grande região
Representação Gráfica – Setores
89,47%
Figura 9 – Exemplo de gráfico de setores, mostrando
a porcentagem de alfabetização no Brasil no ano de 2010
Representação Gráfica – Setores
Distribuição da população por idade no Brasil, 2010
0 a 5 anos 6 a 5 anos 7 a 9 anos 10 a 14 anos 15 a 19 anos
20 a 24 anos 25 a 29 anos 30 a 39 anos 40 a 49 anos 50 a 59 anos
60 a 69 anos 70 anos ou mais
5,22% 8,46%
6,72%
3,29%
5,17%
10,41%
9,7%
14,04%
9,6%
9,74%
16,75%
9,67%
Figura 10 – Exemplo de gráfico em que a representação por setores não é adequada. Temos nesse gráfico
a distribuição da população brasileira por idade, onde os setores ocupam áreas muito parecidas
e a variação dos dados não se torna evidente
Representação – Histograma
1 2 3 4 5 6 Face
Frequência 0,30
relativa
0,20
0,10
1 2 3 4 5 6 Face
Um estudo estatístico completo de uma população deve se basear no método estatístico, que é
composto por uma série de fases:
Definição do problema.
Delimitação do problema.
Planejamento para a obtenção dos dados.
Coleta dos dados.
Apuração dos dados.
Apresentação dos dados.
Análise dos dados.
Interpretação dos dados.
Concluindo
Para efeito de análise dos dados, consideramos que todos os dados, quando agrupados em
intervalos ou classes, estão associados ao Ponto Médio (Pm) da classe à qual pertencem.
O Ponto Médio de uma classe é calculado por:
Na equação:
Quantidade de pessoas
6
5
4
3
2
1
0
Chocolate Morango Creme Flocos Napolitano
Figura 16
Interatividade