Você está na página 1de 47

UNIDADE I

Estatística

Prof. Me. José Lorandi


Conceito Básico da Estatística

 Iniciamos apresentando alguns conceitos básicos, como as definições de estatística,


amostra, população, processos e dados estatísticos.

 Definimos, ainda, o que é estatística descritiva, dados brutos e rol.

 Estatística é um ramo da matemática que visa coletar, analisar e interpretar dados, usando
como ferramentas tabelas e gráficos para analisar fenômenos.

Uma das maneiras de classificarmos a estatística é “dividi-la” em


dois segmentos:
 Estatística Descritiva.
 Estatística Indutiva.
Estatística Descritiva

 A Estatística Descritiva trabalha com conjuntos de dados oriundos de algo “certo”, que já
aconteceu, que “pertence ao passado”.

Exemplo:
 Se soubermos a idade de três pessoas e quisermos calcular a idade média desse grupo, não
há incerteza associada a tal cálculo.
Estatística Indutiva

 A Estatística Indutiva trabalha com uma amostra a fim de que, com o uso de técnicas e
métodos adequados, seja possível obter informações a respeito da população que tal
amostra representa.
 Nesse caso, para dado intervalo de confiança, temos um erro associado.

Exemplo:
 Se uma pesquisa eleitoral diz que certo candidato tem 60% dos votos, com margem de erro
de 3% e confiança de 95%.
 Isso significa que ele tem 95% de chance de ter entre 57% e
63% dos votos na data da pesquisa.
 Vale destacar que nem sempre a máxima “amostra boa é
amostra grande” é verdadeira, pois amostra boa é amostra
que fornece todas as características presentes na população
e na proporção em que ocorrem na população.
Conceitos fundamentais para o estudo da Estatística

População e amostra

 Podemos definir população (ou universo) como um conjunto completo de elementos com um
parâmetro comum.
 A população finita tem um número determinado de elementos, enquanto a população infinita
não tem.
Exemplo:
 A população brasileira é formada pelo conjunto de pessoas nascidas no Brasil ou com
nacionalidade brasileira, então a população pode ser classificada em finita ou infinita.

 A amostra é um subconjunto da população.


Exemplo:
 O grupo formado por jovens brasileiros de 12 a 14 anos é uma
amostra da população brasileira.
Conceitos fundamentais para o estudo da Estatística

Processos Estatísticos de Abordagem


No estudo de um fenômeno coletivo usando Estatística, podemos escolher entre duas
diferentes abordagens:
 Censo.
 Amostragem.

 No Censo é feita a avaliação direta de um parâmetro utilizando-se de toda a população.


A necessidade de acessar toda a população para obter a informação faz com que o processo
seja lento, mas aumenta sua confiabilidade.
 Na Amostragem, a avaliação de um parâmetro é indireta e
usa-se como estimador o cálculo de probabilidades. Nela, não
é necessário acessar toda a população, de forma que o
processo se torna mais rápido e com menos custos,
permitindo, ainda, que os dados sejam
constantemente atualizados.
Conceitos fundamentais para o estudo da Estatística

Dados Estatísticos

 Os Dados Estatísticos são os elementos fundamentais a partir dos quais a estatística é feita.

Define-se como variável a característica de interesse de cada dado da amostra ou da


população. As variáveis podem ser de dois tipos:
 Variáveis Quantitativas.
 Variáveis Qualitativas.
Conceitos fundamentais para o estudo da Estatística

Variáveis Quantitativas

 As Variáveis Quantitativas assumem valores numéricos e, a partir deles, podemos realizar


cálculos estatísticos. Tais variáveis são classificadas como discretas ou contínuas.

 Discretas: assumem apenas certos valores (inteiros).


 Contínuas: podem assumir um intervalo de valores.
Conceitos fundamentais para o estudo da Estatística

Variáveis Qualitativas

 Contêm informações não numéricas relativas a categorias, como gênero, cargo e endereço,
ao tratarmos de pessoas, ou cor, volume e peso, ao tratarmos de produtos.

 Ordinais: contêm informações que localizam o dado dentro de uma categoria,


por exemplo, escolaridade.

 Nominais: contêm informações que não localizam o dado em


uma categoria, como cor dos olhos ou endereço.
Interatividade

Analise o quadro a seguir e indique as Variáveis Qualitativas.


Tabela 1 – Dados dos moradores do condomínio
Morador Placa Número
Apartamento
responsável do carro de moradores
10 Paula Silva – 2
11 Felipe Rodrigues DEF2132 5
20 Marcos Junior F23R222 4
21 Diana Souza AED1202 1
30 Rafaela Moraes – 2

a) São Variáveis Qualitativas o número do apartamento, o nome


do morador responsável e a placa do carro.
b) É Variável Qualitativa o número do apartamento.
c) É Variável Qualitativa o nome do morador.
d) É Variável Qualitativa a placa do carro.
e) É Variável Qualitativa o número de moradores.
Resposta

Analise o quadro a seguir e indique as Variáveis Qualitativas.


Tabela 1 – Dados dos moradores do condomínio
Morador Placa Número
Apartamento
responsável do carro de moradores
10 Paula Silva – 2
11 Felipe Rodrigues DEF2132 5
20 Marcos Junior F23R222 4
21 Diana Souza AED1202 1
30 Rafaela Moraes – 2

a) São Variáveis Qualitativas o número do apartamento, o nome


do morador responsável e a placa do carro.
b) É Variável Qualitativa o número do apartamento.
c) É Variável Qualitativa o nome do morador.
d) É Variável Qualitativa a placa do carro.
e) É Variável Qualitativa o número de moradores.
Estatística Descritiva

Como já foi comentado, a estatística divide-se em:


 Estatística Descritiva.
 Estatística Indutiva.

A Estatística Descritiva tem como objetivo organizar e analisar um conjunto de


dados utilizando:
 Média.
 Moda.
 Mediana.
Estatística Indutiva

 A Estatística Indutiva tem como objetivo inferir, induzir ou estimar o comportamento da


população a partir da qual a amostra foi obtida.

 A Estatística Indutiva faz uma generalização a partir de resultados particulares.


Estatística Descritiva

A Estatística Descritiva e o estudo estatístico completo de uma população deve se basear no


método estatístico, que é composto por uma série de etapas listadas a seguir:

1) Definição do problema.
2) Delimitação do problema.
3) Planejamento para a obtenção dos dados.
4) Coleta dos dados.
5) Apuração dos dados.
6) Apresentação dos dados.
7) Análise dos dados.
8) Interpretação dos dados.
Dados Brutos

 Chamamos de Dados Brutos os dados exatamente da forma como são obtidos, sem
tratamento nem organização.
 Por exemplo: em uma pesquisa de cargos e salários, o conjunto de dados com
cargo do funcionário e o seu salário são Dados Brutos se não passaram por nenhuma
forma de organização.
 Não é incomum que Dados Brutos, isto é, dados sem nenhum tipo de tratamento –,
apresentem incompatibilidades que precisam ser resolvidas.
 Um exemplo clássico está nos dados envolvendo datas, que
podem ser escritas em diversos formatos; esses formatos
precisam ser uniformizados para que a análise dos dados seja
feita de forma correta. Outro exemplo de incompatibilidade
é a frequência de nomes de cidades com diversas grafias
possíveis, como São Paulo, S.Paulo ou, ainda, SP, que se
referem à mesma cidade e devem ter a grafia uniformizada.
Rol

 Se partirmos de Dados Brutos e aplicarmos alguma forma de organização, teremos o que


chamamos de Rol.

No Rol, os dados podem ser organizados da seguinte forma:


 Crescente.
 Decrescente.
 Ordem alfabética.
Rol

Tabela 2 – Desempenhos dos alunos na prova


Aluno Nota
Maria 9
Pedro 4
Otávio 6
Mariana 7
Sheila 8,5
Oswaldo 3
Matheus A. 8
Matheus R. 10
Leonardo 10

 Sem nenhuma organização: 9 4 6 7 8,5 3 8 10 10.


 Decrescente: 10 10 9 8,5 8 7 6 4 3.
 Se aplicarmos qualquer processo de organização nesses
dados, passaremos a ter um Rol.
Rol

 Dessa forma, é possível analisar a distribuição de notas dos alunos com mais facilidade, mas
a informação ainda não está apresentada da melhor maneira, o que pode ser feito a partir de
um estudo de frequências (que veremos mais adiante).

 Nem todos os dados, porém, são de natureza numérica.

 A tabela 2 também apresenta informações sob a forma de nomes, que são classificados
como dados alfanuméricos.

 Poderíamos obter um Rol organizando o nome dos alunos em


ordem alfabética, por exemplo.
Interatividade

Um estudo estatístico completo de uma população deve basear-se no método estatístico, que é
composto por uma Série de Etapas. Qual alternativa a seguir pode ser classificada como uma
das etapas?

a) Entrevista.
b) Reunião.
c) Gráfico.
d) Coleta dos dados.
e) Exclusão de dados.
Resposta

Um estudo estatístico completo de uma população deve basear-se no método estatístico, que é
composto por uma Série de Etapas. Qual alternativa a seguir pode ser classificada como uma
das etapas?

a) Entrevista. Série de Etapas


b) Reunião. 1) Definição do problema.
c) Gráfico. 2) Delimitação do problema.
d) Coleta dos dados. 3) Planejamento para a obtenção dos dados.
e) Exclusão de dados. 4) Coleta dos dados.
5) Apuração dos dados.
6) Apresentação dos dados.
7) Análise dos dados.
8) Interpretação dos dados.
Séries Estatísticas

 Definimos como Séries Estatísticas as tabelas que apresentam os dados organizados em


função do tempo, da localidade ou da espécie do dado.

As Séries Estatísticas são classificadas em:


 Séries Históricas – classificadas em função do tempo.
 Séries Geográficas – classificadas em função da localidade.
 Séries Específicas – classificadas em função de categorias características dos dados.
 Séries Conjugadas – é uma combinação das geográficas ou específicas.
Séries Estatísticas

 As Séries Históricas são classificadas em função do tempo; as Séries Geográficas são


classificadas em função da localidade; as Séries Específicas são classificadas em função de
categorias características dos dados; e as Séries Conjugadas, também conhecidas como
Séries Mistas, são uma combinação das Séries Temporais, Geográficas ou Específicas.

Tabela 3 – População residente no Brasil, por ano

Ano População
1991 146.815.815
2000 169.872.856
2010 190.755.799
Fonte: IBGE (c2022b).
Séries Geográficas

Na tabela 4 a seguir é apresentado um exemplo de Séries Geográficas, onde os dados são


organizados por localidade:

Tabela 4 – População residente no Brasil em 2010, por grande região

Grande região População

Norte 15.864.454

Nordeste 53.081.950

Sudeste 80.364.410

Sul 27.386.891

Centro-Oeste 14.058.094
Fonte: IBGE (c2022b).
Séries Especificas

 Na tabela 5 a seguir, temos um exemplo de Séries Específicas, onde os dados são


organizados por sexo.

Tabela 5 – População residente no Brasil em 2010, por sexo

Sexo População

Homens 93.406.990

Mulheres 97.348.809

Fonte: IBGE (c2022b).


Séries Conjugadas

Na tabela 6 a seguir, temos um exemplo de Séries Conjugadas ou Mistas:

Tabela 6 – População residente no Brasil


em 2010, por grande região e por ano

Ano
Grande Região
1991 2000 2010
Norte 10.027.373 12.911.170 15.864.454
Nordeste 42.494.112 47.782.487 53.081.950
Sudeste 62.740.146 72.430.193 80.364.410
Sul 22.129.131 25.119.348 27.386.891
Centro-Oeste 9.425.053 11.638.658 14.058.094
Fonte: IBGE (c2022b).
Apresentação de Dados Estatísticos

 A maneira fundamental de apresentação e organização de Dados Estatísticos é por tabelas.


São partes fundamentais de uma tabela:
 título;
 cabeçalho;
 coluna indicadora;
 corpo da tabela:
 linhas;
 células.
Apresentação de Dados Estatísticos

 O título localiza-se na parte superior da tabela (ABNT, 2011) e especifica o assunto dos
dados da tabela e, se for o caso, o período ao qual os dados se referem. Todas as tabelas
devem ter título.
 O cabeçalho é a parte superior da tabela, normalmente destacado do corpo da tabela.
 O cabeçalho deve indicar os conteúdos de cada coluna.
 A coluna indicadora é, normalmente, a primeira coluna à esquerda da tabela e especifica o
conteúdo das linhas.
 Na tabela 5, a coluna indicadora é o sexo. Abaixo do cabeçalho e à direita da coluna
indicadora, temos o corpo da tabela.
 No corpo da tabela temos as linhas, que disponibilizam a
informação no sentido horizontal.
 Cada elemento do corpo da tabela, obtido pelo cruzamento
de uma linha com uma coluna, é chamado de célula.
Distribuição de Frequência – Variável Discreta

 Aqui será discutido como apresentar dados usando uma Distribuição de Frequência (f).
 A primeira etapa trata-se de Variáveis Discretas.
Figura 1 – Dados mostrando cada uma das 6 faces Imagine que esse dado tenha sido lançado 14
vezes e que tenham sido obtidos os seguintes
resultados: 4 2 5 1 3 5 2 6 1 6 2 2 3 1.
Tabela 7 – Frequência de resultados obtidos pelo
lançamento de um dado
Face do dado Frequência
Disponível em: https://cutt.ly/bMxBZzD
1 3
2 4
3 2
4 1
5 2
6 2

Note que, se somarmos as Frequências, devemos recuperar o


número total de lançamentos (14).
Distribuição de Frequência Relativa

 Na Frequência Relativa dividimos a frequência de cada valor pelo número total de dados na
amostra ou população.
 Na tabela 8 a seguir são expostas as Frequências Relativas para o resultado do lançamento
do dado estudado no exemplo anterior.
Tabela 8 – Frequência relativa de resultados
obtidos por 14 lançamentos de um dado
Face do dado Frequência Frequência relativa
1 3 3/14 = 0,21
2 4 4/14 = 0,29
3 2 2/14 = 0,14
4 1 1/14 = 0,08
5 2 2/14 = 0,14
6 2 2/14 = 0,14

Note que a soma das Frequências Relativas deve ser igual a


1, ou próxima de 1, no caso de arredondamento dos valores.
Distribuição de Frequência – Variável Contínua

 Nesse caso, é fundamental que os dados sejam agrupados em classes ou intervalos, como
foi feito com as Variáveis Discretas.
 Todas as observações sobre a distribuição de Frequência para as Variáveis Discretas
aplicam-se também à distribuição de Frequências das Variáveis Contínuas.

Tabela 12 – Distribuição de salários em uma empresa

Salário Número de
(em salários mínimos) funcionários
0├ 1 0
1├ 2 5
2├ 3 23
3├ 4 53
4├ 5 12

Frequentemente, a visualização de dados em uma tabela


não apresenta, de forma imediata, as características dos
dados, ainda mais para o público leigo.
Interatividade

Durante sua fase inicial, um aplicativo recebeu as seguintes avaliações dos seus primeiros
200 usuários:
Estrelas
Frequência a) Esse aplicativo tem boa aceitação, pois a frequência relativa
absoluta das 5 estrelas é igual a 50%.
1 estrela 20
b) Esse aplicativo tem boa aceitação, pois a frequência relativa
2 estrelas 8
das 5 estrelas é maior que 50%.
3 estrelas 10
4 estrelas 7 c) Esse aplicativo não tem boa aceitação, pois a frequência
5 estrelas 55 relativa das 5 estrelas é menor que 50%.
Não avaliam 100 d) Esse aplicativo não tem boa aceitação, pois a frequência
relativa das 5 estrelas é igual a 50%.
e) Esse aplicativo não tem boa aceitação, pois a frequência
relativa das 5 estrelas é igual a 500%.
Resposta

 A alternativa correta é a B.

 Primeiramente, calcularemos a frequência relativa das 5 estrelas. Porém, note que havia 200
usuários, sendo que 100 deles não avaliaram, e queremos a frequência relativa somente
daqueles que avaliaram, ou seja,
200 – 100 = 100 usuários
 Desses 100 usuários, 55 avaliaram com 5 estrelas, então temos:
55 : 100 = 0,55 = 55%
 Logo, podemos afirmar que o aplicativo tem boa aceitação, pois a frequência relativa de 5
estrelas é maior que 50%.
Representação Gráfica de Séries Estatísticas

 A melhor forma de apresentarmos os dados ou resultados de uma pesquisa costuma


ser por meio de Gráficos.
 Os Gráficos, independentemente do tipo, precisam ser de fácil visualização e de
rápida interpretação.
 Assim como as tabelas, os Gráficos devem
Figura 4 – Gráficos em um relatório
sempre ser identificados por um título
na parte superior, e, se for o caso,
a fonte dos dados deve ser
identificada na parte inferior.

Disponível em: https://cutt.ly/UMx156S


Representação Gráfica de Séries Estatísticas

Existem diversos tipos de Gráficos, como os listados a seguir:


 Gráfico de Dispersão.
 Gráfico de Barras.
 Gráfico de Colunas.
 Gráfico de Setores.
 Histograma.
 Polígono de Frequências.

 De acordo com os dados que são representados no Gráfico,


um tipo pode ser mais adequado do que o outro.
Representação Gráfica – Dispersão

 O Gráfico de Dispersão é um dos tipos mais usado nas ciências exatas.


 Podemos utilizar Gráficos de Dispersão quando queremos mostrar a relação entre duas
(ou três) grandezas.
Relação entre expectativa de vida e PIB per capita, por país
 Esse gráfico em duas
dimensões tem dois eixos, Expectativa de vida
um na vertical e outro na (anos)
80
horizontal. Nos eixos deve-se
indicar sempre as grandezas
representadas neles e, se for
o caso, suas unidades. 60

40
PIB per capita (US$)
0 20K 40K 60K 80K 100K 120K 140K

Figura 5 – Gráfico tipo dispersão


Representação Gráfica – Barras

 Quando desejamos mostrar a evolução de dada grandeza, ou ainda comparar essa


grandeza em locais e situações diferentes, trabalhamos com Gráficos de Barras.
 Os Gráficos de Barras Número de pessoas analfabetas, por região
também têm dois eixos: Grande região
no eixo vertical, costuma-se
Nordeste
colocar a variável categórica
(ou qualitativa), já no eixo Sudeste
horizontal, costuma-se
colocar a variável quantitativa. Norte

Sul

Centro-Oeste

0 2.000.000 4.000.000 6.000.000 8.000.000


Número de pessoas

Figura 6 – Exemplo de gráfico de barras representando


o número de pessoas analfabetas, por região
Representação Gráfica – Colunas

 Outra forma de representação similar ao Gráfico de Barras é o Gráfico de Colunas.


 A diferença entre eles é que, no Gráfico de Colunas, a variável categórica é representada no
eixo horizontal, e a variável quantitativa é representada no eixo vertical.

Pessoas analfabetas, por grande região


Número
de pessoas

8.000.000

6.000.000

4.000.000

2.000.000

Grande região
Figura 8 – Exemplo de gráfico de colunas representando o número de pessoas
analfabetas, por grande região
Representação Gráfica – Setores

 O Gráfico de Setores, ou “Gráfico de Pizza”, é um gráfico polêmico e muitos não


gostam de usá-lo.
 O Gráfico de Setores é apresentado de forma circular e é utilizado para representar a divisão
de dada grandeza em diferentes categorias, em que cada categoria usa uma fatia do círculo.
 Nesse tipo de gráfico é interessante
representar a grandeza quantitativa Porcentagem de alfabetização no Brasil, 2010
sob a forma de porcentagem. Alfabetizados Não alfabetizados
10,53%

89,47%
Figura 9 – Exemplo de gráfico de setores, mostrando
a porcentagem de alfabetização no Brasil no ano de 2010
Representação Gráfica – Setores
Distribuição da população por idade no Brasil, 2010
0 a 5 anos 6 a 5 anos 7 a 9 anos 10 a 14 anos 15 a 19 anos
20 a 24 anos 25 a 29 anos 30 a 39 anos 40 a 49 anos 50 a 59 anos
60 a 69 anos 70 anos ou mais

5,22% 8,46%
6,72%
3,29%
5,17%
10,41%

9,7%

14,04%
9,6%

9,74%
16,75%
9,67%

Figura 10 – Exemplo de gráfico em que a representação por setores não é adequada. Temos nesse gráfico
a distribuição da população brasileira por idade, onde os setores ocupam áreas muito parecidas
e a variação dos dados não se torna evidente
Representação – Histograma

O Histograma é uma variação do Gráfico de Colunas, em que:


 no eixo horizontal, os dados são divididos em intervalos (ou classes);
 no eixo vertical é apresentada a frequência dos dados.
Distribuição de frequência para lançamento de um dado numérico de 6 faces
Frequência
4

1 2 3 4 5 6 Face

Figura 12 – Exemplo de histograma construído a partir dos dados da tabela 7,


com dados de frequência absoluta dos resultados de 14 lançamentos
de um dado de 6 faces
Representação – Histograma

 Quando trabalhamos com Histogramas é possível incluir no gráfico o que chamamos de


Polígono de Frequências, obtido pela ligação dos pontos médios do topo de cada barra do
Histograma (figura 14).
Distribuição de frequência para lançamento de um dado numérico de 6 faces

Frequência 0,30
relativa

0,20

0,10

1 2 3 4 5 6 Face

Figura 14 – Histograma de frequências relativas com Polígono de


Frequências para os resultados de 14 lançamentos de um dado de 6 faces
Concluindo

Um estudo estatístico completo de uma população deve se basear no método estatístico, que é
composto por uma série de fases:
 Definição do problema.
 Delimitação do problema.
 Planejamento para a obtenção dos dados.
 Coleta dos dados.
 Apuração dos dados.
 Apresentação dos dados.
 Análise dos dados.
 Interpretação dos dados.
Concluindo

 Para efeito de análise dos dados, consideramos que todos os dados, quando agrupados em
intervalos ou classes, estão associados ao Ponto Médio (Pm) da classe à qual pertencem.
O Ponto Médio de uma classe é calculado por:

Na equação:

 Ls é o limite superior do intervalo ou da classe.


 Li é o limite inferior do intervalo ou da classe.
Interatividade

Um entrevistador perguntou a um grupo de pessoas a respeito do sabor preferido de sorvete.


Com os dados obtidos, o entrevistador elaborou o gráfico a seguir.

Sabor preferido de sorvete

Quantidade de pessoas
6
5
4
3
2
1
0
Chocolate Morango Creme Flocos Napolitano

Figura 16
Interatividade

Com base no exposto e em seus conhecimentos, avalie as afirmativas a seguir.

I. O gráfico elaborado pelo entrevistador é chamado de Gráfico de Dispersão.


II. Foram entrevistadas 20 pessoas.
III. O percentual de pessoas que prefere sorvete de flocos é igual a 30%.

É correto o que se afirma em:


a) I, apenas.
b) II, apenas.
c) III, apenas.
d) II e III, apenas.
e) I, II e III.
Resposta

Resposta correta: alternativa D – II e III, apenas.

Análise das afirmativas:


I. Afirmativa incorreta. Justificativa: o gráfico elaborado pelo entrevistador é chamado de
Gráfico de Colunas (ou barras verticais).
II. Afirmativa correta. Justificativa: temos a quantidade de pessoas que preferem determinado
sabor de sorvete e a quantidade total de pessoas entrevistadas (20).
III. Afirmativa correta. Justificativa: como 6 das 20 pessoas preferem sorvete de flocos, o
percentual de pessoas que prefere sorvete de flocos é igual a 30%.
ATÉ A PRÓXIMA!

Você também pode gostar