Escolar Documentos
Profissional Documentos
Cultura Documentos
1. Conceitos fundamentais
da Estatística
2. Divisão da Estatística
3. Fases do método
Estatístico
A Ciência Estatística
Inicialmente devemos entender
que a Ciência Estatística se utiliza
de uma linguagem numérica
matemática, na qual faz deduções
a partir das uma parte (amostra),
para o todo (população).
• A Estatística é o segmento da
ciência responsável pela coleta,
organização e interpretação de dados
experimentais e pela extrapolação dos
resultados da amostra para a
população.
a) coleta de dados;
Definir o
Planejamento
problema e Organizar
e coleta dos
o público os dados
dados
alvo
Interpretar Criticar e
Tabelas e
e analisar
gráficos
apresentar os dados
os
resultados
Fonte: o autor
Fonte: o autor
Professora Fernanda Brandão
• Elaboração do Relatório de Estudo
Denominamos de População ou
Universo o conjunto finito ou
infinito de elementos, que
exibem particularidades comuns
(atributos),que sejam objetos de
um estudo estatístico.
A amostra é um
subconjunto extraído da
População, e desta,
representa as
características em estudo.
• Atributo
É qualquer característica de
interesse de estudo que
apresenta valores não
constantes, e é medida em
cada elemento da amostra ou
população.
Imagens do bancoFernanda
Professora de dados do programa
Brandão
PowerPoint
Classificação das variáveis
De acordo com os valores que um variável pode assumir, ela pode
ser classificada como quantitativa ou qualitativa.
CLASSIFICAÇÃO
DAS VARIÁVEIS
Quantitativas Qualitativas
Fonte: o autor
a. variável quantitativa
Imagens do banco de dados do programa
PowerPoint
contínua: é uma variável que
assume todos os números
infinitos não numeráveis de
valores, pois tomam todos os
valores num certo intervalo, ou
numa união de intervalos.
Nível de
Gênero: pluviosidade: Temperatura:
masculino baixo, normal, escala Celsius Peso de dois
feminino elevado. escala indivíduos
Fahrenheit
Fonte: o autor
Quem pretende tomar decisões ou efetuar estudos, começa normalmente por recolher as
informações que lhes parecem relevantes. Estes elementos recolhidos são compilados de
forma organizada (Rol), e chamam-se dados.
Fonte: o autor
Levantamento de Planejamento e
Hipótese coleta de dados
Descrição do Coleta qualificada
problema; de dados relevantes
para testar a
Pergunta e hipótese
hipótese.
levantada.
HIPÓTESES DADOS
COMUNICAÇÃO ANÁLISES
b. contínua
c. periódica
fidedigna.
sites oficiais.
Considera-se uma amostra, de dimensão 𝑛 , constituída por indivíduos que apresentam uma
determinada característica, com 𝑘 modalidades observadas 𝑥1 , 𝑥2 , 𝑥3 , … , 𝑥𝑘 .
Ex.: Suponha que uma pesquisa foi feita, a classificação dos alunos na disciplina de Estatística do Curso
de Física EaD na Universidade Estadual do Maranhão (UEMA) e o seguinte conjunto de dados foi
obtido: 𝑛 = 50
b. Em seguida, calculamos a amplitude total ou ranger é a diferença entre o maior e o menor valor
de dados observados:
At = 𝑥𝑚á𝑥 − 𝑥𝑚𝑖𝑛
Onde:
At = Amplitude total
Portanto: At = 87 – 27 = 60
c. Posteriormente determine número de classes (k)
𝐾= 𝑛 = 50 = 7,07 ≅ 7
𝐾 = 1 + 3,3 log 𝑛
𝑹 60
𝒉 = 𝑲 aplicando os valores já calculado na fórmula ℎ = = 8, 57 ≅ 9
7
Como colocado anteriormente, para facilitar os cálculos, é melhor arredondar esse valor. Então o
intervalo de classe terá a amplitude de 9.
Os limites das classes, inferior (𝑙) e superior (L), para amplitudes de classes constantes e iguais a
𝑎𝑖 , podem ser obtidos de acordo o que se apresenta na Tabela 1.
… … … …
𝑘 𝑥𝑚𝑖𝑛 + (𝑘 − 1)𝑎 𝑥𝑚𝑖𝑛 + 𝑘𝑎 [𝑥𝑚𝑖𝑛 + 𝑘 − 𝑙 𝑎; 𝑥𝑚𝑖𝑛 + 𝑘𝑎[
Limite inferior (𝑙) da primeira classe: 𝑥𝑚𝑖𝑛 = 27, e, “a ou k = 9”, como já calculado
previamente. Portanto, limite superior (L) da primeira classe 𝑥𝑚𝑖𝑛 + 𝑎, aplicando aos
dados apresentados:
l𝑖 𝐿𝑖
1 [27 36 [
2 [36 45 [
3 [45 54 [
4 [54 63 [
5 [63 72 [
6 [72 81 [
7 [81 90 [
Fonte: o autor
𝑙𝑖 + 𝐿𝑖
𝑐𝑖 =
2
Centro de Classe
𝑐𝑖
(27 + 36) / 2 = 31,50
(36 + 45) / 2 = 40,50
(45 + 54) / 2 = 49,50
(54 + 63) / 2 = 58,5
(63 + 72) / 2 = 67,50
(72 + 81) / 2 = 76,5
(81 + 90) / 2 = 85,5
-
[𝑥𝑚𝑖𝑛 ; 𝑥𝑚𝑖𝑛 + 𝑎[ 𝑛1 𝑛𝑖 𝑁1 = 𝑛1 𝐹1 = 𝑓1
𝑓𝑖 =
𝑛
[𝑥𝑚𝑖𝑛 + 𝑛2 𝑛2 𝑁2 = 𝑛1 + 𝑛2 𝐹2 = 𝑓1 + 𝑓2
𝑓2 =
𝑛
𝑎; 𝑥𝑚𝑖𝑛 + 2𝑎[
[𝑥𝑚𝑖𝑛 + 𝑛3 𝑛3 𝑁3 = 𝑛1 + 𝑛2 + 𝑛3 𝐹3 = 𝑓1 + 𝑓2 + 𝑓3 + 𝑓4
𝑓3 =
𝑛
2𝑎; 𝑥𝑚𝑖𝑛 + 3𝑎[
… … … … …
𝑘-ésima classe 𝑛𝑘 𝑛𝑘 𝑁𝐾 𝐹𝑘 = 𝑓1 + 𝑓2 + 𝑓3 + 𝑓4 +
𝑓𝑘 =
𝑛 = 𝑛1 + 𝑛2 + 𝑛3 + ⋯ + 𝑛𝐾 𝑓𝑘 =1
=𝑛
𝑘 𝑘
𝑛𝑖 = 𝑛 𝑓𝑖 = 1 - -
Total
𝑖−1 𝑖−1
Fonte: adaptado de Cunha et al. (2007)
Professora Fernanda Brandão
Ex.: Aplicação
Tabela 2.3 - Distribuição da frequência da classificação dos alunos na disciplina de
Estatística do Curso de Física EaD na Universidade Estadual do Maranhão (UEMA).
Classes Frequência Frequência Frequências relativas Frequência absoluta
absoluta relativa
acumulada Acumulada
𝑛𝑖 𝑓𝑖 𝐹𝑖 𝑁𝑖
[27, 36 [ 3 3/50 = 0,06 3/50=0,06 3
[36, 45 [ 7 7/50 = 0,14 (3+7) /50=0,2 3+7= 10
[45, 54 [ 11 11/50 = 0,22 (3+7+11) /50=0,42 3+7+11= 21
[54, 62 [ 12 12/50 = 0,24 (3+7+11+12) /50=0,46 3+7+11+12=33
[63, 72 [ 7 7/50 = 0,14 (3+7+11+12+7) /50=14,8 3+7+11+12+7=40
9/50 = 0,18 (3+7+11+12+7+9) 3+7+11+12+7+9=49
[72, 81 [ 9 /50=0,98
[81, 90 [ 1 1/50 = 0,02 (3+7+11+12+7+9+1) /50=1 3+7+11+12+7+9+1=50
7 7 - -
TOTAL 𝑛𝑖 = 50 𝑓𝑖 = 1
𝑖=1 𝑖−1
Fonte: o autor
10
11
5
5 2 3 1 1
0
1 2 3 4 5 6
Fonte: o autor
5
3
1
0 0,1 0,2 0,3 0,4 0,5 0,6
Fonte: o autor
30% Baixo
50% Regular
Alto
20%
Fonte: o autor
Professora Fernanda Brandão
Histograma
O Histograma permite representar graficamente a distribuição de frequência de uma variável
contínua. No eixo horizontal representam-se as classes e no eixo vertical as frequências absolutas
ou relativas.
Classificação na disciplina de
estatística do curso de Física
EaD (UEMA)
15 150,00%
FREQUÊNCIA
10 100,00%
5 50,00%
0 0,00%
65 55 45 75 85 35 Mais 25
BLOCO
Frequência % acumulada
Fonte: o autor
Polígono de Frequências
Os Polígonos de Frequências são gráficos de linha que são obtidos unindo sucessivamente, por
segmentos de reta, os pontos médios dos topos dos retângulos do histograma que representa as
frequências relativas.
Classificação na disciplina de
estatística do curso de Física EaD
(UEMA)
15 150,00%
FREQUÊNCIA
10 100,00%
5 50,00%
0 0,00%
25 35 45 55 65 75 85 Mais
BLOCO
Frequência % acumulada
Professora Fernanda Brandão
Fonte: o autor
Referências
BUSSAB, Wilton de O; MORETTIN, Pedro A. Estatística Básica. 8.ed. São Paulo: Saraiva,
2013. 484 p.
CRESWELL, John W. CLARK, Vicki L. Plano. Pesquisa de métodos mistos. 2.ed. Porto Alegre:
Penso, 2013. 288p.
CUNHA, Gilda; MARTINS, M.ª do Rosário; SOUSA, Ricardo; OLIVEIRA, Felipa Ferraz de.
Estatística aplicada às ciências sociais. Lisboa: Lidel. 2007. 179 p.
MELLO, Francisco Mercês de. Dicionário de estatística. 1.ed. Lisboa: Sílabo, 2014. 311 p.
HILL, Manuela Magalhães; HILL, Andrew. Investigação por questionário. 2.ed. ver. e corr.
Lisboa: Silabo. 2012. 377 p.
REIS, Elizabeth; MELO, Paulo; ANDRADE, Rosa; CALAPEZ, Teresa. Estatística aplicada. V. 2.
4.ed. rev. Lisboa: Sílabo. 2008. 322 p.
REIS, Elizabeth; MELO, Paulo; ANDRADE, Rosa; CALAPEZ, Teresa. Exercícios: Estatística
aplicada. V. 2. 1.ed. Lisboa: Sílabo. 2008. 275 p.
VIEIRA, Sonia. Estatística básica. 1.ed. São Paulo: Cengage Learning, 2015. 176 p.
1. Medidas de localização ou
tendência central
2. Medidas de posição
3. Medidas de Dispersão
O resumo de dados por meio de tabelas de frequências oferece muito mais informações
sobre o comportamento de uma variável do que a própria tabela original de dados.
Entretanto, muitas vezes importa resumir ainda mais estes dados, apresentando um ou
alguns valores que sejam representativos da série toda.
a. Média Aritmética
𝑛
𝒳𝑖 +⋯+ 𝒳𝑛 𝑖=1 𝑥𝑖 1 𝑛
𝒳= = = 𝑖=1 𝑥𝑖 onde: xi – Valores observados; n – Dimensão da
𝓃 𝑛 𝑛
amostra.
3+4+7+8+8
𝒳= =6
5
No entanto, caso existam observações repetidas, pode-se atribuir a cada observação um peso
correspondente à frequência absoluta ou frequência relativa da referida observação. Neste
caso a média é usualmente designada por média aritmética ponderada:
𝑘
𝑖=1 𝑛𝑖𝑥𝑖 𝑘
𝒳= ou 𝒳 = 𝑖=1 𝑥𝑖𝑓𝑖
𝓃
Onde:
𝑛𝑖
𝑓𝑖 = - Frequência relativa;
𝑛
n - Dimensão da amostra;
ni - Frequência absoluta;
k – Número de observações distintas na amostra.
Aplicando a fórmula da média ponderada temos para o exemplo da Tabela 3.1, temos:
𝑘
𝑖=1 𝑛𝑖𝑥𝑖
𝒳= = (4 × 0) + (5 × 1) + (7 × 2) + (3 × 3) + (5 × 1) = 33 = 1,65.
𝓃
20 20
b. Mediana (𝒙)
Com os dados ordenados, a mediana é a terceira medida de tendência central e pode ser definida
como o valor que divide um conjunto de valores em dua partes iguais. É o valor da variável que ocupa
a posição central na sucessão de observações ou na distribuição de frequência.
Se a amostra for construída por um número ímpar de observações, a mediana coincide com o valor
central do conjunto de dados ordenados.
Se a amostra for constituída por um número ímpar de observações, a mediana é a média dos dois
valores centrais.
Pode-se considerar a seguinte definição da mediana.
𝑥= 𝑥 𝑛+1 se 𝑛 ímpar
2
Quando o número de observações for par, usa-se como mediana a média aritmética das duas
observações centrais.
𝑥 𝑛 +𝑥 𝑛
+1
𝑥= 2 2
se 𝑛 par
2
(7+8)
3, 4, 7, 8, 8, 9 a mediana será 𝑥 = = 7,5.
2
Cálculo da Mediana para dados Agrupados:
Portanto:
ℎ. (𝐿𝑥 − 𝐹𝑎𝑛𝑡)
𝑋 = 𝐿𝑖𝑚𝑖𝑛𝑓 +
𝑓𝑖
Onde:
𝐿𝑥 : localização da (posição) da Mediana (𝑥)
𝐹𝑎𝑛𝑡 : frequência acumulada até a classe anterior à classe da mediana
𝑓𝑖 : frequência absoluta da classe da mediana
ℎ: amplitude de classe
𝐿𝑖𝑚𝑖𝑛𝑓 : Limite inferior da classe mediana
c. Moda
Nem todo conjunto de dados possui um valor modal, e também quando possui, este
valor pode não der único.
Fonte: o autor
Variáveis ordenadas 1 1 2 2 2 3 3 4 5
O valor da moda corresponde ao valor da variável que se repete mais vezes na amostra, é
correspondente à realização com maior frequência.
Neste caso, o valor que mais se repete é o 2, portanto é o valor modal, e significa que no
departamento Jurídico, 3 funcionários têm 2 filhos.
Em alguns casos, pode haver mais de uma moda, ou seja, a distribuição dos valores pode ser
bimodal, quando existe duas modas, trimodal, quando existe três modas ou polimodal ou
multimodal quando existe mais de três modas.
Quantis são estatísticas que nos permitem caracterizar conjuntos de dados dividindo-os em partes
iguais.
Os quantis mais utilizados são os percentis, os decis e os quartis. Os percentis dividem um conjunto de
dados em 100 partes iguais, os decis em 10 partes, e os quartis em quatro.
Quartil
ℎ. (𝐿𝑃𝑥 − 𝐹𝑎𝑛𝑡)
Onde: 𝑃 = 𝐿𝑖𝑚𝑖𝑛𝑓 +
𝑓𝑖
𝐿𝑃𝑥 : Localização (posição) do Percentil
ℎ : amplitude de classe
1. Introdução à probabilidade
2. Experimento Aleatório
3. Espaço Amostral
4. Evento
5. Definições de
Probabilidades
Ex.: O valor da velocidade do som (340 m/s) é conhecido mesmo antes de realizada a
experiência. O mesmo acontece com a medição da temperatura de entrada em ebulição
da água, cujo resultado (1000 𝐶) é conhecido a priori.
Os experimentos que iremos estudar são os aleatórios, dos quais não sabemos o
resultado, ou seja, são acontecimentos influenciados pelo acaso, e cujo os resultados não
podem ser previstos.
2. Experimento Aleatório:
Um experimento aleatório tem como características:
É com base nesta última característica que se desenvolve toda uma teoria e um conjunto de
modelos probabilísticos tendentes a explicar os fenômenos aleatórios e dar uma indicação da
maior ou menor probabilidade da sua ocorrência.
Ex.: Não se pode prever o resultado ao lançarmos um dado, pois quando lançamos um dado e
observamos o número inscrito na face voltada pra cima, podemos descrever o conjunto de
todos os resultado possíveis (1, 2, 3, 4, 5 e 6), mas é impossível, antes efetuarmos o
lançamento, afirmar qual a face que irá sair.
Ex.: Não se pode prever o resultado ao lançarmos um
dado, pois quando lançamos um dado e observamos o
número inscrito na face voltada pra cima, podemos
descrever o conjunto de todos os resultado possíveis (1,
2, 3, 4, 5 e 6), mas é impossível, antes efetuarmos o
lançamento, afirmar qual a face que irá sair;
Resposta:
4. Evento ou acontecimento
Retomando o exemplo da experiência aleatória que consiste no lançamento de um dado, e cujo espaço
de resultados de = { 1, 2, 3, 4, 5, 6} .
Sendo o espaço de resultados em conjunto, é possível formar subconjuntos dos seus elementos, como
por exemplo:
A={2}
B = { 1, 3, 5 }
C = { 3, 6 }
Cujo significado é, respectivamente:
A : saída de face 2
Não se deve confundir acontecimento com resultado. Enquanto acontecimento significa algo que a
experiência aleatória pode produzir, mas não se realiza necessariamente, um resultado indica algo
que a experiência aleatória produziu.
5. Definições de Probabilidades
De acordo com a definição e o método de cálculo, podemos definir três conceitos de probabilidades: clássica,
empírica ou frequencista e subjetiva.
As que probabilidades que se baseiam nas características intrínsecas dos acontecimentos são definidas segundo
o conceito clássico.
Aquelas que se baseiam numa quantidade razoável de evidências objetivas, são empíricas ou frequencista.
As probabilidades definidas com base em crenças ou opiniões individuais são denominadas subjetivas.
• Conceito clássico de probabilidade (a priori).
Se a uma experiência aleatória se pode associar N resultados possíveis, mutuamente exclusivos e igualmente
𝑛𝐴
prováveis, e se 𝑛𝐴 desses resultados tiverem atributo A, então a probabilidade de A é a fração ,
𝑁
𝑛𝐴
P [A] =
𝑁
Onde:
Observe que, para o conceito clássico de probabilidade, os resultados possíveis são todos igualmente prováveis, isto
é, todos têm igual probabilidade de se realizarem.
Ex.: Na experiência aleatória que consiste no lançamento de um dado e observação do número inscrito
na face voltada pra cima, seja A o acontecimento: saída da face 3. O espaço de resultados é definido
pelos seguintes elementos = { 1, 2, 3, 4, 5, 6}. A probabilidade de se realizar o acontecimento A é:
𝑛 1
P [A] = 𝑁𝐴 = 6
Com:
𝑛𝐴 : número de resultados favoráveis ao acontecimento A
N : número de resultados possíveis
Ex.: Considere a experiência aleatória que consiste no lançamento de uma moeda equilibrada ao ar.
Seja A o acontecimento: saída da face. O espaço de resultados será constituído por = { cara, coroa}. A
probabilidade de A será:
𝑛𝐴 1
P [A] = =2
𝑁
Referências
BUSSAB, Wilton de O; MORETTIN, Pedro A. Estatística Básica. 8.ed. São
Paulo: Saraiva, 2013. 484 p.
REIS, Elizabeth; MELO, Paulo; ANDRADE, Rosa; CALAPEZ, Teresa.
Estatística aplicada. V. 1. 5.ed. rev. Lisboa: Sílabo. 2007.