Você está na página 1de 28

Estatística

02 – Estatística Descritiva
Distribuições de frequência
• Há muitas maneiras para se organizar e descrever um conjunto de dados.
• Algumas características importantes que devem ser consideradas quando organizamos e descrevemos um
conjunto de dados são seu centro, sua variabilidade (ou dispersão) e sua forma.
• Quando um conjunto de dados tem muitos valores, pode ser difícil de observar padrões.
• Uma maneira de organizar conjuntos de dados é agrupando-os em intervalos chamados de classes e
formando uma distribuição de frequência.

• Definição
• Uma distribuição de frequência é uma tabela que mostra classes ou intervalos dos valores com a contagem
do número de ocorrências em cada classe ou intervalo. A frequência f de uma classe é o número de
ocorrências de dados na classe.
Distribuições de frequência
• Na distribuição de frequência mostrada na Tabela há seis classes.
• As frequências para cada uma das seis classes são 5, 8, 6, 8, 5 e 4.
• Cada classe tem um limite inferior de classe, que é o menor
número que pode pertencer à classe, e um limite superior de
classe, que é o maior número que pode pertencer à classe.
• Na distribuição de frequência mostrada, os limites inferiores de
classe são 1, 6, 11, 16, 21 e 26 e os limites superiores de classe
são 5, 10, 15, 20, 25 e 30.
• A amplitude de classe é a distância entre os limites inferiores
(ou superiores) de classes consecutivas. Por exemplo, a amplitude
de classe na distribuição de frequência mostrada é 6 – 1 = 5.
• A diferença entre os valores máximo e mínimo dos dados é
chamada de amplitude.
• Na tabela de frequência mostrada, suponha que o valor máximo
seja 29, e o mínimo seja 1. A amplitude é, então, 29 – 1 = 28
Distribuições de frequência
• Construindo uma distribuição de frequência com base em um conjunto de dados
• 1. Decida o número de classes para serem incluídas na distribuição de frequência. O número de classes
situa-se usualmente entre 5 e 20; caso contrário, pode ser difícil detectar padrões.
• 2. Encontre a amplitude de classe como a seguir. Determine a amplitude dos dados, divida a amplitude pelo
número de classes e arredonde para um número próximo mais conveniente.
• 3. Encontre os limites de classe. Você pode usar o menor valor dos dados como o limite inferior da primeira
classe. Para encontrar os demais limites inferiores, adicione a amplitude de classe ao limite inferior da classe
precedente. Então, encontre o limite superior da primeira classe. Lembre-se de que as classes não se
sobrepõem. Encontre os limites superiores das classes restantes.
• 4. Faça uma marca de contagem para cada registro na linha da classe apropriada.
• 5. Conte as marcas para encontrar a frequência total f para cada classe.
Distribuições de frequência
• Exemplo:
• O conjunto de dados a seguir lista os preços (em dólares) de 30 aparelhos GPS (global positioning system) portáteis.
• Construa uma distribuição de frequência com sete classes.
128 100 180 150 200 90 340 105 85 270
200 65 230 150 150 120 130 80 230 200
110 126 170 132 140 112 90 340 170 190
• Solução
• 1. O número de classes (7) é dado no problema.
• 2. O valor mínimo é 65 e o máximo é 340, então, a amplitude é 340 – 65 = 275. Divida a amplitude pelo número de
classes e arredonde para encontrar a amplitude de classe.
• = = 39,29
ú
• Pode ser arredondado para 40.
Distribuições de frequência
• 3. O valor mínimo é um limite inferior conveniente para a
primeira classe. Para encontrar os limites inferiores das seis
classes restantes, adicione a amplitude de classe, 40, ao limite
inferior de cada classe precedente. Logo, os limites inferiores
das demais classes são: 65 + 40 = 105, 105 + 40 = 145, e assim
por diante. O limite superior da primeira classe é 104, que é
uma unidade a menos que o limite inferior da segunda classe.
Os limites superiores das outras classes são: 104 + 40 = 144,
144 + 40 = 184, e assim por diante.
• 4. Faça uma marca de contagem para cada registro de dados
na classe apropriada. Por exemplo, o valor 128 está na classe
105–144, então faça uma marca de contagem nessa classe.
Continue até que você tenha feito uma marca para cada um
dos 30 valores
• 5. O número de marcas de contagem para uma classe é a
frequência dessa classe.. A primeira classe, 65–104, tem seis
marcas de contagem. Então, a frequência dessa classe é 6.
Note que a soma das frequências é 30, que é o número de
valores no conjunto de dados.
Distribuições de frequência
• Depois de construir uma distribuição de frequência padrão tal como a do Exemplo 1, você pode incluir
diversas características adicionais que ajudarão a fornecer um melhor entendimento dos dados. Essas
características (ponto médio, frequência relativa e frequência acumulada de cada classe) podem ser
incluídas como colunas adicionais em sua tabela.
• Definição
• O ponto médio de uma classe é a soma dos limites inferior e superior da classe dividida por dois. O ponto
médio é, às vezes, chamado de marca da classe.
𝑙𝑖𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 𝑑𝑎 𝑐𝑙𝑎𝑠𝑠𝑒 + 𝑙𝑖𝑚𝑖𝑡𝑒 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 𝑑𝑎 𝑐𝑙𝑎𝑠𝑠𝑒
𝑝𝑜𝑛𝑡𝑜 𝑚é𝑑𝑖𝑜 =
2
• A frequência relativa de uma classe é a fração, ou proporção, de dados que está nessa classe. Para calcular a
frequência relativa de uma classe, divida a frequência f pelo tamanho n da amostra. Caso queira expressar
em percentagem, basta multiplicar esse resultado por 100.
𝑓𝑟𝑒𝑞𝑢ê𝑛𝑐𝑖𝑎 𝑑𝑎 𝑐𝑙𝑎𝑠𝑠𝑒 𝑓
𝑓𝑟𝑒𝑞𝑢ê𝑛𝑐𝑖𝑎 𝑟𝑒𝑙𝑎𝑡𝑖𝑐𝑎 = =
𝑡𝑎𝑚𝑎𝑛𝑑𝑜 𝑑𝑎 𝑎𝑚𝑜𝑠𝑡𝑟𝑎 𝑛
• A frequência acumulada de uma classe é a soma das frequências dessa classe com todas as anteriores. A
frequência acumulada da última classe é igual ao tamanho n da amostra.
Distribuições de frequência
• Exemplo:
• Usando a distribuição de frequência construída no Exemplo anterior, determine o ponto médio e as
frequências relativa e acumulada para cada classe. Descreva quaisquer padrões.
• Solução:
• Os pontos médios e as frequências relativas e acumuladas para as três primeiras classes são:
Distribuições de frequência
• Os demais pontos médios e frequências relativas e acumuladas são mostradas na distribuição de frequência
expandida na Tabela 2.5.
Gráficos de distribuições de frequência
• Às vezes, é mais fácil identificar padrões de um conjunto de dados olhando um gráfico da distribuição de
frequência. Um desses gráficos é o histograma de frequência.
• Definição
• Um histograma de frequência é um diagrama de barras que representa a distribuição de frequência de um
conjunto de dados. Um histograma tem as seguintes propriedades:
• 1. A escala horizontal é quantitativa e indica os valores dos dados.
• 2. A escala vertical indica as frequências das classes.
• 3. Barras consecutivas devem estar encostadas umas nas outras.
• Em virtude de as barras consecutivas do histograma estarem encostadas, elas devem começar e terminar nas
fronteiras da classe ao invés de em seus limites.
• As fronteiras das classes, também denominadas limites reais, são os números que separam as classes sem
formar lacunas entre elas. Para valores de dados inteiros, subtrair 0,5 de cada limite inferior para encontrar as
fronteiras inferiores das classes. Para encontrar as fronteiras superiores das classes, adicione 0,5 a cada limite
superior.
Gráficos de distribuições de frequência
• Exemplo.
• Faça um histograma de frequência para a distribuição de
frequência do Exemplo anterior. Descreva qualquer padrão.
• Solução:
• Primeiro, encontre as fronteiras das classes (limites reais). Uma
vez que os valores dos dados são inteiros, subtraia 0,5 de cada
limite inferior para achar as fronteiras inferiores das classes e
adicione 0,5 em cada limite superior para achar as fronteiras
superiores das classes.
• Logo, as fronteiras inferior e superior da primeira classe são as
seguintes:
• Fronteira inferior da primeira classe = 65 – 0,5 = 64,5.
• Fronteira superior da primeira classe = 104 + 0,5 = 104,5
Gráficos de distribuições de frequência
Gráficos de distribuições de frequência

• Outra maneira de representar graficamente uma distribuição de frequência é usar um polígono de frequência.
Um polígono de frequência é um gráfico de linha que enfatiza as mudanças contínuas nas frequências.
• Exemplo:
• Faça um polígono de frequência para a distribuição de frequência do Exemplo anterior. Descreva quaisquer
padrões.
• Solução:
• Para construir o polígono de frequência, use as mesmas escalas horizontal e vertical que foram usadas no
histograma com os pontos médios na Figura anterior. Então, assinale pontos que representam o ponto médio e
a frequência de cada classe e conecte-os em ordem, da esquerda para a direita, com segmentos lineares.
Gráficos de distribuições de frequência
Gráficos de distribuições de frequência
• Um histograma de frequência relativa tem a mesma forma e a mesma escala horizontal do correspondente
histograma de frequência. A diferença é que a escala vertical indica as frequências relativas, e não as
frequências (absolutas).
• Exemplo
• Faça um histograma de frequência relativa para a distribuição de frequência do Exemplo anterior.
• Solução:
Gráficos de distribuições de frequência
• Para descrever o número de registros de dados que são menores que ou iguais a certo valor, construa um
gráfico de frequência acumulada.

• Definição
• Um gráfico de frequência acumulada ou ogiva é um gráfico de linhas que mostra a frequência acumulada
até cada classe em sua fronteira superior. As fronteiras superiores são marcadas no eixo horizontal e as
frequências acumuladas são marcadas no eixo vertical.
Gráficos de distribuições de frequência

• Construindo uma ogiva (gráfico de frequência acumulada)


• 1. Construa uma distribuição de frequência que inclua uma coluna com as frequências acumuladas.
• 2. Especifique as escalas horizontal e vertical. A escala horizontal consiste nas fronteiras superiores das
classes e a escala vertical indica as frequências acumuladas.
• 3. Assinale os pontos que representam as fronteiras superiores das classes e as frequências acumuladas
correspondentes.
• 4. Conecte os pontos em ordem da esquerda para a direita com segmentos lineares.
• 5. O gráfico deve começar na fronteira inferior da primeira classe (a frequência acumulada é zero) e deve
terminar na fronteira superior da última classe (a frequência acumulada é igual ao tamanho da amostra).
Gráficos de distribuições de frequência
• Exemplo:
• Desenhe uma ogiva para a distribuição de frequência do Exemplo anterior.
Gráficos de dados qualitativos
• Gráficos de pizza (setoriais) fornecem uma maneira conveniente de apresentar graficamente dados
qualitativos como percentagens de um todo.
• Um gráfico de pizza é um círculo dividido em setores que representam categorias. A área de cada setor é
proporcional à frequência de cada categoria.
• Exemplo:
• Os números de títulos conferidos (em milhares) em 2011 nos Estados Unidos constam na Tabela. Use um
gráfico de pizza para organizar os dados. (Fonte: U.S. National Center for Education Statistics.)
Gráficos de dados qualitativos
• Comece encontrando a frequência relativa, ou percentagem, de cada categoria, como mostra a Tabela.
• Então, construa um gráfico de pizza usando o ângulo central que corresponda a cada categoria.
• Para determinar o ângulo central, multiplique 360º pela frequência relativa da categoria.
• Por exemplo, o ângulo central para o título de tecnólogo é 360º (0,265) ≈ 95º.
Gráficos de dados qualitativos
Gráficos de dados qualitativos
• Outra maneira de representar graficamente dados qualitativos é usando um gráfico de Pareto.
• Um gráfico de Pareto é um gráfico de barras verticais no qual a altura de cada barra representa a frequência
ou a frequência relativa.
• As barras são posicionadas em ordem decrescente de altura, com a barra mais alta posicionada à esquerda.
• Tal posicionamento ajuda a destacar dados importantes e é frequentemente usado em negócios.
• Exemplo:
• Recentemente, a indústria de varejo perdeu US$ 34,5 bilhões com redução nos estoques. A redução de
estoque é uma perda de estoque por meio de quebra, roubo de carga, roubo em lojas e assim por diante.
• As principais causas da redução de estoque são erro administrativo (US$ 4,2 bilhões), roubo por funcionários
(US$ 15,1 bilhões), roubo em lojas (US$ 12,3 bilhões), desconhecida (US$ 1,1 bilhão) e fraude nas vendas
(US$ 1,7 bilhão).
• Use um gráfico de Pareto para organizar os dados. Qual causa de redução de estoque os varejistas deveriam
tratar primeiro? (Adaptado de: National Retail Federation and The Education, University of Florida.)
Gráficos de dados qualitativos
• Solução:
• Usando frequências relativas para o eixo vertical, podemos construir o gráfico de Pareto como mostrado na
Figura:
Gráficos de dados emparelhados

• Quando cada valor em um conjunto de dados corresponde a um valor em um segundo conjunto de dados, tais
conjuntos são chamados de conjuntos de dados emparelhados.
• Por exemplo, um conjunto de dados contém os custos de um item e um segundo conjunto de dados contém as
quantidades de vendas correspondentes.
• Já que cada custo corresponde a uma quantidade de vendas, os conjuntos de dados são emparelhados.
• Uma maneira de representar graficamente conjuntos de dados emparelhados é usando um gráfico de
dispersão, no qual os pares ordenados são representados como pontos em um plano coordenado (plano
cartesiano).
• Um gráfico de dispersão é usado para mostrar a relação entre duas variáveis quantitativas.
Gráficos de dados emparelhados
• Exemplo:
• O estatístico britânico Ronald Fisher apresentou
um famoso conjunto de dados chamado de
conjunto de dados de Íris de Fisher.
• Esse conjunto de dados descreve várias
características físicas, tais como o comprimento e
a largura das pétalas (em milímetros), para três
espécies da flor íris.
• No gráfico de dispersão da Figura, o comprimento
das pétalas forma o primeiro conjunto de dados e a
largura forma o segundo.
• Conforme o comprimento da pétala aumenta, o
que tende a acontecer com a largura?
Gráficos de dados emparelhados

• Solução:
• O eixo horizontal representa o comprimento da pétala e o vertical, a largura.
• Cada ponto no gráfico de dispersão corresponde ao comprimento e a largura da pétala de uma flor.
• Interpretação Com base no gráfico de dispersão, você pode ver que, conforme o comprimento da pétala
aumenta, a largura também tende a aumentar.
Gráficos de dados emparelhados
• Um conjunto de dados quantitativos cujos valores são
obtidos em intervalos regulares, durante um período
de tempo, é chamado de série temporal.
• Por exemplo, a quantidade de precipitação medida a
cada dia por um mês é uma série temporal.
• Você pode usar um gráfico de série temporal para
representar uma série desse tipo.
• Exemplo:
• A Tabela lista o número de assinantes de telefonia
celular (em milhões) e o valor médio mensal da conta
dos assinantes pelo serviço (em dólares) para os anos
de 2002 a 2012. Construa um gráfico de série
temporal para o número de assinantes de celular.
Descreva quaisquer tendências. (Fonte: Cellular
Telecommunications & Internet Association.)
Gráficos de dados emparelhados
• Faça o eixo horizontal representar os anos e o vertical, o número de assinantes (em milhões). Então, assinale
os dados emparelhados e conecte-os com segmentos de reta.

Você também pode gostar