Você está na página 1de 17

NOME DA FACULDADE

ESTATÍSTICA
DESCRITIVA

NOME DO ALUNO

Cidade , 2022.
1. ESTATÍSTICA DESCRITIVA

O termo Estatística tem a sua origem no latim, status (estado). Pode ser definida
como um conjunto de métodos relacionados ao processo de coleta, organização,
descrição, análise e interpretação de dados, realizados em qualquer área do conhecimento.
A Estatística Descritiva é o ramo da estatística que visa sumarizar e descrever
qualquer conjunto de dados, é aquela que irá sintetizar os dados de maneira direta,
preocupando-se menos com variações e intervalos de confiança dos dados

1.1. DADOS ESTATÍSTICOS

• Coleta de Dados
Os métodos utilizados na coleta de dados em estudo de usuários estão
relacionados com a forma de abordagem qualitativa (qualidade) ou
quantitativa (quantidade). Sendo assim, os questionários são utilizados em
estudos quantitativos, que podem ter questões abertas que coletem dados
qualitativos, e entrevistas e observações em estudos qualitativos.
Sua apresentação pode ser realizadas por meio de gráficos, de tabelas
e de medidas descritivas:
• Os gráficos são formas de como os dados são apresentados,
seu objetivo é o de produzir uma compreensão mais rápida
do evento em estudo
• A tabela é definida como um quadro que aborda um
conjunto de consultas, e
• As medidas descritivas mais comuns utilizadas para
resumir os dados numéricos são as medidas de tendência
central e dispersão.
Existem duas formas comuns de coletar os dados pode ser: por censo
ou por amostragem. No censo a pesquisa é realizada com todos os
elementos da população, o que permite uma precisão absoluta. Este é
recomendável quando estamos reunindo dados para tomar decisões de um
alcance maior, por exemplo, um grande programa de controle de
natalidade, ou incentivo à redução da desigualdade regional, e, portanto,
precisamos ter um quadro muito amplo da situação atual. É isso que o
IBGE faz a cada dez anos no Brasil, com o chamado censo demográfico.
Existe também os censos: industrial e agropecuário, entre alguns outros.
Claramente, o censo exige um grande volume de recursos, bem como
um tempo considerável para a sua realização, consolidação dos dados,
produção dos relatórios e análise dos resultados.
Nas pesquisas por amostragem apenas uma pequena parte,
considerada representativa, da população é pesquisada. Os resultados
podem ser então generalizados, usualmente através de métodos estatísticos
apropriados, para toda a população. A economia de tempo e dinheiro é
evidente ao utilizar amostragem.
A partir de uma amostra de 3.000 eleitores podemos obter um retrato
confiável da preferência do eleitorado brasileiro. Contudo, sempre há risco
de que a amostra, por maiores que sejam os cuidados na sua retirada, não
seja representativa da população.
Além da decisão por censo ou amostragem devemos decidir se
utilizaremos dados primários ou secundários. Os dados secundários são
dados existentes, coletados por outros pesquisadores e disponíveis em
relatórios ou publicações. A sua utilização pode reduzir muito os custos de
uma pesquisa.
Se fosse necessário obter informações demográficas poderíamos
utilizar os relatórios do IBGE referentes ao último censo, ou à pesquisa
nacional por amostragem de domicílios (PNAD), não haveria necessidade
de realizar nova pesquisa. Quando os dados não existem, ou estão
ultrapassados, ou não correspondem exatamente aos objetivos de nossa
pesquisa, torna-se necessário coletar dados primários, diretamente dos
elementos da população.

• Tabelas de Frequências e agrupamento de dados


A partir da análise de dados é possível extrair informações e obter
sugestões para a tomada de decisões importantes.
Contudo, os dados brutos dizem pouco ou quase nada sobre o
comportamento de uma variável, tornando necessário o uso de técnicas
para organizar e resumir os dados, como a distribuição de frequências.
A frequência absoluta, ou apenas frequência, de um valor é o número
de vezes que uma determinada variável assume esse valor. Ao conjunto
das frequências dos diferentes valores da variável dá-se o nome de
distribuição da frequência (ou apenas distribuição).
A frequência relativa, é a percentagem relativa à frequência.
A frequência acumulada de um valor, é o número de vezes que uma
variável assume um valor inferior ou igual a esse valor.
A frequência relativa acumulada, é a percentagem relativa à
frequência acumulada.
A tabela de frequências é uma forma de representação da frequência
de cada valor distinto da variável. Juntamente com as frequências, esta
poderá incluir frequências relativas, frequências acumuladas e frequências
relativas acumuladas.

Exemplo: Consideremos a seguinte tabela

Nome Sexo Nome Sexo

Maria F Rubens M

Renan M Miguel M

Ana F Fernanda F

Francisca F Camila F

Guilherme M Cátia F

Temos,
Sexo Masculino: Frequência absoluta: 4,
Frequência relativa: 4 em 10 = 40%
Sexo Feminino: Frequência absoluta: 6,
Frequência relativa: 6 em 10 = 60%

A tabela de frequências da variável Sexo será:


Variável freq. absoluta (n) freq. relativa (%)
Sexo
M 4 40%
F 6 60%
Total 10 100%

• Representações Gráficas dos dados estatísticos


A representação gráfica compreende um sistema gráfico de signos que
possibilita a linguagem de comunicação gráfico-visual.
Gráfico é uma forma visual da Estatística utilizada para retratar um
evento. Sua utilização ocorre em uma grande proporção nos meios de
comunicação científica, social e técnica, devido a sua capacidade de
representar padrões gerais e particulares de determinados conjuntos de
dados em sua observação, facilitando sua interpretação e a eficiência com
que se refere informações destes.
Apesar de os gráficos fornecerem menor grau de detalhes do que as
tabelas em si, estes apresentam um benefício na compreensão geral dos
dados, o que permite que se note rapidamente na sua forma geral sem
deixar de demonstrar algumas características particulares que sejam de
interesse. A representação gráfica coloca em vislumbre as ocorrências
ocasionais, as tendências, os valores mínimos e máximos, assim como as
ordens de grandezas dos eventos que estão sendo analisados.
Principais usados:
Gráfico de barras ou colunas: este é constituído por retângulos
verticais ou horizontais de larguras equivalentes, tendo cada um deles
representando a intensidade de uma modalidade ou característica. gráficos
excelentes para a comparação de quantidades e de suas variações no
tempo. Elaborados a partir do plano cartesiano, são gráficos simples, mas
deve-se obedecer a algumas regras na sua feitura. As barras ou as colunas
devem ter início no valor zero.
Figura 1 Taxa de escolarização de 15 a 17 anos de idade Brasil e grandes regiões –
1992/2002

Gráfico de setores: com o formato de um círculo a variável em estudo


é projetada nela, de raio aleatório, sua divisão ocorre em setores com áreas
proporcionais às frequências das suas classes. São utilizados quando se
quer comparar cada valor da série com o total. Seu uso é recomendado para
o caso onde o número de categorias é pequeno, ou seja, não deve ser grande
e não possuem uma ordem a seguir.

Figura 2- - Município de procedência dos alunos da disciplina Inferência Estatística do curso de


Estatística da UEM, 21/03/2005.

Gráfico de linhas: Sua utilização é indicada para representações de séries


temporais sendo por esse motivo, reconhecido também por gráfico de séries
cronológica. Sua montagem inicia-se colocando-se no eixo vertical (y) a
medida da variável em estudo e na abscissa (x), as unidades da variável de
preferência em ordem crescente. Este estilo de gráfico possibilita
demonstrar séries mais longas, o que ajuda a detectar suas variações assim
como analisar tendências. Além disso neste tipo de gráfico pode ser
representados várias séries em apenas um.

Figura 3- RN – Receita Turística 2002/2004 (US$ 1,00)

Histograma: é um gráfico de colunas que serve para representar a


frequência de ocorrências de uma série expressa em números absolutos ou
em porcentagens, em um eixo cartesiano. A sua construção é semelhante ao
gráfico de colunas, mas sem espaços entre elas.

Figura 4 Idade dos alunos da disciplina Inferência Estatística do curso de Estatística da UEM, 21/03/2005.
• Recursos Computacionais
Atualmente nos dias de hoje é muito comum, por causa ao uso de
computadores, pesquisas serem realizadas onde a coleta de dados resulta
em avantajadas quantidades de dados para exame e torna-se praticamente
impossível compreendê-los, referente ao objetivo do estudo, se estes dados
não forem resumidos. Portanto, os dados na forma crua em que foram
coletados não possibilitam, de maneira simples e rápida, que se retire as
informações. Tornando difícil identificar a ocorrência de algum padrão.
Sendo assim é necessário tratar os dados para transformá-los em
informações úteis, para relacioná-los com outros resultados, ou ainda para
achar sua adequá-lo a alguma teoria, esse tratamento será feito com
recursos computacionais.
Os sumários e ocorrências de dados devem ser bem constituídos, são
altamente necessários para a adequada analise estatística, pois permitem
focar as características dos dados ou ter a capacidade sobre o tipo de
modelo que deveria ser usado na solução do problema em analise.

1.2. MEDIDAS DE TENDÊNCIA CENTRAL

• Média
É a principal medida de tendência central.
Seja X uma variável quantitativa (discreta ou contínua) com valores
observados x1, x2, xn ...Então, a média pode ser calculada por

Portanto, somar os valores de todos os dados observados e dividir o


total obtido pelo número de observações.
Existe também a média ponderada, onde são atribuídos pesos para
cada um dos elementos. Quanto maior for o peso, maior será a influência
daquele determinado dado no valor final da média aritmética ponderada.
Para calcular a média aritmética ponderada, utiliza-se a fórmula:
Onde:
p1, p2, p3, … pn → pesos
x1, x2, x3, … xn → valores do conjunto

Para calcular a média ponderada, calcula o produto de cada valor por


seu respectivo peso e, depois, calcula-se a soma entre esses produtos e
divide pela soma dos pesos.

• Moda
A moda (Mo) será o valor que exibe a maior frequência da variável
entre os valores examinados. Caso ocorra de valores individuais a moda
pode ser definida imediatamente analisando-se o rol ou a frequência
absoluta dos dados. Caso se trate de uma distribuição de frequência de
valores agrupados por classes, é necessário primeiro identificar a classe
modal, aquela que aparece com a maior frequência, e em seguida calcula-
se a moda aplicando a fórmula seguinte:

Onde:
o i: ordem da classe modal;
o li: limite inferior da classe modal;
o h: amplitude da classe modal;
o Fi: frequência absoluta da classe modal;
o Fi 1−: frequência absoluta da classe anterior à classe modal;
o Fi 1+: frequência absoluta da classe posterior à classe
modal

É mais indicado o uso da moda quando se quer obter, depressa, uma


medida de tendência central. O outro aspecto que auxilia a utilização da
moda é que seu valor não é atingido pelos valores extremos do conjunto
de dados em estudo.
• Mediana
A mediana de um conjunto de dados é definida como sendo o “valor
do meio” desse conjunto de dados, dispostos em ordem crescente,
deixando metade dos valores acima dela e metade dos valores abaixo dela.
Para calcular:
Se n é ímpar: Existe apenas um “valor do meio”, que é a mediana
Seja o conjunto de dados ( 2 ; 3,3 ; 2,5 ; 5,6 ; 5 ; 4,3 ; 3,2 ). Ordenando os
valores (2 ; 2,5 ; 3,2 ; 3,3 ; 4,3 ; 5 ; 5,6). O valor do meio é o 3,3 . A
mediana é o valor 3,3.
Se n é par: Existem dois “valores do meio”. A mediana é média
aritmética simples deles. Seja o conjunto de dados ( 3 ; 4,5 ; 5,5 ; 2,5 ; 1,3
; 6 ). Ordenando os valores (1,3 ; 2,5 ; 3 ; 4,5 ; 5,5 ; 6), os valores do meio
são 3 e 4,5. A mediana é (3 + 4,5)/2 = 3,75.
Como medida de tendência central, a mediana é até mais intuitiva do
que a média, pois representa, de fato, o centro (meio) do conjunto de
valores ordenados. Assim como a média, o valor da mediana não precisa
coincidir com algum dos valores do conjunto de dados. Em particular,
quando os dados forem de natureza contínua, essa coincidência
dificilmente ocorrerá.

• Recursos Computacionais
GeoGebra um software de matemática dinâmica gratuito
e multiplataforma para todos os níveis de ensino, que combina geometria,
álgebra, tabelas, gráficos, estatística e cálculo numa única aplicação

• Aplicações práticas das medidas de Tendências Centrais na


administração

Para a Média:
A Comissão Interna de Prevenção de Acidentes (CIPA) de uma
empresa, observando os altos custos com os frequentes acidentes de
trabalho ocorridos, fez, a pedido da diretoria, uma pesquisa do número de
acidentes sofridos por funcionários. Essa pesquisa, realizada com uma
amostra de 100 funcionários, norteará as ações da empresa na política de
segurança no trabalho.
Os resultados obtidos estão no quadro:

Figura 5 Acidentes sofridos por número de trabalhadores

Calculando a média ponderada. Sabendo que o peso será o número de


trabalhadores, cuja soma é 100, temos:

Para Moda:
Em uma loja de calçados femininos, o estoque é reposto mensalmente.
Para entender melhor o consumo de seus clientes, o dono da loja decidiu
anotar o tamanho escolhido pelos 35 primeiros clientes em uma lista:

N = {35, 37, 36, 34, 38, 35, 37, 37, 33, 36, 38, 37,35, 37, 34, 33, 37,
36, 35, 38, 36, 35, 36, 37, 38, 39, 37, 37, 36, 37, 33, 37, 35, 37, 39}

Analisando os dados coletados, para realizar o próximo pedido, o


tamanho de calçado mais recorrente entre as clientes é a moda desse
conjunto.
N = {35, 37, 36, 34, 38, 35, 37, 37, 33, 36, 38, 37,35, 37, 34, 33, 37,
36, 35, 38, 36, 35, 36, 37, 38, 39, 37, 37, 36, 37, 33, 37, 35, 37, 39}

A partir da moda, é possível perceber que 37 é o tamanho mais


recorrente entre as clientes dessa loja, dado esse que ajudaria a loja na
escolha dos tamanhos na hora de repor o estoque. Representamos a moda
por Mo. Nesse caso, temos que Mo = 37.

Para Mediana:
O gráfico apresenta o comportamento de emprego formal surgido,
segundo o CAGED, no período de janeiro de 2010 a outubro de 2010.

Figura 6 comportamento de emprego formal, janeiro a outubro de 2010.

Com base no gráfico, calcula-se o valor da parte inteira da mediana


dos empregos formais surgidos no período.
Note que há 10 valores. Quando se divide 10 por 2, temos que o termo
central é a média entre o 5º e o 6º termo da sequência. Colocando a
sequência em ordem, temos que:

N = {181.419, 181.719, 204.804, 209.425, 212.952, 246.875,


266.415, 298.041, 299.415, 305.068}

Assim, encontra a mediana:


(212.952 + 246.875) : 2 = 229.923
1.3. MEDIDAS DE DISPERSÃO
• Desvio Padrão e Variância
Variância (σ2 ): Ao analisar um conjunto de dados: x1 , x2 ,..., xn, é
possível verificar que eles se distribuem em torno da média, estando
abaixo ou acima dessa média. A variância é um valor que mede o grau de
dispersão ou desvios dos dados em relação ao valor médio. Ela é calculada
dividindo-se a soma dos quadrados dos desvios pelo total de elementos ou
indivíduos analisados.
A fórmula da Variância:

Onde:
x = valor de cada observação na população;
μ = média dos valores na população;
N = número de observações da população

Desvio padrão (σ): Um inconveniente da variância é que ela é


expressa em unidades ao quadrado, ou seja, caso esteja trabalhando com
milhares de reais, o resultado será expresso em milhares de reais, o que
causa algumas dificuldades de interpretação. Para resolver esse problema,
podemos nos utilizar do desvio padrão que é definido como a raiz quadrada
positiva da variância, sendo expresso na mesma unidade em que os dados
foram coletados.
Ficando assim a sua fórmula :

• Coeficientes de Variação
A variância e o desvio padrão são medidas de dispersão absolutas,
desse modo, apenas podem ser utilizados para comparar a variabilidade de
dois ou mais conjuntos de dados quando estes apresentarem:
o Mesma média;
o Mesmo número de observações; e
o Estiverem expressos nas mesmas unidades.
Então, para comparar qualquer conjunto de dados quanto à sua
variabilidade quando, pelo menos, uma dessas condições não é satisfeita,
é necessário lançar mão de uma medida de dispersão relativa como o
coeficiente de variação (CV).
O coeficiente de variação é uma medida de dispersão relativa definida
como a razão entre o desvio padrão e a média:

Com o coeficiente de variação poderá analisar a homogeneidade do


conjunto de dados e, assim sendo, se a média será uma boa medida para
reproduzir estes dados. Podendo ser utilizado, também, para relacionar
conjuntos com unidades de medidas distintas.

• Recursos Computacionais
O sistema SAS é um dos melhores software existentes na atualidade.
Atualmente somente o programa R tem competido com o SASr. O sistema
SAS é um software que propicia grandes vantagens no tratamento de
bancos de dados, nas análises estatísticas e na geração de relatórios das
mais variadas formas.

• Aplicações das medidas de dispersão na Administração


Para Desvio Padrão e Variância:
Três alunos cujas notas em uma disciplina estão apresentadas na
Figura 7. Se observa que as médias de suas notas são iguais, mas seus
desvios são diferentes. Isto significa que seus desempenhos não foram
iguais. O primeiro aluno, o A, seu desempenho é constante, já o segundo
aluno, o B, seu desempenho progride devagar e o terceiro aluno, o C,
houve uma perda de desempenho. Portanto mesmo os três alunos terem a
mesma média, sua a variabilidade varia.
Figura 7 Notas, desvios e média dos alunos em uma disciplina

O desvio padrão pode ser maior ou igual ao desvio médio, assim


ocorre por causa do ao fato de que para fazer o cálculo do desvio-padrão
cada desvio em relação a média é elevado ao quadrado, refletindo no
aumento desproporcional no peso dos valores extremos.

Para Coeficiente de variação:


Apresentando as idades dos alunos de graduação em matemática:

Figura 8 Idade alunos de matemática

Calculando a idade média será:


Precisa considerar os dados agrupados como na Figura 8, a média
ficará:

Fazendo os cálculos seguintes:

E finalmente para calcular o coeficiente de variação:

O Coeficiente de variação deu <50%, o que se comprova que a média


é uma medida descritiva essencial para a variável idade dos alunos.

Resumo:

Figura 9 Quadro resumo de conceitos básicos


2. Bibliografia

http://www.capcs.uerj.br/estatistica-descritiva/

https://www.fm2s.com.br/estatistica-descritiva-basica-e-centralidade/

http://proedu.rnp.br/bitstream/handle/123456789/581/Aula_01.pdf?seque
nce=1&isAllowed=y

https://metodologia.ceie-br.org/wp-
content/uploads/2019/05/livro2_cap9.pdf

http://medstatweb.med.up.pt/cursop/glossario/tfrequencia.html

https://escolaeducacao.com.br/agrupamento-de-dados-em-intervalos/

http://www.ead.uepb.edu.br/ava/arquivos/cursos/geografia/leituras_carto
graficas/Le_Ca_A13_J_GR_260508.pdf

http://www.each.usp.br/rvicente/Guedes_etal_Estatistica_Descritiva.pdf

https://brasilescola.uol.com.br/matematica/moda-media-mediana.htm

http://www.each.usp.br/rvicente/Guedes_etal_Estatistica_Descritiva.pdf

https://des.ufla.br/~danielff/meusarquivospdf/RC0.pdf

http://dca.iag.usp.br/material/morales/Climatologia1/Aula_2_27-03-
2010_3_01-06-2010.pdf

Você também pode gostar