Estatística

Estat�stica descritiva e indutiva e conceitos b�sicos
De acordo com Vieira (2008), estat�stica � a ci�ncia que fornece meios para a
coleta, organiza��o e interpreta��o de dados, possibilitando identificar algumas
caracter�sticas relevantes de um conjunto de dados.
Vamos conhecer agora os conceitos b�sicos utilizados em estat�stica, tais como

estat�stica universo, amostra e vari�vel.
Universo ou popula��o estat�stica - conjunto formado por todos os elementos que

possuem uma determinada carater�stica a ser catalogada e analisada.
Amostra - fra��o da popula��o estat�stica, que serve como par�metro para deduzir o
comportamento de toda a popula��o.
Fen�meno estat�stico - qualquer evento que se pretenda analisar, cujo estudo seja
pass�vel da aplica��o de uma t�cnica estat�stica. Por exemplo, n�mero de portadores
de HIV por grupo de cem mil habitantes no Brasil.
Vari�vel - dados que podem ser classificados conforme atributos. Em vari�veis

qualitativas, que n�o s�o expressas numericamente, como g�nero; e quantitativas,
que s�o expressas numericamente.
Censo - an�lise de dados estat�sticos relacionados a uma determinada popula��o (n�o

necessariamente humana).
Vamos conhecer agora os principais termos utilizados em estat�stica, tais como

estat�stica descritiva e estat�stica indutiva.
Estat�stica descritiva
A estat�stica descritiva permite a realiza��o da descri��o dos eventos estat�sticos
de forma resumida. Em outras palavras, se trata da coleta, observa��o, an�lise e
apresenta��o de dados pertinentes a um determinado fen�meno estat�stico.
Estat�stica indutiva
A estat�stica indutiva, por sua vez, realiza a an�lise dos diferentes eventos por
meio de generaliza��es, do particular para o todo, empregando t�cnicas de
amostragem.
Diferen�a entre estat�stica

descritiva e indutiva
O diferencial est� no foco: a estat�stica descritiva resume dados e observa��es; j�
a indutiva trabalha com amostras de popula��es.
Para realizarmos as an�lises descritivas e indutivas, vamos percorrer uma s�rie de

passos, conhecidos como fases da estat�stica.
Primeiro passo: defini��o do problema

Consiste no passo inicial para o estudo do m�todo estat�stico e ir� nortear todo o
estudo.
Segundo passo: planejamento

Ap�s definido o problema, ou seja, aquilo que queremos estudar, precisamos tra�ar
um planejamento de como ser� feita a pesquisa.
Terceiro passo: coleta de dados

Podemos coletar dados de maneira direta, indireta, utilizando question�rios, entre
outras formas. No entanto, devemos buscar a forma de coleta que seja mais relevante
para o estudo em quest�o.
Quarto passo: apura��o dos dados
Essa etapa consiste na interpreta��o e organiza��o dos dados obtidos.
Quinto passo: apresenta��o dos dados

Um conjunto de dados pode ser representado por meio de tabelas ou gr�ficos.
Sexto passo: an�lise e interpreta��o dos dados

� a etapa conclusiva. Tiram-se conclus�es a respeito da amostra obtida.
� importante lembrar que, ap�s analisar e interpretar os dados, h� o momento de

fazermos a infer�ncia, ou seja, concluir a an�lise estat�stica a respeito da
popula��o, com base na amostra.
M�todo estat�stico e t�cnicas de amostragem
O m�todo estat�stico envolve a sele��o de dados que compor�o uma determinada

amostra a partir de uma popula��o. Com essa amostra, ser�o realizadas an�lises por
meio de t�cnicas de pesquisa que se destinam a realizar dedu��es e infer�ncias. As
fases do m�todo estat�stico s�o:
defini��o do problema;
planejamento;
coleta de dados;
apura��o dos dados;
apresenta��o dos dados;
an�lise e interpreta��o dos dados.
A Coleta de dados se destina a registrar os dados relacionados a uma amostra ou uma

popula��o. Divide-se em:
coleta direta - baseada na pesquisa direta em fontes prim�rias, ou seja, em dados

que n�o foram antes coletados ou sistematizados, por exemplo, os registros de
nascimentos em uma cidade;
coleta indireta - baseada em fontes de dados j� devidamente sistematizados
anteriormente, por exemplo, dados do Censo do ano 2000.
J� a apura��o consiste na contagem e agrupamento dos dados em faixas espec�ficas.
As t�cnicas de amostragem se destinam a obter precis�o na an�lise de um fragmento

de uma popula��o estat�stica pelo emprego de mecanismos de escolha da amostra.
Dividem-se em:
t�cnicas probabil�sticas: aplicadas quando se deseja investigar uma popula��o

selecionando-se a amostra de maneira totalmente aleat�ria;
t�cnicas n�o probabil�sticas: apropriadas para estudos de caso direcionados, por
exemplo, c�ncer entre homens. S�o usadas quando se deseja separar uma amostra com
dados espec�ficos de uma popula��o.
Em uma pesquisa, quando se obt�m fra��es com d�zimas peri�dicas ou raz�es infinitas
de algarismos, por exemplo, 1/3=0,33333..., aplicamos t�cnicas de arredondamento
com o objetivo de facilitar o trabalho do pesquisador e a apresenta��o de dados,
mantendo-se a maior precis�o poss�vel. Assim, veja o exemplo para dois algarismos
significativos:
Quando uma d�zima tem sua s�rie 0,3333... Ou seja, um algarismo menor que 5, o
n�mero � arredondado para o algarismo da esquerda, tornando-se assim 0,33.
Apresenta��o de Dados Estat�sticos

A apresenta��o de dados estat�sticos � uma ferramenta aplicada para o resumo das
informa��es contidas nesses dados, evidenciando seus aspectos mais importantes
(MARTINEZ, 2015). Para isso, � indispens�vel que o pesquisador fa�a a descri��o
completa das caracter�sticas mais marcantes dos dados para, depois, tomar a decis�o
de qual ferramenta utilizar� no tratamento estat�stico.
Devemos identificar os dados em vari�veis quantitativas (cont�nuas ou discretas) ou

vari�veis qualitativas (ordinal ou nominal). Para distinguir entre vari�veis
quantitativas discretas ou cont�nuas, basta fazer o exerc�cio de pensar se a
vari�vel faz mais sentido para voc� contar (discreta) ou medir (cont�nua). Se a
vari�vel expressa qualidade ou estado: fumante e n�o fumante (nominal e n�o segue
uma ordem), classes de consumo de energia A, B ou C (ordinal e segue uma ordem).
Ap�s saber qual � a natureza dos dados, devemos organiz�-los em uma tabela. Antes
de qualquer tipo de organiza��o nos dados, eles s�o chamados de dados brutos; no
momento que voc� os coloca em uma ordem crescente, s�o chamados de ROL.
Com a organiza��o dos dados em uma tabela, podemos ter a dimens�o de como
represent�-los em um gr�fico. Assim, podemos organizar nossos dados em uma tabela
com a frequ�ncia absoluta e frequ�ncia relativa.
Exemplo: um grupo de 150 pessoas em que vamos verificar quem est� doente e quem
est� saud�vel. Nesse grupo, foi verificado que 120 pessoas s�o saud�veis
(frequ�ncia absoluta de saud�veis s�o 120 pessoas; frequ�ncia relativa de saud�veis
ser� 120 divididos por 150 que � igual a 0,8 ou 80%). Lembrando que esse foi um
exemplo de vari�vel qualitativa nominal.
S�o ferramentas poderosas para descri��o de dados. Uma vantagem dos gr�ficos
estat�sticos � a capacidade de transmitir muita informa��o ao leitor em apenas uma
figura. Quando bem constru�do, o leitor entender� as principais caracter�sticas dos
dados com rapidez.
Linhas e curvas:
S�o indicados para representar vari�veis ao longo do tempo. O pesquisador pode
perceber, com o aux�lio dos gr�ficos de linhas, os per�odos de crescimento e
decrescimento da s�rie de dados ao longo do tempo, fato que pode ser importante
para a sua pesquisa.
Barras, colunas e de setores: para um mesmo conjunto de dados, podemos construir

gr�ficos de colunas, barras ou setores, de acordo com o que for mais did�tico para
a apresenta��o dos dados. V�rios programas constroem esses gr�ficos; um programa
f�cil de usar � o Excel da Microsoft Office, que tamb�m funciona como um planilha
de c�lculo. Outros programas gratuitos que fazem gr�ficos e an�lises estat�sticas �
o Calc, da OpenOffice, que funciona nas plataformas Linux e Windows, e o programa
R.
Distribui��o de frequ�ncias por intervalo e por pontos
A coleta de dados para pesquisa gera informa��es que precisam ser adequadamente
tratadas, a fim de que seja poss�vel realizar uma an�lise estat�stica adequada. Um
desses mecanismos � a separa��o dos dados coletados por intervalos, agrupando dados
com as mesmas caracter�sticas dentro de um determinado grupo.
Os dados coletados para um trabalho de an�lise, uma pesquisa, um experimento,

geralmente s�o desordenados inicialmente, pois s�o colhidos de maneira aleat�ria.
Quando reunidos, sem nenhum crit�rio de organiza��o, esses dados geram uma tabela
primitiva. Posteriormente, organizados em torno da vari�vel de estudo sob crit�rios
definidos pelo pesquisador, uma tabela primitiva se torna um Rol.
Em um rol, os dados est�o organizados para facilitar sua visualiza��o e permitir
algumas considera��es iniciais. Essa organiza��o pode ser por ordem crescente ou
decrescente, por exemplo.
Quando separamos os dados coletados para uma pesquisa, definimos a vari�vel por
intervalos e verificamos as frequ�ncias. Assim, encontramos as classes de
frequ�ncia (ou classes), que s�o os intervalos de varia��o da vari�vel analisada.
Limites de classe: a nota��o para a classe � a letra i, sendo que i = 1, 2, 3...k

(com k representando a �ltima classe de uma vari�vel) (CRESPO, 2005). Os limites de
classe podem ser entendidos como os pontos extremos de cada classe de uma vari�vel.
Assim, s�o definidos pelos pontos m�nimo e m�ximo, respectivamente, li e Li, para
uma classe i.
Determinando a amplitude de um intervalo de classe: a amplitude de um intervalo de

classe pode ser compreendida pela diferen�a entre os pontos m�ximo e m�nimo de um
intervalo de classe. Assim, hi = Li - li; em que hi representa a amplitude de
intervalo da classe i.
Podemos verificar a amplitude total de uma distribui��o de frequ�ncia observando o

ponto m�nimo da primeira classe e o ponto m�ximo da �ltima classe. Nesse caso, a
amplitude total (AT) obedece � seguinte equa��o:
AT = Lm�xk - lmin1
Assim, a amplitude total � obtida quando subtra�mos do limite m�ximo da �ltima

classe, k, o limite m�nimo da primeira classe.
Imagine que um pesquisador coletou dados relacionados � renda dos habitantes de uma
cidade do interior e verificou que poderia estabelecer uma distribui��o de
frequ�ncias baseadas em seis classes: �de um a dois sal�rios m�nimos (SM)�; �de
dois a tr�s SM�; �de tr�s a cinco SM�; �de cinco a dez SM�; �de dez a 50 SM�; e uma
classe, com frequ�ncia igual a 1, �de 50 a 200SM�. Observaremos que a Amplitude
Total da frequ�ncia de dados � dada por:
AT = Lm�x6 - lmin1 = 200 - 1 - 199
Agora, passaremos ao c�lculo do ponto m�dio do intervalo de classe.

� poss�vel definir o ponto m�dio (xi) de um intervalo de classe no ponto em que a
classe � dividida em duas partes iguais, como se segue:
xi = (Li + li)/2
Histogramas e pol�gonos
Dados coletados para uma an�lise estat�stica geralmente s�o organizados em classes,
que constituem intervalos de varia��o de uma vari�vel de pesquisa, por exemplo, a
altura de um grupo de alunos.
A frequ�ncia dessa classe seria ent�o calculada pelo n�mero de observa��es
pertencentes �quela classe.
Um histograma possibilita a visualiza��o das dimens�es das frequ�ncias de uma

classe por meio de uma apresenta��o gr�fica. Assim, o histograma pode ser definido
como uma forma de apresenta��o gr�fica de dados organizados em um conjunto de
ret�ngulos dispostos em um gr�fico de colunas, de modo que a altura desses
ret�ngulos corresponda � frequ�ncia, e os pontos m�dios coincidam com os pontos
m�dios dos intervalos de classe.
Um pol�gono de frequ�ncia � uma forma de apresenta��o gr�fica de dados que permite
observar a frequ�ncia de dados de uma vari�vel. O pol�gono � obtido por meio da
liga��o dos pontos formados pelo ponto m�dio dos intervalos de classe, no eixo
horizontal, e as frequ�ncias observadas no eixo vertical (CRESPO, 2005).
Para que a figura se �feche� e se torne um pol�gono, s�o acrescidas duas classes,
uma antes da primeira, e uma depois da �ltima, ambas com frequ�ncia zero.
Um pol�gono de frequ�ncias acumuladas mede as chamadas frequ�ncias acumuladas de

dados associados a uma vari�vel, que entendemos como a soma das frequ�ncias
associadas a uma vari�vel de maneira acumulada.
Tratam-se de somas de frequ�ncias que v�o sendo realizadas � medida que s�o
adicionadas classes a esse somat�rio.
O pol�gono de frequ�ncias acumuladas tender� ao valor m�ximo no ponto relacionado �

�ltima classe.
A frequ�ncias acumulada ali ser� correspondente ao total das frequ�ncias.
A Curva de frequ�ncias mostra uma imagem tendencial da s�rie de dados, enquanto o

pol�gono de frequ�ncias mostra a imagem real dos mesmos (CRESPO, 2005). Essa
opera��o de remo��o das �arestas� � realizada adicionando-se frequ�ncias �s
observadas na tabela de distribui��o de frequ�ncias � as frequ�ncias calculadas �,
que se localizam nos pontos m�dios das frequ�ncias observadas, de acordo com a
equa��o:
fci = (ti-1 + 2fi + fi+1)/4
Onde fci corresponde � frequ�ncia calculada da classe i, fi-1 � a frequ�ncia da

classe imediatamente anterior � classe i, dada por fi, e fi+1 � a frequ�ncia da
classe imediatamente posterior � classe i.
Medidas de posi��o
As medidas de posi��o nos auxiliam a identificar o centro de uma amostra.
Nesse contexto, vamos analisar as medidas mais utilizadas, iniciando pela m�dia.
Ela considera todos os valores que est�o sendo estudados. Portanto, � indicado
utiliz�-la quando a distribui��o de dados for sim�trica. A m�dia � dividida em
simples e ponderada.
M�dia simples
� a medida mais utilizada e melhor compreendida, segundo Duquia e Bastos (2006).
Para calcular a m�dia aritm�tica, basta somar todos os valores de um conjunto de
dados e dividir pelo n�mero de valores somados. Veja na f�rmula:
n
X' = (Somat�rio Xi)/n
i-1
M�dia ponderada
� utilizada quando as frequ�ncias dos valores analisados n�o s�o iguais. Para
calcul�-la, basta somarmos as multiplica��es das frequ�ncias pelos respectivos
valores e dividirmos pela soma das frequ�ncias. Veja na f�rmula:
n n
X'p = (Somat�rio Xi-fi)/(Somat�rio fi)
i-1 i-1
Diferente da m�dia, a mediana sempre tender� a ocupar a posi��o central de um
conjunto de dados. Quando o n�mero total de dados for �mpar, a mediana � o elemento
central; quando o n�mero total de dados for par, a mediana � obtida pela m�dia dos
elementos centrais.
Aten��o: devemos ordenar os dados de forma crescente.
A moda � o elemento que aparece com maior frequ�ncia em um conjunto de dados.

Portanto, ela depende apenas da regularidade de ocorr�ncia, e n�o da distribui��o
de dados.
Um conjunto com apenas uma moda se chama unimodal; com duas modas, bimodal; tr�s ou
mais modas, multimodal; e o conjunto com nenhuma moda se chama amodal.
Em uma situa��o de um conjunto de dados com distribui��o sim�trica, pode-se

utilizar a m�dia, mediana ou moda.
No caso de um conjunto em que a distribui��o n�o seja sim�trica, n�o � aconselh�vel

utilizar a m�dia, mas sim a mediana.
Neste tema, conhecemos as medidas de posi��o mais usuais e seus devidos c�lculos.
Medidas de posi��o: separatrizes
Por meio da an�lise das medidas de posi��o, conseguimos verificar como � realizada
a distribui��o de um determinado conjunto de dados. O crit�rio de distribui��o dos
dados � efetuado pelo pesquisador para que seja poss�vel analisar o comportamento e
as tend�ncias desses dados em sua totalidade.
Separatrizes s�o medidas de posi��o que separam um conjunto de dados em �n� partes.
Cada uma dessas partes deve conter a mesma quantidade de dados. Assim, caso fa�amos
uma divis�o de um conjunto de 40 dados em 4 partes, cada parte ter� 10 dados. A
classifica��o e nomenclatura das separatrizes se d�o com base no n�mero de divis�es
feitas.
Quartis: s�o valores que dividem uma s�rie de dados em quatro partes iguais. S�o
tr�s valores (Q1, Q2 e Q3) que constituem o limite desses subconjuntos.
Decis: dividem um conjunto de dados em 10 partes iguais. Desse modo, podemos dizer
que 10% dos dados s�o inferiores ou iguais ao primeiro decil D1, 20% dos dados s�o
inferiores ou iguais ao segundo decil D2, e assim por diante, at� chegar ao �ltimo
decil D9. O quinto decil corresponde � mediana, haja visto que ele divide os dados
em dois blocos com 50% dos dados para cada lado, assim como a mediana.
Percentil: divide um conjunto de dados em 100 partes iguais. Desta forma, o

percentil P1 indica que 1% dos dados s�o inferiores ou iguais a ele. O percentil P2
ilustra que 2% dos dados s�o inferiores ou iguais a ele; P3 � o percentil que
demonstra que 3% dos dados s�o inferiores ou iguais a ele e assim sucessivamente,
at� o percentil P99. Observe que, sempre que dividimos um conjunto de dados em n
classes, temos (n-1) separatrizes - tr�s quartis, nove decis, noventa e nove
percentis!
Outras medidas de separa��o, outras separatrizes, podem ser adotadas a crit�rio do

pesquisador. Podemos citar dois exemplos:
- Os tercis, que constituem-se em dois valores que dividem uma s�rie de dados em
tr�s partes iguais.
- Os quintis, que separam uma s�rie em cinco partes, a partir de quatro valores
espec�ficos.
Separatrizes s�o �teis para avaliar o comportamento de uma s�rie de dados e suas
tend�ncias, ou seja, se est�o mais concentrados nos dados mais inferiores, ou mais
superiores, por exemplo. Acompanhe a tela seguinte para saber como interpretar as
separatrizes.
Para efetuarmos a interpreta��o de outros tipos de separatrizes, basta recorrermos

aos nossos conhecimentos de quartis, decis e percentis. Naquelas em que as divis�es
n�o s�o exatas, � mais dif�cil de encontrar os valores que ocupam cada divis�o. No
entanto, nada nos impede de fazermos a divis�o de um conjunto de dados em quantas
partes quisermos.
Lembre-se sempre de que a mediana � um valor que separa os 50% menores valores dos
50% maiores. Vamos supor que uma determinada divis�o de um conjunto de dados seja
em 50 partes iguais. Note que 25 partes s�o menores ou iguais � mediana e 25 s�o
maiores. Assim, o valor que ocupa a 25� divis�o � a respectiva mediana.
Medidas de dispers�o: desvio m�dio e desvio padr�o
As medidas de dispers�o t�m a capacidade de nos mostrar se um determinado conjunto

de dados � mais disperso ou concentrado.
Quando analisamos as medidas de dispers�o, quando os valores s�o elevados,
significa que os valores s�o mais distantes entre si, mostrando que h� uma grande
dispers�o em torno de um valor central.
Voc� sabe o que � amplitude total?

A amplitude total � uma medida extremamente f�cil de se entender e calcular. Ela �
dada pela diferen�a entre o maior valor do menor valor de um conjunto de dados.
O desvio m�dio � a m�dia das diferen�as dos valores de cada observa��o, em rela��o
� m�dia, conforme a f�rmula a seguir.
n
DM = Somat�rio(xi - x')/n
i=1
Lembre-se de calcular primeiro a m�dia. Depois, subtra�a dessa m�dia todos os

valores da s�rie de dados. Depois, fazemos o somat�rio dos resultados e, por fim,
dividindo-se pelo n�mero de dados, calcula-se o Desvio M�dio.
A vari�ncia pode ser compreendida como a m�dia do somat�rio dos quadrados da

diferen�a dos dados amostrais ou populacionais em rela��o � m�dia, conforme a
equa��o a seguir.
n
Var(X) = Somat�rio(xi - X')�/n
i=1
A vari�ncia � um indicador de dispers�o, que demonstra, de maneira agregada, a

dispers�o dos dados em rela��o � m�dia dessa s�rie. � a diferen�a entre Vari�ncia
Amostral e populacional: Uso do Fator de Corre��o de Bensel.
O desvio-padr�o mede a dispers�o ou variabilidade de um conjunto de dados. Trata-se

da raiz quadrada da vari�ncia. Sua express�o � dada por:
� = Raiz�Var(X)
Quanto maior o desvio padr�o, mais distantes entre si os dados est�o. Dados com
desvio padr�o zero s�o todos iguais entre si. Trata-se de uma �til medida de
dispers�o. Lembre-se que, quanto mais pr�ximo de zero for o valor do desvio-padr�o,
mais os valores observados est�o pr�ximos � m�dia.
Coeficiente de varia��o e propriedades
O coeficiente de varia��o e propriedades � uma medida adimensional, geralmente em

porcentagem, que representa a dispers�o dos dados em torno da m�dia. A express�o,
uma raz�o entre o desvio-padr�o e a m�dia, para o c�lculo do coeficiente de
varia��o, est� disposta a seguir. Confira!
CV = s/x'(100)
A m�dia, uma medida de dispers�o, � a soma dos valores dividida pelo n�mero de
valores somados. O desvio padr�o mede a dispers�o dos dados e � dado por:
n
s = raiz�s� = raiz� Somat�rio(xi - X')�/n
i=1
Qual destes conjuntos � mais ou menos homog�neo em rela��o � m�dia?

A figura 1 � expressa em metros, j� a figura 2 � expressa em jardas.
Perceba que os dados est�o razoavelmente dispersos em rela��o � m�dia, no par

ordenado (X.Y) = (2,2).
Perceba que a dispers�o dos dados � bem menor, situando-se entre 1,5 e 2,4 para
ambas as vari�veis (X, Y). Nesse caso, como n�o h� nota��es em rela��o aos dados da
vari�vel, podemos comparar os desvios padr�es.
Esta � uma an�lise comparativa, que � viabilizada pelo coeficiente de varia��o.
E quando os dados s�o expressos em grandezas diferentes? Imagine que a primeira

distribui��o � dada em cent�metros, ao passo que a segunda est� em quil�metros.
Para superar essas limita��es, podemos padronizar o desvio padr�o, de modo a criar
uma medida de dispers�o que possa se aplicar a conjuntos de dados com diferentes
m�dias e desvios. Essa medida � o coeficiente de varia��o.
O coeficiente de varia��o � tamb�m conhecido como coeficiente de varia��o de

Pearson. Esse coeficiente � calculado por meio da f�rmula:
n n
CV = (raiz� Somat�rio(xi - X')�/n)/(Somat�rio(xi - X')�/n) = s/X'
i=1 i=1
Agora, acompanhe o exemplo:

Imagine a distribui��o A = {10, 12, 14, 20}.
A m�dia dessa distribui��o � dada por
n
CV = Somat�rio(xi)/n = (10+12+14+20)/4 = 14
i=1
J� o desvio padr�o � dado por:
n
s = raiz�s� = raiz� Somat�rio(xi - X')�/n =========================>
i=1
=> raiz� ((10-14)�+(12-14)�+(14-14)�+(20-14)�)/4 = 3,74
Assim, o coeficiente de varia��o � dado por:

CV = s/X' = 3,74/14 = 0,267
Podemos verificar que a distribui��o A � 26,7% dispersa em rela��o � m�dia.
Como o coeficiente de varia��o � uma raz�o de dispers�o em rela��o � m�dia, temos

que quanto maior � esse coeficiente, maior a dispers�o dos dados, ou seja, o
conjunto ter� uma dispers�o mais heterog�nea.
Da mesma forma, como esse coeficiente � uma medida padronizada, ele permite a
an�lise comparativa entre duas ou mais vari�veis, expressas em diferentes ordens de
grandeza. Uma vari�vel expressa em cent�metros pode ter sua dispers�o comparada com
uma vari�vel expressa em quilos, pois o coeficiente de varia��o � uma raz�o, uma
porcentagem em rela��o a cada m�dia.
Assimetria
Quando analisamos graficamente uma distribui��o, podemos perceber se ela �

sim�trica, ou seja, igualmente distribu�da em rela��o � m�dia, ou assim�trica,
quando h� uma diferen�a em rela��o � distribui��o de dados em torno da m�dia.
Perceba que, com este gr�fico, � poss�vel fazer infer�ncias sobre simetria ou
assimetria daqueles dados.
Neste exemplo, h� uma perfeita simetria em torno da terceira classe, sendo que 50%
dos dados restantes est�o � direita dessa classe, e outros 50% � esquerda da mesma.
Observe que a avalia��o precisa do conceito de assimetria � dada pelo Coeficiente

de Assimetria de Pearson.
A raz�o � a diferen�a entre m�dia e moda e o desvio-padr�o, conforme a f�rmula a

seguir:
Ap = X-Mo/s
Distribui��o sim�trica � aquela que a metade esquerda do histograma � praticamente

a metade-espelho da metade direita. Ela apresenta um formato de sino. Dessa forma,
temos que a m�dia, mediana e moda assumem o mesmo valor, visto que h� simetria.
Nessa distribui��o, o coeficiente de assimetria � nulo.
A distribui��o assim�trica positiva � conhecida pelo nome de distribui��o

assim�trica � direita. Tal nomenclatura se deve ao fato de a assimetria ocorrer na
parte direita do gr�fico.
A distribui��o assim�trica positiva possui as seguintes caracter�sticas:
- a moda � menor que a mediana, que � menor do que a m�dia;
- o coeficiente de assimetria � maior do que zero; e
- n�o h� duas metades do gr�fico que sejam imagem-espelho entre si.
A distribui��o assim�trica negativa recebe a denomina��o de distribui��o

assim�trica � esquerda, pois o �encaudamento� (distor��o) est� presente na parte
esquerda do gr�fico. Uma distribui��o assim�trica negativa pode ser evidenciada
quando h� dados que estejam mais associados a um limite inferior, relacionado a
classes ou intervalos de classes mais baixos (classes 1, 2, 3...) para uma
caracter�stica de interesse, de modo que poucos valores sejam pertencentes a essas
classes.
Experimento aleat�rio, espa�o amostral e evento
A defini��o de uma pesquisa implica a escolha de um experimento, a comprova��o

�pr�tica� de uma hip�tese a ser estudada. Esse experimento pode ser de dois tipos:
aleat�rios e determin�sticos.
Experimentos aleat�rios
S�o baseados em resultados previstos, por�m regidos pelo acaso.
Por exemplo: a retirada de uma carta de um baralho franc�s, com 52 resultados
poss�veis, mas inesperados.
Experimentos determin�sticos
Esses experimentos ocorrem quando os resultados s�o previstos e determinados.
Por exemplo, a ebuli��o do etanol ao n�vel do mar.
O espa�o amostral consiste no conjunto de elementos e informa��es que cont�m todos

os poss�veis resultados gerados por um experimento (sobretudo os aleat�rios).
Os espa�os amostrais podem conter de zero a infinitos resultados poss�veis.
Por exemplo: o espa�o amostral de um dado de seis faces � dado por S = {1; 2; 3; 4;
5; 6}.
J� os eventos s�o as situa��es definidas pelo pesquisador para a realiza��o de um

experimento.
Por exemplo, n�meros �mpares de um dado.
Eventos simples s�o aqueles cujo conjunto de resultados poss�veis � restrito a um

�nico elemento.
Por exemplo: {n�meros de um dado m�ltiplos de 5} -> A= {5}.
Conjuntos com mais de um resultado s�o caracter�sticos de eventos compostos.
Eventos certos s�o visualizados quando h� 100% de chances dos resultados esperados
estarem inclusos dentro do espa�o amostral.
Por exemplo: ao lan�ar-se um dado comum, tem-se o evento A = {N�meros naturais
menores ou iguais a seis e diferentes de zero}.
Eventos imposs�veis ocorrem quando n�o h� nenhum dado no espa�o amostral que
contemple o evento.
Por exemplo: no lan�amento de um dado comum, tem-se o evento B = {n�meros m�ltiplos
de 9}.
A organiza��o de uma s�rie de informa��es pode gerar cruzamento de dados e

duplicidade de contagem.
Perceba que h� situa��es em que alguns dados pertencem a mais de uma vari�vel.
Nesse caso, dizemos que h� uma intersec��o de alguns elementos em torno de dois ou
mais conjuntos.
Para a elimina��o de dupla contagem, a soma de dois conjuntos que possuem dados em
intersec��o deve incluir a subtra��o desses dados, de acordo com a equa��o.
AUB = A+B-(A~UB)
Probabilidade: eventos complementares, eventos independentes, eventos mutuamente

exclusivos.
Experimentos aleat�rios
Experimentos aleat�rios s�o dados com base em resultados poss�veis, por�m incertos.
Por exemplo, o lan�amento de um dado de seis faces. Sabemos que o resultado ser�
entre um e seis, mas n�o qual ser� o resultado.
Espa�o amostral
O espa�o amostral consiste no conjunto de elementos e informa��es que cont�m todos
os poss�veis resultados gerados por um experimento (sobretudo os aleat�rios). Os
espa�os amostrais podem conter de zero a infinitos resultados poss�veis.
Por exemplo: o espa�o amostral de um dado de seis faces � dado por S = {1; 2; 3; 4;
5; 6}
Evento
Eventos s�o as situa��es definidas pelo pesquisador para a realiza��o de um
experimento.
Por exemplo, {n�meros �mpares de um dado}.
Bom, � importante lembrar que a probabilidade � a raz�o entre poss�veis resultados

de um evento e os elementos de um espa�o amostral.
A raz�o � dada por porcentagens ou, preferencialmente, entre zero e um.
Eventos certos, com um resultado poss�vel no espa�o amostral, t�m probabilidade

igual a um.
Eventos imposs�veis n�o possuem resultados vi�veis em um espa�o amostral, ent�o sua
probabilidade � igual a zero.
Eventos elementares possuem apenas um resultado vi�vel no espa�o amostral, de modo

que sua probabilidade de realiza��o � igual a 1/n, sendo n o n�mero de elementos do
espa�o amostral.
Eventos complementares s�o percebidos quando a probabilidade de que um evento

ocorra � dada por p, e a de que n�o ocorra, dada por q. Assim, um mesmo evento tem
probabilidades de sucesso e fracasso em sua realiza��o, de modo que a soma das
probabilidades p e q seja igual a um.
Exemplo: P (valor 1 em um dado) = 1/6
P (qualquer valor exceto 1) = 5/6
Soma = 1
Eventos independentes ocorrem quando a realiza��o de um evento n�o interfere na

ocorr�ncia de outro evento, os resultados independem entre si.
Desse modo, a probabilidade de que os eventos ocorram simultaneamente � dada pelo
produto das probabilidades de cada evento em separado: P = P1 * P2 * ... * Pn
Por exemplo, dois dados s�o lan�ados. A probabilidade de obter o n�mero um em cada
um deles � de 1/6 * 1/6 = 1/36
Eventos mutuamente exclusivos s�o percebidos quando a realiza��o de um evento

exclui a possibilidade de realiza��o de outro evento, ou outros. Por exemplo, obter
"cara" ou "coroa" com uma moeda. Se um evento se realiza, o outro n�o poder� ser
realizado simultaneamente.
A probabilidade associada a eventos mutuamente exclusivos � dada pela soma das

probabilidades dos eventos em separado:
P = P1 +P2 + ... + Pn
Por exemplo: ao se lan�arem dois dados, qual a probabilidade de obtermos o n�mero

cinco em cada um deles?
P = 1/6 + 1/6 = 2/6

Probabilidade condicional e regra do produto, regra da adi��o
A probabilidade � a raz�o que avalia as chances de ocorr�ncia de um denominado

evento, cujos poss�veis resultados est�o submetidos a um espa�o amostral (BUSSAB;
MORETTIN, 2010), conforme f�rmula a seguir.
P(A) = n(A)/n(S)
A probabilidade condicional � uma situa��o em que um evento est� condicionado a um

evento anterior, ou seja, est� dependente desse evento anterior. Assim, a
probabilidade condicional mede a probabilidade de um evento B, dada a realiza��o de
um evento A.
P(A|B) = P(A~U)B/P(B)
Sendo A ^ B os elementos em intersec��o entre os dois conjuntos A e B.
A regra do produto nos mostra que a probabilidade de ocorr�ncia simult�nea entre

dois eventos � dada pelo produto entre a probabilidade de ocorr�ncia do segundo
evento, ap�s o primeiro evento, e a probabilidade do segundo evento. Por exemplo,
se o n�mero 28 � sorteado em uma roleta com 40 n�meros cont�nuos e � ent�o exclu�do
da lista de resultados, a probabilidade do n�mero 13 ser sorteado ap�s o n�mero 28
� de 1/39.
A regra da adi��o nos mostra que, quando h� dados que pertencem a mais de um
conjunto, como n�meros pretos e vermelhos em uma roleta, a probabilidade de
obtermos um determinado resultado em dois eventos, A e B, � dada pela soma das
probabilidades desses eventos, subtraindo-se a probabilidade de encontrarmos dados
em intersec��o, ou seja, que perten�am aos dois eventos ao mesmo tempo, conforme a
f�rmula a seguir:
P(A?B) = P(A) + P(B) � P(A~UB)
O princ�pio da contagem nos mostra que, se um experimento pode ser realizado em n

etapas, o total de resultados poss�veis ser� dado pelo produto entre os resultados
poss�veis (r) e o n�mero de etapas (n), na f�rmula m*n.
Permuta��es
A permuta��o � o processo de ordenar e reordenar os dados do conjunto dos poss�veis
resultados de um evento em uma sequ�ncia definida pelo pesquisador (MILONE;
ANGELINI, 1993).
Arranjos
Os arranjos s�o o n�mero total de resultados vi�veis nos subconjuntos de �x�
elementos de um espa�o amostral com �n� elementos.
Combina��es
As combina��es s�o onde a ordem dos elementos, dispostos como resultado de um
evento, em etapas, n�o � importante.
Vari�veis aleat�rias e distribui��es de probabilidade
Vamos iniciar nossos estudos entendendo que a probabilidade � a raz�o que avalia as
chances de ocorr�ncia de um denominado evento, cujos poss�veis resultados est�o
submetidos a um espa�o amostral (BUSSAB; MORETTIN, 2010).
As vari�veis podem ser calculadas da seguinte forma:
P(A) = n(A)/n(S)
Por exemplo, imagine que temos como objetivo ver quantas vezes obteremos �cara� em
um jogo de �cara ou coroa�. Se lan�amos uma moeda para cima, a vari�vel aleat�ria
X, vari�vel designada para o n�mero de vezes que dar� �cara�, nos mostra que os
resultados poss�veis s�o zero, uma e duas ocorr�ncias para �cara�.
As vari�veis aleat�rias discretas s�o aquelas onde o n�mero de pontos no espa�o

amostral � finito, logo, � enumer�vel.
Por exemplo, a retirada de uma carta de um baralho franc�s, cujo espa�o amostral �
de 52 elementos. A probabilidade que a carta seja do naipe �copas� � de 1/4.
As vari�veis aleat�rias cont�nuas s�o caracter�sticas de situa��es onde o espa�o
amostral cont�m infinitos resultados poss�veis dentro de um determinado intervalo.
Por exemplo, o tempo de acelera��o de um carro entre 0 e 100 km/h.
Quando realizamos a associa��o entre cada ponto do espa�o amostral e a

correspondente probabilidade de um evento vir a ocorrer, obteremos a distribui��o
de probabilidades desse experimento.
A distribui��o discreta de probabilidade est� associada a momentos onde a vari�vel
aleat�ria � discreta, isto �, quando os resultados do conjunto amostral s�o
finitos.
Quando a vari�vel aleat�ria pode assumir qualquer valor dentro de um intervalo,
dizemos que a distribui��o de probabilidade � cont�nua.
Bom, agora, vamos tratar do valor esperado. O valor esperado ou esperan�a

matem�tica � a medida de tend�ncia central das vari�veis aleat�rias. Trata-se,
portanto, da m�dia ponderada dos valores que a vari�vel aleat�ria X poder� assumir.
Esse conceito demonstra qual a m�dia ponderada decorrente da realiza��o de um

experimento. Por exemplo, supondo-se que lan�amos uma moeda quatro vezes, o valor
esperado para obtermos �caras� � igual a 2.
Distribui��o normal da probabilidade
Vamos iniciar nossas discuss�es estudando que as distribui��es normais t�m por
principais caracter�sticas o fato de a m�dia dividir exatamente os valores
observados em duas metades. Desse modo, a representa��o gr�fica dessa distribui��o
� uma curva em forma de sino.
Igualmente, o ponto m�dio dessa distribui��o � o ponto m�ximo da fun��o associada

�s frequ�ncias.
Os pontos de inflex�o, ou seja, onde h� mudan�a do sinal de crescimento da vari�vel

analisada (positivo/negativo) s�o determinados pelo desvio padr�o, de modo que a
fun��o pode ser resumida por N (u�).
A distribui��o normal se caracteriza pela simetria da organiza��o de valores em

torno da m�dia. Desse modo, verificamos que h� infinitas possibilidades de
distribui��es sim�tricas, cada uma com uma m�dia. Mas, sabendo que essa situa��o �
constante nas distribui��es normais, � poss�vel realizar uma padroniza��o.
Nesse caso, temos por resultado a cria��o de uma vari�vel Z, que mede, em n�mero de
desvios-padr�es, o afastamento das vari�veis em rela��o � m�dia, a partir da
express�o:
Z = (x - u)/�
Sabendo-se que o peso m�dio de uma caneta � de 60 gramas, temos que u=60. Se a
varia��o esperada � de tr�s gramas, o desvio padr�o � dado por �=3.
Para saber a probabilidade de uma caneta, selecionada ao acaso, pesar menos de 58

gramas, vamos transformar esse peso efetivo em relativo, por meio da distribui��o
normal padronizada, conforme demonstra��o a seguir.
Z = (x - u)/� = (62 - 60)/3 = 2/3 = 0,66
O Teorema do Limite Central nos mostra que, quanto mais uma amostra aumenta de
tamanho, mais essa distribui��o se aproxima de uma distribui��o normal, com as
maiores observa��es situadas em torno da m�dia.
Por meio desse Teorema, podemos verificar as probabilidades de ocorr�ncia de
eventos, a partir de um intervalo em torno da m�dia e com base em uma amostra.
Correla��o linear, coeficiente de correla��o e covari�ncia
Vamos iniciar nossos estudos com o conceito de correla��o linear, vejamos! Para o
caso de duas vari�veis de pesquisa, como a que mencionamos, a an�lise que ser�
discutida � tratada como an�lise bidimensional. Nesses casos, � poss�vel obter o
grau de associa��o entre vari�veis a partir do conceito de correla��o linear. As
formas de an�lise s�o: gr�fica e coeficiente de correla��o.
A an�lise gr�fica � insuficiente para uma medi��o precisa do grau de associa��o

entre vari�veis.
Bom, agora, vejamos o conceito de correla��o simples.
Nesse caso, para obter o grau de associa��o entre vari�veis, utilizamos o

coeficiente de correla��o de Pearson. Trata-se de uma medida padronizada, de modo
que todas as distribui��es relacionadas a duas vari�veis de pesquisa podem ser
reduzidas a um conjunto entre os n�meros menos um e um.
Voc� sabe o que � um coeficiente de correla��o?

Quanto mais pr�ximo de um for o resultado do coeficiente, maior e mais positiva � a
rela��o entre vari�veis.
Se a correla��o tender a menos um, h� uma correla��o forte, por�m inversa.
Vamos conhecer, agora, a f�rmula de c�lculo.
Perceba que o coeficiente pode ser calculado a partir de um conjunto finito de

dados de associa��o entre vari�veis como essas:
{(x1,y1),(x2,y2),...,(xn,yn)}
Para calcular o coeficiente de correla��o, voc� deve usar a seguinte f�rmula:

n
Corr(X,Y) = 1/n Somat�rio(xi=X'/dp(X))*(yi=Y'/dp(Y)) = raiz
i=1
((Somat�rio xiyi) - nX'Y'/([Somat�rio x2i] - nX�)([Somat�rio y2i] - nY�))
A covari�ncia nos permite analisar numericamente a interdepend�ncia entre duas

vari�veis, de modo que, quanto maior for a covari�ncia, em valores absolutos, mais
intensa ser� essa associa��o. Vari�veis que sejam completamente independentes entre
si possuem covari�ncia igual a zero. A covari�ncia, por�m, possui uma limita��o:
como n�o se trata de uma vari�vel padronizada, ela � sens�vel � nota��o dos dados
das vari�veis.
A f�rmula para se calcular a covari�ncia � a seguinte:
n
Cov(X,Y) = Somat�rio((xi - X')*(yi - Y'))/n
i=1
Regress�o linear
Voc� j� deve ter ouvido nos notici�rios econ�micos algumas previs�es dos
economistas a respeito da taxa esperada de infla��o, de desemprego ou de
crescimento econ�mico, n�o � mesmo?!
Essas medi��es n�o s�o feitas ao acaso, elas s�o obtidas a partir de s�ries de
dados que identificam tend�ncias, de acordo com o conceito de regress�o.
Regress�es permitem a visualiza��o de tend�ncias de distribui��o de conjuntos de
dados com mais de uma vari�vel explicativa.
Perceba que determinadas fun��es s�o bem definidas.

Por exemplo: Y = 3X
Nesse caso, temos os pares ordenados (X,Y) = (1,3), (2,6), (3,9), (4,12)...,
certo?!
Mas qual a fun��o que melhor compreende o conjunto de dados A = (1,3), (2,7),
(3,14), (4,13), (9,28)?
Nesse caso, devemos recorrer � regress�o linear simples. Ela demonstrar� a fun��o
que permite estimar os valores da vari�vel dependente Y em fun��o da vari�vel
independente X.
Siga em frente e conhe�a sobre esse tipo de regress�o linear!
Uma fun��o de regress�o linear simples � baseada em uma rela��o entre dados de duas
vari�veis dispostas de acordo com a seguinte equa��o:
Yi = a + bXi
A equa��o nos mostra que cada valor estimado de Y � dependente de um valor

constante (a), conhecido como coeficiente linear.
O coeficiente b � conhecido como coeficiente angular e determina a varia��o de Y

para cada altera��o dos valores da vari�vel independente X.
A dist�ncia entre um valor observado de Y e o valor estimado na reta de regress�o �

conhecida como erro, ou res�duo:
ei = Yi - Yi
Quando efetuamos uma regress�o, � importante definir em que medida a varia��o dessa
regress�o e da vari�vel independente (X) explica a altern�ncia da vari�vel
dependente (Y).
Essa propor��o � demonstrada pelo coeficiente de determina��o, conhecido como R2.
Esse coeficiente tem valores distribu�dos entre zero e um. Quanto mais pr�ximo de
um for o coeficiente, mais a vari�vel independente X explica a varia��o da vari�vel
dependente Y.
Amostragem
A amostragem consiste em uma s�rie de t�cnicas destinadas � obten��o de uma amostra

de dados com determinadas caracter�sticas de interesse do pesquisador.
Popula��o
Popula��o � o conjunto com todos os n elementos de uma vari�vel com uma
caracter�stica em comum.
Amostra
Amostra � o subconjunto finito da popula��o, com k elementos.
Principais t�cnicas de amostragem
As principais t�cnicas de amostragem s�o:
- casual ou aleat�ria simples;
- proporcional estratificada;
- sistem�tica.
A t�cnica de amostragem aleat�ria simples consiste na obten��o, por sorteio e de

forma casual, de um certo n�mero de elementos de uma popula��o para a obten��o de
uma amostra.
Nesse caso, todos os elementos t�m igual probabilidade de serem selecionados, por
exemplo, o sorteio de loteria.
A probabilidade de um dado x qualquer ser escolhido em meio � popula��o de tamanho
n � dada por: P(X=x) = 1/n
A t�cnica de amostragem sistem�tica ocorre quando o pesquisador define crit�rios

pr�prios de escolha dos dados de uma amostra, sobretudo quando a popula��o �
conhecida e ordenada. Por exemplo: os edif�cios em uma rua.
Nesse caso, mantendo-se o crit�rio da escolha aleat�ria, o pesquisador define o
m�todo de levantamento da amostra.
Exemplo:
Separam-se os mil edif�cios de uma rua. Sorteia-se o n�mero 23. Uma amostra a dois
por cento deve conter cinquenta dados.
Ent�o, come�a-se pelo edif�cio 23 e colhe-se a cada cinquenta edif�cios (23, 73,
123... 923, 973).
Nesse tipo de amostragem, a popula��o est� dividida em estratos, ou seja,

subconjuntos relacionados a alguma caracter�stica, al�m da caracter�stica de
interesse fixada pelo pesquisador. Por exemplo: em cem indiv�duos, h� 20 que
recebem sal�rio m�nimo, 70 que recebem entre um e dois sal�rios, e dez que recebem
mais de dois sal�rios.
Nesses casos, a sele��o de amostras deve ser proporcional ao n�mero de elementos

que comp�em cada estrato, de modo a tornar a amostra fiel � popula��o geral.
Por exemplo:
Selecionando dez por cento dos indiv�duos mencionados acima, uma amostra ideal deve
conter duas pessoas que recebam um sal�rio, sete que recebam entre um e dois
sal�rios, e um que receba mais de dois sal�rios.
O uso das tecnologias como ferramentas da Estat�stica
A utiliza��o de determinados softwares � essencial para a manipula��o de um grande

conjunto de dados. O Microsoft Excel � um aplicativo bastante usado por empresas e
pesquisadores.
O Excel separa os dados coletados em c�lulas, sendo que cada c�lula comporta um
dado ou uma opera��o de an�lise estat�stica. Para efetuar esses c�lculos,
primeiramente, voc� ir� inserir o operador matem�tico de igual (�=�), o nome da
fun��o estat�stica e, fechado entre par�nteses, o intervalo de dados necess�rios �
sua an�lise (RIBEIRO J�NIOR, 2005). Para obter a m�dia dos valores de uma s�rie de
dados, voc� ir� digitar �=�, escrever M�DIA, selecionar o conjunto e apertar a
tecla �Enter�. O valor exibido na c�lula ser� a m�dia do conjunto analisado.
Separatrizes s�o n-1 valores que dividem um conjunto em n partes iguais. Por
exemplo, h� tr�s quartis que dividem um conjunto em quatro partes. Para obter o
primeiro quartil de um conjunto, voc� ir� teclar �=QUARTIL�, selecionar o conjunto
de dados e depois teclar os n�meros um, dois ou tr�s, sendo esse n�mero
correspondente ao quartil que voc� deseja obter.
Tamb�m no Excel, podemos calcular medidas de dispers�o como a vari�ncia e o desvio

padr�o.
Voc� pode calcular a vari�ncia teclando �=VAR�, selecionando o conjunto e apertando
�enter�. O desvio padr�o � calculado ao digitar �=DESVPADP�, selecionar o conjunto
e apertar �enter�. Segundo Ribeiro J�nior (2005), voc� pode confirmar a validade de
seu indicador, calculando a vari�ncia e depois retirando sua raiz quadrada, com o
comando �=(valor da vari�ncia)^0,5�. Por fim, o coeficiente de varia��o � dado pelo
comando �=(valor do desvio padr�o)/(Valor da m�dia)�.
Quando voc� tiver dados com uma ou mais vari�veis, eles podem ser organizados em
tabelas, que podem ser formatadas de forma manual ou por comandos.
O m�todo manual � uma forma de apresenta��o de dados no qual voc� recolhe os dados
relacionados a cada vari�vel e os organiza em colunas. Mas voc� pode tamb�m
selecionar esse conjunto de dados e clicar na op��o �formatar como tabela�, na
barra de menus. Ali, ser� criada uma tabela que permitir� a voc� reorganizar os
dados conforme seu interesse. Voc� pode tornar a tabela esteticamente mais
agrad�vel aplicando bordas (com o comando �borda superior ou inferior�) e
centralizando os dados.
De acordo com Ribeiro J�nior (2005), gr�ficos dinamizam a compreens�o de um

conjunto de dados. Na maior parte das vezes, os gr�ficos do Excel s�o moldados a
partir de dados inseridos pelo pesquisador e dispostos em tabelas.
Primeira etapa
Deve ser selecionado o tipo de gr�fico desejado. H� gr�ficos para cada tipo de
dados; para uma vari�vel, voc� pode utilizar um gr�fico em que os dados ficam
dispostos em colunas, por exemplo. Nessa etapa, um modelo b�sico de gr�fico ser�
exibido.
Segunda etapa
Agora, voc� dever� formatar o gr�fico. Voc� ir� ajust�-lo para tornar a
apresenta��o mais did�tica. Altere o t�tulo clicando nele e depois aloque a caixa
de legenda abaixo do gr�fico, ou a exclua. Por fim, insira informa��es a respeito
de cada um dos eixos, clicando na aba �ferramentas de gr�fico�, e depois em layout
e �t�tulos dos eixos�.
Histogramas, segundo Ribeiro J�nior (2005), s�o apresenta��es gr�ficas em um

conjunto de ret�ngulos dispostos em um gr�fico de colunas, de modo que a altura de
cada ret�ngulo corresponde � frequ�ncia de um intervalo de dados, ou seja, ao
n�mero de vezes em que s�o observados elementos que perten�am a um determinado
intervalo.
Diagramas s�o apresenta��es que demonstram fluxos de decis�o que se relacionam

entre si. Voc� pode criar diagramas a partir dos comandos �Inserir� SmartArt e
selecionar o modelo mais conveniente. O diagrama pode ser utilizado para a
demonstra��o de dados e a��es de uma empresa.
A aplica��o da estat�stica em diferente setores
Vamos iniciar nossos estudos enfatizando que a Estat�stica tem import�ncia

fundamental enquanto ferramenta de pesquisa quantitativa.
Pelo m�todo estat�stico, pesquisadores como empresas, institui��es, o Estado,
estudantes etc., podem coletar e analisar conjuntos e s�ries de dados, hist�ricos
ou relacionados a uma popula��o no tempo presente, e verificar, por meio de
indicadores como a m�dia e as porcentagens, alguma caracter�stica de interesse ou
uma hip�tese a ser estudada.
Por meio da infer�ncia estat�stica, podemos obter informa��es e refer�ncias a
respeito de uma popula��o a partir de um subconjunto finito dessa popula��o, o que
� conhecido como amostra. Amostras, quando coletadas adequadamente, permitem que
fa�amos dedu��es a respeito de uma popula��o que n�o se encontra, por alguma raz�o,
dispon�vel para an�lise ao pesquisador.
O marketing, enquanto ramo do conhecimento destinado a avaliar as prefer�ncias dos

indiv�duos em torno de algum produto, bem ou servi�o, utiliza-se da Estat�stica
para a realiza��o de pesquisas de campo e avalia��es de clientes a respeito de um
item de interesse.
Profissionais de marketing coletam dados e os analisam, conforme o m�todo

estat�stico, visando captar tend�ncias do p�blico consumidor a fim de adaptar os
esfor�os de divulga��o e propaganda da firma para essas tend�ncias.
Agentes privados analisam s�ries hist�ricas de dados, como m�dias de vendas, de

receitas, lucros e preju�zos, projetando, com base nessas tend�ncias, o
comportamento dessas e de outras vari�veis ao longo do tempo. A Estat�stica
funciona, deste modo, como uma ferramenta de previs�o: podemos, no tempo presente,
a partir de uma s�rie de dados, estimar a tend�ncia de realiza��o de uma s�rie de
eventos em um futuro pr�ximo. Da mesma forma, a administra��o p�blica utiliza a
estat�stica para avaliar as tend�ncias de crescimento e queda de diferentes
vari�veis, como a taxa de crescimento da economia, a taxa de mortalidade infantil,
de natalidade da popula��o, entre outras.

Estatística

Enviado por

Dados do documento

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Estatística

Enviado por

Direitos autorais:

Formatos disponíveis

Estat�stica descritiva e indutiva e conceitos b�sicos

Vamos conhecer agora os conceitos b�sicos utilizados em estat�stica, tais como

Universo ou popula��o estat�stica - conjunto formado por todos os elementos que

Vari�vel - dados que podem ser classificados conforme atributos. Em vari�veis

Censo - an�lise de dados estat�sticos relacionados a uma determinada popula��o (n�o

Vamos conhecer agora os principais termos utilizados em estat�stica, tais como

Diferen�a entre estat�stica

Para realizarmos as an�lises descritivas e indutivas, vamos percorrer uma s�rie de

Primeiro passo: defini��o do problema

Segundo passo: planejamento

Terceiro passo: coleta de dados

Quinto passo: apresenta��o dos dados

Sexto passo: an�lise e interpreta��o dos dados

� importante lembrar que, ap�s analisar e interpretar os dados, h� o momento de

M�todo estat�stico e t�cnicas de amostragem

O m�todo estat�stico envolve a sele��o de dados que compor�o uma determinada

A Coleta de dados se destina a registrar os dados relacionados a uma amostra ou uma

coleta direta - baseada na pesquisa direta em fontes prim�rias, ou seja, em dados

J� a apura��o consiste na contagem e agrupamento dos dados em faixas espec�ficas.

As t�cnicas de amostragem se destinam a obter precis�o na an�lise de um fragmento

t�cnicas probabil�sticas: aplicadas quando se deseja investigar uma popula��o

Apresenta��o de Dados Estat�sticos

Devemos identificar os dados em vari�veis quantitativas (cont�nuas ou discretas) ou

Barras, colunas e de setores: para um mesmo conjunto de dados, podemos construir

Distribui��o de frequ�ncias por intervalo e por pontos

Os dados coletados para um trabalho de an�lise, uma pesquisa, um experimento,

Limites de classe: a nota��o para a classe � a letra i, sendo que i = 1, 2, 3...k

Determinando a amplitude de um intervalo de classe: a amplitude de um intervalo de

Podemos verificar a amplitude total de uma distribui��o de frequ�ncia observando o

Assim, a amplitude total � obtida quando subtra�mos do limite m�ximo da �ltima

AT = Lm�x6 - lmin1 = 200 - 1 - 199

Agora, passaremos ao c�lculo do ponto m�dio do intervalo de classe.

Um histograma possibilita a visualiza��o das dimens�es das frequ�ncias de uma

Um pol�gono de frequ�ncias acumuladas mede as chamadas frequ�ncias acumuladas de

O pol�gono de frequ�ncias acumuladas tender� ao valor m�ximo no ponto relacionado �

A frequ�ncias acumulada ali ser� correspondente ao total das frequ�ncias.

A Curva de frequ�ncias mostra uma imagem tendencial da s�rie de dados, enquanto o

fci = (ti-1 + 2fi + fi+1)/4

Onde fci corresponde � frequ�ncia calculada da classe i, fi-1 � a frequ�ncia da

As medidas de posi��o nos auxiliam a identificar o centro de uma amostra.

A moda � o elemento que aparece com maior frequ�ncia em um conjunto de dados.

Em uma situa��o de um conjunto de dados com distribui��o sim�trica, pode-se

No caso de um conjunto em que a distribui��o n�o seja sim�trica, n�o � aconselh�vel

Medidas de posi��o: separatrizes

Percentil: divide um conjunto de dados em 100 partes iguais. Desta forma, o

Outras medidas de separa��o, outras separatrizes, podem ser adotadas a crit�rio do

Para efetuarmos a interpreta��o de outros tipos de separatrizes, basta recorrermos

Medidas de dispers�o: desvio m�dio e desvio padr�o

As medidas de dispers�o t�m a capacidade de nos mostrar se um determinado conjunto

Voc� sabe o que � amplitude total?

Lembre-se de calcular primeiro a m�dia. Depois, subtra�a dessa m�dia todos os

A vari�ncia pode ser compreendida como a m�dia do somat�rio dos quadrados da

A vari�ncia � um indicador de dispers�o, que demonstra, de maneira agregada, a

O desvio-padr�o mede a dispers�o ou variabilidade de um conjunto de dados. Trata-se

O coeficiente de varia��o e propriedades � uma medida adimensional, geralmente em

Qual destes conjuntos � mais ou menos homog�neo em rela��o � m�dia?

Perceba que os dados est�o razoavelmente dispersos em rela��o � m�dia, no par

Esta � uma an�lise comparativa, que � viabilizada pelo coeficiente de varia��o.

E quando os dados s�o expressos em grandezas diferentes? Imagine que a primeira

O coeficiente de varia��o � tamb�m conhecido como coeficiente de varia��o de

Agora, acompanhe o exemplo:

J� o desvio padr�o � dado por:

=> raiz� ((10-14)�+(12-14)�+(14-14)�+(20-14)�)/4 = 3,74

Assim, o coeficiente de varia��o � dado por: