Você está na página 1de 9

Universidade Federal do Piauí

Campus Universitário “Profa. Cinobelina Elvas” – Bom Jesus, PI


Profa. Gisele

ESTATÍSTICA
I - IMPORTÂNCIA DA ESTATÍSTICA E CONCEITOS BÁSICOS

1. INTRODUÇÃO: Origem e importância


Há tempos o homem tem, muitas vezes, tomado notas de coisas e pessoas, não somente com
o fim de acumular números, mas também visando utilizar os dados do passado para a resolução de
problemas do presente. Todavia, somente no fim do século XIX e início do século XX, com a
aplicação das probabilidades aos problemas sobre a interpretação dos dados, os números passaram a
ser utilizados tanto para resolver os problemas do presente quanto prever os acontecimentos futuros.
A palavra Estatística deriva do latim “status”, que significa ESTADO. Os primeiros usos da
estatística envolviam a compilação de dados e gráficos que descreviam vários aspectos de um
estado ou país, daí a origem da palavra estar relacionada a estado. O primeiro levantamento
estatístico remonta a 3500 a.C no Egito, tendo como objetivo informar ao estado sobre os recursos
humanos e econômicos.
No século XVII d.C a disciplina estatística já era lecionada nas universidades alemãs,
continuando com a finalidade de descrever as populações e as riquezas do estado. Ainda neste
século, ocorreu a expansão da ciência em áreas como saúde pública, indústria, comércio e
densidade demográfica.
Alguns estudiosos contribuíram ao longo dos anos para o desenvolvimento da estatística
como ciência, como Francis Galton (1822-1911) que apresentou as noções de regressão e
correlação; Karl Pearson (1857-1936) que apresentou seus famosos coeficientes, hoje chamados de
coeficientes de Pearson; e Fisher que apresentou estudos sobre inferência estatística, dentre outros.
Porém, o grande avanço mesmo da ciência foi por volta de 1940, quando o tratamento dos dados
deixou de ser manual para ser computadorizado e, com isso, a realização de procedimentos
estatísticos que, geralmente eram de alto custo do ponto de vista humano, passaram a ser
dinamizados pela aplicação da informática no tratamento dos dados.

1
A importância da estatística reside no esforço do homem para melhor compreender o
mundo, tanto do ponto de vista físico como social. Na sociedade científica, da qual fazemos parte
atualmente, a investigação é parte essencial do trabalho diário. O interesse por descobrir novos
procedimentos por meio da experiência acumulada tem sido determinante para a necessidade de os
profissionais se perceberem imersos na formação e aprendizado de técnicas básicas de metodologia
da investigação e de algumas mais concretas como a análise de dados. Os profissionais que se
apóiam na quantificação e no estudo do que se observa diariamente, e entendem e conhecem os
conceitos básicos de estatística se aprofundam e compreendem melhor o fundamento de sua área de
trabalho.

2. O QUE É ESTATÍSTICA?

Segundo o Dicionário de Língua Portuguesa Aurélio:

“1Parte da matemática em que se investigam processos de obtenção, organização e análise de


dados sobre uma coleção de seres quaisquer, e métodos de tirar conclusões e fazer predições com
base nesses dados. 2Conjunto de elementos numéricos relativos a um fato social.”

Para muitas pessoas, a palavra “estatística” faz lembrar longas colunas de números, gráficos
e diagramas que mostram de que forma o governo está gastando o dinheiro dos impostos. No
passado, esta palavra referia-se exclusivamente à informações numéricas de que os governos
necessitavam para planejar sua conduta. Os estatísticos eram pessoas que coletavam grandes
quantidades de informações numéricas. Alguns estatísticos ainda realizam este tipo de trabalho, mas
existem outros que auxiliam a conduzir e interpretar experimentos científicos e pesquisas
profissionais. As mudanças no significado da palavra estatística acompanharam as mudanças
ocorridas no tipo de trabalho realizado pelos estatísticos.

A palavra estatística pode ser utilizada para designar dados numéricos, como, por exemplo,
estatísticas esportivas ou estatísticas financeiras. Entretanto, a palavra pode também se referir à
estatística como uma disciplina própria da mesma forma que a matemática ou a economia.

Assim, conceituando temos que:

A estatística é o ramo da matemática interessado nos métodos científicos para coleta,


organização, resumo, apresentação e análise de dados, bem como na obtenção de conclusões
válidas e na tomada de decisões razoáveis baseadas em tais análises.

Portanto, a estatística é uma ciência que se preocupa com o planejamento de uma pesquisa,
envolvendo desde a forma de coleta das observações obtidas em experimentos ou levantamentos,
até a maneira como será feita a organização, a descrição, o resumo dos dados e a avaliação e

2
afirmação sobre características de interesse do pesquisador. Tudo isso corresponde às fases do
método estatístico.

As fases do método estatístico são então:

a) Definição do Problema

Consiste na:

- formulação correta do problema;

- examinar outros levantamentos realizados no mesmo campo (revisão da literatura);

- saber exatamente o que se pretende pesquisar definindo o problema corretamente (variáveis,


população, hipóteses, etc.)

b) Planejamento

Determinar o procedimento necessário para resolver o problema:

- Como levantar informações;

- Tipos de levantamentos: por censo (completo) ou por amostragem (parcial).

- Cronograma, custos, etc.

c) Coleta ou levantamento dos dados

Consiste na obtenção dos dados referentes ao trabalho que desejamos fazer.

A coleta pode ser: Direta - diretamente da fonte; Indireta - feita através de outras fontes.

Os dados podem ser obtidos pela própria pessoa (primários) ou se baseia no registro de terceiros
(secundários).

d) Apuração dos Dados ou sumarização

Consiste em resumir os dados, através de uma contagem e agrupamento. É um trabalho de


coordenação e de tabulação.

e) Apresentação dos dados

É a fase em que são mostrados os resultados obtidos na coleta e na organização.

f) Análise e interpretação dos dados

É a fase mais importante e também a mais delicada. Obtêm-se conclusões que auxiliam o
pesquisador nas tomadas de decisões.

3
OBS: As análises estatísticas dependem da forma de como os dados são coletados, e o
planejamento estatístico da pesquisa indica o esquema sob o qual os dados serão obtidos. Portanto,
o planejamento da pesquisa e a análise estatística dos dados estão intimamente ligados.

PLANEJAMENTO DA PESQUISA ⇒ ANÁLISE ESTATÍSTICA

Assim, o pesquisador deve possuir razoável conhecimento de estatística para desenvolver


suas pesquisas, ou então consultar um estatístico para auxiliá-lo. Vale ressaltar que esta consulta
deve ser feita antes do início da pesquisa, ainda durante a fase de elaboração do projeto.

3. SUBDIVISÕES DA ESTATÍSTICA

A estatística pode ser dividida em duas áreas:

Estatística Descritiva ou Análise Exploratória dos Dados

 Estatística Indutiva ou Inferência Estatística

A Estatística Descritiva ou Análise Exploratória de Dados é a parte da estatística que


cuida da apresentação dos dados observados em certo grupo por meio de uso de tabelas, de gráficos
e de medidas dentre as quais se destacam as medidas de posição e de dispersão, sem fazer
inferências sobre um grupo maior.

A Inferência Estatística ou Analise Confirmatória é a parte da estatística que trata das


condições sob as quais faz-se inferências (ou pressuposições ou generalizações) sobre uma
população. Se uma amostra é representativa de uma população, possui as mesmas características
básicas da mesma, e conclusões importantes sobre a população podem ser inferidas de sua análise,
assim, com a inferência estatística fazemos inferências além dos dados conhecidos. A inferência
estatística envolve questões de dois tipos: a estimação de parâmetros populacionais e os testes de
hipóteses.

Nota: Mesmo sendo um importante instrumento auxiliar na pesquisa e na interpretação dos


fenômenos, a estatística tem as suas limitações quanto ao uso:

• Não serve para corrigir erros grosseiros nem técnicas defeituosas. Como toda informação
está contida nos dados, se esses são viciados, será falsa qualquer conclusão que deles se
obtenha;

• Não substitui o julgamento crítico. Ela fornece critérios que auxiliam na tomada de decisões,
mas não dispensa a análise crítica do pesquisador.

4
4. CONCEITOS BÁSICOS

a) POPULAÇÃO X AMOSTRA

 População (N): Conjunto de todos os elementos relativos a um determinado fenômeno que


possuem pelo menos uma característica em comum, a população é o conjunto Universo. Pode varia
quanto à sua origem (conjunto de pessoas, de objetos, de acontecimentos, etc.), à sua natureza
(existente ou real, hipotética ou não totalmente inexistente) e ainda pode ser finita ou infinita.

Finita - apresenta um número limitado de observações, que é passível de contagem.

 Infinita - apresenta um número ilimitado de observações que é impossível de contar e


geralmente esta associada a processos.

 Uma população pode, mediante processos operacionais, ser considerada infinita, pois a mesma
irá depender do tamanho da amostra. Se a freqüência relativa entre amostra e população for menor
do que 5% ela é considerada infinita, se a freqüência relativa for maior do que 5% ela é considerada
finita.

Amostra (n): É um subconjunto da população e deverá ser considerada finita, a amostra deve ser
selecionada seguindo certas regras e deve ser representativa da população, de modo que ela
represente todas as características da população.

b) CENSO X AMOSTRAGEM

 Censo: É a coleta exaustiva de informações das "N" unidades populacionais.

 Amostragem: É o processo de retirada de informações dos "n" elementos amostrais.

OBS: Censo por amostragem

c) DADO X VARIÁVEL

 Dado: qualquer característica que possa ser observada ou medida de alguma maneira. As
matérias-primas da estatística são os dados observáveis.

As características importantes dos dados são:

• Centro: um valor representativo ou médio, que indica onde está localizado o meio do
conjunto de dados;

5
• Variação: medida de quanto os valores dos dados variam entre eles;

• Distribuição: a natureza ou forma de distribuição dos dados;

• Tempo: características dos dados que mudam com o tempo.

 Variável: É aquilo que se deseja observar para se tirar algum tipo de conclusão. Os símbolos
utilizados para representar estatisticamente as variáveis são as letras maiúsculas do alfabeto, tais
como X, Y, Z, ..., que podem assumir qualquer valor de um conjunto de dados. As variáveis podem
ser classificadas dos seguintes modos:

• Qualitativas (ou atributos ou categóricos): São características que não podem ser
medidas, ou seja, são não-numéricas.

Nominal : são utilizados nomes, rótulos ou símbolos para representar determinados tipos de
dados, mostrando, assim, a qual grupo ou categoria eles pertencem.

Ex.: cor da flor, que pode ser rosa, branca ou vermelha.

Ordinal ou por postos: quando uma classificação for dividida em categorias ordenadas em
graus convencionados, havendo uma relação entre as categorias do tipo “maior do que”,
“menor do que”, “igual a”, os dados por postos consistem de valores relativos atribuídos para
denotar a ordem de primeiro, segundo, terceiro e, assim, sucessivamente.

Ex.: resistência a inseto, que pode ser suscetível, parcialmente resistente e resistente.

• Quantitativas: São características que podem ser contadas ou medidas, sendo classificadas
em discretas e contínuas.

Discretas: são aquelas variáveis que podem assumir somente valores inteiros num conjunto
de valores. É gerada pelo processo de contagem.

Ex.: número de folhas por planta; número de carrapatos por animal; etc.

Contínuas: são aquelas variáveis que podem assumir um valor dentro de um intervalo de
valores. É gerada pelo processo de medição ou mensuração.

Ex.: volume de água em um reservatório; peso de raiz; diâmetro do caule; produção;


produtividade; etc.

d) PARÂMETRO X ESTIMADOR X ESTIMATIVA

 Parâmetro: é uma medida numérica que descreve alguma característica da população. É o


resumo da variável observada na população. Por exemplo, média, variância e desvio padrão.

6
Cada parâmetro é representado por um símbolo ou letra. No exemplo tem-se que para a
média, a variância e o desvio padrão as letras gregas µ (mi), σ2 (sigma ao quadrado) e σ (sigma).

Não é possível fazer inferências baseada em parâmetro, uma vez que toda a população foi
investigada.

  Estimador (também chamado de Estatística): é uma medida numérica que descreve alguma
característica de uma amostra, ou seja, o estimador é obtido a partir do resumo da variável
observada na amostra. Neste caso, é possível utilizarmos as teorias inferências para que, com base
na amostra, possamos obter conclusões sobre a população.

Cada estimador também é representado por um símbolo ou letra. Para a média, a variância e
o desvio padrão as letras gregas µ̂ ou X , σˆ 2 ou S2 e σˆ ou S.

NOTE QUE O ESTIMADOR DO PARÂMETRO PODE SER REPRESENTADO PELO


SÍMBOLO OU LETRA ACRESCIDO DO ACENTO CIRCUNFLEXO OU POR OUTRA LETRA
OU SÍMBOLO.

Parâmetro Estimador

(valores reais) (valores estimados)

Média (µ) µ̂ X

Variância (σ2) σˆ 2 S2

Desvio padrão (σ) σˆ S

Proporção (π) - p̂

 Estimativa: Valor numérico assumido pelo estimador, isto é, valor aproximado do parâmetro,
calculado com base na amostra.

7
Exemplo:

Consideremos uma população hipotética formada por 10 plantas de determinada espécie (N


= 10). A variável em estudo foi altura das plantas em centímetros (variável X). Assim, tem-se que:

X1 X2 X3 X4 X5 X6 X7 X8 X9 X10

1,4 1,5 1,7 1,7 1,8 1,8 1,9 1,9 1,9 2,0

Podemos obter o parâmetro média desta população (µ), qual seja:


N

∑X
i =1
i
1,4 + 1,5 + 1,7 + 1,7 + 1,8 + 1,8 + 1,9 + 1,9 + 1,9 + 2,0
µ= = = 1,76
N 10

Suponhamos que retiramos aleatoriamente uma amostra representativa da população de


tamanho n = 3:

X1 X9 X10

1,4 1,9 2,0

Podemos agora obter o estimador da média da população ( X ), dado por:


n

∑X
i =1
i
1,4 + 1,9 + 2,0
X = = = 1,77
n 3

A estimativa é o resultado numérico dado pelo estimador, ou seja, 1,77.

6. ARREDONDAMENTO DE DADOS

Regras: Portaria 36 de 06/07/1965 - INPM (Instituto Nacional de Pesos e Medidas).

1a) Se o primeiro algarismo após aquele que formos arredondar for de 0 a 4, conservamos o
algarismo a ser arredondado e desprezamos os seguintes.

Ex.: 7,34856 (para décimos) → 7,3

2a) Se o primeiro algarismo após aquele que formos arredondar for de 6 a 9, acrescenta-se uma
unidade no algarismo a ser arredondado e desprezamos os seguintes.

8
Ex.: 1,2734 (para décimos) → 1,3

3a) Se o primeiro algarismo após aquele que formos arredondar for 5, seguido apenas de zeros,
conservamos o algarismo se ele for par ou aumentamos uma unidade se ele for ímpar, desprezando
os seguintes.

Ex.: 6,2500 (para décimos) → 6,2

12,350 (para décimos) → 12,4

Se o 5 for seguido de outros algarismos dos quais, pelo menos um é diferente de zero,
aumentamos uma unidade no algarismo e desprezamos os seguintes.

Ex.: 8,2502 (para décimos) → 8,3

8,4503 (para décimos) → 8,5

4a) Quando, arredondarmos uma série de parcelas, e a soma ficar alterada, devemos fazer um novo
arredondamento (por falta ou por excesso), na maior parcela do conjunto, de modo que a soma fique
inalterada.

Ex.: 17,4% + 18,4% + 12,3% + 29,7% + 22,2% = 100%

Arredondando para inteiro:

17% + 18% + 12% + 30% + 22% = 99%

17% + 18% + 12% + 31% + 22% = 100%

7. LITERATURA CONSULTADA
ARA, A. B.; MUSETTI, A. V.; SHNEIDERMAN, B. Introdução à estatística. São Paulo: Egard
Blucher: Instituto Mauá de Tecnologia, 2003.152p.
CARVALHO, S. Estatística básica. Rio de Janeiro: Campus-Elsevier, 2006. 464p.
FERREIRA, D. F. Estatística básica. Lavras: UFLA, 2005. 664p.
REGAZZI, A. Curso de iniciação à estatística (Apostila). Universidade Federal de Viçosa,
Viçosa – MG, 1997. 136p.
TRIOLA, M. F. Introdução à estatística. Rio de Janeiro: LTC, 2005. 656p.

Este conteúdo é resultado de pesquisas em vários livros e apostilas de estatística básica e aplicada,, portanto, ainda
deve ser revisado. Qualquer erro de digitação (ou outro qualquer), sugestões, críticas, etc., por favor, me comuniquem.
Obrigada, Profa. Gisele