Escolar Documentos
Profissional Documentos
Cultura Documentos
UNIDADE 1
ESTATISTICA
UNIDADE 1
Palavras do Professor
Olá,
Sejam bem-vindos à nossa disciplina Estatística!
Será um prazer poder compartilhar os conhecimentos com você! Saiba que os assuntos que vamos ver
aqui são muito importantes e fundamentais para a sua vida profissional!
Aproveite para compreender todos eles da melhor forma possível!
Isto, sem dúvidas, fará de você um profissional diferenciado no Mercado!
Nesta primeira unidade, vamos conhecer os aspectos introdutórios da estatística. Veremos os seus
objetivos, as fases do método de análise, os conceitos de população e amostra, os tipos de variáveis, os
gráficos de dados, a distribuição de frequência, os intervalos de classe, os histogramas e polígionos de
frequência, e outras representações gráficas.
Pronto para começar?
Vamos lá!
Não é difícil encontrarmos situações em que você é apresentado a porcentagens, tabelas e gráficos, não
é mesmo?
Ao ler uma revista semanal ou mesmo assistir ao noticiário local sempre nos deparamos com animações
que nos dão alguma informação: o resultado da inflação semestral, o índice de vendas de determinado
setor da indústria ou mesmo um resultado que alguma universidade de medicina anuncia a respeito de
um tratamento. Sempre nos deparamos com esses valores.
Visite a Página
Quer conhecer a história da estatística? Sugiro a leitura do texto que está disponível
no link. Vale à pena a leitura!
Será que você já parou para pensar e avaliou a importância desses resultados?
Os valores apresentados, será que são confiáveis? Como eles chegaram a tais valores?
Não que agora você irá se tornar um expert em estatística, esse guia não tem essa pretensão. Mas, um
1
olhar critico sobre todas as informações que nos são apresentadas é sempre útil para alicerçar nossas
conclusões. E é aí que o conhecimento da estatística pode nos ajudar.
Para entender estatística, além de um conhecimento básico sobre conjuntos e operações matemáticas
elementares, sempre será necessária uma disponibilidade de aprender algum software apropriado para
estatística. No mercado existem vários pagos e inclusive alguns grátis muito bons.
De todos os programas que operam estatísticas, as planilhas de cálculo como o Excel, por exemplo, é o
pontapé inicial para engrenar o conhecimento com a prática.
Visite a Página
Se você estiver interessado em alguns destes softwares, visite o site baixe o aplicativo
gratuitamente e tente desenvolver alguns exercícios utilizando o programa disponível
no portal.
Para iniciar essa nossa unidade, eu lhe alertei sobre a grande quantidade de números e estatísticas a
que somos apresentados e depois lhe perguntei sobre a forma de como os resultados são coletados e a
veracidade desses resultados.
Então, o Pensamento Estatístico pode ser entendido como sendo a capacidade que você desenvolve em
analisar um conjunto de informações (obtidos através de experiências; sejam elas empíricas ou não,
por leitura ou outro meio de comunicação) e o seu poder de tomar uma decisão crítica a respeito dessa
informação.
Bem, talvez você esteja entendendo o que quero dizer sobre “Pensar Estatisticamente”, mas onde isso
seria útil?
Ora, muitas das ferramentas de qualidade e de análise de risco que são utilizadas na indústria e em outros
setores da nossa vida profissional são derivadas do pensamento estatístico. E, quando você entender
o processo desde a coleta dos dados até sua finalização em uma conclusão, então não terá nenhuma
dificuldade em entender e aplicar processos de controle de qualidade como os famosos 6σ (seis sigma)
ou vários tipos de cartas de controle para variáveis e atributos, entre outros.
Visite a Página
Quer saber mais sobre o 6σ (seis sigma)? Acesse o link e saiba como funciona.
2
Figura 1 - Um esquema para compreender o método científico. Fonte: O Autor
Quando você está diante de um problema que exige algum estudo estatístico, ao seguir esse pequeno
modelo, suas chances de obter resultados que realmente sejam fieis aos dados populacionais aumentam
de forma significativa.
Agora devemos nos concentrar em alguns conceitos básicos da estatística para que realmente esse nosso
pensamento crítico possa vir a ser utilizado. Por favor, entenda que essa maturidade de pensamentos e
conclusões não surge imediatamente, ela deve ser alimentada durante toda sua carreira profissional.
Haverá acertos e erros (talvez mais erros no começo, é normal...) e com o passar do tempo e com as
experiências vividas o “pensar estatístico” irá amadurecer e se tornar peça chave na formação de suas
opiniões, profissionais ou não.
Está preparado? Então vamos lá!
3
Vamos começar com o conceito de população:
População - Para estatística, a população é o conjunto de todos os elementos de um estudo.
Apesar da ideia que temos sobre população como sendo um grande número de objetos, não se engane
quanto ao fato de uma população ter poucos elementos.
Exemplo:
A = {Conjunto de todos os torcedores do Íbis Sport Club (o pior time do mundo, segundo eles próprios)};
B = {Conjunto de todos seus familiares que são fumantes}.
Quando você estiver interessado em alguma medida numérica para descrever uma característica qualquer
de uma população, chamaremos essa medida de parâmetro. No caso dos exemplos dos conjuntos A e B
das populações apresentadas, um parâmetro interessante poderia ser a porcentagem de pessoas do sexo
feminino de cada população. Já o censo, como o que o IBGE faz regularmente, é o conjunto de todos os
resultados obtidos de todos os elementos de uma população.
Agora vejamos o conceito de amostra;
Amostra – É o subconjunto de elementos de uma população que possa representá-la de maneira efetiva.
Quando falamos de amostra a medida numérica que descreve a característica de importância é chamada
de estatística. Chamaremos de Inferência estatística as afirmações que podemos fazer a partir de um
conjunto de valores representativos, isto é, seu conjunto amostral, sobre uma determinada população. A
Figura 2 nos dá uma breve ideia de como a população e a amostra estão intimamente correlacionados:
Figura 2 - Correlação entre população e espaço amostral. A partir de uma amostragem adequada é
possível calcular algumas estatísticas e realizar inferências sobre a população. Fonte: www.portalaction.
com.br
Bem, talvez você já esteja começando a entender um pouco mais do processo estatístico, mas para não
deixar mais dúvidas vamos pensar no seguinte exemplo:
Exemplo
Considere novamente o conjunto A = {Conjunto de todos os torcedores do Íbis Sport Club}, imagine que
a população de torcedores desse time seja inacreditável 100 indivíduos (calma, é só uma suposição...)
distribuídos por todo o Brasil. Dessa população, se soubermos que 41 torcedores são do sexo feminino
4
e os 59 restantes do sexo masculino, então a conclusão de que 41% de torcedores do Íbis são do sexo
feminino e 59% são do sexo masculino passa a ser um parâmetro da população. Até aí tudo bem? Acredito
que sim!
Agora se quisermos ter uma ideia a respeito da idade desses torcedores? Será que seria uma boa ideia
visitar todos os torcedores do Íbis e lhes perguntar pessoalmente a idade? Quase sempre não é bom tomar
todos os valores de todos de uma população, geralmente tais processos são bastante caros e demorados.
Então, o que faremos?
Bem, uma solução seria escolher de forma aleatória uma quantidade de elementos dessa população e
tomar as medidas desses elementos, daí depois de selecionarmos uma amostra representativa dessa
nossa população chegaríamos a um resultado (uma inferência).
Vamos imaginar que no caso dos torcedores o valor da média de idade deles seja de 42 anos, então esse
valor, essa inferência, sobre os torcedores do Íbis é uma estatística a respeito dessa população.
Algumas coisas são importantes a serem notadas quando fizermos uma inferência estatística:
1. A qualidade da resposta está diretamente ligada à qualidade dos dados obtidos, isto é, os mais
imparciais e aleatórios possíveis sem descartar dados com uma forte justificativa tornarão suas
inferências (conclusões) fortes também;
2. A coleta de dados passa pela avaliação clara do problema ou situação a serem confrontadas, bem
como os objetivos com relação aos mesmos;
3. Os instrumentos, quando necessários, devem estar calibrados e terem capacidade de realizar as
medições de forma eficiente;
4. Muita atenção com as tabelas, cálculos e leituras que você deve fazer (evite erros grosseiros);
5. Os operadores devem ser capacitados para realizar as medições, e os métodos para coleta de
dados e meios que serão utilizados devem ser adequados de acordo com o problema estudado.
Outra definição que devemos discutir é o conceito de variável.
Variável – Pode ser entendida como sendo a característica que é medida de cada elemento da amostra
ou mesmo da população, isto é, seu valor, resposta ou atributo. Como o próprio nome diz, seus valores
variam de elemento para elemento. As variáveis podem assumir valores numéricos ou não.
A Figura 3 mostra os tipos de variáveis e suas subcategorias:
5
Vamos identificar cada uma dessas variáveis?
§ Variáveis quantitativas – Tipo de variáveis que podem ser descritas através de valores
numéricos, sendo que estes valores podem ainda ser classificados como contínuos ou discretos.
ü Variáveis contínuas: a variável é dita contínua se seus resultados podem assumir
quaisquer valores dentro de um intervalo numérico. Exemplos: medidas de massa,
medidas de comprimento, medidas de tempo.
ü Variáveis discretas: Já a variável é chamada de discreta se seus valores só possam ser
representados por elementos de um conjunto, ou seja, seus valores são resultados de uma
contagem e, por isso, só fazem sentido alguns resultados predeterminados. Exemplos:
número de ovos em um cesto, número de carros que passam por uma rua.
§ Variáveis Qualitativas (ou categóricas) - são características ou atributos que não possuem
valores quantitativos sendo definidas por categorias ou uma classificação. Podem ser divididas
em variáveis nominais ou ordinais.
ü Variáveis nominais: Variáveis onde não há uma ordem entre as categorias. Exemplos:
Sexo, Nacionalidade, Estado civil, Aprovado/Reprovado.
ü Variáveis ordinais: Nesse caso há uma ordenação entre as classes. Exemplos: Nível de
escolaridade (1º, 2º, 3º graus), fases de uma doença (inicial, intermediário, terminal), dia
da semana (Domingo, segunda,…, sábado).
Apesar dessa classificação pode acontecer que uma variável originalmente quantitativa seja coletada
de forma qualitativa, claro que isso depende de cada caso a ser avaliado. O importante é saber que a
classificação de uma variável estudada qualquer é uma das premissas básicas para a escolha de um bom
teste estatístico.
Tudo bem; entendi. Mas e daí?
Já que devemos fazer estatísticas em cima de um conjunto menor de elementos podem surgir perguntas
do tipo: Será que existe um método mais eficiente de coletar amostras? Ou só existe um método? E se
tiverem muitos, qual o mais indicado? Para isso existem os métodos de amostragem;
§ Métodos de amostragem – Maneira pela qual será realizada a seleção dos elementos que irão
compor o espaço amostral da estatística.
São técnicas que garantem tanto quanto possível, o acaso na escolha, de modo a garantir à amostra o
caráter de representatividade. São utilizadas, por exemplo, quando:
ü O número da população é muito grande (peixes de uma determinada espécie do mar,
número de habitantes de uma cidade);
ü Queremos economizar tempo e dinheiro (Intenção de voto entre eleitores);
ü E quando desejamos realizar uma pesquisa mais elaborada, detalhada e com maior
precisão.
Dito isto, podemos citar como exemplos de técnicas de amostragem:
§ Amostragem casual ou simples (também conhecida como aleatória);
§ Amostragem sistemática;
§ Amostragem estratificada.
6
A ideia central do método de amostragem é a de que todos os métodos são válidos e que a escolha deste
ou daquele método é puramente uma questão de ocasião e know-how, ou seja, não há preferências sobre
métodos de amostragem, mas que cada método é mais indicado para cada tipo de experimento estatístico
que devemos fazer.
7
3.000.000
2.500.000
2.000.000
2006
Volume importado (m³)
2007
2008
1.500.000
2009
2010
2011
1.000.000 2012
500.000
-
Janeiro Fevereiro Março Abril Maio Junho Julho Agosto Setembro Outubro Novembro Dezembro
Figura 4 – Importação mensal em m³ de petróleo feita pelo Brasil entre os períodos de 2006 a 2012.
Fonte: Secretaria de Comércio Exterior (SECEX) - Ministério do Desenvolvimento, Indústria e Comércio
Exterior.
Observando os dois meios de representar o mesmo conjunto de dados talvez você tenha ainda mais
certeza a respeito de nosso ditado, não é verdade?
O importante é que ao construir uma tabela ou gráfico saiba que existem normas nacionais para a
organização de tabelas e/ou gráficos, tais normas são ditadas pela ABNT (Associação Brasileira de Normas
Técnicas). Essas normas não serão tratadas aqui, mas é bom saber que elas existem e que são muito bem
vindas em qualquer apresentação que você venha a fazer, tenha ou não um conteúdo estatístico nelas.
Por exemplo, tabelas devem ter, no mínimo, os seguintes componentes:
§ Título: Precede a tabela e explica, em poucas palavras, o dado em estudo;
§ Cabeçalho: Especifica o conteúdo de cada coluna;
§ Corpo da tabela: Apresenta a frequência dos dados;
§ Fonte: Especifica a entidade, o pesquisador ou pesquisadores que forneceram os dados.
Então, agora temos que responder a uma questão simples: “Como devo apresentar meus dados? Ou seja,
que gráfico devo escolher?”.
Amigo aluno, como você já deve ter visto (ou lido) existe uma grande gama de representações gráficas e
a utilização de softwares específicos aumenta ainda mais esse número. Cabe ao autor do gráfico escolher
a forma que deve ser utilizada e esta será diretamente relacionada com o tipo de dado e o objetivo do
gráfico, isto é, a representação além da beleza deve ter clareza naquilo que quer mostrar.
DISTRIBUIÇÃO DE FREQUÊNCIA
Ora, quando falamos de dados estatísticos a representação pode ser tanto por tabelas (como a tabela 1
mostrada agora a pouco) quanto por gráficos, como são os gráficos de barra, pizza e pictogramas que tanto
vemos em reportagens e artigos de jornal e revista ou pelas distribuições de frequência.
8
§ Distribuição de frequência: Uma tabela que agrupa os dados por classes de ocorrência, resumindo
a análise de conjunto de dados grandes em um conjunto menor de elementos.
Imagine que o professor de Estatística organizou os resultados obtidos em uma avaliação da maneira
como aparece no rol abaixo. Observe também que esta avaliação foi realizada com 25 alunos.
4,0 5,0 7,0 9,0 9,0
4,0 5,0 7,0 9,0 9,0
4,0 5,0 7,0 9,0 9,0
4,0 6,0 8,0 9,0 9,0
4,0 6,0 8,0 9,0 9,0
9
INTERVALOS DE CLASSE
Considere que estejamos interessados em analisar as notas de uma avaliação sobre os serviços públicos
gerenciados por uma prefeitura. Para tanto, realizou-se um experimento que coletou 50 resultados que
estão apresentados no rol abaixo:
5 1 4 1 1 3 3 2 2 1
4 2 0 2 2 3 6 2 3 1
0 3 1 7 5 1 2 0 1 1
6 2 6 2 1 8 2 9 3 0
7 4 2 0 5 3 1 4 3 2
Fonte: Dados fictícios.
A primeira pergunta que devemos fazer é: Quantas classes devem existir nessa tabela?
Veja que essa é uma pergunta muito importante, pois um número elevado de classes poderá trazer
confusão ao invés de expressar resultado e, um número muito pequeno de classes poderá esconder
resultados que poderiam ser interessantes para o problema.
Nesse sentido existem fórmulas matemáticas que nos ajudam a revelar quantas classes devem existir
nesse intervalo, mas todas as fórmulas que podem ser aplicadas passam pelo crivo de nosso bom senso.
Eis algumas das fórmulas que podem determinar o número de classes, aqui denotada pela letra k, de uma
tabela com n resultados:
Observe que nossa resposta não convergiu para um único resultado. E agora, o que fazer?
10
Bem, vamos continuar nossa tabela usando um número mínimo de classes.
Fazendo isso temos agora outra questão: Qual deverá ser o tamanho de cada classe, isto é, quais deverão
ser os limites superior e inferior de cada classe?
Um cálculo simples é fazer a diferença entre o maior e menor valor obtido do experimento e dividir pelo
número de classes escolhidas, sendo assim teremos:
Adote como limite inferior da primeira classe o menor valor observado do seu experimento e, em seguida,
some a este valor a largura de classe calculada. Desta forma é definido o limite superior da classe.
Feito isto, podemos agora construir a nossa distribuição de frequência com intervalo de classes:
Tabela 3 – Distribuição de frequências com intervalo de classes
Fonte: O Autor.
11
Vamos a eles?
Na estatística, o histograma é uma das sete ferramentas da qualidade. O histograma é um gráfico formado
por retângulos justapostos em que a base de cada um desses retângulos corresponde ao intervalo de uma
dada classe e a sua altura à respectiva frequência e/ou probabilidade de ocorrência dessa classe.
A construção do histograma tem caráter preliminar em qualquer estudo e é um importante indicador da
distribuição de dados. A sua forma pode indicar se uma distribuição aproxima-se ou não de uma função
normal. A figura 5 abaixo ilustra um modelo de histograma padrão.
12
Figura 6 – Representação de um Polígono de frequência para a situação apresentada na figura anterior.
Fonte: http://alexandreprofessor.blogspot.com.br/p/graficos.html
Por fim, as Ogivas são polígonos de frequência construídos com as frequências acumuladas. Estas podem
se apresentar de forma crescente ou decrescente.
Na figura 7 temos os exemplos de duas ogivas, na figura da direita uma amostra de uma ogiva crescente
e na figura a esquerda a amostra de uma ogiva decrescente.
Figura 7 – Exemplo de duas ogivas: (a) Ogivas crescentes e (b) Ogivas decrescentes.
FONTE: http://www.oocities.org/estatistica2002/descritiva/descri.html (com adaptações)
Figura 8 – Queda da taxa de analfabetismo ao longo dos anos representada por um diagrama de linha.
Fonte: www.ibge.gov.br (síntese de Indicadores Sociais 2000)
13
§ Diagrama Circular: esta representação é constituída por um círculo (pizza), em que se
apresentam vários setores que são proporcionais às respectivas frequências.
Figura 9 – Distribuição dos pesos dos itens que compõem o IPCA em Janeiro de 2014.
Fonte: http://www.atireiopaunografico.com.br/2014/03/grafico-de-pizza-usar-ou-nao.html
§ Diagrama de Colunas: consiste em marcar num sistema de eixos coordenados o valor das
categorias e nesses pontos desenhar barras verticais de mesma largura e igualmente espaçadas,
onde as suas alturas correspondem à frequência absoluta ou à frequência relativa (ou frequência
acumulada).
Figura 10 – No diagrama de colunas as frequências (neste caso, frequência absoluta) são representadas
pelo eixo vertical.
Fonte: http://rotadosconcursos.com.br/questoes-de-concursos/estatistica-diagrama-ou-grafico-de-
colunas-ou-barras/393008
14
§ Diagrama de Barras: possui as mesmas características do diagrama de colunas. A principal
diferença, como pode ser observada na figura a seguir, são as barras construídas horizontalmente.
Figura 11 – No diagrama de barras as frequências (neste caso, frequência relativa) são representadas
pelo eixo horizontal.
Fonte: http://www.brasilescola.com/matematica/graficos.htm
§ Gráfico Polar ou Radar: é o gráfico que representa séries temporais em que é possível comparar
os valores da série com o valor da média aritmética. A média aritmética é representada por um círculo,
cujo raio é o valor da média dos dados observados.
Figura 12 – Gráfico polar construído com base nas informações apresentadas na tabela.
Fonte: Ministério da Agricultura (http://slideplayer.com.br/slide/1235210/)
§ Cartograma: é utilizado para representar os dados diretamente sobre o desenho de uma área
geográfica com o objetivo de causar um impacto visual para melhor entendimento das informações.
15
Figura 13 – Número de domicílios com microcomputador e acesso à internet em 2009.
Fonte: http://confins.revues.org/7592
§ Pictograma: são representações gráficas ilustradas por figuras. A representação gráfica é feita
por figuras variadas.
Figura 14 – Pictograma que ilustra o contraste entre a riqueza produzida pelo Estado e o rendimento
médio dos trabalhadores.
Fonte: http://professorandrios.blogspot.com.br/2011/08/representacao-grafica-de-dados.html
Visite a Página
Você quer encontrar uma coleção de belas e viciantes tabelas, gráficos, mapas de
dados interativos sobre temas de todo o mundo? Se sim, acesse o link.
É bem interessante! Vale a pena o acesso!
Palavra Final
16