Você está na página 1de 13

Como analisar de forma simples um grande nmero de dados?

Uma multinacional planeja instalar sua prxima fbrica em Portugal. A escolha da localizao desta fbrica depende de informaes. Os seus executivos desejam saber, entre outras coisas, se h ou no mo-de-obra especializada na regio; qual a renda mdia dos moradores para desenvolver uma poltica de salrios; e qual a capacidade de consumo do mercado portugus, pois disso depender o preo final de suas mercadorias. Da mesma maneira, um pesquisador que rene muitos dados sobre uma determinada populao tem, em seguida, de agrup-los e classifica-los, ou trabalhar esses dados. Esses dados trabalhados podem ser usados nos estudos de determinadas situaes e acontecimentos. Trata-se de um mtodo de anlise e elaborao cientfica dos dados, que chamamos de Estatstica. A Estatstica um ramo da Matemtica que estuda os fenmenos do acaso, agrupando, classificando e ordenando experincias e observaes sobre as manifestaes de um fenmeno para extrair suas consequncias. A Estatstica tem seu desenvolvimento marcado pelas mais recentes descobertas cientficas, como a Teoria da Relatividade, do fsico Albert Einstein, e a Fsica Quntica. Alm disso, tem-se configurado como um importante instrumento de apoio para variados campos do conhecimento, como os da Psicologia, da Economia, da Sociologia e da Medicina.

1. Estatstica descritiva
O estudo estatstico no feito tendo como referncia uma nica pessoa ou um fato isolado, e sim um conjunto de elementos. Esse conjunto chamado de colectivo ou de populao. Se o colectivo ou populao formado por muitos elementos, usa-se uma amostra muito selectiva que seja representativa do total. Cada elemento desse coletivo chamado de indivduo ou unidade estatstica. Chamamos varivel estatstica uma caracterstica da populao. Ela pode ser quantitativa ou qualitativa, caso seja ou no numrica. As pesquisas realizadas para estudar nvel de instruo, religio ou preferncia musical so exemplos de variveis qualitativas. J as pesquisas que envolvem estatura, nmero de habitantes e idade so exemplos de variveis quantitativas.

2. Frequncias absolutas
Para obter uma informao clara e precisa de uma srie de dados estatsticos numricos, devemos primeiro orden-los. A essa ordenao chamamos de rol. Exemplo: 4, 5, 1, 6, 8, 5, 6, 5, 7, 1, 4, 6, 9, 6, 7, 5, 4, 2, 5, 4, 6, 5, 6, 4, 5, 6, 6, 3, 4, 8, 5, 6, 4, 5, 7, 4, 6, 5, 10, 6 Perguntamos, numa turma de 40 alunos, as notas que eles obtiveram numa prova de Matemtica. Recebemos como resposta as notas do quadro ao lado. O conjunto das notas obtidas na prova de Matemtica o que chamamos de dados estatsticos

numricos. Com esses dados, podemos deduzir algumas caractersticas: H apenas uma nota 10, nenhum 0 e muitas notas 5 e 6. Se ordenarmos as notas da maior para a menor, como na Figura 1, abaixo, podemos obter outras informaes:

A nota mais alta foi um 10 e somente uma das pessoas da classe a obteve. A nota mais baixa foi 1 e dois alunos a receberam. ' Dez pessoas receberam 5 e 11 obtiveram 6. Observamos que 10 alunos obtiveram nota 5 e que um recebeu um 10. De outra forma, podemos dizer que a nota 5 aparece com frequncia 10' e a nota 10, com frequncia 1'. Portanto: A frequncia absoluta de um resultado ou um dado o nmero de vezes que esse dado aparece. Podemos, agora, fazer uma tabela de duas colunas mostrando os dados e sua frequncia. esquerda, colocamos as notas e, direita, as frequncias absolutas respectivas:

Dados 1 2 3 4 5 6 7 8 9 10

Frequncia absoluta 2 1 1 8 10 11 3 2 1 1

Interpretao estatstica a frequncia de 1 2 a frequncia de 2 1 a frequncia de 3 1 a frequncia de 4 8 a frequncia de 5 10 a frequncia de 6 11 a frequncia de 7 3 a frequncia de 8 2 a frequncia de 9 1 a frequncia de 10 1

A soma das frequncias da tabela acima 40. Observe como esta cifra coincide com o nmero total de dados.

A soma de todas as frequncias absolutas o nmero total de elementos da populao, que indicado pela letra n.

3. Frequncia acumulada
A frequncia acumulada um dado igual soma das frequncias deste e a de todos os dados anteriores. Exemplo: Quantos alunos obtiveram nota abaixo de 5? Contamos o nmero de alunos que tiraram esta nota: 2 + 1 + 1 + 8 = 12 Agora nos perguntamos quantos alunos obtiveram uma nota menor ou igual a 7. 2 + 1 + 1 + 8 + 10 + 11 + 3 = 36 Para responder de maneira mais simples a esse tipo de pergunta (quantos alunos obtiveram uma nota menor ou igual a 7), vamos criar uma nova coluna correspondente da frequncia acumulada na tabela anterior de frequncias absolutas (Figura 1, abaixo). Utilizemos agora esta nova tabela nos seguintes exemplos:

Quantos alunos obtiveram uma nota abaixo de 7? 2 + 1 + 1 + 8 + 10 + 11 + 3 = 36 Quantos alunos mereceram uma nota menor do que 8? 36 Figura 1

4. Frequncias relativas
Chamamos de frequncia relativa de um dado ao quociente entre a frequncia com que o dado aparece (ou frequncia absoluta) e o nmero total de dados:

Como indica a Tabela de frequncias absoluta e acumulada:

A soma das frequncias absolutas 40: 2 + 1 + 1 + 8 + 10 + 11 + 3 + 2 + 1 + 1 = 40 A soma das frequncias relativas 40/40 = 1: 2/40 + 1/40 + 1/40 + 8/40 + 10/40 + 11/40 + 3/40 + 2/40 + 1/40 + 1/40 = 40/40 Dados 1 2 3 4 5 6 7 8 9 10 Frequncia absoluta 2 1 1 8 10 11 3 2 1 1 Frequncia relativa 2/40 = 0,050 1/40 = 0,025 1/40 = 0,025 8/40 = 0,200 10/40 = 0,250 11/40 = 0,275 3/40 = 0,075 2/40 = 0,050 1/40 = 0,025 1/40 = 0,025

Para lembrar:

A soma das frequncias relativas igual a 1, qualquer que seja o nmero total de observaes, pois a soma dos numeradores igual ao denominador comum.

5. Grficos
Comprovamos que as tabelas de frequncias dos dados estatsticos nos do uma informao boa e ordenada do exemplo que estudamos. Muitas vezes, no entanto, queremos ter uma viso generalizada e rpida. Por isso, os grficos estatsticos so muito teis para entender e comparar vrias tabelas de frequncias. Continuando com o mesmo exemplo empregado at aqui, vamos agora apresentar graficamente os dados. Podemos faz-lo de vrias formas. As mais comuns so: o diagrama de barras, o histograma, o pictograma e o grfico de sectores. Diagrama de barras ou colunas O diagrama de barras ou colunas utilizado na apresentao de variveis qualitativas. Ele composto por rectngulos dispostos verticalmente (em colunas) ou horizontalmente (em barras).

Caracteriza-se por ter todos os rectngulos de mesma largura e os comprimentos proporcionais s frequncias (Figura 2, abaixo). Exemplo:

seguinte grfico de colunas:

Figura 2 Histograma Os histogramas so diagramas de barras utilizados para variveis quantitativas. So formados por rectngulos justapostos. A frequncia correspondente a cada classe ou intervalo representada pela superfcie de um rectngulo, cuja base, situada no eixo horizontal, limitada pelos valores extremos. A altura de cada rectngulo proporcional frequncia de cada classe ou intervalo. Exemplo: Medimos a estatura dos 40 meninos e meninas da classe de nosso exemplo anterior. As medidas obtidas, em centmetros, como mostra a tabela abaixo so: Altura dos alunos em centmetros 168 160 168 175 175 160 165 154 163 165 168 168 158 149 160 161 162 166 163 159 178 169 158 163 171 170 165 150 167 164 162 165 163 156 174 165 173 172 168 168 Como as alturas so muito diferentes e quase no coincidem umas com as outras, vamos agruplas em intervalos. o que mostra a tabela abaixo:

Tabela de frequncias (I) Intervalo Frequncia de 148,5 a 153,5 2 de 153,5 a 158,5 4 de 158,5 a 163,5 11 de 163,5 a 168,5 14 de 168,5 a 173,5 5 de 173,5 a 178,5 4

Em seguida, representamos esses dados na Tabela de frequncias II, abaixo, e no histograma (Figura 3, abaixo). Tabela de frequncias (II) Intervalo Frequncia Altos de 168,5 a 178,5 9 Mdios de 158,5 a 168,5 25 Baixos de 148,5 a 158,5 6

Figura 3

Dado um histograma, se unirmos os pontos mdios das extremidades superiores de cada um dos rectngulos, obteremos uma linha poligonal chamada polgono de frequncias, como a Figura 4, abaixo:

Figura 4 Pictograma Outra forma de representar dados estatsticos o pictograma. Trata-se de um grfico em que so usados desenhos que tm relao directa com a rea que est sendo pesquisada. Na Figura 5, por exemplo, o pictograma indica a fabricao de veculos, em trs anos. Os pictogramas no so muito precisos e, por isso, so pouco utilizados pelos especialistas. Mas eles tm a vantagem de serem fceis de visualizar e muito simples de interpretar.

Figura 5 Grfico de reas ou grfico de sectores So grfico circulares, como o da Figura 6, abaixo, utilizados para representar determinada populao: Cada caracterstica dessa populao ocupa um sector circular do grfico, proporcional sua frequncia. Os grficos de sectores representam o conjunto de todos os dados expressos pela rea de um crculo. Esses grficos so bastante adequados quando os dados so classificados em poucas categorias. Costumam ser utilizados quando h poucos intervalos e so especialmente teis para se estabelecerem comparaes. Figura 6 Exemplo: Vamos comparar as estruturas do grupo de alunos (apresentadas anteriormente, no exemplo do item Histograma) distribudas em alunos altos, mdios e baixos. Dividimos os 360 graus do ngulo central do crculo proporcionalmente s frequncias. Como a soma das frequncias 40, faremos corresponder este nmero a 360 (Figura 6). frequncia dos altos correspondero: 360 X 9/40 = 81 (22,5%) frequncia dos mdios correspondero: 360 X 25/40 = 225 (62,5%) frequncia dos baixos correspondero: 360 X 6/40 = 54 (15%)

6. Estatsticas ajustadas e confiveis


Muita gente se pergunta se possvel que as estatsticas, mesmo ajustadas e apresentadas de acordo com um determinado interesse particular, continuem sendo confiveis. A resposta para essa questo positiva: as estatsticas podem continuar confiveis.

Vamos comprov-la com o seguinte caso: Exemplo: Um gerente de vendas de uma livraria resolve impressionar seu chefe para obter um aumento de salrio. Para tanto, elabora um grfico estatstico das vendas realizadas no ano anterior, como mostra a tabela abaixo. Vendas de livros no ano Meses do ano Volumes vendidos Janeiro 704 363 Fevereiro Maro Abril Maio Junho Julho Agosto Setembro Outubro Novembro Dezembro O resultado apresentado no grfico da Figura 7, abaixo: 707 450 710 300 714 250 722 600 725 230 730 750 736 125 740 875 743 500 747 248 749 100

Figura 7 O efeito visual desse grfico, com certeza, no tem muito impacto. Ele indica, ao contrrio do desejado, que as vendas permaneceram praticamente estveis durante todo o ano. Com ele, qualquer pretenso de aumento salarial no se justificaria.

Figura 8 Mas o gerente de vendas no se d por vencido. Ele faz um segundo grfico, usando os mesmos dados, que mostra uma imagem completamente diferente (Figura 8, acima). Esse grfico, sem dvida, muito mais favorvel aos seus interesses do que o anterior. E, embora ele apresente os dados de outra maneira (ampliando e focalizando apenas o espao de vendas entre 700 mil e 750 mil exemplares), no menos fiel realidade do que o grfico da Figura 6.

7. Medidas de posio central e de disperso


Uma das principais tarefas da Estatstica resumir, classificar e extrair o mximo de informaes de uma grande quantidade de dados. Os clculos que estudaremos a seguir so importantes instrumentos matemticos que permitem obter um conhecimento maior dos dados. Mdia aritmtica A mdia aritmtica de vrios nmeros obtida somando-se todos e dividindo a soma entre o total de dados. Ela representada por X.

Exemplo: As idades dos alunos de uma turma so:

Idades 10 11 12 14 15

Alunos 4 5 3 4 1

Calcule a idade mdia dos alunos dessa turma. 4 X 10 + 5 X 11 + 3 X 12 + 4 X 14 + 1 X 15 =

40 + 55 + 36 + 56 + 15 = 202 202/17 = 11,88 idade mdia = 11,88 anos Portanto, a idade mdia dos alunos : 11,88 anos Desvio de uma mdia Quando calculamos a mdia de vrios nmeros, pode acontecer de alguns clculos terem grandes desvios da mdia e outros apresentarem desvios mnimos. Como podemos medir esse grau de disperso? Uma das maneiras calcular o valor mdio e, outra, assinalar as diferenas entre cada um dos valores observados, em relao ao valor mdio. Quanto maior for essa diferena ou desvio da mdia, maior ser a disperso. Exemplo: As idades de 7 alunos de uma turma so: 15, 15, 14, 14, 14, 13 e 13 anos. A idade mdia desse grupo : 2 X 15 + 3 X 14 + 2 X 13 = 30 + 42 + 26 = 98 98/7 = 14 anos Idade mdia = 14 anos

As idades de um segundo grupo de alunos so: 16, 16, 15, 14, 13, 12 e 12 anos A idade mdia do grupo : 2 X 16 + 1 X 15 + 1 X 14 + 1 X 13 + 2 X 12 = 32 + 15 + 14 + 13 + 24 = 98 98/7 = 14 anos Idade mdia = 14 anos Quanto se desviam da mdia as idades de um e de outro grupo? As diferenas entre as idades do primeiro grupo e a mdia so: 1, 1, 0, 0, 0, 1 e 1. As diferenas entre as idades do segundo grupo e a mdia so: 2, 2, 1, 0, 1, 2 e 2.

Como no segundo grupo, as diferenas entre as idades em seus valores absolutos so maiores, as idades correspondentes apresentam um desvio maior em relao mdia. Portanto, no segundo grupo a disperso de idades maior. Por outro lado, as idades dos alunos do primeiro grupo esto mais concentradas nas proximidades da mdia. Para lembrar:

Quando conhecemos a mdia de uma distribuio e os desvios de cada um dos valores em relao a essa mdia, a soma desses desvios 0 (zero).

O clculo da disperso importante, j que nos permite estabelecer qual grupo mais ou menos homogneo. Mediana No caso da mdia, os valores extremos influem muito e podem produzir uma informao falsa. Portanto, torna-se necessrio introduzir outra medida: a mediana. Para lembrar:

Quando uma srie de nmeros est ordenada em forma crescente: n1 , n2, n3,..., nk, a mediana o valor que ocupa a posio central da srie disposta em ordem crescente ou decrescente. Exemplo: As notas dos alunos de uma classe so: 6, 5, 5, 7, 4, 6, 9, 0, 4, 6, 8, 7, 3, 5 e 8 Organizando essas notas em ordem crescente, temos: 0, 3, 4, 4, 5, 5, 5 7 notas 6 mediana 6, 6, 7, 7, 8, 8, 9 7 notas

Como achamos a mediana nas sries de dados de nmeros pares? 0, 4, 5, 5,5,6, 7, 8, 8, 9 Consideram-se os dois valores centrais e a mediana ser o valor mdio dos dois nmeros centrais:

Mediana = (5 + 6)/2 = 11/2 = 5,5

Moda Corresponde ao termo que tem maior frequncia numa srie de valores. Exemplo: Na srie de valores 0, 2, 5, 3, 3, 1, 2, 3, 0, 7, 3, 5 a moda 3, j que o nmero 3 tem maior frequncia, pois aparece 4 vezes. Varincia e desvio padro Como vimos anteriormente, a soma dos desvios de uma srie sempre ser igual a zero. Procurando contornar isso, os matemticos decidiram elevar ao quadrado cada um desses desvios. Para tanto, fizeram o clculo do valor mdio, acharam as diferenas entre os valores observados e o valor mdio (desvio). Finalmente, elevaram ao quadrado as diferenas obtidas e as somaram. Varincia Chama-se varincia ao quociente entre o valor desta soma (das diferenas obtidas entre os valores observados e o valor mdio, ou desvio, elevadas ao quadrado) e o nmero n de 2 elementos da srie, que indicada pela letra V ou pelo smbolo Portanto, a frmula :

A varincia tem um inconveniente: seu valor fica muito grande ou, ao contrrio, muito pequeno. Alm disso, a disperso dada no quadrado da unidade dos dados. Assim, para obter um dado na mesma unidade de medida, definiu-se uma outra medida de disperso: o desvio padro. Desvio padro O desvio padro a raiz quadrada do valor da varincia. Ele indicado por DP ou pela letra grega .

Portanto:

O desvio padro (DP) sempre um nmero positivo ou 0 (zero). Quando o DP = 0, no h disperso. Todos os valores esto concentrados no valor mdio. Quanto maior for o DP, maior ser a disperso. EXERCCIOS 1. Numa caixa, h 25 lpis de cor. O nmero de lpis de cada cor : 4 vermelhos, 3 azuis, 6 verdes, 7 amarelos e 5 castanhos. Assinalar o conjunto estatstico e completar a seguinte tabela: Varivel estatstica (cor) 1) 2) 3) 4) 5) Frequncia absoluta Frequncia relativa

2. O diagrama seguinte representa o que um grupo de 10 pessoas gasta mensalmente. Observe-o atentamente. Que tipo de diagrama este?

a) Quantas pessoas gastam 2500 euros por ms? b) Quantas pessoas gastam 2000 euros por ms? c) Quantas pessoas gastam 1200 euros por ms? d) Quantas pessoas gastam 700 euros por ms? 3. Os pesos, em quilogramas, de 13 jovens so: 51, 53, 49, 52, 50, 48, 54, 51, 49, 52, 53, 51 e 52. Calcular a mdia dos pesos e sua moda.

Você também pode gostar