Embora muitos no gostem de qualquer definio, a de Fisher satisfaz: ramo da matemtica aplicada, dedicado anlise de dados e de observao. A palavra estatstica, alm disso, usada para descrever os prprios dados. Essa dupla significao do termo, ora para falar do ramo da matemtica, ora para definir um conjunto de dados numricos, gera confuso algumas vezes.
DADOS E INFORMAO
Os dados brutos devem ser processados para que se tornem informaes. Antes disso, eles parecem no ter sentido, tendendo a confundir ao invs de esclarecer. Com o processamento, a quantidade de detalhes reduzida, facilitando a constatao das relaes. Os dados so condensados e transformados em grficos, mapas e nmeros simplificados, tudo isso facilitando a compreenso do essencial.
POPULAO
Populao ou universo o conjunto da totalidade dos indivduos sobre o qual se faz uma inferncia. Inferncia, em estatstica, o ato de analisar e tirar concluses. Por indivduos entende-se os elementos ou objetos sob anlise. A populao pode ser finita ou infinita - nmero de medidas de pesos de uma mesma pessoa para determinar a distribuio das medidas, por exemplo. Na maioria dos casos, antieconmico ou impraticvel examinar toda a populao, por isso usa-se uma amostra. Em outros casos, a coleta do dado destri o objeto - testes com cintos de segurana, por exemplo.
AMOSTRA
Amostra um subconjunto da populao. A partir da amostra, faz-se juzo ou inferncia sobre as caractersticas da populao. Estas caractersticas da populao so denominadas parmetros. Uma aplicao interessante na rea de sade so os chamados grupos experimentais e de controle. Num so aplicados medicamentos e no outro um falso medicamento, sabidamente incuo, para que os 11 indivduos no saibam a qual grupo pertencem. Os dois grupos amostrais so acompanhados a fim de que se obtenha resultados conclusivos.
RAMOS DA ESTATSTICA
ESTATSTICA DESCRITIVA
a parte da estatstica que utiliza nmeros para descrever fatos. Compreende a organizao, resumo e simplificao de informaes que podem ser muito complexas. Lana mo de tabelas e grficos para atingir esses objetivos.
TEORIA DA PROBABILIDADE
o ramo da estatstica que trabalha com o acaso. Situaes que envolvam lanamento de moedas, jogos de cartas, dados, enfim, quaisquer situaes onde no exista relao causal, ou mesmo que ela exista, no seja conveniente valer-se dela.
INFERNCIA
a parte da estatstica que analisa e interpreta os dados amostrais. A idia analisar parte da populao que seja tpica e a partir da concluir sobre toda a populao. Experimentar um doce e colocar o dedo na gua quente so exemplos de amostragens que permitem boas inferncias sobre o gosto e temperatura, respectivamente. Uma parte importante da estatstica a que d a segurana de que a as concluses tiradas da populao a partir da amostra so vlidas.
TIPOS DE DADOS Os dados selecionados como de interesse da estatstica e que admitem certa variabilidade so chamados de variveis. Estas variveis originam-se de dados de diversos tipos:
1.1 CONTNUOS Podem assumir qualquer valor em um intervalo contnuo. Peso, mdia de consumo de combustvel, etc...
1.2 DISCRETOS Podem assumir apenas valores determinados, normalmente inteiros. Nmero de alunos em aula, quantidade de acidentes em uma cidade, etc..
1.3 NOMINAIS Os dados so divididos em categorias e contados os elementos. Como nesse caso os dados no so numricos, mas qualitativos, as variveis so denominadas atributos. Sexo (masculino ou feminino) de um grupo de pessoas e conceitos (timo, bom, regular, ruim) em provas so 12 exemplos de dados nominais. Por vezes, os alunos tm alguma dificuldade em distingui-los dos dados discretos pelo fato de ambos serem inteiros. L, a varivel discreta pode assumir qualquer valor inteiro; aqui, a varivel, que um atributo, recebe valores inteiros, frutos de contagens.
1.4 ORDINAIS Dados ordinais ou por postos, como so denominados muitas vezes, so valores relativos atribudos para denotar ordem - classificao em concurso, de preos, etc...
ETAPAS DO MTODO ESTATSTICO
1. DEFINIO DO PROBLEMA Certificar-se claramente da finalidade do estudo ou anlise e, a partir da, definir cuidadosamente o problema. til examinar outros levantamentos sobre o mesmo assunto ou similares, pois isso pode simplificar ou orientar a pesquisa.
2. PLANEJAMENTO Essa fase consiste em determinar o procedimento necessrio para resolver o problema. Definir os dados a serem obtidos. Como obt-los? Escolher as perguntas e o modo de formul-las para no tornar a pesquisa tendenciosa. O levantamento pode ser censitrio, em que todo o universo contado, ou pode ser amostral, quando devem ser tomados cuidados para que se permita inferir os parmetros da populao.
3. COLETA DE DADOS a parte operacional. Consiste em obter, reunir e registrar os dados de forma sistemtica.
TIPOS DE FONTES PRIMRIAS - quando os dados so recolhidos para o trabalho. SECUNDRIAS - quando colhidos em outro contexto. Nesse caso, os dados devem ser usados com cautela, pois esto sujeitos a algumas limitaes.
MODOS DE COLETA DIRETA - quando obtida diretamente da fonte. Pode ser contnua, peridica ou ocasional. INDIRETA - quando inferida a partir de outros dados. Pode ser realizada por analogia, por proporcionalizao, por indcios ou por avaliao.
4. APURAO DOS DADOS a fase de sumarizao dos dados, mediante contagem e agrupamento. um trabalho de condensao e de tabulao. A apurao pode ser manual, mecnica, eletromecnica e eletrnica.
5. APRESENTAO DOS DADOS TABULAR a apresentao numrica dos dados atravs de tabelas. Fornece informao quantitativa e organizada.
GRFICA a apresentao geomtrica dos dados. Fornece uma viso rpida de conjunto.
6. ANLISE E INTERPRETAO DOS DADOS nessa fase que so tiradas as concluses que auxiliam o pesquisador a resolver o problema. Da saem os nmeros que resumem as concluses, as chamadas estatsticas. Se o trabalho for realizado sobre amostras e no sobre toda a populao, a generalizao para o universo possvel atravs da Estatstica Indutiva ou Inferncia Estatstica.
EMBASAMENTO MATEMTICO ELEMENTOS DA DISTRIBUIO FREQNCIA SIMPLES ABSOLUTA Numa distribuio de frequncias, sejam os dados agrupados em classes ou em valores individuais, o nmero de observaes em cada classe ou valor chamada de frequncia simples absoluta, ou mesmo frequncia, cujo smbolo fj. . No exemplo acima a coluna da direita nas duas tabelas, que por serem diferentes, apresentam valores diferentes para fj.
AMPLITUDE TOTAL a diferena entre o maior e o menor valor da varivel em estudo. Cuidado: a diferena da varivel e no da frequncia. No exemplo acima o menor valor 0 e o maior 9. Portanto:
NMERO DE CLASSES Classe cada um dos grupos de valores em que se subdivide a amplitude total. O nmero de classes de uma distribuio de frequncias, representado pela letra k, deve ser adequado. Se for muito pequeno, os dados ficam comprimidos e pouco se v da distribuio e se, por outro lado, for muito grande, aparecero classes com baixa frequncia, tornando a distribuio irregular. Aconselha-se um nmero de classes entre 5 e 20 e uma primeira boa aproximao que este nmero deve ser da ordem da raiz quadrada do nmero total n de observaes. Entretanto, dois mtodos so indicados na literatura como mais indicados para a determinao do nmero de classes. A escolha real deve ficar prxima aos valores indicados por qualquer um dos mtodos.
REGRA DE STURGES O nmero de classes k igual frmula abaixo em que n o nmero total de observaes.
TABELA DE KELLEY Ela d uma relao aproximada e adequada entre n e k:
LIMITES DE CLASSE Os limites de classe so seus valores extremos. No exemplo acima, os limites da 3 classe so 4 e 5, quatro sendo o limite inferior e cinco o superior. A classe seguinte, a quarta, tem por limites 6 e 7. Esse caso simples porque a varivel discreta, pois representa o nmero de atendimentos que sempre um inteiro. Mas se fosse uma varivel contnua que pudesse valer 5,7, por exemplo, como ficaria? Por esse motivo, conveniente definir os limites reais de classe e um modo mais conveniente de estabelecer os limites de classe.
LIMITES REAIS DE CLASSE Qualquer valor intermedirio entre os limites de classes distintas deve se arredondado para definir a que classe pertence. Na situao apresentada, 5,7 deve ser arredondado para 6, indo para a quarta classe, portanto. Assim, o limite real de classe definido como a mdia do limite superior de uma classe e o inferior da seguinte. Na determinao da amplitude total, para maior preciso, deve-se adotar os limites reais inferior da primeira classe e superior da ltima classe.
INTERVALOS DE CLASSE Para evitar essa dificuldade usa-se o conceito de intervalo de classe aberto ou fechado. Os valores dos limites superior e inferior de classes subsequentes so iguais, mas explicitado a qual das duas classes o limite pertence. O smbolo significa intervalo fechado esquerda e aberto direita, ou seja, o limite inferior da classe est includo nela , enquanto o superior no. Admitindo que XE e XD sejam os limites de uma classe, as alternativas de intervalo so apresentadas abaixo:
AMPLITUDE DE CLASSE Para se determinar o intervalo de classe Ac , basta dividir a amplitude total At pelo nmero de classes k. A amplitude de classe deve ser sempre arredondada para maior, nunca para menor, sob pena de algum dado ficar fora do campo da tabela.
PONTO MDIO DA CLASSE Ponto mdio da classe xj a mdia dos limites inferior e superior da classe. Uma vez conhecido o ponto mdio de uma classe, pode-se encontrar o da classe seguinte, se elas forem do mesmo tamanho. As frmulas so as seguintes: