Você está na página 1de 6

Sophia of Nature

Conhecimento poder!

Posted on 26/05/2013 by MarinhoLopes Anterior Seguinte

A Estatstica das Sondagens


Quando era pequeno ficava surpreendido por nas sondagens que mostravam na televiso
dizerem que tinham, por exemplo, 98% de certezas Como que eles sabem que tm essa
certeza? questionava-me eu, Para saberem isso teriam que comparar a amostragem
usada com a populao total, pensava eu.

Antes de responder a essa questo, vou dar um pequeno passeio sobre alguns conceitos
importantes da Matemtica envolvida.

Primeiro, comum haver alguma confuso entre probabilidades e estatsticas. De modo


simplificador, a estatstica obtm-se atravs de uma amostragem, enquanto que a
probabilidade pode ser calculada simplesmente conhecendo o problema. Por exemplo, se
quisermos saber a probabilidade de sair o nmero 1 no lanamento de um dado de 6 faces
numeradas, basta pensarmos nos casos possveis e favorveis (como explicado no artigo de
como calcular a probabilidade de ganhar o euromilhes): imediatamente chegamos ao
resultado 1/6. Contudo, se nos disserem que o dado est viciado e nos pedirem para estimar
a probabilidade de sair o nmero 1, como que fazemos? Recorremos estatstica:
lanamos vrias vezes o dado e contamos o nmero de vezes que sai cada um dos
nmeros. Se o dado no estivesse viciado, os nmeros deveriam sair mais ou menos o
mesmo nmero de vezes cada um, contando que lanssemos o dado um nmero suficiente
de vezes.

Com isto, chegmos chamada Lei dos Grandes Nmeros, que uma das leis
fundamentais nesta rea da Matemtica: se numa experincia h um dado evento que tem
uma probabilidade determinada de ocorrer, se repetirmos a experincia vrias vezes, a
frequncia com que o evento ir ocorrer ir tender para essa probabilidade. (A frequncia o
nmero de vezes que o evento ocorreu a dividir pelo nmero de vezes que se fez a
experincia.)

Jakob Bernoulli (1654-1705) foi o primeiro matemtico a descrever a Lei dos Grandes
Nmeros. Chamou-lhe o Teorema Dourado.

Um outro resultado importante da teoria de probabilidades tambm ele muito intuitivo,


principalmente para aqueles que j fizeram algum tipo de trabalho que envolvesse medidas.
Se a medida em causa importante, ento para nos assegurarmos que no cometemos um
erro, natural repetir a medio. A obteno do mesmo resultado vrias vezes d-nos uma
crescente confiana nesse resultado. Se por algum motivo se obtiverem vrios resultados
diferentes, intuitivamente escolhemos a mdia. A nvel industrial, muitos produtos vm com a
indicao da sua mdia, bem como da margem de erro (que pode ser estimada atravs das
medidas que fugiram mdia).

Se fizermos um histograma, ou seja, se contarmos o nmero de vezes que ocorreu cada


medida (num dado intervalo, por exemplo), obtemos um grfico deste gnero:
Para concretizar, imaginem que vos foi dada a tarefa de verificar se um dado vendedor de
gua no est a enganar os seus clientes, ao vender garrafes de supostamente 5 litros de
gua com apenas 4.9 litros de gua. Primeiro tm que obter uma amostragem aceitvel,
digamos 100 garrafes. Depois medem a quantidade de gua que cada garrafo tinha.
Finalmente, fazem o grfico (histograma): no eixo horizontal colocam, por exemplo: 4.7, 4.8,
4.9, 5.0, 5.1, 5.2, e depois metem uma coluna vertical cuja altura significa o nmero de vezes
que encontraram um garrafo com essa quantidade de gua. Se a coluna mais alta aparecer
nos 4.9 em vez de nos 5.0, h razes para acreditar que o vendedor de gua est de facto a
enganar os seus clientes. Caso no esteja a enganar, o histograma deveria ser semelhante
ao da figura de cima, centrado nos 5 litros. Quanto mais vezes a experincia fosse repetida,
e menores se fizessem as classes (ou seja, as divises da escala, no caso de cima a escala
era 0.1), ento as colunas deveriam aproximar-se da curva que se v na imagem de cima.
Esta curva chamada distribuio Normal, ou distribuio de Gauss.

E com isto chegmos ao resultado que eu falava, e que provavelmente um dos


fundamentos mais importantes em Estatstica: o Teorema do Limite Central.

Reformulando em linguagem um pouco mais tcnica, este teorema diz-nos que a soma de
vrias variveis independentes e identicamente distribudas (ou seja, as medidas tm que
ser naturalmente da mesma coisa e no podem depender umas das outras) tem uma
distribuio (cuja representao grfica pode ser um histograma) que se aproxima da
distribuio Normal. A aproximao tanto melhor quanto maior for o nmero de variveis
consideradas. (No caso do exemplo, trata-se de aumentar o nmero de garrafes.) Este
teorema foi postulado e posteriormente provado pelos matemticos Moivre, Laplace e
Lyapunov.
Carl Friedrich Gauss (1777-1855) foi um grandioso matemtico e fsico. As contribuies
estendem-se desde a geometria diferencial geofsica, passando pela teoria de nmeros
(provou, por exemplo, o teorema de ouro deixado por Euler), estatstica, electrosttica,
astronomia, ptica Qualquer estudante universitrio das reas de cincias e engenharias
j ter certamente usado o Mtodo dos Mnimos Desvios Quadrticos que foi criado por
Gauss quando este tinha 18 anos (embora Legendre tenha chegado ao mesmo resultado
independentemente, pela mesma altura). referido como o prncipe da Matemtica.

A distribuio Normal depende apenas de dois parmetros, a mdia e a varincia. A mdia


o valor no eixo horizontal que corresponde ao centro da curva, ao seu ponto mais alto. A
varincia qualifica o quanto os valores variam em relao mdia, ou seja, quanto maior for
a abertura da curva, maior a varincia, porque isso significa que houve uma maior
proporo de dados longe da mdia. Tudo o resto sempre igual a forma sempre a
mesma!

Voltando questo inicial, quando se faz uma sondagem, tem-se em mente todos estes
conceitos. No possvel calcular as probabilidades, contudo sabe-se atravs da Lei dos
Grandes Nmeros que quanto maior for a amostragem, a frequncia converge para um dado
valor aquele que corresponde ao de toda a populao. Esta convergncia no mais que
o facto de que o tal histograma se aproxima da curva da distribuio Normal medida que
se aumenta a amostragem. Se quisermos analisar, por exemplo, a estatura mdia da
populao adulta masculina mundial, poderemos considerar uma amostragem de alguns
milhares de sujeitos. H porm um aspecto muito importante para que esta amostragem seja
adequada: dever ser aleatria. Por exemplo, se a amostragem no for bem distribuda entre
pases, tal ir adulterar os resultados. Uma amostragem s com portugueses, por exemplo,
iria obviamente dar um valor inferior mdia mundial. A forma mais simples de garantir
aleatoriedade normalmente aumentar a amostragem, bem como tentar obt-la pesada
com as propores adequadas. No caso da amostragem para estimar a estatura mdia
global, naturalmente que se teria que ter um maior nmero de chineses do que de
portugueses, por exemplo: de preferncia a razo entre o nmero de chineses e portugueses
presentes na amostra deveria ser mais ou menos igual razo entre a populao chinesa
masculina adulta e a populao portuguesa masculina adulta.

Uma vez garantida a aleatoriedade, tem que se verificar que a amostra segue
aproximadamente uma distribuio Normal. Na suposio de que a distribuio de toda a
populao tambm Normal, possvel estimar qual a probabilidade de se estar a cometer
um erro ao se usar aquela amostra para caracterizar toda a populao. daqui que surgem
os referidos 98%, por exemplo. (O clculo tambm pode ser feito ao contrrio, isto , a
dimenso da amostra -nos imposta pelo nvel de confiana que queremos obter no
resultado.)
Marinho Lopes

PAR TI LH AR I STO :

Seja o primeiro a gostar disto.

RE LA C IO NA D O

A Lei de Bayes Probabilidade de ganhar o A Falsa Cincia Parte II


Milhes

This entry was posted in Matemtica and tagged aleatrio, amostra, amostragem, Bernoulli, distribuio
Gauss, distribuio Normal, estatstica, Gauss, Laplace, Lei dos Grandes Nmeros, Lyapunov, Moivre,
probabilidade, Teorema do Limite Central by MarinhoLopes. Bookmark the permalink.

About MarinhoLopes
Doutor em Fsica terica | Contacto: m.lopes @ exeter.ac.uk | Pgina pessoal:
http://malopes.yolasite.com
View all posts by MarinhoLopes

5 THOUGHTS ON A ESTATSTICA DAS SONDAGENS

Pingback: Paradoxos da Razo Parte V | Sophia of Nature

Pingback: O Fascnio dos Nmeros Parte III | Sophia of Nature

Pingback: A Falsa Cincia Parte II | Sophia of Nature


Pingback: ndice de Artigos | Sophia of Nature

Pingback: A Lei de Bayes | Sophia of Nature

Deixe uma Resposta

Create a free website or blog at WordPress.com.