Você está na página 1de 11

ESTATÍSTICA

Estatística

Estatística é a ciência que utiliza-se das teorias probabilísticas para explicar a frequência da
ocorrência de eventos,[1] tanto em estudos observacionais quanto em experimentos
para modelar a aleatoriedade e a incerteza de forma a estimar ou possibilitar a previsão de fenômenos
futuros, conforme o caso.

A estatística é uma ciência que se dedica à coleta, análise e interpretação de dados. Preocupa-se com
os métodos de recolha, organização, resumo, apresentação e interpretação dos dados, assim como
tirar conclusões sobre as características das fontes donde estes foram retirados, para melhor
compreender as situações.

Algumas práticas estatísticas incluem, por exemplo, o planejamento, a sumarização e a interpretação


de observações. Dado que o objetivo da estatística é a produção da melhor informação possível a
partir dos dados disponíveis, alguns autores sugerem que a estatística é um ramo da teoria da decisão.

Devido às suas raízes empíricas e seu foco em aplicações, a estatística geralmente é considerada uma
disciplina distinta da matemática, e não um ramo dela.

Etimologia

O termo "estatística" surge da expressão em latim statisticum collegium palestra sobre os assuntos
do Estado, de onde surgiu a palavra em língua italiana statista, que significa "homem de estado",
ou político, e a palavra alemã Statistik, designando a análise de dados sobre o Estado. A palavra foi
proposta pela primeira vez no século XVII, em latim, por Schmeitzel na Universidade de Jena e
adotada pelo acadêmico alemão Godofredo Achenwall. Aparece como vocabulário na Enciclopédia
Britânica em 1797, e adquiriu um significado de coleta e classificação de dados, no início do século
XIX.

De acordo com a Revista do Instituto Internacional de Estatística, Cinco homens, Hermann


Conring, Gottfried Achenwall, Johann Peter Süssmilch, John Graunt e William Petty já receberam a
honra de serem chamados de fundadores da estatística por diferentes autores.[4]

Alguns autores dizem que é comum encontrar como marco inicial da estatística a publicação
do "Observations on the Bills of Mortality" (Observações sobre os Censos de Mortalidade, 1662) de
John Graunt. As primeiras aplicações do pensamento estatístico estavam voltadas para as
necessidades de Estado, na formulação de políticas públicas, fornecendo
dados demográficos e econômicos. A abrangência da estatística aumentou no começo do século XIX
para incluir a acumulação e análise de dados de maneira geral. Hoje, a estatística é largamente
aplicada nas ciências naturais, e sociais, inclusive na administração pública e privada.

Seus fundamentos matemáticos foram postos no século XVII com o desenvolvimento da teoria das
probabilidades por Pascal e Fermat, que surgiu com o estudo dos jogos de azar. O método dos
mínimos quadrados foi descrito pela primeira vez por Carl Friedrich Gauss, aproximadamente no ano
de 1794. O uso de computadores modernos tem permitido a computação de dados estatísticos em
larga escala e também tornaram possível novos métodos antes impraticáveis.

Fundamentos

Ligações para estatística observacional fenômeno são coletados pelos fenômenos estatísticos.

• Estatística inferencial é o conjunto de técnicas utilizadas para identificar relações entre variáveis que
representem ou não relações de causa e efeito;

• Estatística robusta é o conjunto de técnicas utilizadas para atenuar o efeito de outliers e preservar a
forma de uma distribuição tão aderente quanto possível aos dados empíricos.

A estatística não é uma ferramenta matemática que nos informa sobre o quanto de erro nossas
observações apresentam sobre a realidade pesquisada. A estatística baseia-se na medição do erro
que existe entre a estimativa de quanto uma amostra representa adequadamente a população da qual
foi extraída. Assim o conhecimento de teoria de conjuntos, análise combinatória e cálculo são

WWW.DOMINACONCURSOS.COM.BR 1
ESTATÍSTICA

indispensáveis para compreender como o erro se comporta e a magnitude do mesmo. É o erro (erro
amostral) que define a qualidade da observação e do delineamento experimental.

A faceta dessa ferramenta mais palpável é a estatística descritiva. A descrição dos dados coletados é
comumente apresentado em gráficos ou relatórios e serve tanto a prospecção de uma ou mais
variáveis para posterior aplicação ou não de testes estatísticos bem como a apresentação de
resultados de delineamentos experimentais.

Nós descrevemos o nosso conhecimento de forma matemática e tentamos aprender mais sobre aquilo
que podemos observar. Isto requer:

• O planejamento das observações por forma a controlar a sua variabilidade (concepção do


experimento);

• Sumarização da coleção de observações;

• Inferência estatística - obter um consenso sobre o que as observações nos dizem sobre o mundo que
observamos.

Em algumas formas de estatística descritiva, nomeadamente mineração de dados (data mining), os


segundo e terceiro passos tornam-se normalmente mais importantes que o primeiro.

A probabilidade de um evento é definida como um número entre zero e um.

Normalmente aproximamos a probabilidade de alguma coisa para cima ou para baixo porque elas são
tão prováveis ou improváveis de ocorrer, que é fácil de reconhecê-las como probabilidade de um ou
zero. Entretanto, isso pode levar a desentendimentos e comportamentos perigosos, porque é difícil
distinguir entre, uma probabilidade de 10−4 e uma de 10−9, a despeito da grande diferença numérica
entre elas. Por exemplo, se você espera atravessar uma estrada 105 ou 106 vezes na sua vida, definir o
risco de atravessá-la em 10−9 significa que você está bem seguro pelo resto da sua vida. Entretanto,
um risco de 10−4 significa que é bem provável que você tenha um acidente, mesmo que intuitivamente
um risco de 0,01% pareça muito baixo.

Estatística Computacional

O crescimento rápido e sustentados no poder de processamento dos computadores a partir da


segunda metade do século XX teve um forte impacto na prática da estatística. Os modelos estatísticos
mais antigos eram quase sempre lineares, mas os computadores modernos, junto
com algoritmos numéricos apropriados, causaram um aumento do interesse nos modelos não-
lineares (especialmente redes neurais e árvores de decisão) assim como na criação de novos tipos,
como o modelo linear generalizado e o modelo multi-nível.

O aumento na capacidade de computação também tem levado à popularização de métodos que


demandam muitos cálculos baseados em reamostragem (em inglês e no jargão do meio resampling),
como testes de permutação e bootstrap, enquanto técnicas como a amostragem de Gibbs tem feito
com que os métodos de Bayes fiquem mais fáceis. A revolução informática também tem levado a um
aumento na ênfase na estatística "experimental" e "empírica". Um grande número de softwares
estatísticos, de uso tanto geral como específico estão disponíveis no mercado.

A Estatística é o ramo da Matemática responsável por métodos e técnicas de pesquisa envolvendo


experimentos, coleta de dados, processamento, representações gráficas, análise e divulgação das
informações.

O crescente aperfeiçoamento e desenvolvimento da estatística no decorrer da história sempre visaram


à melhora nos processos de obtenção e recolhimento de informações, permitindo o estudo adequado
de diversos fenômenos, fatos, eventos e ocorrências nas diversas áreas do conhecimento humano.
Portanto, a estatística tem como objetivo principal fornecer ferramentas que ao serem utilizadas
permite lidarmos com situações sujeitas a incertezas.

Os povos da Antiguidade utilizavam das técnicas estatísticas a fim de obter informações sobre o
número de habitantes, riquezas, casos de doenças, entre outras situações que levassem ao
enfraquecimento do poderio militar dos povos. Os governantes passaram a realizar pesquisas

WWW.DOMINACONCURSOS.COM.BR 2
ESTATÍSTICA

estatísticas referentes às variáveis econômicas: comércio, alimentos, produção de bens, exportações


de produtos entre outras.

No Brasil, órgãos como o IBGE (Instituto Brasileiro de Geografia e Estatística) e instituições como a
FGV (Fundação Getúlio Vargas) têm por objetivo a coleta, análise e divulgação de informações
relacionadas ao meio político, econômico, social, segurança, educacional, saúde e diversos ramos da
sociedade.
Os levantamentos estatísticos são divulgados em jornais, Internet, noticiários de televisão e revistas,
comumente possuem relação direta com a vida das pessoas, pois envolvem temas relacionados a
hábitos da população em geral.

O estatístico é um especialista no ramo da matemática voltado para a coleta, a análise e a


interpretação de dados numéricos no estudo de fenômenos naturais, econômicos e sociais.

Ele planeja e coordena o levantamento de informações por meio de questionários, entrevistas,


medições e análise desses dados. Organiza, analisa e interpreta os resultados para explicar
fenômenos sociais, econômicos ou naturais, e ajudar na tomada de decisões em empresas públicas e
privadas. Monta banco de dados para os mais diversos usos.

Na indústria, acompanha testes de qualidade e ajuda a fazer a previsão de vendas com base em
modelos matemáticos.

Em teoria das probabilidades e estatística, a função densidade de probabilidade (FDP),


ou densidade de uma variável aleatória contínua, é uma função que descreve a probabilidade relativa
de uma variável aleatória tomar um valor dado. A probabilidade da variável aleatória cair em uma faixa
particular é dada pela integral da densidade dessa variável sobre tal faixa - isto é, é dada pela área
abaixo da função densidade mas acima do eixo horizontal e entre o menor e o maior valor dessa faixa.
A função densidade de probabilidade é não negativa sempre, e sua integral sobre todo o espaço é
igual a um. A função densidade pode ser obtida a partir da função distribuição acumulada a partir da
operação de derivação (quando esta é derivável).

Se uma variável aleatória tem densidade dada por f(x), então o intervalo infinitesimal [x, x+dx]
tem probabilidade f(x) dx. Formalmente, a função densidade de probabilidade (ou fdp), denotada
por fx(x), de uma variável aleatóriacontínua X é a função que satisfaz

Os termos função distribuição de probabilidade e função de probabilidade por vezes foram sido
utilizados para denotar a função de densidade de probabilidade. No entanto, esse uso não é padrão
entre estatísticos. Em outras fontes, função de distribuição de probabilidade pode ser utilizado quando
a distribuição de probabilidade é definida como uma função sobre conjuntos de valores, ou pode referir-
se a função distribuição acumulada, ou ainda pode ser uma função massa de probabilidade (FMP), em
vez de densidade. Existem outras confusões da terminologia porque função densidade também tem
sido usado para o que é aqui chamado de função massa de probabilidade (FMP). Em geral, porém, a
FMP é usada no contexto de variáveis aleatórias discretas (variáveis aleatórias que tenham valores de
um conjunto discreto), enquanto FDP é usado no contexto de variáveis aleatórias contínuas.

Exemplo

Suponhamos que uma espécie de bactérias normalmente vive por 4 a 6 horas. Qual é a probabilidade
de que uma bactéria viva exatamente 5 horas? A resposta é de 0%. Muitas bactérias vivem
por aproximadamente 5 horas, mas não há nenhuma chance de que qualquer bactéria morra
em exatamente 5.000000000 horas.

Em vez disso, poderíamos perguntar: qual é a probabilidade de que a bactéria morra entre 5 horas e
5,01 horas? Vamos dizer que a resposta é de 0,02 (ou seja, 2%). A seguir: qual é a probabilidade de
que a bactéria morra entre 5 horas e 5.001 horas? A resposta é provavelmente em torno de 0,002, uma
vez que este é um décimo do intervalo anterior. A probabilidade de que a bactéria morre entre 5 horas
e 5.0001 horas é provavelmente cerca de 0,0002, e assim por diante.

Nestes três exemplos, a relação (probabilidade de morrer durante um intervalo)/(período de duração do


intervalo) é aproximadamente constante, e igual a 2 por hora (ou 2 horas-1). Por exemplo, há uma
probabilidade de 0,02 de morte no intervalo de 0,01 horas entre 5 e 5,01 horas, e (0,02 de

WWW.DOMINACONCURSOS.COM.BR 3
ESTATÍSTICA

probabilidade / 0,01 horas) = 2 horas-1. Esta quantidade de 2 horas-1 é chamada de densidade de


probabilidade para a morte em cerca de 5 horas.

Portanto, em resposta à pergunta qual é a probabilidade de que a bactéria morra em 5 horas?, a


resposta literalmente correta, mas inútil, é 0, mas uma melhor resposta pode ser escrita como (2 horas-
1
) dt. Esta é a probabilidade de que a bactéria morra dentro de um pequeno (infinitesimal) a janela de
tempo de cerca de 5 horas, onde dt é a duração da janela.

Por exemplo, a probabilidade de que ela viva por mais do que 5 horas, mas menos do que (5 horas + 1
nanossegundo), é (2 horas-1) x (1 nanosegundo) ≃ 6 × 10-13 (usando a conversão de unidade 3,6 ×
1012 nanossegundos = 1 hora).

Existe uma função de densidade de probabilidade com f sendo f (5 horas) = 2 horas-1.


A integral de f sobre qualquer janela de tempo (não apenas janelas infinitesimais, mas também grandes
janelas) é a probabilidade de que a bactéria morra nessa janela.

Diferença entre "função de probabilidade" e "função densidade de probabilidade"

O conceito de "função densidade de probabilidade" é muito semelhante ao conceito de "função de


probabilidade", que serve para o caso de variáveis aleatórias discretas. No entanto, é preciso entender
bem a diferença entre eles.

Uma variável aleatória discreta tem um número definido de possíveis ocorrências. Por exemplo,
a variável aleatória "resultado de um dado" tem apenas 6 possíveis ocorrências: 1,2,3,4,5 e 6. Por isso,
a função de probabilidade a ela associada também só pode assumir 6 valores (1/6 cada uma, se o
dado não for viciado), que necessariamente somarão 1.

Uma variável aleatória contínua, ao contrário, tem um número infinito de ocorrências. Por exemplo,
a variável aleatória "idade de cada empregado de uma empresa" pode assumir infinitos valores, por
exemplo 18,1 anos, 18,23 anos, 20,341 anos, 30,3167 anos etc. Por isso, se simplesmente tentarmos
calcular p(x=x) como faz uma função de probabilidade para uma variável aleatória discreta,
chegaremos ao seguinte:

Ou seja, a probabilidade de a variável aleatória contínua X assumir um determinado valor x é zero. Por
isso, a "função densidade de probabilidade" não trabalha com valores pontuais, e sim com intervalos
infinitesimais - ela informa a probabilidade de a variável X assumir um valor naquele intervalo.

No caso univariado contínuo acima, a medida de referência é a medida de Lebesgue. A função massa
de probabilidade de uma variável aleatória discreta é a densidade no que diz respeito à medida
contável sobre o espaço da amostra (normalmente o conjunto de números inteiros, ou um subconjunto
dos mesmos).

Note-se que não é possível definir uma densidade referindo a uma medida arbitrária (por exemplo, não
se pode escolher a medida contável como uma referência para uma variável aleatória contínua). Além
disso, quando ela existe, a densidade é em quase todos os lugares únicas.

Nem toda distribuição de probabilidade tem uma função densidade: as distribuições de variáveis
aleatórias discretas não possuem; nem a distribuição de Cantor, mesmo ela não tendo qualquer
componente discreto, isto é, não atribui probabilidade positiva para qualquer ponto individual.

Se uma distribuição de probabilidade admite uma densidade, então a probabilidade de cada conjunto
de um ponto {a} é zero; o mesmo vale para conjuntos finitos e contáveis.

Duas densidades de probabilidade f e g'’ representam precisamente a mesma distribuição de


probabilidade se eles diferem apenas em um conjunto com medida de Lebesgue zero.

WWW.DOMINACONCURSOS.COM.BR 4
ESTATÍSTICA

No campo da física estatística, uma reformulação não formal da relação acima entre a derivada da
função distribuição acumulada e a função densidade de probabilidade é geralmente utilizada como a
definição da função densidade de probabilidade.

Ligação Entre Distribuições Discretas E Contínuas

É possível representar certas variáveis aleatórias discretas, bem como variáveis aleatórias que
envolvem tanto uma parte contínua e uma parte discreta com uma função densidade de probabilidade
generalizada, usando a função delta de Dirac. Por exemplo, considere uma variável aleatória discreta
binária tendo uma distribuição de Rademacher – isto é, assumindo valores −1 ou 1, com probabilidade
½ cada.

Isso unifica substancialmente o tratamento de distribuições de probabilidade discretas e contínuas. Por


exemplo, a expressão acima permite determinar características estatísticas de uma variável discreta
(tais como a sua média e variância), a partir das fórmulas dadas para uma distribuição contínua da
probabilidade.

Famílias De Densidades

É comum para funções densidade de probabilidade (e funções massa de probabilidade) serem


parametrizadas, isto é, serem caracterizadas por parâmetros não especificados. Por exemplo, a
distribuição normal é parametrizada em termos da média e da variância, denotada, É importante ter em
mente a diferença entre o domínio de uma família de densidades e os parâmetros da família.
Diferentes valores dos parâmetros descrevem diferentes distribuições de diferentes variáveis aleatórias
no mesmo espaço de amostra (o mesmo conjunto de todos os valores possíveis da variável); este
espaço de amostra é o domínio da família de variáveis aleatórias que esta família de distribuições
descreve. Um determinado conjunto de parâmetros descreve uma única distribuição dentro da família
compartilhando a forma funcional da densidade. Do ponto de vista de uma dada distribuição, os
parâmetros são constantes e termos de uma função densidade que contêm apenas os parâmetros,
mas não variáveis, são partes do fator de normalização de uma distribuição (o fator multiplicativo que
garante que a área sob a densidade - a probabilidade de algo no domínio ocorrer - é igual a 1). Este
fator de normalização é fora do kernel da distribuição.

Uma vez que os parâmetros são constantes, re parametrizar uma densidade em termos de diferentes
parâmetros, para se obter uma caracterização de uma variável aleatória diferente na família, significa
simplesmente substituir os novos valores de parâmetros para a fórmula em lugar dos antigos. Alterar o
domínio de uma densidade de probabilidade, no entanto, é mais complicado e exige mais trabalho:
consulte a seção abaixo sobre a mudança de variáveis.

Uma estatística é uma função (qualquer) das variáveis observáveis que não contém qualquer
parâmetro desconhecido.

Mais formalmente, a Teoria Estatística define uma estatística como uma função de uma amostra em
que a função por si mesma é independente da distribuição que gerou a amostra.

Este termo é utilizado usualmente tanto para a função quanto para o particular valor numérico da
função aplicada a uma dada amostra observada.

Uma estatística não representa o mesmo conceito que um parâmetro estatístico, que não é calculável
da amostra. Por exemplo, a média amostral é uma estatística, enquanto que a média de uma
população é um parâmetro. Em geral utiliza-se um estimador (caso particular de estatística) para
chegar num valor numérico que estima um parâmetro. No exemplo anterior, o estimador para a média
da população é a média amostral.

A palavra estatística é do latim e significa “estado”. Este termo provém do primeiro uso da estatística
eu tinha como função o registro de dados (nº de habitantes da população, nº de casamentos...) e a
elaboração de tabelas e gráficos para descrever resumidamente um determinado país em números.

Passado muito tempo a estatística evoluiu, tornando-se uma ampla e complexa ciência, tirando
conclusões sobre o conjunto todo a partir de amostras representativas.

Uma boa definição de estatística é a de ser um conjunto de métodos especialmente apropriados à

WWW.DOMINACONCURSOS.COM.BR 5
ESTATÍSTICA

coleta, à apresentação (organização, resumo e descrição), à análise e à interpretação de dados de


observação, tendo como objetivo a compreensão de uma realidade específica para a tomada da
decisão.

Mais precisamente a estatística se preocupa com:

-A coleta, a organização, a sintetização e a apresentação de dados;

-A medição da variação nos dados e levantamento de dados;

-A estimativa dos parâmetros da população e a determinação da precisão das estimativas;

-A aplicação dos testes de hipótese em relação aos parâmetros;

-A análise da relação entre duas ou mais variáveis.

A estatística trabalha com dois conjuntos de dados: o universo e a amostra. Apesar de a estatística se
preocupar em obter informações sobre a população, dificilmente ela estuda todos os componentes da
mesma (censo).

Não existem estatísticas especiais, como bioestatística e estatística econômica, mas sim aplicações
específicas de estatística em determinadas áreas, o que leva a dividir a estatística especificamente
para questões didáticas.

A Estatística Pode Ser Dividida Em Duas:

-Estatística descritiva: é a parte que procura os melhores métodos para coletar, ordenar e sumarizar os
dados dos experimentos.

-Estatística experimental: é a parte que fornece os métodos de análise e interpretação dos resultados
dos experimentos.

Distribuições estáveis paretianas têm propriedades atraentes para modelagem empírica em finanças,
porque incluem a distribuição normal como um caso especial, mas também pode permitir caudas mais
pesadas e assimetria.

Uma razão principal para a pouca utilização dessa distribuição em trabalhos acadêmicos aplicados é
devido ao fato de que, em geral, não há expressão de "forma fechada" para a a função de densidade
de probabilidade, e que as aproximações numéricas computacionais são não-triviais e
computacionalmente extensivas.

Nesse post vou mostrar como é possível calcular a função densidade de probabilidade via Fast-Fourier
Transform (FFT).

O trabalho original sobre esse assunto foi produzido por Mittnik, Doganoglu e Chenyao (1999).

A Distribuição Alfa-Estável.

A distribuição alfa-estável, em geral, não possui expressão analítica para sua função densidade de
probabilidade (f.d.p) ou ainda para a sua função distribuição acumulada (f.d.a), mas pode ser escrita
por meio de sua função característica (Rachev e Mittnik, 2000 ):

onde é o expoente da distribuição ou índice de cauda, é o parâmetro de


assimetria, é o parâmetro de escala e é o parâmetro de locação, a função é dada
por:

__________________________________________________________________________________

__________________________________________________________________________________

WWW.DOMINACONCURSOS.COM.BR 6
ESTATÍSTICA

A distribuição alfa-estável representada acima e definida pela notação é denominada


parametrização segundo Nolan (2010).

A função densidade de probabilidade pode ser aproximada utilizando o método FFT (Fast Fourier
Transform) o qual é computacionalmente eficiente e permite um processo de aproximação mais rápido
do que expansão por séries (Bergström, 1952) ou integração direta (Nolan, J. P., 2001. Maximum
likelihood estimation of stable parameters. Manuscrito não publicado.).

Segundo Durrett (2010) página 106 uma função densidade de probabilidade pode ser escrita
pela Transformada de Fourier da função característica, em outras palavras:

A integral acima pode ser calculada para pontos igualmente espaçados com distância e soma
resultante pode ser computada por meio do método FFT (Fast Fourier Transform). Mittnik e Doganoglu
(1999) sugerem que os valores de e devem ser respectivamente e para que uma
boa aproximação seja possível.

A distribuição normal conhecida também como distribuição gaussiana é sem dúvida a mais importante
distribuição contínua. Sua importância se deve a vários fatores, entre eles podemos citar o teorema
central do limite, o qual é um resultado fundamental em aplicações práticas e teóricas, pois ele garante
que mesmo que os dados não sejam distribuídos segundo uma normal a média dos dados converge
para uma distribuição normal conforme o número de dados aumenta. Além disso diversos estudos
práticos tem como resultado uma distribuição normal. Podemos citar como exemplo a altura de uma
determinada população em geral segue uma distribuição normal. Entre outras características físicas e
sociais tem um comportamento gaussiano, ou seja, segue uma distribuição normal.

A variação natural de muitos processos industriais é realmente aleatória. Embora as distribuições de


muitos processos possam assumir uma variedade de formas, muitas variáveis observadas possuem
uma distribuição de frequências que é, aproximadamente, uma distribuição de probabilidade Normal.

Probabilidade é a chance real de ocorrer um determinado evento, isto é, a chance de ocorrer uma
medida em um determinado intervalo. Por exemplo, a frequência relativa deste intervalo, observada à
partir de uma amostra de medidas, é a aproximação da probabilidade. E a distribuição de frequências é
a aproximação da distribuição de probabilidades.

A palavra probabilidade deriva do Latim probare(provar ou testar). Informalmente, provável é uma das
muitas palavras utilizadas para eventos incertos ou conhecidos, sendo também substituída por
algumas palavras como “sorte”, “risco”, “azar”, “incerteza”, “duvidoso”, dependendo do contexto.

A probabilidade é um número que varia de 0 (zero) a 1 (um) e que mede a chance de ocorrência de um
determinado resultado. Quanto mais próxima de zero for a probabilidade, menores são as chances de
ocorrer o resultado e quanto mais próxima de um for a probabilidade, maiores são as chances.

As probabilidades podem ser expressas de diversas maneiras, inclusive decimais, frações e


percentagens. Por exemplo, a chance de ocorrência de um determinado evento pode ser expressa
como 10%; 5 em 10; 0,20 ou 1/7.

Experimento Aleatório

Experimento é qualquer atividade realizada que pode apresentar diferentes resultados. Um


experimento é dito aleatório quando não conseguimos afirmar o resultado que será obtido antes de
realizar o experimento. Um experimento é dito equiprovável se todos os possíveis resultados possuem
a mesma chance de ocorrer.

WWW.DOMINACONCURSOS.COM.BR 7
ESTATÍSTICA

Espaço Amostral E Evento

Em uma tentativa com um número limitado de resultados, todos com chances iguais, devemos
considerar:

Espaço Amostral (E)

Espaço amostral é o conjunto E cujos elementos são todos os possíveis resultados que podem ser
obtidos na realização de um experimento.

Evento (A)

Evento é qualquer subconjunto de um espaço amostral.

Cálculo De Probabilidades

Seja um evento A de um espaço amostral referente a um experimento aleatório e equiprovável.

A probabilidade P(A) de se obter o evento A é dada por:

Onde:

▪ n(A) é o número de elementos do evento A;

▪ n(E) é o número de elementos do espaço amostral

Estatística

A Estatística está presente em todas as áreas da ciência que envolvam o planejamento do


experimento, a construção de modelos, a coleta, o processamento e a análise de dados e sua
consequente transformação em informação, para validar hipóteses científicas sobre um fenômeno
observável. Desta forma, a Estatística pode ser pensada como a ciência de aprendizagem a partir de
dados.

A aplicação de técnicas estatísticas a dados meteorológicos tem a vantagem de compactar o enorme


volume de dados, medidos, por exemplo, em uma estação, em uma simples tabela ou uma equação,
capaz de sumariar todas as informações de modo a facilitar as inferências sobre os dados.

Definição

A estatística é uma coleção de métodos para planejar experimentos, obter dados e organiza-los,
resumi-los, analisá-los, interpretá-los e deles extrair conclusões.

Noções De Estatística

Amostra

São elementos coletados dentro do vasto universo.

ROL

É toda sequência de dados numéricos.

Exemplo:

Os cincos alunos de uma amostra apresentaram as seguintes notas na prova bimestral de matemática
6; 4; 8; 7; 8. Apresentando esses dados em rol, temos: (4; 6; 7; 8; 8) ou (8; 8; 7; 6; 4).

WWW.DOMINACONCURSOS.COM.BR 8
ESTATÍSTICA

Classes

Qualquer intervalo real que contenha um rol da amostra.

Medidas De Posição

São as estatísticas que representam uma série de dados orientando-nos quanto à posição da
distribuição em relação ao eixo horizontal do gráfico da curva de frequência.

As medidas de posições mais importantes são as medidas de tendência central ou pro


médias (verifica-se uma tendência dos dados observados a se agruparem em torno dos valores
centrais).

As medidas de tendência central mais utilizadas são: média aritmética, moda e mediana.

Média Aritmética

É igual ao quociente entre a soma dos valores do conjunto e o número total dos valores.

Média Aritmética Ponderada

Consideremos uma coleção formada por n números, de forma que cada um esteja sujeito a um peso
(valor que indica a quantidade de vezes em que cada número se repete).

A média aritmética ponderada desses n números é a soma dos produtos de cada um por seu peso,
dividida pelos somatórios dos seus pesos, isto é:

Nota: “peso” é sinónimo de “ponderação

Moda: (MO)

É o valor que ocorre com maior frequência.

Quando dois valores ocorrem com a mesma frequência, cada um deles é chamado de uma moda, e o
conjunto se diz BIMODAL.

Se mais de dois valores ocorrem com a mesma frequência máxima, cada um deles é uma moda e o
conjunto é MULTIMODAL.

Quando nenhum valor é repetido o conjunto não tem moda

Mediana (MD)

Valor do meio do conjunto de dados, quando os valores estão dispostos em ordem crescente ou
decrescente; divide um conjunto de dados em duas partes iguais.

Para calcular:

▪ Disponha os valores em ordem (crescente ou decrescente)

▪ Se o número de valores é ímpar, a mediana é o número localizado no meio da lista.

WWW.DOMINACONCURSOS.COM.BR 9
ESTATÍSTICA

▪ Se o número é par, a mediana é a média aritmética dos dois valores do meio.

Medidas De Dispersão

Existem algumas medidas chamadas medidas de dispersão, que procuram mostrar como os elementos
do conjunto se comportam em torno da região central, ou seja, medidas que mostram se eles estão
mais ou menos dispersos.

Por exemplo, num jogo de duplas de tênis, são conhecidas as idades dos jogadores:

Equipe A Equipe B

O jogador 1 tem 26 anos; O jogador 1 tem 45 anos;


O jogador 2 tem 24 anos. O jogador 2 tem 5 anos.
Veja que, nos dois casos, a média das idades é a mesma, ou seja, 25 anos.

No entanto, as idades da equipe B estão bem mais dispersas em torno da média do que as idades da
equipe A.

Duas medidas de dispersão são chamados de Variância e Desvio-Padrão.

Variância

Veja, por exemplo, o conjunto de dados:

2, 5, 6, 8, 14,

Onde a média aritmética é 7. A diferença entre cada valor é a média é chamada desvio. Assim,
os desvios para o nosso conjunto de dados serão:

Observação: a soma dos desvios é sempre nula.

Chamamos variância de um conjunto de dados a média aritmética dos quadrados dos desvios. No
nosso exemplo, temos:

A variância é :

WWW.DOMINACONCURSOS.COM.BR 10
ESTATÍSTICA

Desvio-Padrão

O desvio-padrão é definido como a raiz quadrada da variância, sendo indicado por

Assim, no nosso exemplo, temos:

__________________________________________________________________________________

__________________________________________________________________________________

__________________________________________________________________________________

__________________________________________________________________________________

__________________________________________________________________________________

__________________________________________________________________________________

__________________________________________________________________________________

__________________________________________________________________________________

__________________________________________________________________________________

__________________________________________________________________________________

__________________________________________________________________________________

__________________________________________________________________________________

__________________________________________________________________________________

__________________________________________________________________________________

__________________________________________________________________________________

__________________________________________________________________________________

__________________________________________________________________________________

__________________________________________________________________________________

__________________________________________________________________________________

__________________________________________________________________________________

__________________________________________________________________________________

__________________________________________________________________________________

__________________________________________________________________________________

__________________________________________________________________________________

WWW.DOMINACONCURSOS.COM.BR 11

Você também pode gostar