Probabilidade clássica frequentista e subjetiva - Matemática


Fabio 02 Aug 2022 educação matemática e probabilidade

Todas as coisas são números.

Transformando idéias e sensações em números

O mundo não é determinístico para nós. Não dispomos das fórmulas, das regras, das leis, ou a onisciência de saber quando, quanto e se a coisas acontecerão no futuro, entretanto ainda conseguimos perceber que alguns eventos são mais prováveis de ocorrer que outros; sabemos naturalmente que em céu nublado é mais provável de chover do que em céu limpo, que ganhar na loteria é mais improvável que ganhar em um jogo de cartas.

Porém confiar somente nas vagas sensações de que algo acontecerá não estava funcionando mais. Os egipicios se esforçavam em desenvolver uma matemática que os ajudassem a evitar a fome ao prever as cheias do Rio Nilo, desde então, o mundo foi percebendo que números são instrumentos confiáveis em representar o mundo. O dinheiro, os soldados, as provisões e as terras eram melhores representados em números. Essa quantificação das idéias chegou nas ‘possibilidades’ para nos ajudar a prever o futuro desconhecido.

Foi na busca pelo dinheiro fácil, através dos jogos, que a matemática de tentar prever o futuro avançou e tornou-se o que conhecemos hoje como probabilidade. Já não éra possível confiar na intuição “é agora que eu ganho!”, era necessário um número confiável e preciso para representar as chances de uma vitória.

Os jogos em geral são fáceis de se lidar matematicamente, são poucas as variáveis e com valores facilmente acessíveis. Um dado lançado tem 1 variável e 6 valores possíveis, uma carta tirada de um baralho completo será de uma das 52 cartas possíveis. Uma moeda lançada ao acaso terá como resultado a cara ou a coroa. Chamamos esses resultados de eventos de um experimento. Jogar um dado e anotar a face de cima é um experimento, o valor da face é o evento.

Imagine que sua chance de ficar rico seja o lançar de um dado de 6 lados. Se você acertar o número que aparecer na face de cima após um lançamento você ficará rico. Se o dado tem 6 lados então temos 5 chances de perder e somente 1 possibilidade de ganhar. E se for um dado de 20 lados? Agora são 19 para 1 a possibilidade de perder. E se lhe fosse permitido escolher 5 números no dado de 6? Então neste caso você teria 5 chances de ganhar e 1 de perder. Seria muito azar não ficar rico.

Não confunda as chances, possibilidades e tentativas. Há apenas uma tentativa em nosso jogo. Perdeu no primeiro lançamento, acabou o sonho. Se for uma moeda você já abre o champanhe antes mesmo de lançar pois as chances são grandes. Se for na Mega Sena você não dá bola, pois sabe que vai perder.
Probabilidade Clássica

A probabilidade clássica considera que os eventos tem a mesma probabilidade de ocorrerem, ou seja, são equiprováveis. Se você pensar no lançamento do dado a chance de cair qualquer número é igual para todos. É o mesmo caso do lançamento da moeda no cara e coroa ou na retirada do baralho.

O conjunto de valores possíveis que um evento pode ter se chama Espaço Amostral e é abreviado pela letra ‘S’. A tabela a seguir ilustra o espaço amostral dos exemplos mais comuns:

  Valores possíveis Espaço amostral Número
Elementos 1,2,3,4,5,6 $S={1,2,3,4,5,6}$ 6
Moeda Cara,Coroa $S={Cara,Coroa}$ 2
Baralho 52 cartas Às de espada,Reis de ouro, 2 de copas, … $S={\text{Às de espada}, …\ \text{Reis de Ouro}}$ 52

Na probabilidade clássica como cada elemento do conjunto do espaço tem a mesma probabilidade de ocorrer e para se obter a probabilidade de algum valor ocorrer dividimos 1 (ou 100%) por todas a combinações possíveis do evento, ou seja, a quantidade de elementos do Espaço amostral. Quanto maior o Espaço Amostral menores as chances de um evento ocorrer, como se vê na tabela a seguir.

  Valores possíveis Espaço amostral Probabilidade
Dado $S={1,2,3,4,5,6}$ 6 $P=\frac{1}{6}=0.16…$
Moeda $S={Cara,Coroa}$ 2 $P=\frac{1}{2}=0.50$
Baralho $S={\text{Às de espada}, …\ \text{Reis de Ouro}}$ 52 $P=\frac{1}{52}=0.019$

Como se pode ver a probabilidade clássica atribui um número igual para todos os eventos.

O problema da probabilidade clássica é assumir que todos os elementos do espaço amostral tem a mesma probabilidade e conhecer o número de elementos do espaço amostral, o que nem sempre ocorre na vida real.

Probabilidade frequentista

A probabilidade se mostrou útil para outras áreas além dos jogos, porém em outras áreas não é possível calcular a probabilidade de um evento ocorrer com uma simples divisão. Em uma indústria de lampadas como saber qual a probabilidade de uma lampada queimar depois de 1000 horas de uso? O senso comum costuma dizer que “Queima ou não queima, então são 50% de queimar.”. Não, não é assim que funciona.

Uma outra forma de atribuir probabilidades a eventos é observando diversos experimentos reais e calcular os eventos ocorridos pelo número de observações.

Exemplos:

Uma indústria testou 100 lampadas ligadas por 1000 horas e depois de 1000 horas 7 delas queimaram. Qual a probabilidade que uma lampada dessa indústria queime com 1000 horas de uso?

Efetuando os cálculos:

$P=\frac{7}{100}=0.07=7\%$

Há 7% de chance de uma lampada dessa indústria queimar com 1000 horas de uso.

Um cassino estava sob suspeita de fraude e desconfiou-se que seus dados não são confiáveis. Para dirimir as dúvidas foram lançados 50 vezes o dado e obtido os seguintes valores:

Valor123456
Exibições988889
Probabilidade988889

Determine se o dado é confiável.

Efetuando os cálculos:

Exibições 9 8 8 8 8 9
Probabilidade $\frac{9}{50}=0.18$ $\frac{8}{50}=0.16$ $\frac{8}{50}=0.16$ $\frac{8}{50}=0.16$ $\frac{8}{50}=0.16$ $\frac{9}{50}=0.18$

Como a probabilidade de um dado confiável (dado pela probabilidade clássica) é $\frac{1}{6}=0.16$ podemos concluir que o dado é confiável.1

A probabilidade frequentista tem a desvantagem de ser necessário realizar os experimentos para a obtenção dos dados o que em alguns casos é impraticável, no exemplo da indústria de lâmpadas seria preciso esperar um bom tempo e destruir as lampadas para a obtenção dos dados. Outro problema é saber quantos experimentos realizar. A teoria diz que o correto é a realização de infinitos testes, algo impossível de se realizar.

Comparada a anterior, a visão frequentista é mais eficiente em determinar as probabilidades de eventos diferentes do espaço amostral do que simplesmente assumir que os eventos são equiprováveis.

Probabilidade subjetiva

Enquanto a probabilidade clássica tem total controle sobre o espaço amostral e seus valores e na probabilidade frequentista experimentos são feitos para se obter as probabilidades dos eventos, na probabilidade subjetiva as chances dos eventos ocorrerem é uma opinião pessoal.

De fato é preferível valores precisos da visão frequentista mas em alguns casos não há histórico das observações ou a possibilidade de realizar os experimentos. Suponha um escritório de advocacia que recebeu um processo de um cliente e este pergunta as chances de se ter vitória? Como calcular isso matematicamente? Em geral, o advogado mais experiente faz as melhores previsões.

Nos cargos de gerência e situações de tomada de decisões um dos atributos mais importantes é perceber corretamente as probabilidades dos eventos. 2

Curiosidade: O big data é uma grande quantidade de dados de alguma área registrados em computador. Ao dirigir usando o GPS este registra o trânsito, tempo de viagem, percurso e ocorrências de todas as pessoas que usam ele; essa grande quantidade de dados com o uso de computadores ajuda o GPS a calcular a probabilidade e o tempo de viagem em um dado dia e horário. Os escritórios de advocacia e os tribunais tem registro de milhares de processos que estão sendo fontes de big data para que programas calculem, usando métodos frequentistas e de processamento de linguagem, as chances dos litígios.
  1. Para um leitor de nível superior a conclusão não segue o rito normal da inferência estatística. Porém o artigo é direcionado ao nível médio e o leitor pode concordar que intuitivamente é uma conclusão válida. 

  2. Read, D. (2005). Judgment and Choice. In K. Kempf-Leonard (Ed.), Encyclopedia of Social Measurement (pp. 401–407). Elsevier.