A palavra "probabilidade" está no nosso vocabulário cotiano, mas raramente paramos para pensar no seu verdadeiro significado. Quando se pergunta a alguém o que é probabilidade, ou qual é a propriedade que a probabilidade pode ser usada para medir, a resposta mais comum costuma ser "chance". Entretanto, essa não é uma resposta satisfatória, pois na verdade "chance" é apenas um dos vários sinônimos que usamos para probabilidade, e não indica qual é o objeto que poderíamos medir usando probabilidade.
Por exemplo, o que significa dizer que a probabilidade de chuva amanhã é 50%? Será que significaria a mesma coisa que dizer que a probabilidade de sair "coroa" em uma jogada de uma moeda, que também é 50%? E se uma médica dissesse que há 50% de chance que a causa da doença de uma paciente é um certo vírus, estaria ela empregando a palavra "probabilidade" no mesmo sentido?
Do ponto de vista puramente matemático não há qualquer dúvida ou contradição nas regras de probabilidade que já aprendemos, que podem ser usadas para calcular e manipular probabilidades. Porém, por este ponto de vista matemático, probabilidade é apenas uma abstração que pode ser utilizada para representar ou medir alguma propriedade, assim como um ponto e uma reta podem ser usados em um mapa para representar cidades ou rodovias.
Enfim, chegou a hora de discutirmos o significado de probabilidade. Afinal de contas, é preciso termos clareza nos termos e conceitos empregados, não apenas para sabermos o que estamos medindo, mas também para facilitar a comunicação científica.
Aula versão 09/09/2020
"A probabilidade de sair 'cara' em uma jogada de uma moeda justa é 50%". "A probabilidade de sair 2 em um dado de 6 lados é 1/6". "A probabilidade de ganhar na mega-sena com uma aposta simples é 1 em 50.063.860".
Percebeu a semelhança no sentido do emprego da palavra "probabilidade"? Todos os três exemplos indicam uma frequência relativa esperada de um evento caso o experimento (ou processo) seja sistematicamente repetido muitas vezes. Então, essas probabilidades indicam tendência, predisposição, ou propensão.
Repare que essa probabilidade que indica frequência esperada, ou frequentista diz respeito a uma propriedade do experimento a ser repetido (ex. a constituição física da moeda e o processo de joga-la ao ar), e pode ser empiricamente estimada ou verificada por qualquer pessoa disposta a repetir o processo experimental.
Matemáticos comumente empregam o sentido frequentista da probabilidade, pois em várias circunstâncias é possível derivar matematicamente as probabilidades de eventos assumindo modelos teóricos do funcionamento de um experimento.
Estatísticos usam o sentido frequentista da probabilidade para estimar a variabilidade esperada em uma estimativa (ex. média) caso a amostragem seja repetida (erro amostral).
"Há não mais do que 10% de probabilidade que o réu seja culpado pela morte da vítima". "A probabilidade de meu time de futebol ganhar esse campeonato é 10%". "A probabilidade da bolsa de valores subir amanhã é 20%, pois o mercado não está muito animado".
Percebeu o sentido comum da palavra probabilidade entre esses exemplos? Claro, em nenhum desses casos as probabilidades indicam frequência esperada, pois há apenas um réu sendo acusado, apenas um campeonato de futebol nesse ano, e é impossível fazer um experimento repetido com o mercado financeiro.
Na verdade, em todas as afirmações acima a palavra probabilidade está sendo empregada para indicar plausibilidade, certeza, razoabilidade, corretude ou compatibilidade com os fatos.
Porém, ao contrário do sentido frequentista, a probabilidade que indica plausibilidade é dependente da informação e conhecimento disponível (ou indisponível), que pode variar entre pessoas (dependendo do conhecimento de cada uma) ou ser alterada com o tempo com novas evidências.
Assim, se probabilidade pode ser usada para indicar conhecimento, consequentemente podemos afirmar que o complemento dessa probabilidade pode ser usado para indicar falta de conhecimento ou incerteza.
Portanto, esse sentido da probabilidade é também conhecido como epistêmico, indutivo ou subjetivo.
A inferência Bayesiana é dedicada à estimativa de probabilidades epistêmicas, de tal maneira que poderíamos verdadeiramente falar em probabilidade de uma hipótese científica como medida do suporte das evidências disponíveis para essa hipótese.