Eu sei que você deve estar cansada de estudar probabilidade com exemplos de dados e cartas de baralho, além de uma boa dose de análise combinatorial. Pois é, eu posso garantir que essa aula vai ser bem diferente. Aqui eu vou mostrar para você que probabilidade é bem interessante, e com aplicações surpreendentes. Entretanto, apesar do Laplace ter dito que “probabilidade é nada mais do que senso comum reduzido em contas matemáticas”, vou também mostrar que a nossa intuição pode frequentemente falhar ao avaliar probabilidades. Por exemplo, você sabia que, mesmo que um exame médico tenha resultado positivo ou negativo, existe uma probabilidade que o resultado do exame esteja errado, e que essa probabilidade depende da frequência da doença na população? Como estamos no meio da pandemia, vou contextualizar melhor usando Covid-19. Imagine que o seu teste RT-PCR deu negativo. Você sabia que, apesar do resultado do teste, a probabilidade de você ainda assim ter o vírus depende, parcialmente, do número de pessoas infectadas na sua cidade?
Aula versão 26/08 e 02/09, 2020
Nesse vídeo eu comento brevemente a história do surgimento da probabilidade. Apesar de hoje a probabilidade envolver matemática avançada, os conceitos gerais de probabilidade surgiram muito tardiamente na história da matemática. Na verdade, levou muitas gerações para que os próprios matemáticos considerassem a probabilidade como um braço legítimo da matemática, uma vez que a probabilidade surgiu inicialmente a partir de especulações derivadas de jogos de azar. A aplicação da matemática em pesquisa científica foi formalizada principalmente por Laplace, na tentativa de levar em consideração o erro de observação astronômica na posição de corpos celestes. A probabilidade não surgiu antes pois exigia uma ciência moderna, não determinística, empiricista e experimentalista. Hoje a probabilidade é amplamente aplicada em todos os ramos de pesquisa em ciências naturais e sociais.
Aqui vamos conversar sobre as definições e regras fundamentais da probabilidade. Várias delas você já conhece, como (1) a regra da multiplicação para encontrar a probabilidade de ocorrência de dois eventos independentes, ou (2) a regra da soma para encontrar a probabilidade de um ou outro evento. Também mostro aqui a tabela de probabilidades, que facilita a compreensão da diferença entre uma probabilidade combinada (joint) e uma probabilidade marginal. Além disso, faço questão de representar as probabilidades usando o diagrama de Venn, que nos ajuda a ver probabilidade por figuras geométricas.
Quando novas informações sobre ficam disponíveis, ou quando você está disposta a assumir que alguma informação é correta (ex.: hipótese ou experimento mental), as probabilidades de tudo que está associado à aquela nova informação ficam imediatamente diferentes. Para muitos isso pode parecer uma surpresa, pois de início poderíamos imaginar que probabilidade é uma medida absoluta, mas é sempre preciso lembrar que qualquer probabilidade é uma razão entre a frequência esperada de um determinado evento, dividido pelo universo de alternativas possíveis de acontecimentos. Ou seja, se surge alguma informação ou pressuposto, o universo de alternativas fica imediatamente mais estreito, alterando a probabilidade inicial. Por exemplo, apenas 1% das mulheres entre 40 e 50 anos de idade desenvolvem câncer de mama (prevalência), ou P(câncer). Uma mulher nessa idade acaba de testar positivo em um mamograma, que é capaz de detectar 90% dos casos de mulheres que têm câncer (sensitividade, verdadeiro positivo), ou P(positivo | câncer), mas indica erroneamente câncer em 10% das mulheres que não possuem câncer (falso negativo), ou P(positivo | não-câncer). Por mais incrível que possa parecer, a probabilidade de ter câncer dessa mulher que já testou positivo em um mamograma nem ficou estacionada em 1% (prevalência), nem tampouco é 90% (sensitividade). Ou seja, gostaríamos de saber a probabilidade dessa mulher ter câncer, uma vez que ela testou positivo no mamograma, ou P(câncer | positivo). Neste vídeo eu vou te mostrar que a probabilidade dessa mulher ter câncer é de 8,3%, dado que ela testou positivo no mamograma. Assim, probabilidade condicional é aquela que incorpora novas informações disponíveis, seja na forma de evidência empírica ou pressuposto.
A regra de Bayes é uma derivação matemática das regras de cálculo e manipulação de probabilidades condicionais, e não há qualquer controvérsia sobre sua validade lógico-matemática. Uma vez que as probabilidades combinadas (joint) são simétricas, P(a e b) = P(b e a), é fácil derivar cada uma dessas probabilidades combinadas em função de suas condicionais, P(a|b) * P(b) = P(b|a) * P(a). Assim, a regra de Bayes indica que P(a|b) = [P(b|a) * P(a)] / P(b). A grande vantagem da regra de Bayes, como essa formulação mostra, é poder calcular uma probabilidade condicional P(a|b) a partir se sua probabilidade condicional inversa P(b|a). Nesse vídeo eu mostro que não é necessário decorar a formulação da regra de Bayes, pois ela deriva diretamente das regras de manipulação de probabilidade. Também mostro, com exemplos, que dominar o conceito de probabilidade condicional e a regra de Bayes é muito útil para o dia-a-dia em pesquisa científica.
Nesse vídeo eu mostro, com exemplos, tudo que nós aprendemos até aqui, com foco especial na matriz de probabilidades e probabilidades condicionais. Aproveitando que gravei essa aula durante a pandêmica de covid-19 em 2020, mostro que, surpreendentemente, mesmo quando um teste RT-PCR tem resultado positivo, a probabilidade da pessoa que testou positivo realmente ter o vírus depende também da prevalência da doença na cidade onde a pessoa mora, pois: P(covid|PCR+) = [P(PCR+|covid) * P(covid)] / P(PCR+).
(1) Um taxonomista identifica corretamente 80% dos indivíduos pertencentes a uma espécie rara (positivo verdadeiro, sensitividade), e (2) identifica corretamente 85% dos indivíduos que não pertecem à mesma espécie (negativo verdadeiro, especificidade).
(3) A abundância relativa dessa espécie rara na natureza é 5%.
(4) O taxonomista acaba de identificar um indivíduo amostrado ao acaso como NÃO pertencente à espécie rara.
(Q) Qual é a probabilidade que, na verdade, o indivíduo PERTENCE a espécie rara?
(A resolução e resposta está no vídeo logo após a pergunta. Procure pausar o vídeo e tentar encontrar sozinha(o) a resposta, pois assim você poderá avaliar o seu próprio conhecimento)
Esse é um vídeo curto recaptulando tudo que aprendemos até agora sobre probabilidade, incluindo os principais conceitos e as operações algébricas derivadas das fórmulas. Vale a pena assistir essa revisão para conferir se você solidificou todo o conhecimento ao longo dos últimos vídeos. Nos próximos vídeos esse conhecimento vai ser útil para entendermos a aplicação da probabilidade em casos mais complexos.
Quase nenhuma variável de interesse científico apresenta apenas duas condições possíveis (ex. vivo/morto, macho/fêmea). Ao contrário, mesmos as variáveis mais simples, quando não são contínuas, costumam ser classificadas em pelo menos mais de duas (múltiplas) categorias (ex. cor, estação do ano, espécie, fase ontogenética, etc). Aqui eu vou mostrar que as regras da probabilidade que já aprendemos se aplicam da mesma maneira para variáveis multinomiais (multiplas categorias).
Nesse vídeo eu mostro a notação mais comum da regra de Bayes aplicada à probabilidade multinomial. Na prática é apenas uma expansão aritmética da regra geral: Probabilidade condicional é igual a uma probabilidade conjugada (joint) dividido por uma probabilidade marginal. Porém, com essa formulação da regra de Bayes poderemos evitar termos que calcular probabilidades que são difícies de serem calculadas, calculando probabilidades condicionais inversas à aquelas que podemos estimar a partir do mundo real.