Domando a Incerteza: Intervalo de Confiança


Diversas são as fontes de incerteza que afetam os estudos científicos. Algumas incertezas fazem parte do próprio interesse da pesquisa, como, por exemplo, determinar as causas ou consequências de determinado fenômeno natural (ex. quais são os genes que afetam estatura?). Entretanto, a fonte de incerteza que mais interessa à estatística científica diz respeito ao fato de não podermos estudar o fenômeno por completo; censos são muito caros e frequentemente impossíveis. Assim, por ser impossível medir a estatura de todos os brasileiros, ou contar todas as formigas do Cerrado, ou pesar todos os peixes do Rio Amazonas, o estudo de fenômenos complexos fica sempre limitado a informação incompleta (amostragem). Entretanto, como já aprendemos na aula de Erro Amostral, se a amostragem for aleatória, a estimativa (ex. média da estatura dos brasileiros estudados) apresentará uma quantidade de variabilidade previsível caso o estudo seja repetido muitas vezes. Então, que tal associar a inferência (ex. média estimada da estatura da população) a uma medida de incerteza causada pelo erro amostral?
Aula versão 19/04/2018

Erro Amostral e Erro Padrão da Média


O Erro Amostral é uma fonte de incerteza inevitável, pois uma amostra é uma quantidade limitada de informação sobre o fenômeno. Assim, todas as inferências (conclusões) tomadas a partir de uma amostra estarão associadas a incertezas. Do ponto de vista prático, se o estudo fosse repetido, a amostra que seria coletada seria diferente das anteriores, o que geraria um outro valor da estimativa (ex. médias de estaturas diferentes entre dois estudos da mesma população). Entretanto, essa variabilidade possui um comportamento previsível caso o estudo fosse repetido múltiplas vezes, pois sabemos que a variabilidade da estimativa (erro padrão) depende fundamentalmente da variabilidade natural do fenômeno (ex. diferença natural na estatura das pessoas) e do tamanho da amostra (ex. número de pessoas estudadas). Então, não precisaremos de fato repetir a amostragem para calcular o tamanho da variabilidade da média que é esperada no estudo, pois podemos usar um modelo de distribuição de frequências para calcular a variabilidade da média se uma amostragem equivalente fosse repetida (ex. mesmo número de pessoas selecionadas ao acaso da mesma população).


Distribuição t de Student


A variabilidade das médias estimadas através de várias amostras repetidas da mesma população parece obedecer uma distribuição normal: valores intermediários são frequentes e valores extremos são raros. Entretanto, na verdade essas repetidas médias seguem uma distribuição de frequência chamada distribuição t de Student, que é uma irmã da distribuição normal. A distribuição t de Student leva em consideração o tamanho da amostra que foi utilizada para calcular as médias repetidas. Assim, se o tamanho da amostra for pequeno, valores de média estimada muito diferentes entre si (extremos) não serão tão raros assim, pois não seria tão incomum selecionar aleatoriamente apenas pessoas altas/baixas em uma amostra pequena. Ao contrário, se o tamanho das amostras for grande, valores calculados de médias repetidas não serão tão diferentes assim entre si, pois seria muito improvável selecionar aleatoriamente apenas pessoas altas/baixas em uma amostra muito grande. Na prática, a distribuição de frequências t de Student fica cada vez mais parecida com a distribuição normal quando o tamanho da amostra cresce. Baixe aqui o programa que eu construí para ilustrar a diferença entre a distribuição normal e a distribuição t de Student.


Intervalo de Confiança


Agora que temos um bom modelo para estudar e prever a variabilidade de médias calculadas através de amostras, ao invés de repetirmos nossa amostragem, podemos calcular a faixa de valores na qual esperaríamos encontrar outras médias caso a amostragem fosse repetida. Essa faixa de valores é chamada Intervalo de Confiança, e estende o valor de uma única média calculada conforme o tamanho da incerteza na estimativa dessa média. Como sabemos, em um estudo amostral, a variabilidade esperada (incerteza) no valor da média calculada é o Erro Padrão da Média, que pode ser estimado pela variabilidade do fenômeno natural e do tamanho da amostra. Já o Intervalo de Confiança depende não apenas do Erro Padrão da Média, mas também do Nível de Confiança necessário na pesquisa, que é atribuído pelo cientista. Assim, o Nível de Confiança é o tamanho da garantia que o pesquisador precisa de que, caso o estudo fosse repetido, quantos entre os novos Intervalos de Confiança abarcariam o parâmetro populacional. Se esse Nível de Confiança for muito grande, o Intervalo de Confiança será correspondentemente grande. Portanto, o Intervalo de Confiança não faz a pesquisa mais ou menos segura, apenas deixa clara a incerteza causada pelo erro amostral do estudo. Baixe aqui o programa que eu construí para ilustrar a área (ou frequência, ou probabilidade) sob a distribuição t de Student, de acordo com um alfa (nível de confiança) especificado.


Interpretação do Intervalo de Confiança


A interpretação do Intervalo de Confiança possui uma relação direta com a variabilidade esperada para a média caso a amostragem fosse repetida (Erro Padrão da Média). Então, se a média calculada (estimativa) com base na estatura de 20 pessoas (amostra) é 165cm, e o desvio padrão (estimativa) é 5cm (erro padrão estimado 1,12cm), um Intervalo de Confiança construído a partir de um Nível Confiança de 90% irá de 163,06cm até 166,93cm. Então, podemos usar nosso conhecimento de frequência e probabilidade para afirmar que: (1) se a amostragem fosse repetida 100 vezes usando o mesmo Nível de Significância, 90% dos Intervalos de Confiança, calculados para cada uma das repetição da amostragem, abarcaria a média real da estatura população completa (parâmetro), ou que (2) existe 90% de probabilidade que um Intervalo de Confiança calculado com base em uma nova amostragem abarcará a média da estatura da população (parâmetro). Portanto, seria errado afirmar que existe 90% de probabilidade de que o parâmetro está dentro do Intervalo de Confiança que já foi calculado, pois essa interpretação de probabilidade não diz respeito a incerteza causada pelo erro amostral (repetição da amostragem). Baixe aqui o programa que eu construí para testar a estimativa de Intervalo de Confiança a partir da amostra, e sua relação com parâmetro (média da distribuição da população).


Recursos


Programa 1: Distribuições Normal e t
Nesse programa eu mostro as diferenças entre a Distribuição Normal e a Distribuição t de Student. Como você vai ver, quando o tamanho amostral é pequeno a Distribuição t apresenta maior probabilidade de valores extremos. Isso significa que esperamos que haja erros grandes com amostragens pequenas. Ao contrário, quando o tamanho amostral é grande a Distribuição apresenta menor probabilidade de erros grandes. Na verdade, a Distribuição t converge para a prória Distribuição Normal se o tamanho amostral for infinitamente grande.



Programa 2: Intervalo de Confiança
Nesse programa você pode calcular o Intervalo de Confiança diretamente na Distribuição t, ajustando a média (estimada), erro padrão (estimado), tamanho amostral (depende do seu estudo) e nível de confiança (depende da sua pergunta).



Programa 3: Aplicação do Intervalo de Confiança em Incerteza Amostral
Nesse programa eu demonstro graficamente a interpretação do Intervalo de Confiança. Para fins de demonstração você deve imaginar que a distribuição amarela na parte superior representa a população real (paramétrica), com média (losango) e desvio padrão (barra amarela) definida por você. Essa Distribuição paramétrica você nunca conhecerá no mundo real (estudo empírico), e está sendo usada aqui apenas para demonstrar a incerteza causada pela amostragem. Então você pode definir o tamanho amostral e um valor de t (que é referente a um nível de significância, digamos 95%). Ao clicar "Amostrar" uma amostra é retirada ao acaso da população (mostrada no painel inferior, em vermelho), que representa o que você faria em uma situação real, a partir da qual é calculada uma média (estimada, seta vermelha) e um intervalo de confiança (estimado, barra vermelha). Quando você repete a amostragem você pode ver quantas vezes o Intervalo de Confiança (barra vermelha) inclui a média paramétrica (losando amarelo). Como você verá, esse número de vezes é o próprio Nível de Confiança que você escolheu.



Dados
Nesse conjunto de dados você tem valores de estatura de 100 pessoas amostradas ao acaso. Usei essa amostra para calcular um Intervalo de Confiança, que indica que com certa frequencia/probabilidade (Nível de Confiança) quantas vezes eu espero que novas amostragens incluirão o parâmetro (média da estatura da população como um todo).