Introdução à Estatística Científica


Ciência é a arte de reduzir a incerteza sobre o funcionamento do universo. Mas como será que os cientistas aprendem? Como é possível conhecer as relações entre fenômenos tão complexos? Como a meteorologia prevê o tempo com dias de antecedência? Como a epidemiologia antecipa e combate a evolução de uma epidemia? Como a medicina e a farmacologia medem a eficácia de uma nova droga experimental? A Ciência passou por uma revolução no século XVI, quando Galileu Galilei levou ao chão vários dogmas sobre o universo, usando para isso a observação de fenômenos naturais e o poder da razão. A experimentação direta da natureza passou a ter máxima importância para decidir a validade de uma proposição sobre o mundo. Como você verá, a Estatística surgiu para auxiliar cientistas a extrair a maior quantidade de informação útil a partir de ideias simplificadas e observações incertas. Hoje a Estatística é uma ferramenta fundamental não apenas em pesquisa científica, mas em todo tipo de investigação para responder perguntas ou tomar decisões diante de incerteza.
Aula versão 31/12/2019

Apresentação do Curso


Ministro diversas disciplinas de Análise Estatística, em todos os níveis acadêmicos, na Universidade Federal de Goiás. Sou biólogo, com atuação como pesquisador na área de ecologia e biodiversidade. Originalmente comecei a gravar minhas aulas e disponibilizar aos estudantes para que pudessem revisar o conteúdo e para que houvesse mais tempo para aulas práticas de análise estatística no computador. Por sugestão dos estudantes e colegas da UFG, passei a ampliar o conteúdo gravado e disponibilizar as aulas na internet de maneira irrestrita.

Como indicado no título, esse curso é voltado para pesquisa científica. Por isso, imagino que estudantes e pesquisadores nas áreas de Ciências Naturais terão mais interesse. Entretanto, como mostrado nessa aula, Estatística tem aplicação em todas as áreas de conhecimento humano onde há necessidade de investigação para responder perguntas ou tomar decisões diante de incerteza.

Não sigo o protocolo padrão de cursos de estatística que são voltados para demonstrações matemáticas e operações numéricas mecânicas. Ao contrário, prefiro ensinar como os conceitos de estatística sugiram ao debater com os estudantes sobre as dificuldades na busca por certezas com informações fragmentadas, em um universo complexo. Não considero que uma prova matemática é o melhor argumento possível, mas entendo que todo pesquisador que utiliza estatística precisa entender quais os conceitos estão inseridos em cada equação, de cada método estatístico. Apenas as quatro operações aritméticas são suficientes para seguir todo o conteúdo desse curso. Por isso, a parte prática desse curso começa em planilha eletrônica (Excel), tanto para entrada de dados quanto para o cálculo. Em seguida, a partir da segunda metade do curso, introduzo gradualmente o ambiente R, hoje universalmente utilizado para análise estatística.

Estou sempre aberto a sugestões e críticas por parte de todos que assistem o curso. Fique absolutamente a vontade para entrar em contato, principalmente se você observar algum erro. Por fim, espero que esse curso possa ampliar os horizontes da sua carreira científica. Abraços!

A Evolução da Incerteza


Carregamos incerteza constantemente conosco. Não sabemos se vai chover, não sabemos a causa da nossa dor de cabeça, e acima de tudo não sabemos sobre o futuro. O universo, a natureza, são muito complexos, e não conhecemos todas as infinitas relações causa-efeito que governam seu funcionamento.

O nosso cérebro evoluiu gradualmente a capacidade de detectar regularidades, que, aliado à nossa imensa curiosidade, levou a experimentação e desenvolvimento de tecnologia. O aprimoramento de técnicas para produção de ferramentas é o exemplo mais documentado desse processo. Assim, nossos antepassados começaram a compreender que alguns fenômenos estavam sob o controle deles, tais como fogo e estações do ano, pois alguns de seus modelos mentais permitiam entender alguns aspectos do mundo. Por outro lado, havia grande incerteza sobre muitos outros fenômenos naturais menos regulares, tais como inundações, secas e terremotos. Então, se nós humanos não estávamos sob o controle do ambiente, era natural supor que alguém estaria. Durante a primeira fase da evolução da incerteza nossos antepassados imaginaram entidades sobrenaturais que operariam o universo segundo seus próprios motivos, dando origem a toda forma de adivinhação, superstição e religião.

O desenvolvimento da lógica e razão gradualmente rompeu com a atribuição de causalidade ao sobrenatural. No renascimento, Galileu Galilei e Newton lideraram a revolução científica, desenvolvendo modelos matemáticos capazes de prever fenômenos naturais com altíssima precisão, tais como eclipses e marés. Com isso, físicos passaram a considerar que a incerteza significava apenas ignorância; com mais informação e análise seria um dia possível reduzir todo o universo a uma única equação. A segunda fase da incerteza foi acreditar que o universo era mecânico, e que a ciência um dia eliminaria por completo a incerteza.

Na tentativa de lidar com erros de observação e documentação de fenômenos naturais que eram usados para desenvolvimento e teste de teorias, tal como a posição de planetas, astrônomos começam a tentar quantificar a incerteza na observação do universo. Esse processo levou ao desenvolvimento da probabilidade, que é o braço da matemática aplicado à incerteza. Ao mesmo tempo, a documentação e catalogação dos fenômenos biológicos mostrou que seria impossível reduzir todos os fenômenos naturais à uma única equação. A terceira fase da incerteza é o reconhecimento que nunca haverá certezas absolutas, apesar do constante avanço da ciência na redução da incerteza. Por isso, toda investigação científica sempre terá que quantificar a incerteza de suas conclusões.

A Atitude Científica


Cientistas tentam explicar o universo criando modelos que capturam aspectos de seu funcionamento. Por definição, esses modelos são representações imperfeitas do universo. Um bom modelo científico é geral (aplicável a grande número de fenômenos), realista (nos auxilia a entender o funcionamento do universo) e preciso (é capaz de indicar condições naturais que ainda não tenham sido observadas). Eles podem ser avaliados ao comparar suas predições com observações do mundo real, seja por meio de observação ou experimentação direta. O que difere a ciência de todas as outras formas de busca por conhecimento é que não existem dogmas, ou seja, o conhecimento pode sempre ser ampliado se um modelo com melhor correspondência com a realidade for desenvolvido. Cientistas estão a todo momento avaliando seus modelos criticamente, na busca por falhas conceituais, pressupostos irrealistas ou falta de correspondência com a realidade. A estatística não apenas serve para buscar regularidades na complexidade do universo, mas também é a ferramenta utilizada para essa comparação entre as ideias e a realidade, levando em consideração incertezas nos modelos e na observação do universo.

Uma Breve História da Estatística


A estatística surgiu com Laplace, que aplicou conceitos de probabilidade para lidar com incerteza nas medidas tomadas por astrônomos e levantamentos demográficos. Em seguida, Legendre e Gauss propuseram uma estratégia para estimar o valor verdadeiro de um fenômeno a partir de múltiplas observações díspares. Quetelet aplicou a estatística para estudar e comparar sociedades humanas. Galton criou técnicas para estudar a relação entre fenômenos naturais, principalmente hereditariedade. Pearson aprimorou a ideia de Galton com uma medida sintética do grau de correlação entre fenômenos. Fisher desenvolveu os princípios de delineamento de experimentos científicos, seguindo a tradição de Galileo, hoje amplamente utilizados em toda a ciência moderna. Tukey utilizou a informática para ampliar a aplicação de estatística, permitindo que cientistas sumarizassem grandes conjuntos de dados.

O que é Estatística?


A ciência avança reduzindo a incerteza sobre o funcionamento do universo. Regularidades na natureza são as melhores pistas que temos sobre possíveis relações causa-efeito. A documentação, busca e identificação desses padrões naturais, dentro de um mar de complexidade que é o universo, é o objetivo das estatísticas descritivas. Uma vez que os cientistas possuam um modelo para explicar um fenômeno, a avaliação desse modelo é foco da estatística inferencial. Depois dos modelos terem sido desenvolvidos e testados, a estatística preditiva pode ser usada para tentar fazer previsões de fenômenos naturais sob condições não observadas, levando em consideração a incerteza nessas previsões. Estatística é uma ferramenta utilizada por cientistas para ampliar o alcance da cognição humana, tanto por meio da descrição de regularidades, quanto na avaliação das ideias científicas sobre fenômenos naturais. Toda investigação que busca responder uma pergunta ou tomar decisão diante de incerteza pode ser beneficiada com a Estatística.