Quando chegou para trabalhar com o astrônomo dinamarquês Tycho Brahe (1546–1601) em 1600, no Castelo de Benátky, perto de Praga, na atual República Tcheca, Johannes Kepler (1571–1630) não imaginava a abundância de dados que o aguardava. Kepler aceitou o desafio de colaborar com Brahe.
No entanto, apenas 18 meses depois de Kepler começar a trabalhar no observatório, Tycho Brahe faleceu de maneira súbita, em 24 de outubro de 1601, em Praga, provavelmente devido a uma infecção urinária. Segundo historiadores, antes de morrer, Brahe teria pedido a Kepler: “Não deixe que meus esforços sejam em vão”.
Quando teve acesso completo aos dados, Kepler teve a oportunidade de confirmar as ideias de Copérnico, que sustentavam que a Terra era um planeta e se movia ao redor do Sol. Ao se debruçar sobre a precisão de Brahe, Kepler tinha certeza de que encontraria órbitas circulares e padrões geométricos perfeitos. Porém, por meio de tentativa usando a matemática disponível na época, ajustou um modelo matemático que pudesse prever a órbita de Marte. Para sua surpresa, as órbitas não eram circulares, como ele esperava, mas elípticas.
Relutante, ele aceitou o que os dados mostravam e formulou sua primeira lei, a Lei das Órbitas Elípticas. Kepler continuou analisando os dados e, por meio de tentativa e erro, descobriu mais duas leis fundamentais.
Ilustração da segunda lei de Kepler: a linha que conecta um planeta ao Sol varre áreas iguais durante intervalos de tempo iguais, o que implica que os planetas se deslocam com maior velocidade quando estão mais próximos do Sol.
Agora que sabemos um pouco sobre a vida do Kepler, qual é a sua relação com a Ciência de Dados? Para começar, Kepler foi um dos primeiros cientistas a usar dados para ajustar uma teoria. Diferentemente dos gregos antigos, como Aristóteles, Kepler baseou suas leis em dados empíricos.
Os dados prevaleceram sobre suas crenças. Ele não dispunha dos métodos e modelos que temos hoje, como o método dos mínimos quadrados, introduzido por Gauss mais de um século depois, ou modelos de regressão e estatística multivariada. Além disso, ele não tinha computadores ou as mesmas calculadoras. Ou seja, ele utilizou apenas tentativa e erro, guiado por princípios matemáticos e físicos, principalmente a geometria.
Kepler analisa os dados, acordos padrões (equações matemáticas) e, em seguida, fornece que o modelo era válido para novos dados. Ele deixou suas opiniões pessoais de lado e publicou seus resultados de maneira crítica e imparcial, permitindo que outros pudessem verificar suas descobertas. Esse é um trabalho típico de um cientista de dados.
Descubra mais curiosidades sobre o tema:
Caso tenha curiosidade em conhecer minhas pesquisas, visite esse link: https://sites.icmc.usp.br/francisco/.
Para saber mais:
A Harmonia do Mundo, Marcelo Gleiser.
AI Feynman: Um método inspirado na física para regressão simbólica, SM Udrescu , M. Tegmark .