O desafio de confiar em uma base de dados olímpica

Qualquer um deve encarar as estatísticas das olimpíadas com algumas ressalvas. A primeira é que entre os anos de 1896 e 1920 os relatórios oficiais dos jogos não passavam de resumos. A busca pelos resultados detalhados nesse período é um verdadeiro trabalho de arqueologia olímpica. Lentamente, historiadores foram reunindo o que dava para encontrar nos registros locais das cidades onde os jogos aconteceram — indo até lá pessoalmente — ou nas revistas e jornais esportivos em bibliotecas ao redor do mundo.

Mesmo com esse esforço contínuo dos grupos de historiadores, qualquer base com o registro granular de cada atleta olímpico e suas conquistas possui buracos. É possível que alguns resultados estejam perdidos para sempre. Essas são características fundamentais da coleta de dados olímpicos que precisam vir à tona em qualquer trabalho que se debruce sobre as bases.

Alguns fatores ajudam a explicar essas dificuldades. Se os relatórios oficiais passaram a divulgar dados detalhados sobre os jogos após 1920, apenas em 1960 os computadores passaram a colaborar com a coleta, armazenamento e processamento de dados no contexto olímpico. São 40 anos de nomes, resultados, fichas técnicas, quadro de medalhas e organização feitos no papel, guardados em arquivos, caixas e etiquetados… ou não. Se com bases de dados digitais que possuem centenas de milhares de pontos de dados as chances de erros surgirem aqui e ali são imensas, dá pra se ter uma ideia do tamanho do problema para dados que foram coletados e armazenados à mão e só ganharam organização há algumas décadas.

Um exemplo de erros que estão à espreita é a lista de ciclistas numa prova dos jogos de 1928. Os registros oficiais sempre apontavam 14 competidores e a classificação do número um ao 14. Jeroen Heijmans, patinador holandês e participante do grupo de historiadores das olimpíadas OlyMADMen, encontrou um jornal da época listando 16 participantes e os registros oficiais foram corrigidos logo depois.

Outro exemplo mais recente são os resultados do Tiro com Arco. Ao todo, 32 participantes foram classificados pela soma dos resultados nas partidas de confronto direto. Um grupo de pesquisadores aplicou as regras do esporte e encontrou uma lista diferente da classificação considerada “oficial”. A Federação internacional de Tiro com Arco admitiu o erro e os resultados foram corrigidos.

Os deslizes acima mostram que o esforço para construir uma base completa e precisa sobre os Jogos Olímpicos é contínuo. O próprio Comitê Olímpico Internacional depende do auxílio de historiadores e pesquisadores dos jogos para atualizar seus registros oficiais. As bases levantadas pela Gênero e Número e nossas investigações devem ser interpretadas nesse contexto. Reunimos dados de diversas fontes para trazer mais riqueza às nossas análises, mas também estamos sujeitas às mesmas fragilidades.

Se você encontrou algum erro no levantamento ou tem alguma crítica ou sugestão, entre em contato com a gente!

Se você chegou até aqui, apoie nosso trabalho.

Você é fundamental para seguirmos com o nosso trabalho, produzindo o jornalismo urgente que fazemos, que revela, com análises, dados e contexto, as questões críticas das desigualdades de raça e de gênero no país.

Somos jornalistas, designers, cientistas de dados e pesquisadoras que produzem informação de qualidade para embasar discursos de mudança. São muitos padrões e estereótipos que precisam ser desnaturalizados.

A Gênero e Número é uma empresa social sem fins lucrativos que não coleta seus dados, não vende anúncio para garantir independência editorial e não atende a interesses de grandes empresas de mídia.

Quero apoiar ver mais