Lançamento da Tarefa 1: 06/09/24
Entrega da Tarefa 1: 23/09/24
- Assista ao vídeo “Limpeza de dados em python: pandas no google colab” (link https://www.youtube.com/watch?v=0SgghZ5S87o) onde eu mostro como baixar dados de seguro rural de 2021, limpar, organizar e salvar a nova planilha com os dados organizados.
- Use este notebook como modelo. Nele eu uso os dados atualizados de 2021 (há algumas diferenças para os valores mostrados no vídeo, mas a ideia é a mesma).
- Faça uma cópia do notebook de modelo no seu google drive (pelo google colab vá em Arquivo > Salvar uma cópia no Drive) e renomeie o notebook para um nome apropriado (tal como "tarefa1-ana.ipynb"). Faça os ajustes necessários para que a leitura dos dados seja feita adequadamente.
- Realize os mesmos comandos do notebook de modelo, porém usando os dados de 2023 (em vez de 2021). Para isso, acesse a página https://dados.agricultura.gov.br/dataset/sisser3 e use a planilha: PSR - 2022 a 2023. No notebook de modelo, eu selecionei os dados de 2021, faça o mesmo para selecionar os dados de 2023.
- Salve os dados como uma planilha .xlsx no seu google drive chamada 'seguro-rural-2023.xlsx'.
- No fim do notebook de modelo, eu li os dados salvos. Faça o mesmo com os dados de 2023.
- No fim do notebook, ao rodar o comando shape dos dados lidos, os valores devem ser (106886, 21), ou seja, há 106.886 linhas (observações ou apólices) e 21 colunas (variáveis).
- Ao executar dados.head() você deverá visualizar as primeiras linhas do conjunto de dados como:
- Compartilhe seu notebook comigo para que eu veja que deu tudo certo (no google colab vá em Compartilhar e use o meu e-mail patricia.ramos@unifal-mg.edu.br).