Ao fim do no nosso curso de R para Ciência de dados I, apresentamos aos alunos (que antes do curso tinham pouca ou nenhuma experiência com R) a tarefa de realizar uma análise estatística (descritiva) e comunicar os resultados utilizando um relatório produzido em R Markdown ou um dashboard feito com o pacote flexdashboard
.
A análise tinha o seguinte contexto: dois produtores que não sabem nada de cinema querem investir seus milhões em um filme, mas não sabem qual tipo de filme ou quais atrizes, atores e diretoras(res) teriam mais chance de gerar um potencial sucesso de crítica e bilheteria. Para responder essa pergunta, eles contrataram cientistas de dados para analisar uma base de filmes do IMDB e responder essa pergunta. O Athos e eu (William) fizemos o papel dos produtores, no sentido de que não demos nenhuma direção sobre a análise a ser realizada (apenas ajudamos com a programação em R, é claro) e os alunos fizeram o papel dos cientistas de dados.
Para motivar, resolvemos premiar os melhores trabalhos com vagas em qualquer um dos nossos cursos.
O nosso objetivo, de início, era trazer aos alunos um pouco da experiência do dia-a-dia do cientista de dados: usar análise crítica (nesse caso, conhecimento sobre cinema) e uma ferramenta (no nosso caso, o R) para transformar uma base de dados em uma reposta para uma pergunta difícil1.
Ao final, recebemos trabalhos tão maravilhosos que, além de parabenizar cada um dos participantes, decidimos compartilhar os 4 ganhadores com a comunidade. Esse é o objetivo desse post.
Abaixo, apresentamos as análises, os autores e os principais pontos pelos quais decidimos destacar esses trabalhos. Todos os textos estão muito claros e bem escritos, então vamos focar apenas no que mais nos chamou atenção em cada trabalho.
Louise Mamedio
Destaques do trabalho da Louise Mamedio:
- Criatividade. A análise conta uma história.
- Bom humor. A parte técnica muito bem diluída em um texto muito gostoso de ser lido, o que é muito convidativo para leitores pouco acostumados com análises de dados.
- Direto ao ponto. Todos os seus textos são informativos, sem enrolação ou mera descrição do que já está sendo mostrado no gráfico.
Veja o trabalho completo aqui: https://curso-r.github.io/202005-r4ds-1/trabalhos_vencedores/concursolouise.html
Camila Bertini
Destaques do trabalho da Camila Bertini:
- Técnica. Dashboard muito bem construído e organizado.
- Visual. Gráficos e tabelas bem formatados, com cores, labels e legendas que ajudam a interpretação.
Veja o trabalho completo aqui: https://curso-r.github.io/202005-r4ds-1/trabalhos_vencedores/Desafio_flexdasboard.html
Rodrigo Almeida
Destaques do trabalho do Rodrigo Almeida:
- Organização. O texto explica a análise de maneira muito bem organizada.
- Análise crítica. As visualizações escolhidas para apresentar cada informação e a definição das variáveis com poder de atuação mostram como técnica e conhecimento do tema (negócio) devem se relacionar em uma análise de dados.
Veja o trabalho completo aqui: https://curso-r.github.io/202005-r4ds-1/trabalhos_vencedores/Projeto_Curso-R.html
Mariana Costa
Destaques do trabalho da Mariana Costa.
- Estrutura. Análise muito bem estruturada, com objetivo bem estabelecido e desenvolvimento coerente.
- Visual. Gráficos e tabelas bem formatados, com cores, labels e legendas que ajudam a interpretação.s
- Conclusão clara e direta ao ponto.
Veja o trabalho completo aqui: https://curso-r.github.io/202005-r4ds-1/trabalhos_vencedores/analise_descritiva.pdf
E claro: em tempo limitado. Os alunos tiveram uma semana para fazer o trabalho.↩︎