Melhores trabalhos do curso R para Ciência de dados I (maio de 2020)

Ao fim do no nosso curso de R para Ciência de dados I, apresentamos aos alunos (que antes do curso tinham pouca ou nenhuma experiência com R) a tarefa de realizar uma análise estatística (descritiva) e comunicar os resultados utilizando um relatório produzido em R Markdown ou um dashboard feito com o pacote flexdashboard.

A análise tinha o seguinte contexto: dois produtores que não sabem nada de cinema querem investir seus milhões em um filme, mas não sabem qual tipo de filme ou quais atrizes, atores e diretoras(res) teriam mais chance de gerar um potencial sucesso de crítica e bilheteria. Para responder essa pergunta, eles contrataram cientistas de dados para analisar uma base de filmes do IMDB e responder essa pergunta. O Athos e eu (William) fizemos o papel dos produtores, no sentido de que não demos nenhuma direção sobre a análise a ser realizada (apenas ajudamos com a programação em R, é claro) e os alunos fizeram o papel dos cientistas de dados.

Para motivar, resolvemos premiar os melhores trabalhos com vagas em qualquer um dos nossos cursos.

O nosso objetivo, de início, era trazer aos alunos um pouco da experiência do dia-a-dia do cientista de dados: usar análise crítica (nesse caso, conhecimento sobre cinema) e uma ferramenta (no nosso caso, o R) para transformar uma base de dados em uma reposta para uma pergunta difícil1.

Ao final, recebemos trabalhos tão maravilhosos que, além de parabenizar cada um dos participantes, decidimos compartilhar os 4 ganhadores com a comunidade. Esse é o objetivo desse post.

Abaixo, apresentamos as análises, os autores e os principais pontos pelos quais decidimos destacar esses trabalhos. Todos os textos estão muito claros e bem escritos, então vamos focar apenas no que mais nos chamou atenção em cada trabalho.

Louise Mamedio

Destaques do trabalho da Louise Mamedio:

  • Criatividade. A análise conta uma história.
  • Bom humor. A parte técnica muito bem diluída em um texto muito gostoso de ser lido, o que é muito convidativo para leitores pouco acostumados com análises de dados.
  • Direto ao ponto. Todos os seus textos são informativos, sem enrolação ou mera descrição do que já está sendo mostrado no gráfico.

Veja o trabalho completo aqui: https://curso-r.github.io/202005-r4ds-1/trabalhos_vencedores/concursolouise.html

Camila Bertini

Destaques do trabalho da Camila Bertini:

  • Técnica. Dashboard muito bem construído e organizado.
  • Visual. Gráficos e tabelas bem formatados, com cores, labels e legendas que ajudam a interpretação.

Veja o trabalho completo aqui: https://curso-r.github.io/202005-r4ds-1/trabalhos_vencedores/Desafio_flexdasboard.html

Rodrigo Almeida

Destaques do trabalho do Rodrigo Almeida:

  • Organização. O texto explica a análise de maneira muito bem organizada.
  • Análise crítica. As visualizações escolhidas para apresentar cada informação e a definição das variáveis com poder de atuação mostram como técnica e conhecimento do tema (negócio) devem se relacionar em uma análise de dados.

Veja o trabalho completo aqui: https://curso-r.github.io/202005-r4ds-1/trabalhos_vencedores/Projeto_Curso-R.html

Mariana Costa

Destaques do trabalho da Mariana Costa.

  • Estrutura. Análise muito bem estruturada, com objetivo bem estabelecido e desenvolvimento coerente.
  • Visual. Gráficos e tabelas bem formatados, com cores, labels e legendas que ajudam a interpretação.s
  • Conclusão clara e direta ao ponto.

Veja o trabalho completo aqui: https://curso-r.github.io/202005-r4ds-1/trabalhos_vencedores/analise_descritiva.pdf


  1. E claro: em tempo limitado. Os alunos tiveram uma semana para fazer o trabalho.↩︎

comments powered by Disqus