Programação é uma das habilidades mais importantes da atualidade, principalmente para quem mexe com análise de dados. Hoje nós vamos explorar 5 motivos para te lembrar ou relembrar de porque R é uma das maiores linguagens para Ciência de Dados. Alguns dos motivos se aplicam a todas as linguagens de programação, mas sempre vamos destacar porque o R é especial, e alguns outros são específicos da nossa querida linguagem. Vamos a eles!
Motivo 1: R é completamente gratuito!
dplyr
, ggplot2
, Rmarkdown
e tidymodels
são apenas alguns exemplos de bibliotecas para R que, assim como a própria linguagem, são 100% gratuitas e mantidas pela comunidade. Quem usa R pode aproveitar uma ampla gama de funcionalidades sem gastar um centavo sequer com licenças, softwares, planos etc.
Motivo 2: Grandes pessoas da comunidade disponibilizam seu trabalho em R
Várias pesssoas importantes da comunidade de estatística e machine learning participam ativamente da comunidade R e impulsionam seus trabalhos teóricos através de bibliotecas feitas especificamente para R. Para citar um exemplo, Trevor Hastie, Jerome Friedman, Rob Tibshirani e quem colabora com eles lançaram uma primeira versão do pacote (glmnet)[https://glmnet.stanford.edu/articles/glmnet.html] em 2010 antes de fazê-lo em qualquer outra linguagem. Esse pacote foi fruto de uma série de pesquisas desses autores e quem usa R pode aproveitar as primeiras implementações logo após a publicação dos resultados.
Motivo 3: R possui um ecossistema que incentiva a reprodutibilidade
Uma das maiores virtudes de se usar uma linguagem de programação para análise de dados é garantir que qualquer resultado, da conta mais simples ao gráfico mais complexo, pode ser reproduzida de maneira completamente fiel por um programa de computador. Isso é importante por vários motivos, mas principalmente porque (1) te ajuda a economizar tempo, já que você pode simplesmente usar o mesmo programa para vários problemas parecidos, e (2) em muitos contextos, como na pesquisa científica por exemplo, é importante que se saiba com muita precisão como cada resultado foi produzido, inclusive para que ele possa ser verificado por pares posteriormente.
Então, se já nos convencemos de que reprodutibilidade é importante, podemos ver claramente porque R é tão especial: existe todo um ecossistema que suporta e incentiva a reprodutibilidade. Desde a existência do pacote reprex
(que te ajuda a compartilhar pequenos pedaços de código em texto simples) até ferramentas como Rmarkdown
e as boas práticas incentivadas pelo RStudio, por exemplo. Além disso, como grande parte da comunidade R é formada por pessoas que trabalham na academia, muito do que se produz e discute nos blogs e fóruns é como garantir que nossas análises sejam reprodutíveis.
Motivo 4: R tem uma comunidade vibrante e crescente
Ter alguém para conversar e tirar dúvidas é uma parte importante do aprendizado de praticamente qualquer tópico. Em R no Brasil e no mundo temos uma grande e crescente comunidade disposta a ajudar e discutir, inclusive divulgando materiais gratuitos introdutórios e avançados para que muitas pessoas possam aproveitar. Nesse sentido, um esforço particularmente relevante da comunidade foca-se também em promover a inclusão de grupos sub representados no mundo tech
, como é o caso de iniciativas como a R-Ladies.
Motivo 5: Os focos da linguagem são modelagem, visualização e análise de dados
Desde os seus primórdios em meados de 1976, R e suas encarnações anteriores foram focadas em fornecer ferramentas para quem faz análise de dados, seja isso modelagem, visualização ou elaboração de relatórios. Por isso, nesses 45 anos de desenvolvimento da linguagem, a comunidade se focou principalmente em simplificar a vida de quem manipula bases de dados e, consequentemente, hoje temos ferramentas que produzem resultados sofisticados a partir de uma sintaxe simples e consistente. Não que outras linguagens não tenham grandes contribuições, mas a herança das gerações anteriores faz com que R seja ainda hoje uma das mais ricas no quesito “dados”.
Gostou? Quer saber mais?
Se você quiser dar os seus primeiros passos para aprender a manipular dados com R, dê uma olhada no nosso curso R para Ciência de Dados I e aproveite!
Caso você tenha dúvidas, entre em contato com a gente pelos comentários aqui embaixo, pelo nosso Discourse ou pelo e-mail contato@curso-r.com.