Ciência de Dados é uma área nova e, embora relacionada a muitas outras áreas mais tradicionais como estatística e computação, pode parecer um mar vasto demais. Por isso, nesse post vamos recomendar 3 livros muito legais para começar os seus estudos.
Muitos e muitos livros poderiam aparecer nessa lista, mas para garantir que mais pessoas possam ter acesso às nossas recomendações selecionamos apenas obras já publicadas em português. Nosso recorte também foi feito considerando materiais introdutórios que não exijam muito conhecimento prévio de quem lê. De toda forma, muitos outros livros ficaram de fora da lista, mas esses já representam um bom ponto de partida.
1. “Estatística Básica”, por Wilton Bussab e Pedro Morettin
Estatística é uma das principais ferramentas no cinto de utilidades de Cientistas de Dados. Embora também seja importante cultivar outros conhecimentos, as técnicas e estratégias de análise tradicionais do campo da Estatística resolvem muitos problemas comuns da vida de quem mexe com dados.
“Estatística Básica” é usado em diversos cursos introdutórios de estatística e explica com clareza conceitos básicos como tipos de variáveis, testes de hipótese e princípios básicos de amostragem. Algumas passagens do livro soam antiquadas para quem o lê hoje em dia, mas sendo um grande e completo clássico, esse livro não pode faltar na sua estante.
2. “Storytelling com Dados: um Guia Sobre Visualização de Dados Para Profissionais de Negócios”, por Cole Nussbaumer Knaflic
O verdadeiro trabalho de quem trabalha com dados é, antes de tudo, conseguir traduzir o que os dados têm a dizer para uma linguagem que seja útil para um negócio, pesquisa ou qualquer outra forma de investigação. As pessoas que vão consumir nossos resultados, em geral, precisam acessar o amplo contexto no qual os dados estão inseridos e muitas vezes a forma mais produtiva de transmitir as nossas informações é contando uma história com começo, meio e fim. Às vezes podemos nos esquecer disso, já que gastamos uma grande parte do nosso tempo em tarefas complementares, como limpeza e modelagem de dados, mas nunca se pode perder de vista que no final vamos precisar contar uma história pra alguém, e possivelmente só aí nosso trabalho terá sido útil.
“Storytelling com Dados: um Guia Sobre Visualização de Dados Para Profissionais de Negócios” abraça essa filosofia com muito afinco e a autora americana Cole Nussbaumer Knaflic nos guia pelas técnicas que podem nos ajudar a apresentar nossos dados da maneira mais efetiva o possível: quais gráficos devemos usar, para quais aspectos devemos chamar atenção, como fornecer contexto para a audiência e muitos outros temas que você não pode viver sem.
3. “R Para Data Science”, por Hadley Wickham e Garrett Grolemund
Muitas pessoas definem como Ciência de Dados como uma união entre métodos quantitativos em geral (estatística, matemática, machine learning etc), programação, e uma atuação focada a negócios. Desses três temas, apenas um ainda não estava contemplado na nossa lista: a progamação.
“R para Data Science” é uma obra prima moderna que ensina a extrair o melhor da linguagem R, contextualizando o uso de uma linguagem de programação para o uso mais frequente por quem pratica Ciência de Dados: geração de análises reprodutíveis, escaláveis e muito poderosas. O seu trabalho diário como Cientista de Dados certamente vai melhorar muito depois de ler esse livro.
Gostou? Quer saber mais?
Se você quiser aprender um pouco mais sobre manipulação de dados como abordada no livro “R para Data Science”, dê uma olhada nos nossos cursos de R para Ciência de Dados I e R para Ciência de Dados II. Se você quiser aprender um pouco mais sobre visualização de dados, dê uma olhada no nosso curso Relatórios e visualização de dados e aproveite!