12 meilleurs livres de Data Science

9 Meilleurs Livres de Data Science en 2019

Dans cet article, je vous propose une liste de livres qui vous permettront de développer vos compétences en Data Science. Les sujets traités vont de la programmation Python et R à l’apprentissage automatique en passant par les mathématiques et les statistiques.

Allons, donc, voir vos prochains livres de chevet !

1 – Python Data Science Handbook

Python Data Science Handbook

Python Data Science Handbook

Les tendances montrent que Python est toujours le langage principal de la Data Science et du Machine Learning.

Le livre Python Data Science Handbook est une excellente référence pour renforcer les compétences en Python.

On vous demandera souvent aux Data Scientists de travailler sur de nombreuses tâches, mais le nettoyage et la manipulation des données restent la tache qui prend la plus grande partie du temps.

Ce livre est une référence parfaite à garder sous la main pour les tâches fréquentes de manipulation de données principalement utilisant pandas.

Parmi les sujets traités dans ce livre:

  • Shell IPython
  • Numpy
  • Manipulation des données avec pandas
  • Visualisations de données avec Matplotlib
  • Machine Learning avec Scikit-Learn

Cliquer ici pour consulter le livre sur Amazon.

2 – Think Python

Think Python

Think Python

Si vous débutez avec Python, ce livre est fait pour vous.

Si vous avez un bon niveau en Python, ce livre est pour vous aussi.

Think Python traite toutes les bases de Python, des bases des structures et fonctions de données aux sujets plus avancés tels que les classes et l’héritage.

Dans ce livre, vous verrez en plus de la présentation des concepts clés, des cas d’études concrets. C’est un excellent moyen pour comprendre et assimiler de nouveaux concepts.

Parmi les sujets traités dans ce livre :

  • Les fonctions
  • Itération
  • Structures de données
  • Des dossiers
  • Des classes
  • Les méthodes
  • Héritage

Cliquer ici pour consulter le livre sur Amazon.

3 – R for Data Science

R for Data Science

R for Data Science

une bonne maîtrise de R vous permettra de vous “vendre” facilement auprès des employeurs. R est une compétence très recherchée.

R dispute avec Python la place du premier langage de programmation pour la Data Science.

Une étude récente menée par des Data Scientists a montré que 52,1% des Data Scientists répondants au sondage utilisent R, un peu moins de 52,6% utilisant Python.

Ce livre est parfait pour développer vos compétences en programmation statistique avec R.

Il couvre toutes les bases de R allant d’un niveau débutant aux sujet les plus avancés.

Ce livre est une excellente référence générale qui doit accompagner tout développeur R ou Data Scientist !

Les sujets abordés dans le livre :

  • Exploration
  • La programmation
  • La modélisation
  • La communication

Cliquer ici pour consulter le livre sur Amazon.

4 – Advanced R

Advanced R

Advanced R

Si vous voulez vraiment vous distinguer en tant qu’utilisateur R et impressionner les employeurs, Advanced R est une excellente ressource.

Il couvre tout, des fondations aux structures de données, à la programmation orientée objet et au débogage, à la programmation fonctionnelle et au code de performance.

Si vous avez une connaissance avancée de R et pouvez penser au code de niveau de production, vous vous rendrez immédiatement plus attrayant pour les employeurs potentiels.

Cliquer ici pour consulter le livre sur Amazon.

5 – Introduction to Statistical Learning

Introduction to Statistical Learning

Introduction to Statistical Learning


Ce livre est l’un des meilleurs livres d’introduction au Machine Learning.  l fournit des explications faciles pour comprendre des concepts de base et donne des exemples de code avec R.

Il couvre également les bases des modèles linéaires de manière approfondie.

Connaitre ces bases vous permettra de couvrir la major partie des problématiques ou questions posés pendant les entretiens d’embauche.

Les sujets abordés dans le livre :

  • Sélection de fonctionnalité
  • Régression polynomiale
  • Méthodes basées sur des arbres
  • Apprentissage supervisé
  • Apprentissage non supervisé

Cliquer ici pour consulter le livre sur Amazon.

6 – The Elements of Statistical Learning

The Elements of Statistical Learning

The Elements of Statistical Learning


Si vous souhaitez accélérer votre carrière dans le Machine Learning, vous devez bien maîtriser plus que les bases. Vous devez maîtriser les sujets avancés.

Ce livre est la ressource idéale pour amener vos compétences en Machine Learning à un niveau supérieur.

C’est l’un des livres les plus complets sur le Machine Learning.

Dans ce livre vous trouverez tout les concepts du Machine Learning, des méthodes linéaires aux réseaux de neurones, en passant par les forêts aléatoires.

C’est un peu plus mathématique que les autres livres, donc pour approfondir la compréhension des concepts c’est le TOP.

Cliquer ici pour consulter le livre sur Amazon.

7 – Understanding Machine Learning: From Theory to Algorithms

Understanding Machine Learning: From Theory to Algorithms

Understanding Machine Learning: From Theory to Algorithms


Si vous souhaitez bien comprendre les algorithmes de Machine Learning, ce livre est un excellent choix.

Il est divisé en sections de plus en plus complexes:

  • Bases
  • De la théorie aux algorithmes
  • Modèles de Machine Learning
  • Théorie avancée

C’est un excellent moyen d’acquérir une bonne compréhension des concepts de Machine Learning est de les implémenter.

Cliquer ici pour consulter le livre sur Amazon.

8 – Mining of Massive Datasets

Mining of Massive Datasets

Mining of Massive Datasets

Ce livre a été rédigé à partir de plusieurs cours de Stanford sur l’exploration de données à grande échelle.

Dans ce livre, on parle essentiellement de Data Mining.

Parmi les sujet abordés dans le livre :

  • Mapreduce
  • Exploitation de data stream
  • Systèmes de recommandation
  • Exploitation de graphiques de réseaux sociaux
  • Réduction de la dimensionnalité
  • Machine Learning à grande échelle

 

Cliquer ici pour consulter le livre sur Amazon.

9 – Think Stats

Think Stats

Think Stats



En tant que Data Scientist ou Data Analyst,  vous devez maîtriser les probabilités et les statistiques.

Les modèles de Machinea Learning sont basés sur des principes fondamentaux de la théorie des probabilités.

Donc, pendant vos entretiens d’embauche attendez vous a quelques questions sur les probabilités et les statistiques. 

Ce livre n’est pas destiné aux mathématiciens ou statisticiens, il utilise donc une approche pratique pour expliquer les concepts mathématiques.

Les sections sont courtes et faciles à lire, vous pourrez donc travailler rapidement à travers des exemples.

Ce livre aborde, entre autres, les sujets suivant :

  • Statistiques descriptives
  • Fonctions de distribution cumulatives
  • Distributions continues
  • Probabilités
  • Opération et distributions
  • Tests d’hypothèses
  • Estimation
  • Corrélation

Cliquer ici pour consulter le livre sur Amazon.

>