Les mathématiques représentent la base de toute discipline scientifique. Presque tous les concepts de Data Science et Machine Learning reposent sur des bases mathématiques.
Dans votre apprentissage des techniques, algorithmes et langages de programmation en vue de devenir Data Scientist ou d’approfondir vos connaissance, il ne faut pas OUBLIER les mathématiques.
Il est souvent préférable de connaitre les dessous des algorithmes que vous utiliserez que d’être un simple exécutant. Par conséquent, une solide compréhension des mathématique vous donnera un avantage concurrentiel parmi vos pairs.
Considérons un développeur ou un analyste. Ils peuvent traiter un grand nombre de données et d’informations, mais ils sont pas intéressés par une modélisation de ces données. Souvent, l’accent est mis sur l’utilisation des données pour un besoin immédiat plutôt que sur une exploration scientifique approfondie.
La Data Science, en revanche, devrait s’intéresser aux modèles et ainsi suivre un processus scientifique. Le processus scientifique est le suivant :
La Data Science est applicable à, presque, tous les domaines. Ainsi, elle peut traiter des problèmes aussi divers que le diagnostic du cancer et l’analyse du comportement social.
Cela donne la possibilité d’un tableau vertigineux d’objets mathématiques à n dimensions, de distributions statistiques, de fonctions d’optimisation, etc.
Dans le reste de l’article, je vous fourni les notions qu’il faut maitriser pour faire partie des meilleurs Data Scientists.
Fonction Mathématique
Cette partie couvre les bases mathématiques, de l’équation au théorème binomial :
Si vous souhaitez comprendre comment une requête s’exécute rapidement dans une base de données contenant des données massives triée, vous rencontrerez le concept de «recherche binaire».
Pour en comprendre ce concept, vous devez comprendre les logarithmes et la récurrence.
Ou, si vous souhaitez analyser une série temporelle, vous pouvez rencontrer des concepts tels que «fonctions périodiques».
Statistiques
Apprendre et maîtriser les concepts statistique et probabiliste est un pré-requis quand on parle de Machine Learning. Chaque Data Scientist doit avoir de solide connaissance en statistique.
De nombreux Data Scientists considèrent en fait que le Machine Learning n’est qu’un apprentissage statistique.
Bien évidement c’est un sujet très vaste et une planification et organisation sont essentielles pour couvrir les concepts les plus importants :
Mathématiques discrètes
Les Mathématiques discrètes sont rarement cité quand on parle de Data Science. Et pourtant les mathématiques discrètes sont au cœur des systèmes informatiques modernes.
Vous devez connaitre les concepts de Maths discrète d’algorithmes et de structures de données dans un projet d’analyse :
Algèbre linéaire
Pour comprendre le fonctionnement des algorithmes de Machine Learning sur un flux de données afin de créer un aperçu, l’algèbre linéaire est essentielle.
Vous avez certainement déjà eu des suggestions d’amis sur Facebook ou des recommandations de video sur YouTube, en passant par le transfert de votre selfie vers un portrait à la Salvador Dali utilisant l’apprentissage par transfert en profondeur. Tous ces exemples implique des matrices et une algèbre matricielle.
Les notions que vous devez apprendre :
Calculs
Le calcul apparaît partout en Data Science et en apprentissage automatique et plus globalement derrière tous les programmes et algorithmes.
Les calculs se cachent derrière la solution analytique d’apparence simple d’un problème des moindres carrés ordinaires en régression linéaire ou intégrée à chaque propagation en retour de votre réseau de neurones pour apprendre un nouveau motif.
Si vous deviez vos concentrer que sur les concepts essentielles, apprenez ces sujets :
recherche opérationnelle
Ces concepts sont très pertinents car une compréhension de base de ces techniques puissantes peut être fructueuse dans la pratique du Machine Learning.
Pratiquement tous les algorithmes de Machine Learning visent à minimiser un type d’erreur d’estimation soumis à diverses contraintes, ce qui constitue un problème d’optimisation.
Vous devez à minima vous intéresser à ces sujets:
La session a expiré
Veuillez vous reconnecter. La page de connexion s’ouvrira dans une nouvelle fenêtre. Après connexion, vous pourrez la fermer et revenir à cette page.