Machine Learning

    Entretien d’embauche Machine Learning: 50 Questions à préparer en 2020

    La préparation pour un entretien d’embauche est très importante car elle vous permettra de renvoyer une image professionnelle et compétente au recruteur et c’est ce que les entreprises cherchent réellement: des professionnels compétents. Afin de vous aider à reussir votre entretien, nous vous présentons dans cet article 50 questions à préparer pour un entretien d’embauche de Machine Learning.

    1. Que signifie Machine Learning pour vous ?

    L’apprentissage automatique est la forme d’intelligence artificielle qui traite de la programmation du système et automatise l’analyse des données pour permettre aux ordinateurs d’apprendre et d’agir par le biais d’expériences sans être explicitement programmés.

    2. Différencier l’apprentissage inductif de l’apprentissage déductif?

    Dans l’apprentissage inductif, le modèle apprend par des exemples d’un ensemble d’exemples observés pour tirer une conclusion généralisée.

    dans l’apprentissage déductif, le modèle applique d’abord la conclusion, puis la conclusion est tirée. L’apprentissage inductif est la méthode d’utilisation des observations pour tirer des conclusions. L’apprentissage déductif est la méthode d’utilisation des conclusions pour former des observations.

    3. Quelle est la différence entre Data Mining et Machine Learning ?

    L’exploration de données peut être décrite comme le processus dans lequel les données structurées tentent d’abstraire des connaissances ou des modèles inconnus intéressants. Au cours de ce processus, des algorithmes d’apprentissage automatique ou Machine Learning sont utilisés.

    L’apprentissage automatique ou Machine Learning  représente l’étude, la conception et le développement des algorithmes qui permettent aux processeurs d’apprendre sans être explicitement programmés au préalable.

    4. Que signifie Overfitting ou le dépassement  en Machine learning?

    Le dépassement peut être vu dans la Machine learning  quand un modèle statistique décrit une erreur aléatoire ou un  bruit au lieu de la relation sous-jacente. Le dépassement est généralement observé lorsqu’un modèle est excessivement complexe. Cela se produit parce qu’il y a trop de paramètres concernant le nombre de types de données de formation. Le modèle affiche des performances médiocres, qui a été surchargé.

    5. Pourquoi le dépassement ou overfitting se produit-il?

    La possibilité de débordement se produit lorsque les critères utilisés pour la formation du modèle ne sont pas ceux utilisés pour qualifier  l’efficacité d’un modèle.

    6. Quelle est la méthode utiliser pour éviter le overfitting?

    Le débordement, dépassement ou overfitting se produit lorsque nous avons un petit ensemble de données et qu’un modèle essaie d’en tirer des leçons. En utilisant une grande quantité de données, le débordement peut être évité.

    Mais si nous avons une petite base de données et que nous  devons construire un modèle à partir de celle-ci, nous pouvons utiliser une technique connue sous le nom de la validation croisée ou cross-validation.

    Le but principal de la méthode cross-validation est de définir un ensemble de données pour “tester” le modèle dans la phase de formation. S’il y a suffisamment de données, Isotonic Regression ou régression istonique est utilisé pour prévenir les  overfitting.

    7. Quelle méthode est fréquemment utilisée pour éviter les débordements ou overfitting?

    Lorsqu’il y a suffisamment de données, la « régression isotonique » est utilisée pour prévenir un problème de surabondance.

    8. Quelle est la Différence entre  l’apprentissage automatique supervisé et non supervisé?

    Dans l’apprentissage automatique supervisé, la machine est formée à l’aide de données étiquetées. Puis un nouvel ensemble de données est donné dans le modèle d’apprentissage de sorte que l’algorithme fournit un résultat positif en analysant les données étiquetées. Par exemple, nous devons d’abord étiqueter les données qui sont nécessaires pour former le modèle tout en effectuant la classification.

    Dans l’apprentissage automatique non supervisé, la machine n’est pas formée à l’aide de données étiquetées et laisse les algorithmes prendre les décisions sans aucune variable de sortie correspondante.

    9. En quoi la Machine Learning  diffère du Deep Learning?

    L’apprentissage automatique se base sur  des algorithmes qui sont utilisés pour analyser les données, en tirer des leçons, puis appliquer ce qu’ils ont appris pour prendre des décisions.

    Le deep Learning  fait partie du Machine Learning. Il  s’inspire de la structure du cerveau humain et qui est particulièrement utile dans la détection de fonctions.

    10. Quelle est la différence entre KNN et k-means ?

    KNN ou K nearest neighbors(voisins les plus proches) est un algorithme supervisé qui est utilisé pour la classification. Dans KNN, un échantillon d’essai est donné comme classe de la majorité de ses voisins les plus proches.

    K-means est un algorithme non supervisé qui est principalement utilisé pour le regroupement. Dans le regroupement k-means, un ensemble de points non étiquetés et un seuil sont nécessaires. L’algorithme prend ensuite des données non étiquetées et apprend comment les regrouper en groupes en calculant la moyenne de la distance entre les différents points non étiquetés.

    11. Quels sont les différents types de méthodes d’algorithme dans la Machine Learning?

    Les différents types de méthodes d’algorithme dans l’apprentissage automatique sont :

    • Apprentissage supervisé
    • Apprentissage Semi-supervisé
    • Apprentissage non supervisé
    • Transduction
    • apprentissage par renforcement.

     12. Définissez l’’apprentissage par renforcement.

    L’apprentissage de renforcement est une technique d’algorithme utilisée dans l’apprentissage automatique. Il s’agit d’un agent qui interagit avec son environnement en produisant des actions et en découvrant des erreurs ou des récompenses. L’apprentissage de renforcement est utilisé par différents logiciels et machines pour rechercher le meilleur comportement approprié ou la voie qu’il devrait suivre dans une situation spécifique. Il apprend habituellement à la base de la récompense ou de la pénalité donnée pour chaque action qu’il effectue.

    13. Quelle est l’approche standard de l’apprentissage supervisé?

    L’approche standard de l’apprentissage supervisé consiste à diviser l’ensemble de l’exemple en un ensemble de la formation et le test.

    14. Quelles sont les fonctions de l’apprentissage non supervisé?

    L’apprentissage non supervisé sert à trouver :

    • les cluster de données
    • des représentations de faible dimension des données
    • des directions intéressantes dans les données
    • des Coordonnées et corrélations intéressantes
    • de nouvelles observations / nettoyage de bases de données

    15. Quelles sont les fonctions de l’apprentissage supervisé?

    • Classification
    • Reconnaissance vocale
    • Régression
    • Prédiction des séries chronologiques
    •  Annotation des chaînes

    16. Que signifie Training set (ensemble de formation) et Test set ensembles de test()?

    Dans divers domaines de la science de données comme la Machine Learning, un ensemble de données est utilisé pour découvrir la relation prédictive appelée « ensemble de formation ». L’ensemble de formation est un exemple donné à l’apprenant, tandis que l’ensemble de test est utilisé pour vérifier l’exactitude des hypothèses produites par l’apprenant, et c’est l’ensemble d’exemple retenu de l’apprenant. Les ensembles de formation sont distincts des ensembles de test.

    17. Quelles sont les trois étapes pour construire les hypothèses ou le modèle dans la Machine Learning ?

    • Construction du modèle
    • test du modèle
    •  Application du modèle

    18. Listez les différentes approches de la Machine Learning

    les différentes approches de la Machine Learning sont :

    • Apprentissage de Concept vs l’apprentissage de la  Classification
    • Apprentissage symbolique Vs apprentissage statistique
    • Apprentissage inductif Vs apprentissage analytique

    19. Quelle est la différence entre la classification et la  régression

    • La classification est:
    • une tâche pour prévoir une étiquette de classe discrète.
    • Dans un problème de classification, les données sont étiquetées avec une ou plusieurs classes
    • Une classification ayant un problème avec deux classes est appelée classification binaire, et pour  plus de deux classes est appelée classification multi-classes
    • La classification d’un email spam ou non-spam est un exemple de problème de classification

    La régression

    • La régression est la tâche de prédiction d’une quantité continue.
    • Un problème de régression nécessite la prédiction d’une quantité
    • Un problème de régression contenant plusieurs variables d’entrée est appelé un problème de régression multivariée.
    • Prévoir le prix d’un titre sur une certaine période est un problème de régression.

    20. Quelles sont les deux méthodes de classification que SVM (Support Vector Machine) peut gérer ?

    • Combinaison de classificateurs binaires
    • Modification du binaire pour intégrer l’apprentissage multiclasse

    21. Quelle est la différence entre l’intelligence artificielle et la Machine Learning?

    La conception et le développement d’algorithmes en fonction des comportements fondés sur des données empiriques sont connus sous le nom de Machine Learning. Si l’intelligence artificielle s’ajoute à la Machine Learning, elle couvre également d’autres aspects tels que la représentation des connaissances, le traitement du langage naturel, la planification, la robotique, etc.

    22. Dans quels domaines la reconnaissance des models ou Pattern recognition est-elle utilisée?

    • Vision informatique
    • Reconnaissance vocale
    • Exploration de données
    • Statistiques
    • Extraction informelle
    • Bio-informatique

    23. Que signifie la sélection de modèles dans la Machine leaning?

    Le processus de sélection des modèles parmi  différents modèles mathématiques, qui sont utilisés pour décrire le même ensemble de données,  est connu sous le nom de sélection de modèle. La sélection des modèles est appliquée aux domaines de la statistique, de l’apprentissage automatique et de l’exploration de données.

    24. Que signifie Perceptron dans la Machine Learning?

    Dans Machine Learning, Perceptron est un algorithme de classification supervisée de l’entrée dans l’une des nombreuses sorties non binaires possibles.

    25. Que sont les réseaux bayésiens (BN) ?

    Le réseau bayésien est utilisé pour représenter le modèle graphique de la relation de probabilité entre un ensemble de variables .

    Machine Learning

    26. Que signifie l’apprentissage d’ensemble?

    Pour résoudre un programme de calcul particulier, plusieurs modèles tels que les classificateurs ou les experts sont stratégiquement générés et combinés. Ce processus est connu sous le nom d’apprentissage d’ensemble.

    27. Pourquoi l’apprentissage d’ensemble est-il utilisé?

    L’apprentissage d’ensemble sert à améliorer la classification, la prédiction, l’approximation des fonctions, … d’un modèle.

    28. Quand utiliser l’apprentissage d’ensemble?

    L’apprentissage d’ensemble est utilisé lorsque vous construisez des classificateurs de composants qui sont plus précis et indépendants les uns des autres.

    29. Quels sont les deux paradigmes des méthodes d’ensemble ?

    Les deux paradigmes des méthodes d’ensemble sont

    •  Méthodes d’ensemble séquentielles
    • Méthodes d’ensemble parallèles

    30. À quoi servent PCA, KPCA et ICA?

    • PCA : Principal Components Analysis,
    • KPCA : Kernel based Principal Component Analysis
    • ICA : Independent Component Analysis

    sont d’importantes techniques d’extraction de caractéristiques utilisées pour la réduction dimensionnelle.

    31. Que signifie la réduction de dimension dans la Machine Learning?

    Dans la machine Learning et en statistiques, réduction de la dimension est le processus de réduction du nombre de variables aléatoires en  considérations et peut être divisé en sélection de caractéristiques et extraction de caractéristiques.

    32. Quelles sont les SVM : Support Vector Machine?

    Les SVM sont des algorithmes d’apprentissage supervisé utilisés pour l’analyse dela classification et la régression.

    33. Quelles sont les composantes des techniques d’évaluation relationnelle?

    Les composantes importantes des techniques d’évaluation relationnelles sont:

    •  l’acquisition de données ou data Acquisition
    •  l’acquisition de la vérité au sol ou Ground Truth Acquisition
    • la technique de validation croisée ou Cross Validation Technique
    • le type d’interrogation ou Query Type
    • la mesure de la notation ou Scoring Metric
    • le test de l’importance ou Significance Test

    34. Que signifie PAC Learning ?

    • PAC : Probably Approximately Correct.
    • PAC Learning  est un Framework d’apprentissage qui a été introduit pour analyser les algorithmes d’apprentissage et leurs efficacité statistique.

    35. Que signifie sequence learning ou l’apprentissage séquentiel?

    L’apprentissage séquentiel est une méthode d’enseignement et d’apprentissage logique.

    36. Quelles sont les différentes catégories possibles pour le processus d’apprentissage séquentiel?

    • Prévision
    • génération
    • Reconnaissance
    • décision

    37. Quelles sont les deux techniques de la Machine Learning?

    Les deux techniques de la Machine Learning sont:

    • Programmation génétique ou Genetic Programming
    • Apprentissage inductif  ou Inductive Learning

    38. Que signifie genetic programming ou programmation Génétique?

    La programmation génétique est l’une des deux techniques utilisées en Machine Learning. Le modèle est basé sur le test et la sélection du meilleur choix parmi un ensemble de résultats.

    39. Que signifie Inductive Logic Programming(ILP) en Machine Learning?

    Programmation logique inductive est un sous-domaine de la Machine Learning qui utilise la programmation logique représentant les connaissances de base et des exemples.

    40. Qu’est ce qu’une sélection de modèle  en Machine Learning?

    Le processus de sélection de modèles parmi différents modèles mathématiques, qui sont utilisés pour décrire le même ensemble de données, est connu sous le nom de sélection de modèles.

    La sélection des modèles est appliquée aux domaines de la statistique, de l’apprentissage automatique et de l’exploration de données.

    41. Quelles sont les deux méthodes utilisées pour la bonne prédiction dans l’apprentissage supervisé?

    les deux méthodes utilisées pour la bonne prédiction dans l’apprentissage supervisé sont:

    • Platt Calibration ou calibration plate
    • Isotonic Regression ou régression isotonique

    42. Quelles sont les méthodes de l’apprentissage séquentiel supervisé?

    Les methodes de resolution des problèmes de l’apprentissage séquentiel supervisé sont:

    • Sliding-window methods
    • Recurrent sliding windows
    •  Hidden Markow models
    • Maximum entropy Markow models
    • Conditional random fields
    • Graph transformer networks

    43. Quels sont les domaines de la robotique et du traitement de l’information où un problème de prévision séquentielle se manifeste?

    un problème de prévision séquentielle se manifeste dans les cas suivants:

    •            Imitation d’apprentissage
    •            Prediction structuré
    •            Apprentissage de renforcement basé sur un modèle

    44.  Que signifient Bagging et Boosting?

    Bagging est un processus d’ensemble d’apprentissage, utilisé pour améliorer les systèmes d’estimation ou de classification instables.

    Les méthodes boosting sont utilisées pour réduire le biais du modèle combiné.

    45. Quelles sont les similarités entre Bagging et Boosting?

    Les deux sont:

    •  des méthodes d’ensemble pour obtenir N apprend de 1 apprenant.
    • génèrent plusieurs ensembles de données de formation avec un échantillonnage aléatoire.
    • génèrent le résultat final en prenant la moyenne de N apprenants.
    • réduisent la variance et fournissent une grande évolutivité

    46. Quelle est la différence entre Bagging et Boosting?

    Boosting détermine le poids des données pour faire pencher la balance en faveur des cas les plus difficiles.

    Boosting essaye de réduire le biais.Au contraire,  Bagging peut résoudre le problème du overfitting alors que Boosting peut l’augmenter

    47. Quels sont les réseaux Bayesian?

    les réseaux Bayesian font référence à ‘belief networks‘  ou casual networks‘. Ils sont utilisés pour présenter une modélisation graphique des liens entre les probabilités sur plusieurs variables.

    48. Quelles sont les deux composantes du programme logique bayésien?

    Un programme logique bayésien a de deux composantes :

    • Logique: contient un ensemble de clauses bayésiennes, qui capturent la structure qualitative du domaine.
    • Quantitative: utilisé pour encoder des informations quantitatives sur le domaine.chatbot

    49. Nommez une application de Machine Learning que vous rencontrez tous les jours

    Les recommandations des site Ecommerce utilisent la Machine Learning

    50. Que sont les systèmes de recommandation?

    Les systèmes recommandation  représentent un filtrage de données. ILs prévoient les préférences des utilisateurs sur les produits en vente. Avec cette préférence, les systèmes de recommandations peuvent recommander un produit ou service à l’utilisateur.

    Le système de recommandation est largement utilisé pour recommander: des films, articles à lire, produits, musique,…

     

    A lire aussi:

     

    >