SAS propose des certifications big data

    Entretien d’embauche SAS: 50 Questions à préparer en 2020   

    La préparation pour un entretien d’embauche est très importante car elle vous permettra de renvoyer une image professionnelle et compétente au recruteur et c’est ce que les entreprises cherchent réellement: des professionnels compétents. Afin de vous aider à réussir votre entretien, nous vous présentons dans cet article 50 questions à préparer pour SAS.

    1. Que signifie SAS?

    • Statistical Analytics System ou Système d’analyse statistique
    • SAS est un logiciel d’analyse de données avancé: analyse multivarié, intelligence d’affaires, gestion de données et analyse prédictive.
    • développé par SAS Institute.
    • SAS fournit une interface utilisateur point-and-click graphique pour les utilisateurs non techniques et d’autres options plus avancées grâce au langage SAS.

    2. Pourquoi devriez-vous choisir SAS plutôt qu’un autre outils d’analyse de données?

    Vous devriez choisir SAS pour plusieurs raisons:

    • SAS est facile à apprendre, même pour des utilisateurs non techniques, surtout si vous avez des connaissances en SQL.
    • SAS a des bonnes capacités de traitement des données même lorsqu’on les compare aux langages de programmation R et Python.
    • SAS dispose d’une interface graphique interactive qui peut être personnalisée
    • SAS dispose de plusieurs outils où les déploiements sont testés et contrôlés en temps réel.
    • SAS est un leader mondial du marché de l’emploi. Elle détient actuellement 70 % de la part de marché.

    3. Quels sont les avantages du SAS?

    Les avantages du SAS suivants à votre entreprise  :

    • Solutions d’affaires efficaces
    • Leader sur le marché de l’analyse de données
    • C’est un logiciel SGBD(DBMS en anglais) pour la gestion d’accès aux données
    • Fournit une Visualisation graphiques simples ou complexes

    4. Quelles sont les capacités du Framework SAS?

    Les 4 capacités du Framework SAS sont :

      • L’analyse
      • L’acces
      • La gestion
      • la visualisation

    5. Quoi sert OUTPUT dans le un programme SAS?

    Pour enregistrer les statistiques récapitulatives dans un ensemble de données SAS, le statut OUTPUT est nécessaire.

    6. A quoi sert STOP dans un programme SAS?

    La requête STOP est nécessaire pour  interrompre rapidement le traitement des ensembles de données

    7. Comment l’option « drop = data set » est-elle utilisée dans une requête SET ?

    Si vous êtes intéressé par le traitement d’un certain ensemble de variables et vous ne voulez pas apparaitre dans le nouvel ensemble de données, vous utilisez  « drop = dataset » dans l’énoncé de l’ensemble.

    8. Comment l’option « drop = data set » est-elle utilisée dans l’énoncé de données?

    Si vous n’êtes pas intéressé par le traitement  d’un certain ensemble de variables et que vous ne voulez pas apparaître dans le nouvel ensemble de données, l’option « drop = dataset » est utilisée dans l’énoncé de données.

    9. Comment les données sont-elles accessibles à partir d’un fichier de données externe dans SAS?

    Lorsque les données sont accessibles à partir d’un fichier externe, seules les lectures sont prises en compte et les variables doivent être déclarées à nouveau si vous voulez les utiliser.

    10. Comment les données sont-elles accessibles à partir d’un ensemble de données existant dans SAS?

    Si vous voulez accéder à l’ensemble de données existant, utilisez SET et les valeurs des variables seront conservées d’une lecture à l’autre.

    11. Quels sont les types de données les plus utilisés dans le SAS?

    Les types de données les plus utilisés dans le SAS sont Character et Numeric.

    12. Comment différencier les fonctions et les procédures dans SAS?

    Dans les fonctions, les valeurs des arguments sont fournies à travers une observation. Dans le cas de procédures, il n’y en a qu’une pour chaque variable.

    13. Quelle est la différence entre SUM et l’opérateur “+” dans SAS?

    La fonction SUM retourne le total des arguments et l’opérateur “+” retourne la valeur manquante de toute valeur d’argument.

    exemple:

    • data mydata;
    • input x y z;
    • cards;
    • 33 3 3
    • 24 3 4
    • 24 3 4
    • . 3 2
    • 23 . 3
    • 54 4 .
    • 35 4 2
    • ;
    • run;
    • data mydata2;
    • set mydata;
    • a=sum(x,y,z);
    • p=x+y+z;
    • run;
    • n the output, value of p is missing for 4th, 5th and 6th observation as:
    • a p
    • 39 39
    • 31 31
    • 31 31
    • 5 .
    • 26 .
    • 58 .
    • 41 41

    14. Quel est l’avantage d’option de end=data set dans SAS?

    end=data set est utilisée pour lire la dernière valeur d’un ensemble de données non triées pour apparaître dans le nouvel ensemble de données.

     

    15. Quelle est la différence entre PROC SUMMARY et PROC MEANS?

    PROC MEANS fournit des statistiques d’un sous-groupe seulement s’il est trié ou ordonné.

    PROC SUMMARY peut fournir automatiquement des statistiques de tous les groupes

    16. Comment effacer les valeurs dupliquées dans un ensemble de données?

    Pour effacer les valeurs dupliquées dans un ensemble de données, utilisez la commande  “Proc SQL”.

    17. Quelle est la différence entre PUT et INPUT dans SAS?

    PUT est utilisée pour la conversion d’une valeur  de type “Numeric” en une valeur “Character”.

    Et pour le conversion d’une valeur “character” en une valeur “Numeric”, il faut utiliser INPUT.

    18. Quelle longueur maximale qui peut être attribuée à la variable cible par fonction Scan?

    C’est 200.

    19. Dans un ensemble de données non triés, comment pouvons-nous lire la dernière observation d’un nouvel ensemble de données?

    On peut lire la dernière observation d’un nouvel ensemble de données avec l’option “end =data set”

    exemple:

    data work.calculus;

    set work.comp end=last;

    If last;

    run;

    Calculus est un nouvel ensemble de données a creer et comp est l’ensemble de données existant. last est une variable temporaire, initialisé à 0, et qui passera à 1 lorsque la derniere observation est en lecture.

     

    20. Nommez quelques fonctions de SAS

    Parmi les fonctions de SAS, nous avons: Scan, Substr, trim, Catx, Index, tranwrd, find, Sum.

    21. A quoi sert la fonction TRANWRD?

    La fonction TRANWRD  sert à remplacer ou effacer toutes les occurrences d’un motif de caractères dans une chaîne de caractères.

    22. En considérant ce script:

    data finance;

    Amount=1000;

    Rate=.075/12;

    do month=1 to 12;

    Earned+(amount+earned)*(rate);

    output;

    end;

    run;

    Quel est le nombre d’observation à la fin de l’exécution?

    12

    23. Comment utilisez-vous la boucle do si vous ne savez pas combien de fois vous devriez exécuter cette boucle do?

    On peut utiliser: do until ou do while pour spécifier la condition d’itération

    24. Quelle est la différence entre Do until et Do while?

    Do while est évaluée en haut de la boucle DO et si la condition est fausse la première fois, la boucle do ne s’exécute jamais. Alors que Do until s’exécute au moins une seule fois.

    25. Comment spécifier le nombre d’itérations dans une boucle do?

    Exemple:

    data work;

    do i=1 to 20 until(Sum>=20000);

    Year+1;

    Sum+2000;

    Sum+Sum*.10;

    end;

    run;

    Cette itération permet d’exécuter la boucle jusqu’à ce que la somme soit supérieur à 20000 ou jusqu’à ce que la boucle do s’exécute 10 fois

    26. Quelles sont les paramètres de la fonction Scan?

    scan(argument,n,delimiters)

    Où, l’argument est la variable ou l’expression à scanner, n est le mot à lire, et delimiters sont des caractères spéciaux qui doivent être entourés par des  guillemets.

    27. Si une variable contient uniquement des nombre(ex:12567), pourrait-elle être d’un type Character?

    le type de données dépend de la variable.

    Il y a des chiffres que nous pouvons utiliser pour identifier une catégorie plutôt qu’une quantité. Un exemple de cela peut être une variable appelée « Étranger » où les observations ont la valeur « 0 » ou « 1 », 0 pour identifier le non-étranger et 1 pour étranger. De même, l’ID d’un tableau particulier peut être en nombre, mais ne représente pas spécifiquement une quantité. Les numéros de téléphone est un autre exemple populaire.

    28. Si une variable contient une lettre ou un caractère spécial, pourrait-elle considéré comme un type numérique?

    Non, elle doit être de type Character.

    29. Quelle est la taille maximale d’un ensemble de données dans SAS?

    Le nombre d’observation est limité par la capacité de maintenance et stockage des ordinateurs.

    Avant SAS 9.1, les ensembles de données SAS pouvaient contenir jusqu’à 32 767 variables. Dans SAS 9.1, le nombre maximal de variables dans un ensemble de données SAS est limité par les ressources disponibles sur votre ordinateur.

    30. Donnez des exemples où les valeurs par défaut de PROC REPORT sont différentes de celles de PROC PRINT?

    • No Record Numbers en Proc Report
    • Labels utilisés comme entêtes en  Proc Report
    • REPORT qui en besoin d’option  NOWINDOWS

    31. Donnez des exemples où les valeurs par défaut de PROC REPORT sont les mêmes que celles de PROC PRINT?

    • Variables/Colonnes dans l’ordre des positions.
    • Lignes ordonnées telles qu’elles apparaissent dans l’ensemble de données.

    32. Quelle est la différence entre les variables Order et les variables Group dans les proc report? 

    • si la variable est utilisée comme variable de groupe, les lignes qui ont les mêmes valeurs sont réduites.
    • Les variables de groupe produisent un rapport de liste tandis que la variable d’ordre produit un rapport de synthèse.

    33. Quelles sont les statistiques par défaut pour la procédure des moyennes?

    n-count, mean, standard deviation, minimum, et  maximum

    34. Comment limiter les décimales d’une variable en utilisant PROC MEANS ?

    en utilisant : MAXDEC= option

    35. Quelle est la différence entre l’énoncé CLASS et BY dans PROC MEANS?

      • BY nécessite que vos données soient déjà triées ou indexées dans l’ordre des variables BY.
      • Les résultats du groupe BY ont une mise en page différente de celle des résultats du groupe CLASS.

     

    36. Quelle est la différence entre PROC MEANS et Proc SUMMARY?

    La différence entre les deux procédures est que PROC MEANS produit un rapport par défaut. Par contre, pour produire un rapport dans PROC SUMMARY, vous devez inclure une option PRINT dans l’énoncé PROC SUMMARY.

    37. Quelle est la différence d’utilisation de PROC MEANS et PROC FREQ?

    Nous utiliserons PROC MEANS pour les variables numériques tandis que nous utiliserons PROC FREQ pour les variables catégorielles.

    38. Quels sont les  trailing @ et @@ dans SAS?

    L’option trailing @ est utilisée dans le pointeur de colonne pour maintenir la ligne. L’option trailing @ @ sert à maintenir la ligne encore plus par rapport au  trailing @ .

    39. Comment pouvez-vous produire les rapports de synthèse ou summary reports dans SAS ?

    Utilisez le rapport proc et définissez la variable comme variable de groupe pour créer le rapport de synthèse.

    40. Comment pouvez-vous spécifier la variable à traiter dans FREQ Procedure ?

    Cela peut se faire dans la  Table Statement.

    41. Comment fusionner ou combiner des ensembles de données dans SAS ?

    data combined;

    merge data1 data2;

    run;

    42. Lequel est le plus approprié pour combiner des ensembles de données: la fusion one-to-one ou la fusion par correspondance ?

    Il est recommandé d’utiliser l’option de fusion un à un plutôt que la fusion de correspondance.

    43. Quelle est la différence entre la fusion one to one et la fusion de correspondance? Donnez un exemple

    44. Que signifie interleaving dans SAS?

    L’interleaving combine des ensembles de données SAS triés et individuels en un seul ensemble de données triées de SAS. Pour chaque observation, la figure suivante montre la valeur de la variable par laquelle les ensembles de données ont été triés. L’ interleaving se fait à l’aide d’une instruction SET accompagnée d’une instruction BY.

    Ci-dessous un exemple de données triés en fonction de l’année:

    Nous pouvons trier et ensuite rejoindre les ensembles de données sur l’année avec le code ci-dessous.

    data combined;

    set data1 data2;

    by Year;

    run;

    45. Si nous avons un ensemble de données concaténées ayant la variable a b et c. Comment renommer un a et b en e et f?

    data concat(rename=(a=e b=f));

    set concat;

    run;

    46. Que fait la procédure CALENDAR dans SAS?

    La procédure Calendar affiche les données sur un calendrier mensuel

    47. A quoi sert la fonction DIVIDE?

    Divide est utilisée pour retourner un résultat de division.

    48. A quoi sert l’option ALTER = DATA Set?

    Elle est utilisée pour Il est attribué un mot de passe ALTER, qui empêchera les utilisateurs de changer le fichier.

    49. Décryptez l’abréviation ODS?

    ODS = Output Delivery System.

    50. Que signifie PDV ?

    PVD est l’abréviation de Program Data Vector ou Vecteur de données du programme.

    PVD est  est une zone logique dans la mémoire.

     

    A lire aussi:

    >