Apprendre la Data Science avec R

Apprendre la Data Science avec R

En partant de zéro, ce cours vous apprendre les bases des data sciences, en s'appuyant sur le langage Ret des cas concrets utilisant des données réelles
Après avoir installé R et découvert l'outil RStudio, nous progresserons rapidement à travers les différentes structures de données existantes, et peu à peu la théorie laissera la place à des exercices de plus en plus concrets. Nous jouerons avec un jeu de données présentant des indicateurs de développement sur tous les pays du monde depuis 1960. 
Au début simplifiées, ces données s'étofferont en même temps que vos compétences, jusqu'à ce que vous puissiez vous-même, de manière autonome, réaliser une analyse de données complète.
C'est alors que nous passerons à la visualisation graphique, compétence indispensable au data scientist pour communiquer ses résultats à son équipe, sa hiérarchie, ou au grand public. 
Pourquoi apprendre R ?
R est, avec Python, le langage le plus utilisé en data science. À l'origine inventé par des statisticiens et pour des statisticiens, il a su s'enrichir et se développer face aux progrès du domaine. Étant complètement libre, de nombreux data scientists développent de nouveaux packages pour intégrer tous les nouveaux modèles et algorithmes des data sciences, ou bien pour rendre le langage plus rapide et optimisé.
R était à l'origine surtout utilisé dans le monde académique, mais sa croissance phénoménale, sa puissance grandissante, et son côté libre, lui ont permis peu à peu d'intégrer les services de data science des plus grandes compagnies, telles Google, Facebook, Airbnb, mais aussi EDF, La Poste, ou Renault, en France.
Le R de base (sans les packages) est assez limité. C'est pourquoi dans ce cours nous utiliserons les packages "dplyr" et "ggplot2", respectivement pour la manipulation et la visualisation de données. Ce sont les plus utilisés à l'heure actuelle et ils permettent bien plus de choses que le R de base, souvent de manière plus optimisée en terme de performances.
Objectifs de ce cours
L'objectif de ce cours est de vous rendre autonome dans l'analyse de données. Une fois terminé, vous serez capable de :
  • Trouver le jeu de données qu'il vous faut sur internet (je vous donne de nombreuses sources).
  • Charger ces données dans R.
  • Trouver les réponses aux questions que vous vous posez en analysant ces données.
  • Communiquer vos résultats sous forme de visualisation graphique à l'aspect professionnel.
  • Et donc créer votre propre portfolio.
À noter que l'objectif n'est PAS de faire de vous un programmeur en R qui connaît toutes les fonctions. D'abord, ce serait impossible, parce que les possibilités sont quasi-infinies, et c'est un langage en développement constant. 
J'ai donc délibérément choisi des limites et omis certains détails dans le but de garder le cours dynamique, avec une progression constante et rapide, afin que vous puissiez vous débrouiller le plus rapidement possible.
Je crois fermement en la pratique et l'expérience pour apprendre tous ces petits détails. Voilà pourquoi, plutôt que d'aligner les vidéos de théorie, j'ai préféré ajouter des exercices concrets sur des données réelles pour que vous acquériez directement cette expérience. 
Nous verrons aussi comment lire la documentation ou chercher sur internet lorsqu'on ne sait pas comment faire quelque chose. L'objectif final est de faire de vous un data scientist réfléchi qui n'a pas la vocation de tout savoir par cœur, mais plutôt de toujours savoir où trouver l'information, et la trouver rapidement.
Ce cours est en constante évolution
Mon objectif est de faire de ce cours le meilleur possible afin que vous puissiez vous lancer le plus rapidement votre carrière de data scientist.
Voilà pourquoi je compte continuer à l'étoffer au fil du temps selon le feedback et les demandes que je recevrai. Ça peut passer par ajouter du nouveau contenu ou bien refaire de l'ancien contenu que vous jugez peut-être confus ou trop bref.
N'hésitez donc surtout pas à me dire si :
  • Vous pensez qu'un thème que je n'ai pas abordé devrait l'être,
  • Vous trouvez qu'un sujet est traité trop rapidement et vous aimeriez avoir de plus amples explications,
  • Vous aimeriez plus d'exercices sur un sujet en particulier.
100% Off Udemy Coupon Code - https://www.udemy.com/datascience-r/?couponCode=PROMO500

Post a Comment

Post a Comment (0)

Previous Post Next Post