R5.12 - Modélisations mathématiques

Projet de prédiction de données sur un voyage spatial.


L’objectif de cette ressource est d'apprendre à utiliser différentes bibliothèques dédiées au domaine d’application pour réaliser une prédiction sur un dataset.

Le projet s'est déroulé en plusieurs étapes :

  1. Prendre en main les différents outils

    Pour pouvoir réaliser le projet, il a d'abord fallu apprendre à utiliser les différents outils d'études et d'affichage de données. J'ai donc appris à utiliser Pandas, Matplotlib, Seaborn et Scikit-learn lors de 6 TP. J'ai également appris à utiliser Google Colab pour réaliser mes projets.

  2. Choisir le dataset à étudier

    Le choix du dataset était libre sous condition de contenir suffisamment de données pour pouvoir réaliser une prédiction. J'ai choisi le dataset du Spaceship Titanic disponible sur Kaggle. J'ai choisi ce dataset car il contient des données sur les passagers du vaisseau spatial et je trouvais intéressant de pouvoir prédire si une personne a survécu ou non en fonction de ses caractéristiques.

  3. Appliquer les apprentissages

    J'ai ensuite appliqué les apprentissages réalisés lors des TP pour réaliser une prédiction sur le dataset choisi. J'ai donc utilisé les bibliothèques Pandas, Matplotlib, Seaborn et Scikit-learn pour réaliser une prédiction sur le dataset du Spaceship Titanic.


Outils utilisés

  • Python
    Langage
  • Google Colab
    IDE
  • Pandas
    Bibliothèque
  • Matplotlib
    Bibliothèque
  • Seaborn
    Bibliothèque
  • Scikit-learn
    Bibliothèque
  • Kaggle
    Site internet

Données utilisées

Site internet

Kaggle

Le dataset utilisé pour ce projet est disponible sur Kaggle. C'est une plateforme de compétition de science des données.

Dataset

Jeu de données

Il contient le jeu de données sur lequel j'ai travaillé et que j'ai récupéré sur Kaggle.

Livrable produit

Notebook

Le notebook contient le code source et les résultats obtenus. Il est disponible sur Google Colab et pour le consulter, vous aurez besoin d'un compte Google.


Conclusion

Cette ressource a permis de mettre en œuvre les compétences suivantes :
AC32.03 : Choisir et utiliser des bibliothèques et méthodes dédiées au domaine d’application.

J'estime que ce TP prouve ma réussite dans cette ressource puisque j'ai réalisé toutes les tâches demandées et que j'ai compris et mis en application les concepts abordés dans les tp réalisés.

J'ai appris à utiliser différentes bibliothèques pour réaliser une prédiction sur un dataset. J'ai également appris à utiliser Google Colab et les notebooks pour réaliser mon projet.

En terme d'acquisition de la compétence AC32.03, je pense que j'ai réussi à utiliser des bibliothèques et méthodes dédiées au domaine d’application.En effet, pour réaliser ce projet, j'ai utilisé les bibliothèques Pandas, Matplotlib, Seaborn et Scikit-learn pour réaliser une prédiction sur un dataset.