Intelligence artificielle Formation Python – Machine Learning 17/30 : Pandas - Le cas...

Pour approfondir le sujet

Sur le même thème :

Tutoriel d’initiation à l’IA – Python, Pandas et Matplotlib partie 2

Dans ce tutoriel, nous allons nous initier à Python, Pandas et Matplotlib en manipulant des données CSV. Nous partons du principe qu'Anaconda est installé...

JetBrains propose DataSpell, son nouvel environnement de développement dédié à la data science

JetBrains, un éditeur de logiciels pour développeurs, présente en mode preview, son nouvel environnement de développement (IDE) intitulé DataSpell. Dédié à la data science,...

ABBYY enrichit sa bibliothèque de développement open source dédiée au machine learning

ABBYY, une multinationale spécialisée dans la conception de logiciels et dans "l'intelligence digitale", étend les capacités de sa bibliothèque de développement open source NeoML....

Facebook AI et le HZM utilisent l’intelligence artificielle pour prévoir les effets des combinaisons de médicaments

Dans le cadre d'une recherche collaborative entre le centre de recherche allemand Helmholtz Zentrum München (HZM) et Facebook AI, un modèle d'intelligence artificielle a...

Formation Python – Machine Learning 17/30 : Pandas – Le cas des passagers du Titanic

Ce tutoriel python français vous présente Pandas : la libraire python la plus importante pour l’analyse de données et le data science.

Pandas ressemble beaucoup à Excel dans python, mais surpasse de loin les capacités d’Excel en matière d’analyse de données. Ce tutoriel francais vous présente les fonctions d’analyses les plus simples et les plus importantes en faisant l’analyse d’un dataset très célèbre: le Dataset des Passagers du Titanic.

Timecode la vidéo:

PARTIE 1: Analyse des données du TITANIC !

  • 01:12 Importer vos données dans python : pd.read_csv()
  • 02:18 Inspecter un Dataframe : shape, head, columns
  • 03:22 Éliminer les colonnes inutiles: drop()
  • 04:23 Statistiques rapides: describe()
  • 05:13 Les données manquantes dans Pandas : fillna() dropna()
  • 07:08 Value_counts et graphiques matplotlib !
  • 08:26 Groupby : equivalent des pivot table de Excel dans Pandas

PARTIE 2: DATAFRAMES ET SÉRIES dans les DÉTAILS

  • 10:11 DataFrame et Séries
  • 12:08 Indexing et Slicing
  • 13:58 Iloc et loc
  • 15:45 Exercice de Feature Engineering

 

►TÉLÉCHARGER LE DATASET DU TITANIC

► Documentation Pandas 

 

 

Sommaire de la formation:

[su_menu name=”formation_python_machinelearnia”]

Contributeur expert

Guillaume Saint-Cirgue

Guillaume Saint-Cirgue est Lead Data Scientist à GKNAerospace (Royaume-Uni). Ingénieur généra

Partager l'article

Levée de fonds record pour Databricks qui sécurise 10 milliards de dollars

Databricks, "The Data and AI company” pionnière de l’architecture data lakehouse, a récemment annoncé une levée de fonds record de 10 milliards de dollars lors...

Extension du Lille Ynov Campus : un pôle d’innovation au cœur du développement numérique de la métropole lilloise

Le jeudi 21 novembre dernier, Ynov, une école privée qui forme aux métiers du numérique, de la création et de l’innovation, a officiellement inauguré...

Deepfakes : YouTube et la Creative Artists Agency s’associent pour protéger l’image des célébrités

YouTube a annoncé ce 17 décembre s'associer à la Creative Artists Agency (CAA), l'une des agences les plus influentes dans le domaine du divertissement...

Le Hub France IA annonce l’ouverture des candidatures pour l’édition 2025 de sa cartographie des start-ups IA

Depuis 2020, le HUB France IA apporte, via sa cartographie, de la visibilité aux start-ups françaises prometteuses dont l’IA est le cœur du produit...