Intelligence artificielle Formation Python – Machine Learning 17/30 : Pandas - Le cas...

Pour approfondir le sujet

Sur le même thème :

Tutoriel d’initiation à l’IA – Python, Pandas et Matplotlib partie 2

Dans ce tutoriel, nous allons nous initier à Python, Pandas et Matplotlib en manipulant des données CSV. Nous partons du principe qu'Anaconda est installé...

JetBrains propose DataSpell, son nouvel environnement de développement dédié à la data science

JetBrains, un éditeur de logiciels pour développeurs, présente en mode preview, son nouvel environnement de développement (IDE) intitulé DataSpell. Dédié à la data science,...

ABBYY enrichit sa bibliothèque de développement open source dédiée au machine learning

ABBYY, une multinationale spécialisée dans la conception de logiciels et dans "l'intelligence digitale", étend les capacités de sa bibliothèque de développement open source NeoML....

Facebook AI et le HZM utilisent l’intelligence artificielle pour prévoir les effets des combinaisons de médicaments

Dans le cadre d'une recherche collaborative entre le centre de recherche allemand Helmholtz Zentrum München (HZM) et Facebook AI, un modèle d'intelligence artificielle a...

Formation Python – Machine Learning 17/30 : Pandas – Le cas des passagers du Titanic

Ce tutoriel python français vous présente Pandas : la libraire python la plus importante pour l’analyse de données et le data science.

Pandas ressemble beaucoup à Excel dans python, mais surpasse de loin les capacités d’Excel en matière d’analyse de données. Ce tutoriel francais vous présente les fonctions d’analyses les plus simples et les plus importantes en faisant l’analyse d’un dataset très célèbre: le Dataset des Passagers du Titanic.

Timecode la vidéo:

PARTIE 1: Analyse des données du TITANIC !

  • 01:12 Importer vos données dans python : pd.read_csv()
  • 02:18 Inspecter un Dataframe : shape, head, columns
  • 03:22 Éliminer les colonnes inutiles: drop()
  • 04:23 Statistiques rapides: describe()
  • 05:13 Les données manquantes dans Pandas : fillna() dropna()
  • 07:08 Value_counts et graphiques matplotlib !
  • 08:26 Groupby : equivalent des pivot table de Excel dans Pandas

PARTIE 2: DATAFRAMES ET SÉRIES dans les DÉTAILS

  • 10:11 DataFrame et Séries
  • 12:08 Indexing et Slicing
  • 13:58 Iloc et loc
  • 15:45 Exercice de Feature Engineering

 

►TÉLÉCHARGER LE DATASET DU TITANIC

► Documentation Pandas 

 

 

Sommaire de la formation:

[su_menu name=”formation_python_machinelearnia”]

Contributeur expert

Guillaume Saint-Cirgue

Guillaume Saint-Cirgue est Lead Data Scientist à GKNAerospace (Royaume-Uni). Ingénieur généra

Partager l'article

Vendée Territoire Connecté : réseau d’objets connectés et jumeau numérique au service de la transition écologique

Vendée Territoire Connecté, l'un des douze projets lauréats de l'appel à projets DIAT, entre dans sa phase opérationnelle. Porté par Vendée Numérique et soutenu...

Nomination de Clara Chappaz : La voie vers une nouvelle mission ?

En ligne avec l’intervention en Serbie d’Emmanuel Macron fin août, la nomination de Clara Chappaz en tant que Secrétaire d’Etat Chargée de l’Intelligence Artificielle...

Mozilla appelle à créer une alternative publique à l’IA privée dominée par les Big Tech

Si l'organisation à but non-lucratif Mozilla est connue principalement pour son navigateur web, Mozilla Firefox, elle, œuvre sans relâche en faveur des libertés numériques, de...

IA et sûreté : vers une généralisation des caméras de vidéosurveillance intelligentes en France

L'expérimentation des caméras de surveillance augmentées d'IA lors des Jeux olympiques et paralympiques s'est avérée positive. Le gouvernement réfléchit donc à l'installer durablement sur...