Ce tutoriel python français vous présente Pandas : la libraire python la plus importante pour l’analyse de données et le data science.
Pandas ressemble beaucoup à Excel dans python, mais surpasse de loin les capacités d’Excel en matière d’analyse de données. Ce tutoriel francais vous présente les fonctions d’analyses les plus simples et les plus importantes en faisant l’analyse d’un dataset très célèbre: le Dataset des Passagers du Titanic.
Timecode la vidéo:
PARTIE 1: Analyse des données du TITANIC !
- 01:12 Importer vos données dans python : pd.read_csv()
- 02:18 Inspecter un Dataframe : shape, head, columns
- 03:22 Éliminer les colonnes inutiles: drop()
- 04:23 Statistiques rapides: describe()
- 05:13 Les données manquantes dans Pandas : fillna() dropna()
- 07:08 Value_counts et graphiques matplotlib !
- 08:26 Groupby : equivalent des pivot table de Excel dans Pandas
PARTIE 2: DATAFRAMES ET SÉRIES dans les DÉTAILS
- 10:11 DataFrame et Séries
- 12:08 Indexing et Slicing
- 13:58 Iloc et loc
- 15:45 Exercice de Feature Engineering
►TÉLÉCHARGER LE DATASET DU TITANIC
Sommaire de la formation:
[su_menu name=”formation_python_machinelearnia”]