Mis a jour le 2024-10-20, 20:16

Réorganisation des dataframes

Pivotage dans fonction d'aggrégation :
pivot_table : plus souple que pivot :
Stacking : consiste à empiler les différentes colonnes d'un dataframe :
Si on part d'un dataframe df = pandas.DataFrame({'person': ['a', 'a', 'b', 'b', 'c', 'c'], 'condition': ['A', 'B', 'A', 'B', 'A', 'B'], 'value': [5, 8, 4, 9, 1, 6]}) et que l'on veut un dataframe avec comme colonnes person, A et B :
Réorganisation avec melt pour empiler les données associés à certaines colonnes définies comme clefs :
One-hot encoding : transforme les colonnes de type catégories en autant de colonnes que de valeurs avec un 1 quand c'est la bonne valeur et des 0 ailleurs :

Copyright python-simple.com
programmer en python, tutoriel python, graphes en python, Aymeric Duclert