Mis a jour le 2024-10-20, 20:16

Dataframes et indexation

Quand on boucle sur un dataframe, on boucle sur les noms des colonnes :
for x in df:
  print(x) # imprime le nom de la colonne
  
On peut boucler sur les lignes d'un dataframe, chaque ligne se comportant comme un namedtuple :
Accès à une colonne :
Attention :
df['A'][0:3] : les 3 premières valeurs des 3 premières lignes de la colonne 'A' (sous forme de Series).
Accès à un sous-ensemble du dataframe avec les noms des lignes et colonnes :
Accès à un sous-ensemble du dataframe avec les numéros des lignes et colonnes :
Type récupéré lors de l'accès par colonne d'une dataframe : si df est un dataframe avec 'A' parmi ses colonnes :
Accès à certaines colonnes et certaines lignes par numéros : df.loc[:,['A', 'b']].iloc[0:2]
Quand on veut adresser une cellule d'un dataframe en utilisant à la fois un numéro de ligne et un nom de colonne :
Accès selon une condition :
s.index.to_list() : donne la liste des valeurs de l'index
Quand on a 2 index de dataframes :
Réindexation d'un dataframe :
Pour compter le nombre de lignes pour lesquelles on a une valeur : (df['A'] == 'x').sum()
Sampling d'un dataframe :

Copyright python-simple.com
programmer en python, tutoriel python, graphes en python, Aymeric Duclert