Mis a jour le 2018-10-21, 16:55

Dataframes et indexation

Quand on boucle sur un dataframe, on boucle sur les noms des colonnes :
for x in df:
  print(x) # imprime le nom de la colonne
  
On peut boucler sur les lignes d'un dataframe, chaque ligne se comportant comme un namedtuple :
Accès à une colonne :
df['A'][0:3] : les 3 premières valeurs des 3 premières lignes de la colonne 'A' (sous forme de Series).
Accès à un sous-ensemble du dataframe avec les noms des lignes et colonnes :
Accès à un sous-ensemble du dataframe avec les numéros des lignes et colonnes :
Accès à certaines colonnes et certaines lignes par numéros : df.loc[:,['A', 'b']].iloc[0:2]
Quand on veut adresser une cellule d'un dataframe en utilisant à la fois un numéro de ligne et un nom de colonne : df.loc[df.index[3], 'A'] (nécessaire si on veut changer la valeur)
Accès selon une condition :
Réindexation d'un dataframe :

Copyright python-simple.com
programmer en python, tutoriel python, graphes en python, Aymeric Duclert