Mis a jour le 2021-03-28, 20:41

Création de Series

Création d'une série, c'est à dire d'un vecteur de valeurs d'une variable (en général valeurs pour différents individus) :
Si s = pandas.Series([1, 5, 3, 9, numpy.inf, numpy.nan]) :
s2 = s.copy() : fait une copie indépendante de la série.
Modification de valeurs : on peut faire s.replace({'a': 'A', 'b': 'B'}) : remplace les 'a' par des 'A' et 'b' par des 'B' et renvoie une série modifiée.
Index d'une série : c'est le nom affecté à chaque valeur :
s.describe() : valeurs statistiques d'une série.
Création d'une série avec valeur répétée :
Indexation des séries :
Indexation de sous-séries : attention, quand on a extrait une sous-série avec par exemple s = s[s > 4], les numéros d'index n'ont pas changé ! (s[1] pointe toujours vers la même valeur qu'avant s'il fait toujours partie de la série, sinon, exception).
Tri d'une series :
Slicing d'une series : s = pandas.Series(['ACBDE', 'acbde']); s.str.slice(start = 1, stop = 3) donne la series ['CB', 'cb']
Opérations sur les séries : on peut utiliser les opérations comme sur les array numpy :
Minimum élément par élément de 2 séries :
Attribut name d'une série :
Concaténation de series de type string, ici séparées par des tirets : s1 + '-' + s2 + '-' + s3
Pour une série :
Comptage de valeurs :
Elimination des NaN :
Pour des séries, si s1 = pandas.Series([1, 2, 3, numpy.nan]) et s2 = pandas.Series([1, 4, 3, 6])
Attention : l'opérateur in pour une série ne teste pas l'appartenance à la série, mais à son index ! Si s = pandas.Series(['a', 'b', 'c']) :
Fonction isin : si s = pandas.Series(['a', 'b', 'c']), s.isin(['a', 'c', 'x']) teste si chaque élément de la série est ou non dans la liste donnée (donc renvoie ici la Series [True, False, True]).
Test pour les NaN :
pour déterminer le numéro d'ordre de chaque valeur (rank) :
s1.argsort() : renvoie les index dans l'ordre croissant des valeurs (de telle sorte que s1[s1.argsort()] est trié par ordre croissant). Attention : ce ne sont pas les numéros d'ordre pour chaque valeur, utiliser rank pour cela !
Fonctions vectorisées sur une série contenant des chaînes de caractères :
Sélection de valeurs :
Conversion d'une series :
Divers :

Copyright python-simple.com
programmer en python, tutoriel python, graphes en python, Aymeric Duclert