Mis a jour le 2024-10-20, 20:16

Manipulation des séquences

Pour savoir quelle version de biopython est utilisée : import Bio; print Bio.__version__ (help(Bio) permet de voir quel est le fichier .py utilisé).
Définition d'une séquence :
Quand on définit une Seq, il vaut mieux la définir avec un alphabet : from Bio.Alphabet import DNAAlphabet; seq = Seq("ACGATGAC", DNAAlphabet()). C'est nécessaire si par exemple on veut sortir un seqRecord au format genbank. Alphabets possibles :
Conversion d'une protéine avec code à lettres en code à une lettre :
Table de traduction en protéines :
Séquences mutables :
SeqRecord : séquence avec un id, des annotations, des features, ... :
Bio.SeqFeature.SeqFeature :
FeatureLocation :
CompoundLocation :
Reconstruire un mRNA à partir des features de type exon d'un SeqRecord :
exonFeatures = filter(lambda x: x.type == 'exon', seqRecord.features)
newSeqRecord = reduce(lambda x, y: x + y, [feat.location.extract(seqRecord) for feat in exonFeatures])
  
conversion code 1 lettre / code 3 lettres protéique :

Copyright python-simple.com
programmer en python, tutoriel python, graphes en python, Aymeric Duclert