Tryptophane
Par exemple, y a-t-il une raison pour laquelle «W» a été spécifiquement choisi pour le tryptophane (autre que le fait que «T» a été pris)?
Une fois que vous avez attribué les 19 autres acides aminés, il ne reste plus que 7 lettres de l'alphabet: B, J, O, U, W, X et Z. (Certainement pas une belle Scrabble à la main!)
Si l'on veut utiliser une lettre trouvée dans le nom de l'acide aminé, la seule lettre disponible serait O. Cependant, l'utilisation de U et O était historiquement déconseillée car ces les lettres peuvent être facilement confondues avec d'autres lettres (U avec V; O avec G, Q, C, D et le chiffre 0).
Il s'avère que le choix a été fait car W est un très gros lettre et rappelait le système cyclique indole présent dans le tryptophane (le seul acide aminé à contenir un système bicyclique). (Voir ci-dessous pour la source.)
Qu'est-il arrivé aux six autres lettres, alors?
Les 26 lettres de l'alphabet sont désormais utilisées comme code à une lettre pour les acides aminés ou diverses combinaisons de ceux-ci.
Après leurs découvertes, la sélénocystéine et la pyrrolysine (cette dernière ne se trouvant que dans les bactéries) se sont vu attribuer respectivement U et O. De plus, B est utilisé pour représenter l'acide aspartique OU l'asparagine; J est utilisé pour représenter la leucine OU l'isoleucine; Z est utilisé pour représenter l'acide glutamique OU la glutamine; et X est utilisé pour représenter un acide aminé inconnu.
Je crois que B et Z trouvent une utilité parce que, dans le séquençage des protéines, l'hydrolyse acide est souvent utilisée pour rompre les liaisons peptidiques. Cela a pour effet secondaire indésirable d'hydrolyser les groupes amide dans l'asparagine / glutamine, conduisant à la formation d'acides aspartiques / glutamiques, ce qui signifie que l'on ne peut pas dire exactement de quel acide aminé il s'agissait au départ. J est utilisé en spectroscopie RMN où l'isoleucine et la leucine sont difficiles à distinguer.
Pourquoi ont-ils choisi les lettres qu'ils ont choisies?
Pour autant que je sache, l'utilisation des symboles à une lettre est adoptée par l'IUPAC et l'IUB (depuis 1991, IUBMB) dans leurs recommandations conjointes de 1983 sur «Nomenclature et symbolisme des acides aminés et des peptides». 1 le résumé concis du développement historique d'Ankit7540 mentionnait déjà ces recommandations.
En particulier, la Section 3AA-21.2 "Les symboles de code" a une description de la raison pour laquelle les lettres étaient choisi. Ce document est probablement la position la plus officielle en la matière. La justification est en grande partie conforme à la réponse de Jan:
Les lettres initiales des noms des acides aminés ont été choisies là où il n'y avait aucune ambiguïté. Il y a six cas de ce type: cystéine, histidine. isoleucine, méthionine, sérine et valine. Tous les autres acides aminés partagent les lettres initiales A, G, L, P ou T, de sorte que des attributions arbitraires ont été faites. Ces lettres ont été attribuées aux acides aminés les plus fréquents et structurellement les plus simples avec ces initiales, alanine (A), glycine (G), leucine (L), proline (P) et thréonine (T).
D'autres affectations ont été faites sur la base d'associations qui pourraient être utiles pour se souvenir du code, par exemple les associations phonétiques de F pour la phénylalanine et R pour l'arginine. Pour le tryptophane, le double anneau de la molécule est associé à la lettre volumineuse W. Les lettres N et Q ont été attribuées respectivement à l'asparagine et à la glutamine; D et E aux acides aspartique et glutamique respectivement. K et Y ont été choisis pour les deux acides aminés restants, la lysine et la tyrosine, car, parmi les quelques lettres restantes, ils étaient proches alphabétiquement des lettres initiales des noms. U et O ont été évités parce que U est facilement confondu avec V dans un document manuscrit, et O avec G, Q, C et D dans des impressions informatiques imparfaites, et également avec zéro. J a été évité car il est absent de plusieurs langues.
Deux autres symboles sont souvent nécessaires pour des séquences partiellement déterminées, donc B a été attribué à l'acide aspartique ou à l'asparagine lorsque ceux-ci n'ont pas été distingués; Z a été attribué de manière similaire à l'acide glutamique ou à la glutamine. X signifie que l'identité d'un acide aminé est indéterminée, ou que l'acide aminé est atypique.
On ne peut que faire l'hypothèse de ce qu'ils entendaient par "associations qui pourraient être utiles pour se souvenir du code" dans le cas de N / Q / D / E. Ma meilleure supposition est:
- D et E ont peut-être été choisis pour les acides aspartique et glutamique parce qu'ils étaient la seule paire consécutive de lettres restantes, soulignant leur similitude chimique. L'acide aspartique est plus court que l'acide glutamique par un groupe méthylène (CH 2 ), donc il obtient la première lettre D.
- La glutamine ressemble à la Q-tamine. Si vous pensez que cela ne semble pas similaire, répétez-le 50 fois jusqu'à ce que vous le fassiez.
- AsparagiNe s'est vu attribuer N.
Référence
- Commission mixte IUPAC-IUB sur la nomenclature biochimique. Nomenclature et symbolisme des acides aminés et des peptides: recommandations 1983. FEBS J. 1984, 138 (1), 9–37. DOI: 10.1111 / j.1432-1033.1984.tb07877.x. Une version HTML (peut-être plus conviviale) est disponible à cette adresse.