RNA-Seq juvéniles de bar: Projet 3S (Seabass, Sex and Stress)
Données de séquençage de 122 échantillons (P2: 10, P3: 69 et P4 (gonades): 43). Séquencées par un HiSeq 2500 d'Illumina
Data accessChemin d'accès | /home/ref-bioinfo/ifremer/marbec/3S_FEAMP |
Date(s)Date(s) |
|
Author(s)Auteur(s) | Geffroy Benjamin
(IFREMER)
|
Contact(s)Contact(s) | IFREMER
|
SourceSource |
CNRS MGX |
LineageGénéalogie |
1 Procédures expérimentales 1.1 Préparation d'une banque de mRNA La préparation de la banque se fait à l'aide d'un kit TruSeq Stranded mRNA Sample Preparation kit d'Illumina. Elle comprend 7 étapes : 1. La sélection des ARN polyadenylés sur billes magnétiques oligo(dT) ; 2. La fragmentation chimique des ARN sélectionnés ; 3. La synthèse du premier brin de cDNA (random primers + SuperScript II) en présence d'actinomycine D afin de bloquer la synthèse du second brin ; 4. La synthèse du second brin de cDNA en remplaçant le dTTP par du dUTP afin de bloquer la synthèse du second brin lors de l'étape d'amplification par PCR ; 5. L'ajout d'une base A à ces extrémités ; 6. La ligation d'adpatateurs à ces extrémités. 7. Une étape d'amplification par PCR. Cette étape permet aussi une sélection puisque seuls les fragments portant les deux types d'adpatateurs seront amplifiés. La validation des banques est réalisée grâce à une quantification (concentration et taille des fragments) de l'ADN sur Fragment Analyzer (kit Standard Sensitivity NGS) ainsi que par qPCR (ROCHE Light Cycler 480). 1.2 Séquences des adaptateurs La séquence des adaptateurs unique dual (UD) index utilisés pour ce type de banque est la suivante : Index 1 (i7) Adapters GATCGGAAGAGCACACGTCTGAACTCCAGTCAC[i7]ATCTCGTATGCCGTCTTCTGCTTG Index 2 (i5) Adapters AATGATACGGCGACCACCGAGATCTACAC[i5]ACACTCTTTCCCTACACGACGCTCTTCCGATCT Les séquences suivantes doivent être utilisées si vous voulez réaliser une étape de trimming des adaptateurs : — Read1 : AGATCGGAAGAGCACACGTCTGAACTCCAGTCA — Read2 : AGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGT 1.3 Génération des clusters et hybridation du primer de séquençage Les différentes étapes qui vont suivre sont réalisées à l'intérieur d'une flow cell sur un appareil appelé cBot à l'aide d'un kit cluster generation d'Illumina. La flow cell est une lame de verre sur laquelle sont coatées de façon covalente des séquences d'ADN complémentaires de celles des adaptateurs qui ont été ajoutées aux fragments d'ADN lors de la constitution de la banque. Chaque flow cell possède 8 pistes et permet donc de traiter 8 banques, ou pools de banques, en même temps de façon indépendante. La cBot est composée d'un bloc chauffant/refroidissant qui accueille la flow cell et d'une partie qui va accueillir les réactifs. Un système de pompe et de tubulure permet d'amener les réactifs à la flow cell et de les injecter dans chaque piste. Cette cBot permet de réaliser 5 étapes qui sont, dans l'ordre chronologique : 1. l'hybridation des fragments d'ADN constituant la banque à la flow cell 2. l'amplification de ces fragments une fois fixés à la flow cell. Cette amplification est isotherme et est rendue possible par la formation de ponts d'ADN. Elle permet la génération de clusters d'ADN (population clonale de fragments d'ADN) 3. la linéarisation des sus-dit ponts d'ADN 4. le blocage de l'extrémité libre des fragments d'ADN fixés à la flow cell 5. la dernière étape correspond à l'hybridation du primer de séquençage sur l'extrémité libre des fragments d'ADN fixés à la flow cell L'optimisation du séquençage qui aura lieu lors de l'étape suivante est intimement liée à la densité des clusters présents sur la flow cell à l'issue des 5 étapes décrites ci-dessus. C'est pourquoi les banques sont poolées de façon équimolaire, puis chaque pool est dénaturé puis dilué à 20 pM avant d'être injecté et hybridé à la flow cell. 1.4 Le séquençage Il est réalisé sur un HiSeq 2500 d'Illumina grâce à la technique SBS (Sequence By Synthesis). Il s'agit de l'incorporation et de la détection séquentielle de nucléotides par polymérisation en se servant des clusters d'ADN fixés à la flow cell comme matrice. Chaque type de nucléotide qui va permettre cette réaction est marqué avec un fluorochrome (émettant après excitation à une longueur d'onde donnée) et un agent bloquant qui empêchera l'incorporation de plusieurs nucléotides lors d'un même cycle de SBS. La partie optique du séquenceur est constituée de 2 lasers, de 2 filtres et de 4 caméras numériques (une par nucléotide). A la fin de chaque cycle de SBS, un tampon de clivage sera injecté dans chaque piste, permettant la coupure du fluorochrome et de l'agent bloquant pour chaque nucléotide incorporé. Ceci permettra l'incorporation d'un nouveau nucléotide lors du cycle suivant. On peut donc décrire chaque cycle de SBS comme suit : — lavage — incorporation d'un nouveau nucléotide — lavage — détection — lavage — clivage Le contrˆole de la qualité du run de séquençage se fait à l'issue du premier cycle, une fois la première base incorporée. Un rapport est alors généré sur l'analyse de cette première base permettant ainsi d'estimer : — la densité en cluster sur chaque piste de la flow cell — l'intensité du signal généré — la qualité du focus de l'appareil Ce focus est réalisé de façon automatique et dynamique. 1.5 Autres informations Chaque piste (lane) de la flow cell v4 est divisée en 3 colonnes ou swaths, correspondant à la largeur de balayage de la caméra. La caméra lit en continu la fluorescence, le laser rouge precedant le laser vert. Le logiciel HiSeq Control Software (HCS) divise une swath en 16 portions (tiles) pour l'analyse d'images. Au total, on aura 96 tiles par piste soit 48 par face (top et bottom). 2 Pré-traitement informatique Analyses d'images Les analyses d'images sont réalisées avec le logiciel HiSeq Control Software (HCS) d'Illumina. L'analyse d'images identifie la position des clusters, leurs intensités et le bruit associé. Base calling Le base calling est réalisé par le logiciel RTA fourni par Illumina. Cette étape permet de corriger les intensités et de transformer l'intensité en base nucléotidique. Cette phase se décompose en 3 étapes : — les images sont tout d'abord corrigées pour tenir compte du recouvrement des spectres d'émission des 4 fluorophores ; — les images subissent ensuite une déconvolution afin d'optimiser le signal de chaque pixel ; — la conversion des intensités de fluorescence à chaque longueur d'onde en base nucléotidique est ensuite réalisée, en tenant compte, cluster par cluster, d'un éventuel déphasage de la synthèse d'ADN lors des cycles précédents. Séquences contrˆole Avant démultiplexage, les séquences de vos échantillons sont mélangées avec celles du spike de PhiX (contrˆole Illumina) à hauteur de 1% par piste. Après démultiplexage, vos échantillons ne contiennent plus de séquences du PhiX. |
ConstraintsContraintes |
|
Spatial informationsInformations géographiques |
|
Citation proposalCiter la ressource
Geffroy Benjamin .RNA-Seq juvéniles de bar: Projet 3S (Seabass, Sex and Stress).IFREMER
https://doi.org/10.12770/5cb1485f-385e-46e9-9cc1-4b4d77802183
accessData
OverviewsAperçus

)