STAR

Pourcentage des lectures selon leurs types de mapping.

Figure 1 : diagramme en barres représentant les lectures catégorisées par leur famille d'alignement.

source : nf-core RNAseq MultiQC

Dans la figure 1, chaque échantillon est représenté en ordonnée et le pourcentage des lectures en abscisses.

Métriques :

Uniquely mapped : lectures qui ont le meilleur score d'alignement.

Mapped to multiple loci : lectures qui peuvent être gardées ou filtrées selon l'objectif du projet.

Mapped to too many loci : lectures filtrées mais pas alignées car elles sont présentes trop de fois à travers le génome de référence. Si une lecture est mappée plus de 10 fois elle ne sera pas alignée. Ce nombre est paramétrable (voir la documentation STAR.).

Unmapped too short : lectures non alignées car le ratio de mapping relatif à l'alignemnet dépassait les 30% de mismatch.

Unmapped other : lectures non alignées car 66% de la lecture n'a pas pue être alignée. Un autre cas est possible où la seed d'alignement n'a pas pu être trouvée c'est souvent le cas dans les contaminations par exemple.

S’il y a trop de séquences multi-mappées, cela correspond à une forte duplication du génome ou à des erreurs de manipulations/séquençages comme metttre plusieurs fois les même lectures par exemple. Le graphique ci-dessus montre un bon résultat : on attend au moins 90% de lectures Uniquely mapped.

results matching ""

    No results matching ""