Le righe (cioè i geni) del dataset originale che hanno meno di 5 conteggi di lettura sono state filtrate: questo è un modo standard per rimuovere i geni non espressi e rendere la tabella dei dati più leggera, poiché molti geni sono per lo più non espressi. In casi particolari può essere utilizzato un numero diverso (più alto), al fine di essere più stringenti.
Nella tabella sottostante un sotto insieme dei campioni: 25 osservazioni (geni) e 4 variabili (individui).
Mostra il codice R
# create DESeq objects (Dataset)dds<-DESeqDataSetFromMatrix( countData =readcounts, colData =coldata, design =~infection)#> Warning in DESeqDataSet(se, design = design, ignoreRank): some variables in#> design formula are characters, converting to factors# remove genes with less than 5 countsdds<-dds[rowSums(counts(dds))>5, ]datatable(counts(dds)[1:25, 1:4], options =list( pageLength =5, autoWidth =TRUE, dom ="Bfrtip", filter ="top"), rownames =TRUE)
---params: mycondition: infection mynum: InfluenzaA mydenom: NonInfected mypval: 0.01 myfc: 0.8 mypadj: fdr---```{r}#| echo: false#| message: false#| warning: falsesource("_common.R")library(tidyverse)library(DESeq2) # BioClibrary(RColorBrewer)library(pheatmap)library(ggrepel)library(cowplot)library(DT)library(scales)library(vsn) # BioClibrary(apeglm) # BioClibrary(rmarkdown)library(gt)readcounts <-readRDS("data/readcounts.rds")coldata <-readRDS("data/coldata.rds")```# Filtraggio {#sec-preproc-filter}::: {.content-hidden when-meta="features.advanced_analysis"}Le righe (cioè i geni) del dataset originale che hanno **meno di 5 conteggi di lettura** sono state filtrate: questo è un modo standard per rimuovere i geni non espressi e rendere la tabella dei dati più leggera, poiché molti geni sono per lo più non espressi. In casi particolari può essere utilizzato un numero diverso (più alto), al fine di essere più stringenti.:::::: {.content-hidden unless-meta="features.advanced_analysis"}I geni che hanno **meno di 5 conteggi di lettura** sono stati filtrati.:::Nella tabella sottostante un sotto insieme dei campioni: 25 osservazioni (geni) e 4 variabili (individui).```{r dds_filter}#| echo: true# create DESeq objects (Dataset)dds <- DESeqDataSetFromMatrix( countData = readcounts, colData = coldata, design = ~infection)# remove genes with less than 5 countsdds <- dds[rowSums(counts(dds)) > 5, ]datatable(counts(dds)[1:25, 1:4], options = list( pageLength = 5, autoWidth = TRUE, dom = "Bfrtip", filter = "top" ), rownames = TRUE)saveRDS(dds, "data/dds_fitered.rds")```