3 Filtraggio

Le righe (cioè i geni) del dataset originale che hanno meno di 5 conteggi di lettura sono state filtrate: questo è un modo standard per rimuovere i geni non espressi e rendere la tabella dei dati più leggera, poiché molti geni sono per lo più non espressi. In casi particolari può essere utilizzato un numero diverso (più alto), al fine di essere più stringenti.

Nella tabella sottostante un sotto insieme dei campioni: 25 osservazioni (geni) e 4 variabili (individui).

Mostra il codice R

# create DESeq objects (Dataset)
dds <- DESeqDataSetFromMatrix(
  countData = readcounts,
  colData = coldata,
  design = ~infection
)
#> Warning in DESeqDataSet(se, design = design, ignoreRank): some variables in
#> design formula are characters, converting to factors

# remove genes with less than 5 counts
dds <- dds[rowSums(counts(dds)) > 5, ]

datatable(counts(dds)[1:25, 1:4],
  options = list(
    pageLength = 5,
    autoWidth = TRUE,
    dom = "Bfrtip",
    filter = "top"
  ), rownames = TRUE
)

Mostra il codice R


saveRDS(dds, "data/dds_fitered.rds")

---
params:
  mycondition: infection
  mynum: InfluenzaA
  mydenom: NonInfected
  mypval: 0.01
  myfc: 0.8
  mypadj: fdr
---

```{r}
#| echo: false
#| message: false
#| warning: false
source("_common.R")
library(tidyverse)
library(DESeq2) # BioC
library(RColorBrewer)
library(pheatmap)
library(ggrepel)
library(cowplot)
library(DT)
library(scales)
library(vsn) # BioC
library(apeglm) # BioC
library(rmarkdown)
library(gt)

readcounts <- readRDS("data/readcounts.rds")
coldata <- readRDS("data/coldata.rds")
```

# Filtraggio {#sec-preproc-filter}

::: {.content-hidden when-meta="features.advanced_analysis"}
Le righe (cioè i geni) del dataset originale che hanno **meno di 5 conteggi di lettura** sono state filtrate: questo è un modo standard per rimuovere i geni non espressi e rendere la tabella dei dati più leggera, poiché molti geni sono per lo più non espressi. In casi particolari può essere utilizzato un numero diverso (più alto), al fine di essere più stringenti.
:::

::: {.content-hidden unless-meta="features.advanced_analysis"}
I geni che hanno **meno di 5 conteggi di lettura** sono stati filtrati.
:::

Nella tabella sottostante un sotto insieme dei campioni: 25 osservazioni (geni) e 4 variabili (individui).

```{r dds_filter}
#| echo: true
# create DESeq objects (Dataset)
dds <- DESeqDataSetFromMatrix(
  countData = readcounts,
  colData = coldata,
  design = ~infection
)

# remove genes with less than 5 counts
dds <- dds[rowSums(counts(dds)) > 5, ]

datatable(counts(dds)[1:25, 1:4],
  options = list(
    pageLength = 5,
    autoWidth = TRUE,
    dom = "Bfrtip",
    filter = "top"
  ), rownames = TRUE
)

saveRDS(dds, "data/dds_fitered.rds")
```