![]()
掌握單細(xì)胞的環(huán)境搭建和分析套路后,接下來主要是單細(xì)胞數(shù)據(jù)分析。單細(xì)胞數(shù)據(jù)與單細(xì)胞測(cè)序平臺(tái)密切相關(guān)。早期單細(xì)胞測(cè)序基于熒光分子或者細(xì)胞形態(tài)篩選細(xì)胞,再擴(kuò)增和測(cè)序,往往通量較低,以SMART-seq最具代表性,其數(shù)據(jù)由三部分組成,可以分別獲取。比如肝癌數(shù)據(jù)集GSE144028。
![]()
min.features = 200)非特異性細(xì)胞分選比較成熟的單細(xì)胞高通量測(cè)序技術(shù),主要包括Fluidigm的C1平臺(tái),BD Rhapsody平臺(tái)和目前使用最廣泛的 10xGenomics 平臺(tái)。 上傳到GEO的數(shù)據(jù)并沒有經(jīng)過平臺(tái)歸一化處理 ,其中無論是芯片數(shù)據(jù)、二代測(cè)序數(shù)據(jù)還是單細(xì)胞數(shù)據(jù)的格式差異較大,而不像TCGA數(shù)據(jù)那么歸整。這就導(dǎo)致GEO單細(xì)胞數(shù)據(jù)及其讀取的多樣性。
min.features = 200)GEO數(shù)據(jù)庫(kù)提供的單細(xì)胞數(shù)據(jù)大致分為三類,①原始數(shù)據(jù):fastq格式的測(cè)序數(shù)據(jù);②經(jīng)過Cellranger標(biāo)準(zhǔn)化后的10X數(shù)據(jù);③counts數(shù)據(jù)。前面分享的主要是第二種數(shù)據(jù)。對(duì)于fastq數(shù)據(jù)的處理,需要用到Linux和shell ,我們以后再做分享。關(guān)于counts數(shù)據(jù),仍然屬于下游數(shù)據(jù)分析,值得嘗試分析。
save(scRNA_all, file = "scRNA_all.Rdata")此外,還有 h5格式等存儲(chǔ)的單細(xì)胞數(shù)據(jù)文件,在很多公眾號(hào)上都有詳細(xì)的代碼,這里不再贅述。掌握上述代碼,我們基本上能應(yīng)付GEO數(shù)據(jù)庫(kù)80%左右的單細(xì)胞數(shù)據(jù)了。如果還有其他格式或情況的單細(xì)胞數(shù)據(jù),我們用到時(shí)候再學(xué)習(xí)也不遲。
參考資料
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.