助力非腫瘤疾病研究:全網疾病單細胞資料庫彙總

單細胞測序做為近十年最偉大的科學技術之一,它的應用在很多科研領域均產生了深刻的影響。單細胞測序技術解決了很多在bulk測序上解決不了的單個細胞尺度上的機制研究,這使其已經成為一種現象級研究手段。做為一種適應性很廣,功能多樣的測序技術,它在研究腫瘤抑制性,免疫細胞和神經系統複雜性上有突出的優勢。除了迅速增長的單細胞測序資料之外,各種基於單細胞測序的生信分析工具也得以快速發展。雖然單細胞測序技術最常用於腫瘤研究,而近些年在非腫瘤領域也在迅速增長,考慮到大家也有關注非腫瘤研究領域,並且腫瘤研究的單細胞資料庫也都被介紹的很多。所以小編系統整理了截止到2022年初所有的非腫瘤單細胞資料庫,今天隨推文一起分享給大家,此外我們還整理了具體疾病的單細胞資料集,有需要的文章最下方歡迎掃碼領取。

以下對非腫瘤單細胞資料庫的介紹主要分為三種類型:

第一種是大型綜合單細胞資料庫

,這種資料庫多是多項重大研究成果的產物,其主要是作為單細胞資料儲存的資料庫;第二種是

疾病特異性單細胞資料庫

,這種非腫瘤單細胞資料庫收錄的資料就沒有第一種多,主要是針對具體的疾病型別進行資料整理;第三種

是單細胞功能分析資料庫

,這種資料庫是針對某一項科學問題,對單細胞資料進行功能分析的資料庫,我們可以使用這種資料庫完成對單細胞資料的某項具體的功能分析。

一。大型綜合單細胞資料庫

1。

Human cell atlas(HCA)

:人類細胞圖譜計劃,迄今為止專案最龐大的單細胞測序專案成果。聚焦人正常組織,獲取人體各個組織器官的單細胞層面資料均可使用這個網站進行下載。

網址:

https://data.humancellatlas.org/

助力非腫瘤疾病研究:全網疾病單細胞資料庫彙總

2。

SCXA

:EBI旗下的單細胞資料庫,收錄了各種疾病型別的單細胞資料,而且這個網站持續更新。由於EBI旗下還有很多bulk RNA資料庫和功能分析資料庫,這個網站均可無縫連線到相應資料庫。

網址:

https://www.ebi.ac.uk/gxa/sc/home

助力非腫瘤疾病研究:全網疾病單細胞資料庫彙總

3。

Single Cell Portal

:目前收錄412個研究中的1800萬+的單細胞資料庫,而且持續更新,資料維護的很好,還可以進行簡單的線上分析。

網址:

https://singlecell.broadinstitute.org/single_cell

助力非腫瘤疾病研究:全網疾病單細胞資料庫彙總

4。

SCPortalen

:日本的單細胞測序資料庫,日本的生物醫學領域還是很先進的,很多諾貝爾醫學獎得主都是日本人。這個網站做的很精細,唯一的缺點是資料更新沒有Single Cell Portal和SCXA這兩個資料庫快。

網址:

http://single-cell.clst.riken.jp/

助力非腫瘤疾病研究:全網疾病單細胞資料庫彙總

5。

scRNASeqDB

:另一大型單細胞資料庫,專門收集人類單細胞測序的資料庫,涵蓋200種細胞系和13440個GSM。除了資料龐大的特點,這個資料庫可以進行關鍵基因的線上分析。

網址:

https://bioinfo.uth.edu/scrnaseqdb/

助力非腫瘤疾病研究:全網疾病單細胞資料庫彙總

6。

Tabula Muris

:小鼠的單細胞轉錄組資料庫,包含了來自20個器官和組織的近10萬個細胞。這些資料允許對組織間共享的細胞型別的基因表達進行直接和受控的比較,例如來自不同解剖位置的免疫細胞。它們還允許對兩種不同的技術的單細胞資料進行比較:基於微流控液滴的3端測序:以相對較低的覆蓋率對每個器官的數千個細胞進行研究;和基於流式細胞儀的全長轉錄本分析:提供更高的靈敏度和覆蓋率。

網址:

https://tabula-muris.ds.czbiohub.org/

助力非腫瘤疾病研究:全網疾病單細胞資料庫彙總

7。

SpatialDB

:專門存放單細胞空間轉錄組資料的資料庫,單細胞空間轉錄組相對於普通的單細胞測序資料,其保留了樣本的各種細胞空間分佈資訊。這個資料庫可以下載多種疾病模型的單細胞空間轉錄組的資料。

網址:

https://www.spatialomics.org/SpatialDB/

助力非腫瘤疾病研究:全網疾病單細胞資料庫彙總

8。

MCA

:浙大郭國驥老師團隊製作的小鼠單細胞圖譜資料庫,小鼠正常組織的單細胞資料均可在這個資料庫中下載。

網址:

http://bis.zju.edu.cn/MCA/

助力非腫瘤疾病研究:全網疾病單細胞資料庫彙總

9。

PlantscRNAd

:光有動物的單細胞資料可不夠,還有做植物研究的小夥伴。但是我們知道植物細胞有細胞壁,做植物的單細胞測序難度是很高的,於是業界大佬浙江大學樊龍江團隊就專門構建了植物單細胞資料庫。

網址:

http://ibi.zju.edu.cn/plantscrnadb/

助力非腫瘤疾病研究:全網疾病單細胞資料庫彙總

二。疾病特異性單細胞資料庫

1。

SC2disease

:此資料庫主要用於各類疾病分析,其基於各種疾病和正常單細胞轉錄組基因表達譜資料,為研究者提供豐富的細胞特異性資訊,如感興趣基因細胞特異性表達情況,特定細胞型別標記,多種疾病生物標誌物,以及提供在疾病和非疾病狀態下各種型別細胞的表達譜差異性分析功能。

網址:

http://easybioai.com/sc2disease/

助力非腫瘤疾病研究:全網疾病單細胞資料庫彙總

2。

BloodSpot

:健康和血液病單細胞轉錄組資料庫,對於研究血液性疾病的小夥伴,這是一個寶貴的資料庫。這個資料庫雖然只收錄了迴圈系統的單細胞資料,但是功能強大,可使用這個資料庫進行多種線上分析,而且可以將分析結果以各種圖片的形式匯出。

網址:

http://servers.binf.ku.dk/bloodspot/

助力非腫瘤疾病研究:全網疾病單細胞資料庫彙總

3。

KIT

:腎臟單細胞資料庫,收錄了各種腎臟組織的單細胞資料,對腎臟疾病進行研究的小夥伴可要將這個網址記住。

網址:

http://humphreyslab.com/SingleCell/

助力非腫瘤疾病研究:全網疾病單細胞資料庫彙總

4。

VascularSingleCell

:血管單細胞資料庫,這個資料庫收錄了人和小鼠的腦血管肺血管的單細胞資料,不同於上面講述的血細胞資料庫,這個資料庫只關注血管細胞。

網址:

http://betsholtzlab.org/VascularSingleCells/database.html

助力非腫瘤疾病研究:全網疾病單細胞資料庫彙總

5。

iSyTE

:專注於研究眼睛發育的單細胞資料庫。

網址:

https://research.bioinformatics.udel.edu/iSyTE/ppi/index.php

助力非腫瘤疾病研究:全網疾病單細胞資料庫彙總

6。

DBTMEE

:專門用於研究眼睛小鼠早期胚胎髮育的單細胞資料庫。

網址:

http://dbtmee.hgc.jp/

助力非腫瘤疾病研究:全網疾病單細胞資料庫彙總

7。

CeDR Atlas

:CeDR Atlas資料庫基於文獻中人類、小鼠和不同細胞系的特異性藥物反應資訊,綜合分析了細胞型別特異性藥物反應分析,涵蓋疾病狀態下的細胞型別和正常細胞型別,為細胞藥物反應譜提供直接參考。資料庫目前收錄超過582個人類、小鼠和細胞系的單細胞資料結果,包括約140個表型和1250個組織/細胞型別的約188,157個人類相關、42660個小鼠相關和10299個細胞系相關的細胞藥物反應資訊。

網址:

https://ngdc.cncb.ac.cn/cedr

助力非腫瘤疾病研究:全網疾病單細胞資料庫彙總

8。

Jingle Bells

:資料來源為公開可用的資料(該資料庫只是把公開資料進行了整合) 資料來源相對集中,收集免疫(120個數據集)以及非免疫(183個數據集)該資料庫作為免疫相關資料的資料庫確實具有著把相關資訊集中以便我們搜尋和學習的作用,我們可以透過這個資料庫去了解免疫相關的資料以及文獻從而深化我們的課題進展

網址:

http://jinglebells.bgu.ac.il/1.

助力非腫瘤疾病研究:全網疾病單細胞資料庫彙總

9。

Aging Atlas

:衰老研究一直都是一個很熱門的領域,這個資料庫整理了多項專門研究衰老的單細胞資料,可以使用其進行衰老相關基因的研究。

網址:

https://ngdc.cncb.ac.cn/aging/index

助力非腫瘤疾病研究:全網疾病單細胞資料庫彙總

10。

Gut Cell Atlas

:腸道組織的單細胞測序資料庫,所有單細胞資料均公開可下載。

網址:

https://www.gutcellatlas.org/

助力非腫瘤疾病研究:全網疾病單細胞資料庫彙總

11。

StemMapper

:幹細胞發育研究單細胞資料庫。

網址:

http://stemmapper.sysbiolab.eu/

助力非腫瘤疾病研究:全網疾病單細胞資料庫彙總

12。

stemformatics

:和StemMapper類似,同樣是針對幹細胞構建的單細胞資料庫。

網址:

https://www.stemformatics.org/expressions/gene_expression_graph

助力非腫瘤疾病研究:全網疾病單細胞資料庫彙總

三。單細胞功能分析資料庫

1。

HCL

:不同於人類圖譜計劃,這個資料庫線上分析功能強大。由浙江大學郭國驥教授開發,包括人類50種組織的超過70萬個細胞,劃分為102個cluster,可以查詢每種組織、每個cluster的marker基因。可以上傳和下載資料自行分析。

網址:

https://db.cngb.org/HCL/

助力非腫瘤疾病研究:全網疾病單細胞資料庫彙總

2。

Cell Blast

:Cell BLAST是一個自帶高質量參考資料庫的scRNA-seq資料檢索/註釋工具,能做細胞型別鑑定、發現新細胞型別、註釋連續細胞狀態。

網址:

https://cblast.gao-lab.org/

助力非腫瘤疾病研究:全網疾病單細胞資料庫彙總

3。

PanglaoDB

:來自瑞典卡洛琳學院的研究人員開發的PanglaoDB資料庫,用於探索小鼠和人類scRNA-seq資料,為單細胞組學研究提供公共scRNA-seq資料資源。相關研究成果2019年發表在《Database》。PanglaoDB資料庫收集並整合來自多個研究的資料,包括:小鼠的184種組織、1063個樣本、446W細胞;人的74種組織、305個樣本、112w細胞。

網址:

https://panglaodb.se/index.html

助力非腫瘤疾病研究:全網疾病單細胞資料庫彙總

4。

CellMarkrer

:該資料庫包括來源於100000+已發表文獻整理出來的,人的158種組織/亞組織、467個細胞型別、13605個Marker基因;小鼠81種組織/亞組織、389個細胞型別、9148個Marker基因。使用者可以透過選擇物種、組織型別、細胞型別來查詢marker基因,也可以下載marker基因列表,還可以上傳自己的文章或資料。

網址:

http://bio-bigdata.hrbmu.edu.cn/CellMarker/

助力非腫瘤疾病研究:全網疾病單細胞資料庫彙總

5。

scQuery

:對比分析不同研究的單細胞轉錄組資料。

網址:

https://scquery.cs.cmu.edu/

助力非腫瘤疾病研究:全網疾病單細胞資料庫彙總

6。

SCDevDB

:單細胞深度組學資料庫,線上分析功能強大。

網址:

https://scdevdb.deepomics.org/

助力非腫瘤疾病研究:全網疾病單細胞資料庫彙總

7。

LnCeCell

:從GEO和CancerSEA收集了與癌症相關的scRNA-seq資料集,確保質量,控制癌細胞數> 100,並且透過註釋將表達譜分為mRNA和lncRNA,使用GENCODE資料庫註釋(GRCh38,版本34)。最後得到源於25種癌症的40個單細胞資料集,總共有94605個單細胞被用於構建LnCeCell。

網址:

http://www.bio-bigdata.net/LnCeCell/

助力非腫瘤疾病研究:全網疾病單細胞資料庫彙總

8。

ColorCells

:這個資料庫提供了一個友好的視覺化介面,包括PCA和t-SNE演算法應用於細胞叢集在2d和3d空間中,開發一個工具來展示各種組織和細胞型別在人類和老鼠,建立一個超幾何分佈的統計檢驗方法自動分配給細胞叢集,基於SNN和pearson相關分析,構建蛋白- lncrna共表達網路,從scRNA-Seq資料預測lncrna。

網址:

https://rna.sysu.edu.cn/colorcells/

助力非腫瘤疾病研究:全網疾病單細胞資料庫彙總

9。

Virtual Cytometry

:它為使用scRNA-seq資料的免疫細胞分化研究提供計算平臺,透過“發現模組”和“假設測試模組”分別識別和驗證參與免疫細胞分化的基因。

網址:

https://www.grnpedia.org/cytometry/

助力非腫瘤疾病研究:全網疾病單細胞資料庫彙總

10。

SPICA

:專注於研究病毒感染和腫瘤小鼠模型的單細胞資料庫。

網址:

https://spica.epfl.ch/projects

助力非腫瘤疾病研究:全網疾病單細胞資料庫彙總

11。

GRNdb

:轉錄因子及其下游靶基因形成的基因調控網路(Gene Regulatory Network, GRN)資料庫,是一個免費訪問和使用者友好的資料庫,可以方便地探索和視覺化由轉錄因子(轉錄因子)和下游靶基因(稱為調控)形成的預測調控網路,基於大規模RNA-seq資料,以及已知的tf -靶標關係,適用於各種人類和小鼠條件。

網址:

http://www.grndb.com/

助力非腫瘤疾病研究:全網疾病單細胞資料庫彙總

12。

SciBet

:是一種利用單細胞RNA測序技術預測任意隨機測序細胞身份的計算工具。與其他有監督的單元型別識別方法相比,SciBet在精度、魯棒性、可擴充套件性和速度方面都具有優勢。在普通計算機上,對於包含10萬個cell的資料集,我們可以在1秒左右完成準確的特徵選擇和分類分析。我們不僅提供了R語言的二進位制包,還提供了來自多個數據集的大約100種訓練過的模式。此外,使用者可以線上使用SciBet上傳他們的定製資料集進行分類。

網址:

http://scibet.cancer-pku.cn/index.html

助力非腫瘤疾病研究:全網疾病單細胞資料庫彙總

13。

CellPhoneDB

:細胞間通訊網路研究的必備研究工具,是由英國Wellcome Sanger Institute的Teichmann Lab和Vento-Tormo Lab開發,但是線上工具不是很穩定,需下載自行分析。

網址:

https://www.cellphonedb.org/

助力非腫瘤疾病研究:全網疾病單細胞資料庫彙總

14。

scMetabolism

:收集了KEGG,Reactom中的基因集,可自行上傳資料,完成對單細胞資料完成代謝通路的分析。

網址:

http://www.cancerdiversity.asia/scMetabolism/

助力非腫瘤疾病研究:全網疾病單細胞資料庫彙總

15。

signatureDB

: B cell資料庫,相應成果在2018年發表在新英格蘭雜誌上,資料以表格的形式進行展示,僅供自行下載研究。

網址:

https://lymphochip.nih.gov/signaturedb/

助力非腫瘤疾病研究:全網疾病單細胞資料庫彙總

總結

小編可以負責任的和大家講,這是截止到目前,最全面的非腫瘤單細胞資料總結的推文了。其實還有一個數據庫沒有提及,那就是GEO資料庫,這個資料庫是很多上述講到的資料庫資料的最初來源,大家也都知道GEO涵蓋了包括bulk, ATAC, Chip等各種資料,當然各大單細胞研究的資料也會優先上傳在這個資料庫上,小編在這裡就不對其進行細說了。

各種單細胞資料庫是非常寶貴的資源,對已經發表的資料進行二次分析也逐漸成為一種常態,特別對一些經費不足的小課題組,分析已經發表的單細胞資料來研究自己的科學問題是一項非常具有重大意義的工作。運用這些資料庫進行資料探勘時,首先是去綜合性資料庫下載資料,因為這些大型資料庫對資料的整理相對規範;其次針對自己的研究領域去找疾病特異性的單細胞資料庫;最後是利用可以進行線上分析的資料庫對具體細胞亞群的功能進行研究;最後,希望大家都能利用好這些非腫瘤資料庫資源,早早發表大paper。