俗話說“一圖勝千言”,而一張“美貌與智慧並重”的圖放在文章中,往往會讓審稿人眼前一亮,無形中給文章加分!
相關係數是生物醫學論文中最常見的一個指標,用於描述兩個連續變數之間的線性相關程度,例如A基因的表達是否和B基因的表達正相關?基因A的表達是否與其甲基化程度負相關等等。最常用的就是皮爾森相關係數,其值介於-1和1之間。
相關係數與相關程度一般劃分為:
0。8 - 1。0 極強相關
0。6 - 0。8 強相關
0。4 - 0。6 中等程度相關
0。2 - 0。4 弱相關
0。0 - 0。2 極弱相關或無相關。
R語言中,我們可以使用cor()函式來計算相關性。
Python語言中,我們可以使用scipy。stats。pearsonr函式來計算相關性。
對於多個基因,計算出來的就是一個相關係數矩陣,如圖1所示。
圖1。 相關性矩陣
雖然這種展示方式非常直觀,然而看起來比較費勁,同時佔空間比較大。這時,我們可以使用圓形形式來展示相關係數矩陣,如圖2所示。圓形有著天然的魅力,因為從視覺運動方面來講,曲線具有天然的平滑性、節奏感、飽滿、擴張和一定方向感,因此會讓人感覺很柔美、很豐富,並且有深度和動感(摘自網路)。
圖2。 圓形相關係數圖
1.開啟圓形相關係數繪圖頁面
首先,使用瀏覽器(推薦chrome或者edge)開啟圓形相關係數繪製頁面。左側為常見作圖導航,中間為資料輸入框和可選引數,右側為描述和結果示例。也可以在主頁搜尋框中搜索相關係數,找到繪圖頁面。
微生信-線上繪製圓形相關係數圖
圖3。視覺化繪圖頁面
2,示例資料
點選右側“示例資料”連結下載excel格式的示例資料。
圖4。 輸入資料示例
示例資料(僅供參考)為矩陣形式,其中
行為基因
列為樣品
行列相交的cell為基因在該樣品中的表達值。一般需要用標準化後的值進行計算。
注意:
需要參考示例資料,將自己的資料在excel中整理成示例資料的樣式,每個cell都需要有,表達值不能為空或者NA。行列相反的話,可以轉置後使用。
3,貼上示例資料
直接複製示例資料中的A-K列資料,然後貼上到輸入框。
注意:不是複製excel檔案,是複製excel檔案裡邊的資料。另外貼上到輸入框後,格式亂了沒關係,只要在excel中是整齊的就行。並且資料矩陣中不能有空的單元格,中文字元等。
圖5。 必需輸入
4,修改引數,並提交
我們設定了資料轉換、相關係數計算方法、圖片尺寸、colorbar位置、連線顏色、基因顏色、字型等引數,基本能滿足日常繪圖使用。如需更高階的定製,請聯絡我們。
圖6。顏色、字型、colorbar位置等可調引數
5,提交出圖
貼上好輸入資料,調整好引數(或者全部預設)後,點選提交按鈕,幾秒鐘後,會在頁面右側出現預覽圖。我們提供了4種圖片格式供下載使用,兩種向量圖(pdf,svg)和兩種標量圖(600 dpi tiff和300 dpi png)。同時提供了相關係數矩陣計算結果供下載。
圖7。預覽與下載
圖解讀:
該圖為弦圖,外圈是11個基因,內圈為基因間的相關係數連線。其中A-B,與B-A的相關係數僅保留1次,因此每個弦上延伸出來10條帶(去掉了自身與自身的),紅色帶表示正相關,綠色帶表示負相關,顏色越深表示相關性越大(越正相關或越負相關),帶越寬表示絕對值越大。弦上的刻度表示該基因與其他基因間的相關性的絕對值之和,因此其刻度和長度不是固定的。
沒有預覽就沒有出圖,這時請參考示例資料,檢查自己輸入資料的格式。
遇到文字截斷,需要修改字型、調整字型大小等,請參考科研作圖實操:用inkscape編輯svg向量圖
微生信助力發文章,谷歌引用640+,知網引用480+