轉(zhuǎn)自:https://mp.weixin.qq.com/s/8MTZGcb-ywuo1d_DALExtA
eGPS 下載地址:http://www.egps-software.net
這里介紹eGPS 更新后的韋恩圖模塊,交互式操作更加便捷,各種參數(shù)下的結(jié)果“所見即所得”。這里介紹的三種形式是最常用,最直觀,最易于被人接受的三種形式。這三種形式各有優(yōu)缺點。為了更好地促進用戶交互式使用,我們增加了探索性分析。以上圖形的展示是被動的,需要觀察者被動接受信息。我們的韋恩圖模塊支持觀察者主動去獲取某個集合。例如有三個輸出集合,我們就想查看集合1與集合2的交集,而不考慮集合3,這就需要有交互式的軟件來完成這個工作。正好,現(xiàn)在eGPS就有此功能,詳情請查看探索性分析的功能。
韋恩圖:
一 韋恩圖的原理
有若干集合,用一圖顯示其交、差、并等關(guān)系的圖,即為韋恩圖。通俗地講:交集就是兩個集合共有的元素所組成的集合;差集就是一個集合中有而另一個集合不存在的元素的集合;并集就是兩者之一所含有的元素的集合。以上就是全部原理。
一般有兩種類型的韋恩圖,傳統(tǒng)的用各個圓圈的排布組合所形成的圖形。還有就是Upset圖,前幾年興起的一種圖形。當(dāng)顯示的集合數(shù)量過多時,前者已經(jīng)不再適用。但是傳統(tǒng)的韋恩圖也有其好處,2-3個集合的時候可以根據(jù)大小顯示,而且其包含、交叉關(guān)系更加直觀。
二 輸入格式
本模塊的輸入格式為以tab鍵分隔的文本文件,根據(jù)集合元素的不同可以分為兩種具體的類型。第一種是String類型,下面是一個示例內(nèi)容:
第一列固定為集合名稱,后面幾列為具體的元素。第二種是Genomic region類型,下面是一個示例內(nèi)容:
該類型與String的區(qū)別在于所有元素是以逗號分隔的基因組區(qū)域。
二、快速上手:
如果不想看文字版的描述請移步,下面的視頻適用于eGPS v1.8及更早版本。Bilibili https://space.bilibili.com/479371629/channel/detail?cid=95839
打開軟件,依次點擊菜單欄的 iTools --> Venn diagram 進入模塊。
- 輸入數(shù)據(jù)
有兩種方式可以輸入數(shù)據(jù):第一種是從文件中導(dǎo)入,點擊Import file 按鈕即可彈出對話框。鼠標(biāo)懸停在按鈕上時可以看到輸入文件應(yīng)該具有的格式。注意在導(dǎo)入數(shù)據(jù)之前,你需要根據(jù)需要選擇你的內(nèi)容是Single string 還是Genomic regions。
第二種是很方便快捷型的方式,直接在內(nèi)容面板的輸入框中粘貼字符串即可。如果想看示例數(shù)據(jù),請直接點擊Display example按鈕。進入模塊后,我們已經(jīng)準(zhǔn)備了測試數(shù)據(jù),數(shù)據(jù)位于Import content區(qū)域。
輸入數(shù)據(jù)之后,點擊下面的View venn diagram進入可視化界面。
- 參數(shù)設(shè)置
首先顯示的是傳統(tǒng)的韋恩圖Classical venn plot。
點擊 按鈕或者點擊左側(cè)的Upset plot按鈕進入Upset plot可視化界面。左側(cè)控制面板的所有按鈕都是交互式的,可以直接點擊看效果,這里不在贅述。
Exporary Analysis 一欄的功能,請看下文的介紹。
對于初次使用者,還有一個Plain text info. 的tab,這里直接以字符串的形式顯示了多個集合交集的情況。在頂部我們還提供了Jarcard index,這用來表征輸入集合的相似性,其實它也是一種重要的距離度量指標(biāo)。
- 出圖保存
點擊工具欄上的保存按鈕即可保存。我們支持png, svg, pdf等格式。
三、eGPS的優(yōu)勢
那我們有什么優(yōu)勢呢?簡單、方便、交互式!學(xué)習(xí)成本低!
如果不想看文字版的描述請移步,下面的視頻適用于eGPS v1.8及更早版本。Bilibili
1. 靈活便捷的數(shù)據(jù)輸入與三種形式的信息展示快速切換
傳統(tǒng)韋恩圖,Upset plot 和文本格式的展示方式可以很方便地展示集合之間的情況。正如標(biāo)題所述,數(shù)據(jù)輸入與出圖相輔相成?!八娂此谩薄?/p>
2. 不僅支持簡單的字符串,還支持基因組區(qū)間
用戶可以在輸入面板中,Content處選擇Genomic region,然后再點擊Display example,查看該個功能的效果。
該功能的原理:功能上僅僅是將simple string的字符串中的相等規(guī)則的判定更改。原先是比較兩個字符串是否內(nèi)容一致,現(xiàn)在成了兩個要比較的區(qū)間是否是重疊的。
3. 圖形是高度交互的,而不是靜態(tài)的圖片
便捷操作
第一個選擇框:是否展示左上角的餅圖
餅圖的繪制原理:最內(nèi)部的灰色的圓代表的是所有集合的并集。外面的每一圈都代表各個集合在并集上的分布。從外向內(nèi)的圓環(huán)分別對應(yīng)從下到上的left bar。
第二個選擇框:是否展示圖例 第三個選擇框:是否顯示上面柱子的具體的數(shù)值。
第一個按鈕:自適應(yīng)屏幕,當(dāng)改變軟件窗口大小的時候,點此按鈕重新出圖。第二個按鈕:隨機化所有柱子顏色。第三個按鈕:刪除上面為數(shù)值為0的所有柱子。第四個按鈕:查找元素所在的集合,若在該個集合,則會以選中的形式出現(xiàn)。
Display Options
這些操作顧名思義。
我們還支持在圖形區(qū)域的交互式操作:
左鍵單擊可以設(shè)置若干元素的選中狀態(tài),支持Ctrl鍵連選。選中后可點擊工具欄上的change color選項改變顏色。下圖是改變顏色的操作界面。
右鍵單擊圓圈或者豎直的柱子可以用五角星標(biāo)記目標(biāo)交集。
雙擊豎直的柱子或者圓圈所在的位置可以顯示具體的元素內(nèi)容。
雙擊title與name可以改內(nèi)容。
傳統(tǒng)韋恩圖可以通過點擊圖例選中目標(biāo)集合。
傳統(tǒng)韋恩圖的交互
支持交互式拖拽圖形,適合微調(diào)一些視覺元素。在Upset plot中可以拖拽各個區(qū)域的邊界,調(diào)整每個區(qū)域的大小。
4. 支持探索性分析
探索性分析,主要針對的是如下的需求:假設(shè)導(dǎo)入了N個集合,用戶想看第1個與第2個集合的交集,或者用戶想看第1個集合中去除第二個集合元素之后的情況……等等一系列的需求。
在Exporary Analysis一欄中點擊Enable analysis選擇框。啟用探索性分析。第一步選擇特定集合的使用情況,這總共有三種情況:與這個集合的元素取交集、去除這個集合的元素和不考慮這個集合。
第二步:點擊Add item增加這個結(jié)果,點擊remove last item去除最后一個結(jié)果,點擊clear去除所有結(jié)果。
現(xiàn)在我們可以實現(xiàn)開頭所說的一個需求,用戶只要include 集合1和集合2,然后把集合3設(shè)定為Not take into consideration即可。
5. 傳統(tǒng)的韋恩圖根據(jù)大小顯示經(jīng)過優(yōu)化
傳統(tǒng)韋恩圖在2-3個集合的可視化時,我們支持顯示內(nèi)容與集合大小一致。
傳統(tǒng)韋恩圖2-3個集合可視化
值得一提的是,我們?nèi)齻€集合的這種展示經(jīng)過一定優(yōu)化,可以處理比較多的包含與交叉的關(guān)系。
最后我們再來看一下這三種形式韋恩圖的優(yōu)缺點:
最后再貼一下我們的聯(lián)系地址:
eGPS 下載地址:http://www.egps-software.net