<bdo id="qusuu"><li id="qusuu"></li></bdo>
  • Bionumerics的Sars-CoV-2(COVID-19)插件

    首頁    模塊配置    Bionumerics的Sars-CoV-2(COVID-19)插件

    SarsCoV2插件

    SarsCoV2插件        

    1.        引言        

    2. Bionumerics中的初始工作和相關設置        

    2.1 程序啟動        

    2.2 創建一個新數據庫        

    2.3 Sequence Extraction插件        

    2.4 SarsCoV2插件        

    3.導入序列        

    4.處理序列        

    4.1 序列提取        

    4.2 Haplotype        

    4.3 提取地點        

    5.        SNP        

    6.        SNP數據的聚類        

    7.        SNPs        

    8. 其他工具        

    8.1 PCR產物        

    8.2 accession BLAST Entrez        

    8.3 定義相同SNP        

     

     

     

    1.       引言

    手冊中主要介紹了對SARS-CoV-2基因組序列的處理和分析,序列可以是從公共數據庫下載或者是本地生成的數據。每個單獨基因組序列被分成一系列子序列(從序列中提取多個部分序列),每一個序列會根據參考基因組進SNP的分析。所有SNP以開放的(動態)字符集存儲,這些字符集能夠在現有的最高分辨率下進行簡單的對比和菌株分型。

    SarsCoV2插件是免費提供的。如果要安裝該插件,Bionumerics軟件的最低配置特征數據模、序列數據模、樹狀網絡分析模基因組分析工具模。

    2. Bionumerics中的初始工作和相關設置

    2.1 程序啟動

            Bionumerics軟件已是最新版本(https://www.applied-maths.com/download/software,安裝手冊可從https://www.applied-maths.com/download/manuals下載。

            雙擊電腦Bionumerics軟件的程序圖標進入到軟件的啟動窗口(2.1。

    img1

    2.1 Bionumerics軟件啟動窗口

            通過點擊img2按鈕創建新的數據庫,點擊img3按鈕或者雙擊數據庫列表中的名稱可以打開已創建的數據庫。

    2.2 創建一個新數據庫

            2.1點擊Bionumerics軟件啟動窗口中的img4圖標進入新數據庫的向導。

            2.2為數據庫命名(例如My database),然后點擊<Next>。

    彈出的新對話框會提示數據庫類型。

            2.3保持默認選Create new然后點<Next>。

    彈出的新對話框會提示數據庫引擎。

            2.4保持默認選項(2.2)然后點擊<Finish>完成新數據庫的設置。

    img5

    2.2 選擇數據庫引擎

    彈出插件對話框,允許您安裝其他功能。

            2.5點擊<Proceed>進入數據庫主界面。

    2.3 安裝Sequence Extraction插件

    在安裝SarsCoV2插件(2.4)前,請確定您已安裝Sequence extraction插件:

            3.1點擊數據庫主界面左上 File > Install / remove plugins.. 調用插件對話框。

            3.2在插件對話框中點擊 Utilities 子菜單,從列表中選擇Sequence extraction并點擊<Activate>按鈕。

            3.3確認安裝插件(2.3)。

    插件成功安裝后,對話框中會標記為綠色對勾(2.4)。

            3.4關閉插件對話框。

    img6

    2.3 確認安裝插件

     

    img7

    2.4 安裝插件

     

     

    2.4 SarsCoV2插件

            4.1點擊數據庫主界面左上 File > Install / remove plugins... 調用插件對話框。

            4.2在插件對話框中點擊 Database Functionality 子菜單,然后點擊<Add / Update...>按鈕。

            4.3點擊<Browse>按鈕,選擇提供的SarsCoV2Client.BPL文件(2.5)。

            4.4點擊<OK>安裝插件。

            4.5確認安裝插件(2.6

    彈出Create database components對話框顯示了所有插件需要的數據庫組件:entry fields,character type實驗,sequence type實驗(2.7)。如果有需要的話,這些名稱都可以更改。

            4.6點擊<OK>確認創建數據庫組件。

    彈出的信息顯示插件已安裝成功(2.8)。

            4.7點擊<OK>。

    插件對話框中SarsCoV2插件被綠色對勾標記(圖2.9)。

    img8

    2.5 瀏覽選bpl文件

     

    img9

    2.6 確認安裝插件

     

     

     

    img10

    2.7 新的數據庫組件

     

    img11

    2.8 插件安裝完成

            

    4.8關閉插件對話框

            4.9關閉數據庫并重新打開來激活SarsCoV2插件的功能

     

     

     

    img12

    2.9 插件安裝完成

    數據庫主界面如2.10所示。

    img13

    2.10 安裝完SarsCoV2插件后的數據庫主界面

     

     

    安裝SarsCoV2插件后數據庫會增加SARSCoV2菜單項(2.11)和以下組件:

    l                      名為genome的序列類型實驗,存儲拼接后的全基因組。

    l                      26個序列類型,存儲所提取的子序列。

    l                      名為SNP特征類型實驗,存SNP信息。

    l                      33個信息字段,由標準GenBank元數據字段NCBISARS-CoV-2數據中心列組成。

     

    img14

    2.11 菜單項

    數據庫有一keyWuhan-Hu-1的條目。NCBISARS-CoV-2的參考序列NC_045512被存儲在這一條目的genome序列類型實驗中。

    4.10點擊數據庫主界面實驗展示面板中對應genome序列類型實驗的綠點(默認配置2號實驗),打開序列編輯窗口。

            窗口上部分是序列,下部分是序列的圖形化展示(2.12)。Annotation面板顯示NCBI的特征區域,Header面板顯示header信息。

    img15

    2.12 序列編輯窗口

     

     

            4.11關閉序列編輯窗口

    SARS-CoV參考序列NC_045512的子序列分別存儲在對應的序列類型實驗中。序列實驗名稱為ORFOpen Reading Frame開放閱讀框架)后接數字以及可選的nspNuclear Shuttle Protein核穿梭蛋白)組成。例如ORF01_nsp01。這些子序列作為樣品序列篩選BLAST的參考序列(圖4.1)。

    3. 導入序列

    0.1選擇File > Import... 調用數據導入對話框。

    Bionumerics軟件中所有導入(拼接后)基因組序列的途徑都是從Sequence data菜單中。

            0.2通過點擊Sequence type data旁的+標志顯示所有序列導入途徑(3.1)。

    img16

    3.1 數據導入選項

    例如,我們會從EMBL/NCBI抓取序列。更多關于其他序列導入方法的詳細信息可見網站中的序列手冊。

            0.3數據導入對話框選擇<Manage import templates>。

            0.4選擇<Import from file>,瀏覽找到SarsCoV2 template.xml文件,和插件文件放在一起,然后點擊<OK>3.2)。

     

     

    img17

    3.2 XML模板

    導入模板將EMBL/NCBI標簽和SarsCoV2插件創建的條目字段關聯。

            0.5點擊<OK>將導入模板添加到數據庫中。

    img18

    3.3 xml模板

            0.6在數據導入對話框中,選擇Sequence type data下的 Download sequences from internet并點擊<Import>。

            0.7Accession codes輸入字段中輸入accession號(例如MT385458,MT385436,MT385431),這些號由,分隔。

            0.8指定,作為Separation character,并選擇可用的下載站點比如EBI。

            0.9勾選        Preview sequences并點擊<Next>。

    導入方法會抓取所選數據庫的序列并在下一步驟中顯示詳細信息(3.4)。

            0.10點擊<Next>。

    導入向導的下一步列出了數據庫中導入序列信息的模板。前面步驟導入的預先設置的模板則被列出(圖3.6)。

            0.11確保選擇了My EMBL/NCBI template,并點擊<Preview>按鈕來檢查映射(3.5)。

            0.12關閉預覽窗口。

            0.13確保選擇了My EMBL/NCBI templategenome實驗,然后點擊<Next>。

            0.14點擊<Finish>。

    條目則被創建并自動是選擇狀態。條目字段被更新并且序列存儲在genome實驗中(3.7)。

     

     

    img19

    3.4 抓取的信息

     

    img20

    3.5 預覽

     

     

    img21

    3.6 導入模板

     

    img22

    3.7 導入基因組序列后的數據庫主界面

     

     

    4. 處理序列

    導入并存儲在genome實驗中的序列現在可以通過SarsCoV2插件進行分析:

            0.1數據庫的Database entries面板中所選的條目,可以通過Ctrl鍵選擇。同樣可以勾選條目旁邊的復選框進行選擇。

            0.2選擇菜單欄中SARSCoV2 > Process Entries或者img23圖標開始處理。

    包括以下過程:

    1.       genome實驗中存儲的基因組序列提26個子序列,并將子序列存儲到對應的實驗類型中(4.1)。

    2.       通過將一常見的錯義SNP翻譯為氨基酸來確定Haplotype4.2)。

    3.       從帶注釋的源序列中提取Locality。

    4.1 序列提取

    SarsCoV2插件通BLAST方法從genome實驗中的序列提取子序列。Wuhan-Hu-1條目的子序列作BLAST搜索的參考序列。

    所選條目的基因組序列找到的子序列被存儲在對應的序列類型中。序列實驗名稱為ORFOpen Reading Frame開放閱讀框架)后接數字以及可選的nspNuclear Shuttle Protein核穿梭蛋白)組成。例如ORF01_nsp01。

            BLAST篩選后,彈出的信息框會詢問是否BLAST結果的報告(4.1)。

            1.1點擊<Yes>打開報告窗口。

    報告窗口包含了每個條目的報告(4.2)。Entries面板中是所有條目的分組。

            1.2選擇Entries面板中其中一個條目。

    所選條目的結果展示在Report面板中,包括處理數據的日期和條目的名稱。

    img24

    4.1 確認對話框

     

     

    img25

    4.2 報告窗口

     

    對于每個序列類型(Locus列),都表明了是否找到BLAST hit、所篩選基因序列的起始位置、序列準確度(Identity (%))、序列重疊(Length (%))。

            此外,報告了檢索到的子序列的長度(Ref length)、參考序列錯配的數目(Mismatches、gaps的數目(Open gaps)和長度修正(如果應用的話)。

            1.3關閉報告窗口。

            1.4點擊其中一個條目的ORF序列實驗對應的綠點。

    這樣會在序列編輯窗口中顯示所提取的序列(4.3為例)。

            1.5關閉序列編輯窗口。

    img26

    4.3 ORF01 nsp01序列

    4.2確定Haplotype

    在第二步的處理過程,通過將一常見的錯義SNP翻譯為氨基酸來確定Haplotype。氨基酸按時間順序分類,最早的在左邊,最近的在右邊。Haplotype條目字段顯示了Haplotype的結果(4.4)。

    img27

    4.4 確定Haplotype

    通過菜單欄的SARSCoV2 > Get haplotypes也能夠確定Haplotypes。

    4.3 提取地點

            最后一步處理過程,元數據通過序列注釋被解析(如果有的話),并存儲在IsolateLocality條目字段中。通過菜單欄中SARSCoV2 > Get qualifiers也能獲取同樣的信息。

            Bionumerics中的calculated field選項,Locality條目字段China:Wuhan 或者 USA:CA)可以解析成僅包含國家信息(ChinaUSA)。相關操作可以在參考手冊中找到。

    img28

    4.5 從序列注釋中提取元數據

    5.       SNP

    提取完子序列后,這些子序列可以進SNP篩選:

    0.1選擇數據庫主界面中Database entries面板中的條目

    0.2選擇SARSCoV2 > Update SNPs或者點擊img29按鈕

    子序列則會通ionumerics內置SNP分析工具進SNP篩選(也可以通過菜單欄中的Analysis > Sequence types > Start SNP analysis)。

            SNP的結果會基于Relaxed SNP filtering模板進行過濾,過濾后SNP會存儲在SNP特征類型實驗中。

            Relaxed SNP filtering模板下,非ACGT的堿基也會包含在分析中。然而,非ACGT的堿基實際上不會存儲在SNP特征類型實驗中,而是用缺失值代替。

            SNP篩選后,彈出的信息對話框會顯示檢測SNP的數目(5.1)。如果檢測到新SNP位置,同樣會顯示出并且這些新SNP位置會自動添加SNP字符集中。

    img30

    5.1 SNP信息

            0.3點擊<OK>關閉確認窗口。

            0.4點擊其中一個條目在實驗數據展示面板中對SNP特征實驗的綠點,打開特征實驗卡。

    特征實驗卡列出來樣品中所有檢測到SNP。Mapping列顯示了堿基(5.2)。

            0.5點擊實驗卡左上角關閉實驗卡。

    img31

    5.2 SNP特征信息卡

    6.       SNP數據的聚類

    0.1在數據庫主界面的Database entries面板中選擇想要聚類的條目。

    0.2選擇SARSCoV2 > Cluster SNPs或者點擊主界面img32按鈕對選擇條目進行聚類。

    在第一步中,所選的條目都要經過數據處理步驟的提取序列才能進行篩選。

            對于子序列有缺失、SNP特征信息中不完整的條目會從聚類比較中排除。警告信息的對話框會提示用戶(6.1)。

    img33

    6.1 從分析中排除的條目

    比較窗口出現,如6.2

    l                      SNP實驗類型計算相似矩陣,使用Categorical (differences)相似系數,顯示在Similarities面板中。

    l                      基于Complete linkage算法得到樹狀圖,顯示在Dendrogram面板中。

    l                      Experiment data面板中,只顯SNP字符集中的多SNP。

    0.3計算樹狀圖的參數設置可以通過Clustering > Show information調用。

    0.4想要顯示節點SNP差異的數目,可以選擇Clustering > Dendrogram display settings...,并勾選Show node information。

    在比較窗口中,可以根據數據庫字段進行分組(比如基于地理位置或者haplotype),或者其他字段。

            0.5想要基于數據庫字段創建分組,只需右鍵點擊Information fields面板中的字段名稱,并選擇Create groups from database field。想要基于選擇的條目自定義分組,只需使用比較窗口中Groups菜單欄中的命令。

    img34

    6.2 比較窗口

    Advanced cluster analysis窗口中可以計算最小生成樹??梢栽诒容^窗口中以下操作實現:

            0.6確保在比較窗口中的Experiments面板選擇了SNP實驗。

            0.7        選擇Clustering > Calculate > Advanced cluster analysis...或點擊img35圖標        , 并選擇Advanced cluster analysis執行創建網絡向導。

            0.8選擇MST for categorical data,然后點擊<Next>。

    最小生成樹則被計算并顯示在Advanced cluster analysis窗口中(6.3)。

            0.9關閉Advanced cluster analysis窗口。

            0.10通過File > Save as...保存該次對比,并通過File > Exit關閉對比。

    img36

    6.3 定義分組后的最小生成樹

    7.       SNPs

    通過數據庫主界面的SARSCoV2 > Translate SNPs,存儲在SNP實驗SNP將進行翻譯。

            0.1選擇SNP實驗有數據的條目。

            0.2選擇SARSCoV2 > Translate SNPs或者點擊img37按鈕。

    第一次進行上述操作時,SNP TRANSL實驗將被創建并添加到Experiment types面板中。

    所選條目的SNP實驗中SNP進行翻譯,并且氨基酸信息存儲到SNP TRANSL實驗中。

    0.3點擊對應SNP TRANSL實驗數據的綠點打開特征實驗卡。

    氨基酸信息在Mapping列中顯示(7.1)。

     

     

    img38

    7.1 特征信息卡

            0.4 點擊特征信息卡左上角關閉。

    該翻譯工具假設每個序列的框架都從位1開始。

    8. 其他工具

    8.1 提取        PCR產物

    通過SarsCoV2插件,PCR產物能夠基于WHO標準的引物序列提?。?/span>https://www.who.int/emergencies/diseases/novel-coronavirus-2019/technical-guidance/laboratory-guidance)。

    1.1在數據庫主界面選擇想要PCR產物的條目。

    1.2選擇SARSCoV2 > Exctract PCR products。

    第一次上述操作會創建新的實驗類型。

    提取PCR產物存儲在對應PCR序列實驗中(8.1)。

    img39

    8.1 存儲PCR產物的序列類型

    在比較窗口中,可以進一步對指PCR產物進行分析:

            1.3選擇想要分析的條目。

            1.4使主界面右下方的Comparisons面板處于高亮狀態,然后選擇主界面菜單欄Edit > Create new object...對所選條目創建對比。

            1.5點擊Experiments面板中序列類型實驗旁邊的img40圖標(8.2)。

    可以使Bionumerics中的序列分析工具進一步分析序列。

    img41

    8.2 PCR產物

    8.2 導出accession 號至BLAST Entrez

    Bionumerics軟件中的數據導入對話框已有標準的導入工具,NCBI下載GenBank序列,但是不適用于新序列的導入。

    要批量檢索GenBank格式的序列,請按照以下步驟操作

            2.1選擇要導accession號的條目。

            2.2選擇SARSCoV2 > Export accessions to Batch Entrez。

            2.3瀏覽選擇一個已有的文件夾然后點擊<OK>8.3)。

    img42

    8.3 瀏覽選擇文件夾

    該命令accession號(存儲在AC  ACCESSION字段)導出至所選文件夾中以空格分隔的文本文件,然后瀏覽器打開NCBI BLAST Entrez網站(8.4),從網站中可以選擇accessions的文件(通過<Browse>按鈕)來檢索GenBank格式的序列。

    img43

    8.4 Batch Entrez

     

     

    8.3 定義相同SNP

            3.1數據主界面選擇想要包含SNP篩選中的條目。

            3.2選擇SARSCoV2 > Define common SNPs。

            3.3對話框中指定最小頻率(8.5)并點擊<OK>。

    img44

    8.5 指定閾值

    基于提供的頻率閾值,被鑒定的相SNP顯示出來(8.6)。

            3.4點擊<OK>關閉對話框。

    SNP保存至SNP實驗中的Common視圖中:

            3.5雙擊主界面Experiment types面板中SNP實驗打開特征類型窗口(圖8.7)。

            3.6點擊工具欄中的下拉框,從列表中選擇Common特征視圖

    img45

    8.6 結果

    根據命令SARSCoV2 > Define common SNPs,相SNP被鑒定并顯示出來。

            3.7關閉特征類型窗口。

    img46

    8.7 特征視圖

    2020年5月11日 17:13
    ?瀏覽量:0
    ?收藏
    日本A级啪啪大片_日本XXX色视频_日本苍井空免费人成视频播放_综合