提交到序列操作套件的序列不會離開您的計算機(jī),而是由執(zhí)行 JavaScript 的 Web 瀏覽器進(jìn)行操作。 序列操作套件由 Paul Stothard(加拿大阿爾伯塔大學(xué))編寫。 將問題和意見發(fā)送至stothard@ualberta.ca。
以下是組成序列操作套件的程序的簡短描述:
格式轉(zhuǎn)換:
結(jié)合 FASTA - 將多個 FASTA 序列記錄轉(zhuǎn)換為單個序列。 例如,當(dāng)您希望使用接受單個序列作為輸入的程序來確定序列集合的密碼子使用情況時,請使用組合 FASTA。
EMBL 到 FASTA - 接受一個或多個 EMBL 文件作為輸入,并以 FASTA 格式返回每個文件的 DNA 序列。 當(dāng)您希望從 EMBL 文件中快速刪除所有非 DNA 序列信息時,請使用此程序。
EMBL 特征提取器 - 接受一個或多個 EMBL 文件作為輸入,并讀取特征表中描述的序列特征信息。 程序提取或突出顯示相關(guān)的序列段,并以 FASTA 格式返回每個序列特征。 當(dāng)您希望從包含許多內(nèi)含子的基因組序列中提取 cDNA 序列時,EMBL 特征提取器特別有用。
EMBL反式提取器 - 接受一個或多個 EMBL 文件作為輸入,并以 FASTA 格式返回文件中描述的每個蛋白質(zhì)翻譯。 當(dāng)您對 DNA 序列的預(yù)測蛋白質(zhì)翻譯比 DNA 序列本身更感興趣時,可以使用 EMBL Trans Extractor。
DNA過濾器 - 從文本中刪除非 DNA 字符。 當(dāng)您希望從序列中刪除數(shù)字和空格以使其適用于其他應(yīng)用程序時,請使用此程序。
過濾蛋白質(zhì) - 從文本中刪除非蛋白質(zhì)字符。 當(dāng)您希望從序列中刪除數(shù)字和空格以使其適用于其他應(yīng)用程序時,請使用此程序。
GenBank 到 FASTA - 接受一個或多個 GenBank 文件作為輸入,并以 FASTA 格式返回每個文件的完整 DNA 序列。 當(dāng)您希望從 GenBank 文件中快速刪除所有非 DNA 序列信息時,請使用此程序。
GenBank 特征提取器 - 根據(jù) GenBank 發(fā)行說明中概述的規(guī)則,接受一個或多個 GenBank 文件作為輸入,并讀取特征表中描述的序列特征信息。 程序提取或突出顯示相關(guān)的序列段,并以 FASTA 格式返回每個序列特征。 當(dāng)您希望從包含許多內(nèi)含子的基因組序列中提取 cDNA 序列時,GenBank 特征提取器特別有用。
GenBank 反式提取器 - 接受一個或多個 GenBank 文件作為輸入,并以 FASTA 格式返回文件中描述的每個蛋白質(zhì)翻譯。 當(dāng)您對 DNA 序列的預(yù)測蛋白質(zhì)翻譯比 DNA 序列本身更感興趣時,應(yīng)該使用 GenBank Trans Extractor。
一到三 - 將單字母翻譯轉(zhuǎn)換為三字母翻譯。
范圍提取器 DNA - 接受一個或多個 DNA 序列以及一組位置或范圍。 與位置或范圍相對應(yīng)的堿基以單個新序列、一組 FASTA 記錄、大寫文本或小寫文本的形式返回。 使用 Range Extractor DNA 獲取使用位置信息的子序列。
范圍提取器蛋白質(zhì) - 接受一個或多個蛋白質(zhì)序列以及一組位置或范圍。 與位置或范圍相對應(yīng)的殘基以單個新序列、一組 FASTA 記錄、大寫文本或小寫文本的形式返回。 使用 Range Extractor Protein 獲取使用位置信息的子序列。
反向補(bǔ)碼 - 將 DNA 序列轉(zhuǎn)化為其反向、互補(bǔ)或反向互補(bǔ)序列。 支持整個 IUPAC DNA 字母表,并保持每個輸入序列字符的大小寫。 如果序列在反向鏈上包含 ORF,您可能希望使用該序列的反向補(bǔ)碼。
分裂密碼子 - 將編碼序列分成三個新序列,每個序列由三個密碼子位置之一的堿基組成。
拆分 FASTA - 將 FASTA 序列記錄劃分為您指定大小的更小的 FASTA 序列。 可選的重疊值可用于創(chuàng)建重疊的序列。
三到一 - 將三個字母的翻譯轉(zhuǎn)換為單字母的翻譯。 數(shù)字和空格會自動刪除。 非標(biāo)準(zhǔn)三元組被忽略。
窗戶提取器 DNA - 接受一個或多個 DNA 序列以及位置和窗口大小。 位于窗口中的堿基以新序列、大寫文本或小寫文本的形式返回。 使用 Window Extractor DNA 獲取使用位置信息的子序列。
窗口提取器蛋白 - 接受一個或多個蛋白質(zhì)序列以及位置和窗口大小。 位于窗口中的殘基以新序列、大寫文本或小寫文本的形式返回。 使用 Window Extractor Protein 獲取使用位置信息的子序列。
序列分析:
密碼子圖 - 接受 DNA 序列并生成由每個密碼子的水平條組成的圖形圖。 條的長度與您輸入的密碼子頻率表中的密碼子頻率成正比。 使用密碼子圖查找可能表達(dá)不佳的 DNA 序列部分,或查看密碼子使用表的圖形表示(通過使用由每種密碼子類型之一組成的 DNA 序列)。
密碼子使用 - 接受一個或多個 DNA 序列并返回每種密碼子類型的數(shù)量和頻率。 由于該程序還比較了編碼相同氨基酸(同義密碼子)的密碼子的頻率,因此您可以使用它來評估序列是否顯示出對特定同義密碼子的偏好。
CpG 群島 - 使用 Gardiner-Garden 和 Frommer (1987) 描述的方法報告了潛在的 CpG 島區(qū)域。 使用以 1 bp 間隔在序列中移動的 200 bp 窗口進(jìn)行計算。 CpG 島定義為 Obs/Exp 值大于 0.6 且 GC 含量大于 50% 的序列范圍。 窗口中 CpG 二聚體的預(yù)期數(shù)量計算為窗口中“C”的數(shù)量乘以窗口中“G”的數(shù)量,除以窗口長度。 CpG 島經(jīng)常出現(xiàn)在脊椎動物基因的 5' 區(qū)域,因此該程序可用于突出顯示基因組序列中的潛在基因。
DNA 分子量 - 接受一個或多個 DNA 序列并計算分子量。 序列可以被視為雙鏈或單鏈,以及線性或環(huán)狀。 計算分子拷貝數(shù)時使用 DNA 分子量。
DNA 模式查找 - 接受一個或多個序列以及搜索模式,并返回與該模式匹配的站點(diǎn)的數(shù)量和位置。 搜索模式被編寫為 JavaScript 正則表達(dá)式,類似于用其他編程語言(如 Perl)編寫的正則表達(dá)式。
DNA統(tǒng)計 - 返回您輸入的序列中每個殘基的出現(xiàn)次數(shù)。 還給出了每個殘基和某些殘基組的百分比總數(shù),使您可以快速比較不同序列獲得的結(jié)果。
模糊搜索 DNA - 接受一個 DNA 序列和一個查詢序列,并返回與查詢相同或相似的位點(diǎn)。 例如,您可以使用該程序來查找可以輕松突變?yōu)橛杏玫南拗菩晕稽c(diǎn)的序列。
模糊搜索蛋白 - 接受一個蛋白質(zhì)序列和一個查詢序列,并返回與查詢相同或相似的位點(diǎn)。
Ident 和 Sim - 接受一組對齊的序列(FASTA 或 GDE 格式)并計算每個序列對的同一性和相似性。 同一性和相似性值通常用于評估兩個序列是否具有共同的祖先或功能。
變異摘要 - 接受 DNA 序列作為輸入,并搜索易于突變的區(qū)域以創(chuàng)建感興趣的限制性位點(diǎn)。 該程序還報告蛋白質(zhì)翻譯,以便您可以查看哪些閱讀框被建議的突變改變。 使用 Mutate for Digest 查找可以使用 PCR 或定點(diǎn)誘變轉(zhuǎn)化為有用的限制性位點(diǎn)的序列。
多轉(zhuǎn)反 - 接受蛋白質(zhì)比對并使用密碼子使用表生成簡并 DNA 編碼序列。 該程序還返回一個圖表,該圖表可用于在核苷酸水平上找到最小簡并區(qū)域。 在設(shè)計 PCR 引物以與相關(guān)物種的未測序編碼序列退火時使用 Multi Rev Trans。
開放閱讀框查找器 - 在您輸入的 DNA 序列中搜索開放閱讀框 (ORF)。 該程序返回每個 ORF 的范圍,以及它的蛋白質(zhì)翻譯。 ORF Finder 支持整個 IUPAC 字母表和幾個遺傳密碼。 使用 ORF Finder 搜索新測序的 DNA 以尋找潛在的蛋白質(zhì)編碼片段。
成對對齊密碼子 - 接受兩個編碼序列并確定最佳全局比對。 使用 Pairwise Align Codons 尋找保守的編碼序列區(qū)域。
成對比對 DNA - 接受兩個 DNA 序列并確定最佳全局比對。 使用 Pairwise Align DNA 尋找保守的序列區(qū)域。
成對比對蛋白 - 接受兩個蛋白質(zhì)序列并確定最佳全局比對。 使用 Pairwise Align Protein 尋找保守的序列區(qū)域。
PCR第一統(tǒng)計 - 接受 PCR 引物序列列表并返回描述每個引物特性的報告,包括熔解溫度、GC 含量百分比和 PCR 適用性。 使用 PCR Primer Stats 評估潛在的 PCR 引物。
PCR產(chǎn)物 - 接受一個或多個 DNA 序列模板和兩個引物序列。 該程序搜索可以產(chǎn)生 PCR 產(chǎn)物的完全匹配的引物退火位點(diǎn)。 任何產(chǎn)生的產(chǎn)物都按大小排序,并給它們一個標(biāo)題,說明它們的長度、它們在原始序列中的位置以及產(chǎn)生它們的引物。 您可以使用線性或環(huán)狀分子作為模板。 使用 PCR 產(chǎn)品確定您在實(shí)驗(yàn)室中進(jìn)行 PCR 時可以看到的產(chǎn)品大小。
蛋白質(zhì)肉汁 - Protein GRAVY 返回您輸入的蛋白質(zhì)序列的 GRAVY(親水性的大平均值)值。 通過將每個殘基的親水性值相加并除以序列長度來計算 GRAVY 值(Kyte 和 Doolittle; 1982)。
蛋白質(zhì)等電點(diǎn) - 計算您輸入的蛋白質(zhì)序列的理論 pI(等電點(diǎn))。 當(dāng)您想知道在 2-D 凝膠上大約可以找到特定蛋白質(zhì)的位置時,請使用蛋白質(zhì)等電點(diǎn)。
蛋白質(zhì)分子量 - 接受一個或多個蛋白質(zhì)序列并計算分子量。 您可以使用提供的列表附加常用表位和融合蛋白的副本。 如果您希望預(yù)測目標(biāo)蛋白質(zhì)在凝膠上相對于一組蛋白質(zhì)標(biāo)準(zhǔn)品的位置,請使用蛋白質(zhì)分子量。
蛋白質(zhì)模式查找 - 接受一個或多個序列以及搜索模式,并返回與該模式匹配的站點(diǎn)的數(shù)量和位置。 搜索模式被編寫為 JavaScript 正則表達(dá)式,類似于用其他編程語言(如 Perl)編寫的正則表達(dá)式。
蛋白質(zhì)統(tǒng)計 - 返回您輸入的序列中每個殘基的出現(xiàn)次數(shù)。 還給出了每個殘基和某些殘基組的百分比總數(shù),使您可以快速比較不同序列獲得的結(jié)果。
限制文摘 - 用一種、兩種或三種限制酶切割虛擬限制性消化中的 DNA 序列。 生成的片段按大小排序,并給它們一個標(biāo)題,說明它們的長度、它們在原始序列中的位置以及產(chǎn)生它們的酶位點(diǎn)。 您可以消化線性或環(huán)狀分子,甚至是分子混合物(通過以 FASTA 格式輸入多個序列)。 使用 Restriction Digest 確定您在實(shí)驗(yàn)室執(zhí)行摘要時將看到的片段大小。
限制摘要 - 接受 DNA 序列并返回常用限制性內(nèi)切酶切割位點(diǎn)的數(shù)量和位置。 如果您希望快速確定酶是否切割特定的 DNA 片段,請使用此程序。
反向翻譯 - 接受蛋白質(zhì)序列作為輸入,并使用密碼子使用表生成代表最可能的非簡并編碼序列的 DNA 序列。 還返回源自每個氨基酸的所有可能密碼子的共有序列。 在設(shè)計 PCR 引物以與相關(guān)物種的未測序編碼序列退火時使用反向翻譯。
翻譯 - 接受 DNA 序列并將其轉(zhuǎn)換為您指定的閱讀框中的蛋白質(zhì)。 Translate 支持整個 IUPAC 字母表和幾個遺傳密碼。
序列圖:
顏色對齊保護(hù) - 接受一組對齊的序列(FASTA 或 GDE 格式)并為對齊著色。 該程序檢查每個殘基并將其與同一列中的其他殘基進(jìn)行比較。 序列中相同的殘基被賦予黑色背景,序列中相似的殘基被賦予灰色背景。 剩余的殘基得到白色背景。 您可以指定要應(yīng)用的著色必須相同和相似的殘基百分比。 使用 Color Align Conservation 增強(qiáng)序列比對程序的輸出。
顏色對齊屬性 - 接受一組對齊的序列(FASTA 或 GDE 格式)并為對齊著色。 該程序檢查每個殘基并將其與同一列中的其他殘基進(jìn)行比較。 序列中相同或相似的殘基被賦予彩色背景。 顏色是根據(jù)殘留物的生化特性來選擇的。 您可以指定要應(yīng)用的著色必須相同和相似的殘基百分比。 使用顏色對齊特性突出顯示具有保守生化特性的蛋白質(zhì)區(qū)域。
DNA組 - 調(diào)整 DNA 序列的間距并添加編號。 您可以指定組大小(每組的堿基數(shù))以及每行的堿基數(shù)。 這個程序的輸出可以作為一個方便的參考,因?yàn)榫幪柡烷g距可以讓你快速定位特定的堿基。
蛋白質(zhì)組 - 調(diào)整蛋白質(zhì)序列的間距并添加編號。 您可以指定組大?。拷M的殘基數(shù))以及每行的殘基數(shù)。 這個程序的輸出可以作為一個方便的參考,因?yàn)榫幪柡烷g距可以讓你快速定位特定的殘基。
第一張地圖 - 接受 DNA 序列并返回顯示 PCR 引物退火位置的文本圖。 還可以顯示限制性內(nèi)切酶切割位點(diǎn)和 DNA 序列的蛋白質(zhì)翻譯。 使用該程序生成有用的參考圖,特別是當(dāng)您為特定模板設(shè)計了大量引物時。 Primer Map 支持整個 IUPAC 字母表和幾個遺傳密碼。
限制地圖 - 接受 DNA 序列并返回顯示限制性內(nèi)切酶切割位點(diǎn)位置的文本圖。 在您指定的閱讀框中,還給出了 DNA 序列的翻譯。 計劃克隆策略時,請使用該程序的輸出作為參考。 Restriction Map 支持整個 IUPAC 字母表和幾個遺傳密碼。
翻譯圖 - 接受 DNA 序列并返回顯示蛋白質(zhì)翻譯的文本圖。 可以指定翻譯的閱讀框(1、2、3 或全部三個),也可以選擇將大寫文本作為閱讀框。 Translation Map 支持整個 IUPAC 字母表和幾個遺傳密碼。
隨機(jī)序列:
突變 DNA - 將堿基變化引入 DNA 序列。 您可以選擇要引入的突變數(shù)量,以及是否保留序列中的第一個和最后三個堿基,以反映選擇作用以維持起始和終止密碼子。 每個突變的位置是隨機(jī)選擇的,單個位點(diǎn)可以發(fā)生多個突變。 突變序列可用于評估序列分析結(jié)果的重要性。
突變蛋白質(zhì) - 將殘基變化引入蛋白質(zhì)序列。 您可以選擇要引入的突變數(shù)量,以及是否保留序列中的第一個殘基,以反映選擇作用以維持起始密碼子。 每個突變的位置是隨機(jī)選擇的,單個位點(diǎn)可以發(fā)生多個突變。 突變序列可用于評估序列分析結(jié)果的重要性。
隨機(jī)編碼 DNA - 生成以起始密碼子開始并以終止密碼子結(jié)束的隨機(jī)開放閱讀框。 您可以選擇要使用的遺傳密碼和要生成的序列長度。 隨機(jī)序列可用于評估序列分析結(jié)果的重要性。
隨機(jī) DNA 序列 - 生成您指定長度的隨機(jī)序列。 隨機(jī)序列可用于評估序列分析結(jié)果的重要性。
隨機(jī) DNA 區(qū)域 - 用隨機(jī)堿基替換 DNA 序列區(qū)域。 隨機(jī)序列可用于評估序列分析結(jié)果的重要性。
隨機(jī)蛋白質(zhì)序列 - 生成您指定長度的隨機(jī)序列。 隨機(jī)序列可用于評估序列分析結(jié)果的重要性。
隨機(jī)蛋白質(zhì)區(qū)域 - 用隨機(jī)殘基替換蛋白質(zhì)序列區(qū)域。 隨機(jī)序列可用于評估序列分析結(jié)果的重要性。
樣本 DNA - 從指導(dǎo)序列中隨機(jī)選擇堿基,直到構(gòu)建出您指定長度的序列。 每個選定的堿基都被替換,以便可以再次選擇它。
樣品蛋白質(zhì) - 從指導(dǎo)序列中隨機(jī)選擇堿基,直到構(gòu)建出您指定長度的序列。 每個選定的殘基都會被替換,以便可以再次選擇它。
洗牌 DNA - 隨機(jī)打亂 DNA 序列。 混洗序列可用于評估序列分析結(jié)果的重要性,特別是當(dāng)序列組成是重要考慮因素時。
洗牌蛋白 - 隨機(jī)打亂蛋白質(zhì)序列。 混洗序列可用于評估序列分析結(jié)果的重要性,特別是當(dāng)序列組成是重要考慮因素時。