MotDB


AJACS10/neta/BLAST

AJACS10/netaに戻る



AJACS10.009.jpg
AJACS10.010.jpg
AJACS10.011.jpg
AJACS10.012.jpg
AJACS10.013.jpg
AJACS10.014.jpg
AJACS10.015.jpg

_ ホモロジー検索(BLAST)

_ データベース

_ ツール

  • SSEARCH
    • 配列全体を探索
  • FASTA
    • よく似た領域の周囲だけを探索
  • BLAST
    • 「ワード」の一致を発見
    • そこからアラインメントを横へ伸ばす。伸びなくなったらあきらめる。
    • きわめて高速で巨大配列も探索可能
  • BLAST検索のprogram option
program入力DB概要
BLASTNDNA塩基配列DNA塩基配列入力配列(DNA塩基配列)と類似の核酸配列を検索
BLASTPアミノ酸配列アミノ酸配列入力配列(アミノ酸配列)と類似のアミノ酸配列を検索
BLASTXDNA塩基配列アミノ酸配列入力DNA塩基配列をアミノ酸に翻訳した配列で、類似のアミノ酸配列を検索
TBLASTNアミノ酸配列DNA塩基配列入力アミノ酸配列を、DNA塩基配列のデータベースをアミノ酸配列に翻訳したものに対して、類似の配列を検索
TBLASTXDNA塩基配列DNA塩基配列入力DNA塩基配列をアミノ酸配列に翻訳したものを、核酸配列データベースをアミノ酸配列に翻訳したものとの類似を検索
PSI-BLASTアミノ酸配列アミノ酸配列入力配列とアミノ酸データベースとの検索を繰り返すことで、弱い類似しかない配列を検索可能にする方法
PHI-BLASTアミノ酸配列アミノ酸配列配列の「パターン」で類似の配列を検索する

これらのプログラムはもともと自分の使えるサーバやパソコンにインストールして使うものですが、BLASTなんかはウェブ経由でも使えるようになっています

_ 【実習】BLAST検索

  • 今回はBLASTを使って機能未知のアミノ酸配列の機能を推定してみましょう。
  1. 以下の配列をコピーします (control-C)
    • 書き写すのは大変な上に必ず打ち間違えますので、やめましょう
      MERSHLPETPFDLAHSGPRFQAQSSGNGSVLDNVLPDMAHLVNPYWSRFAPMDPMMSKIL
      GLFTLAIMIISCCGNGVVVYIFGGTKSLRTPANLLVLNLAFSDFCMMASQSPVMIINFYY
      ETWVLGPLWCDIYAGCGSLFGCVSIWSMCMIAFDRYNVIVKGINGTPMTIKTSIMKILFI
      WMMAVFWTVMPLIGWSAYVPEGNLTACSIDYMTRMWNPRSYLITYSLFVYYTPLFLICYS
      YWFIIAAVAAHEKAMREQAKKMNVKSLRSSEDCDKSAEGKLAKVALTTISLWFMAWTPYL
      VICYFGLFKIDGLTPLTTIWGATFAKTSAVYNPIVYGISHPKYRIVLKEKCPMCVFGNTD
      EPKPDAPASDTETTSEADSKA
  2. NCBI BLASTのページを開きます: http://www.ncbi.nlm.nih.gov/blast/
    • 右クリックから「新しいタブで開く」(or 新しいウインドウを開く)を選択して別のタブで開くと便利です
    • NCBI: National Center for Biotechnology Information 米国国立生物工学情報センター
  3. 「protein blast」を選択します
    • アミノ酸配列が入力で、アミノ酸データベースに対して検索を行います
  4. 「Search」窓に上記配列をペーストします (control-V)
  5. 「Choose database」で「swissprot」を選択
    • 検索対象としてどのデータベースを選ぶかは非常に重要です。解析の目的に合わせて適切なデータベースを選びます
    • 今回は機能未知配列の(なるべく)正確な機能を推定したいので、人手で整備されている(データがきれいな)swissprotを選びました。
  6. Algorithm が blastp (protein-protein BLAST) になっているのを確認する
  7. 「BLAST」ボタンをクリック → これで計算が始まります
    • 結果の一番上に、Conserved Domain(機能が共通しているタンパク質で保存されている領域)が表示されます
    • 実行が遅いときはこちら:あらかじめ検索した結果
  8. 画像の7tm_1をクリック
    • conserved domainとして「pfam00001, 7tm_1, 7 transmembrane receptor (rhodopsin family)..」が見つかった(7回膜貫通型receptor; Pfam00001)
      • どういうドメインを持っているかで大体の機能の予測ができることも多いです
  9. 戻って、検索の結果を見てみます
    • まずアラインメントされた(並べることのできた)領域の絵が出力されています
    • その下にヒットしてきた配列のリストとスコア、E-valueが表示されます
      • E-valueとは、そのライブラリで偶然に同じスコアでヒットする本数の期待値
    • 配列リストの右の「G」は「Entrez gene (遺伝子ごとに情報をとりまとめたデータベース)」へのリンク
      • どのような情報がとりまとめられているか、確認してみましょう
    • さらに下の方に行くと、配列のアラインメントを見れます

_ 計算結果をいろいろな方法で表示

  • 結果上部にある「Formatting options」から結果を別の書式で表示させることができます。
  • 結果上部にある「Download」から結果を別の書式で表示させることができます。
  • 【応用】テーブル形式で結果を保存し、エクセルで開いてみよう
  1. 「Download」をクリックします
  2. 「Alignment」のしたにある「Hit Table(text) 」をクリックします
    • デスクトップとかに保存します
    • 保存したファイルはテキストファイルなので、「メモ帳」とかでも開けます
  3. Excelを起動します
  4. 「ファイル」→「開く」からさきほどダウンロードしたファイルを開きます
    • ファイル名は「なんたらかんたら-Alignment.txt」
    • ファイルが灰色になって選択できない場合には、「選択対象」とやらを「すべての読み込み可能なファイル」から「すべてのファイル」に変更します
  5. 「カンマやタブなどの〜」を選んで「次へ」
  6. 区切り文字 のところで、「タブ」と「コンマ(カンマ?)」両方にチェックを入れます → 「次へ」
  7. 「完了」を押すとBLASTの結果をExcelで表示できました
  1. 結果ページの「Alignments」(リストの下)のところに、それぞれの配列の先頭にチェックボックスがあるので、欲しい配列にチェックを入れます
    • 全部欲しい場合には「Select all」をチェックすれば全部の配列にチェックが入ります。もう一回押せばチェックを解除できます
  2. 今回は上から5個の配列にチェックを入れてみます
  3. 「Select all」の横にある「Get selected sequences」を押します
  4. 上の方にある「Display: Summary」のところを「FASTA」に変更します(自動的にページが更新されます)
  5. 「Send to」のところを「File」に変更します(自動的に配列をダウンロードします)
  6. メモ帳でダウンロードしたファイルを開きます

_ その他の機能

  • 【応用】: PSI-BLASTを使うと、何回も繰り返し検索を実行することで類似が低いが遠縁であるような配列を捕まえることもできます。上記の配列で実行してみましょう。
  1. 新しくBLASTのサイトを開きます
    • 前の配列が残っている場合には入力ボックスの上にある「Clear」を押して前の配列を消してから実行します
  2. 配列を入力ボックスにコピペし、検索対象データベースを確認します
  3. 「Algorithm」のところを「PSI-BLAST (Position-Specific Iterated BLAST)」に変更します
  4. 「BLAST」ボタンをクリック
    • 表示される結果が1回目のPSI-BLASTの結果です(1回目の結果は blastp の結果と同じになります)
  5. 「Descriptions」(絵の下)にある「Run PSI-Blast iteration 2 with max 500」の横にある「Go」をクリックすると2回目の検索が始まります
    • 「Descriptions」のところで New マークが付いている配列が新しく見つかった配列です

AJACS10/netaに戻る

 
添付ファイル: fileAJACS10.015.jpg 1393件 [詳細] fileAJACS10.014.jpg 945件 [詳細] fileAJACS10.013.jpg 1284件 [詳細] fileAJACS10.012.jpg 1061件 [詳細] fileAJACS10.011.jpg 1293件 [詳細] fileAJACS10.010.jpg 1174件 [詳細] fileAJACS10.009.jpg 1288件 [詳細]
 
Link: AJACS10/neta(3980d)
Last-modified: 2009-05-15 (金) 14:40:37 (3981d)