MotDB


AJACS湘南/講習内容/part4

AJACS湘南/講習内容へもどる


目次


_ 遺伝子機能予測とDB高度化

_ 遺伝子の機能を知るためには

機能が「本当の意味で」判明している遺伝子は驚くほど少ない。

_ 実験で知る・推し量る

  • 酵素活性をはかる
    • 遺伝子(DNA)→転写→RNA→翻訳→タンパク質
    • タンパク質をとり、どんな酵素活性をもつのか調べる
  • 逆遺伝学
    • 古典的遺伝学 形態や現象から遺伝子へ
    • 逆遺伝学 遺伝子から形態や現象へ=遺伝子を「潰す」
  • 転写産物の動態を観察する

_ 類推する方法は?

  • 配列の類似
    • 配列が似ていれば機能も似ている(多分)
    • 類似の類似の類似の類似は類似ではないかもしれない
      • 「相同 (homology) 人の手=猫の足=鳥の羽
      • 「相似」(similarity) コウモリと鳥の羽、パンダの親指
    • 部分一致している部分は機能と関わらないかもしれない
    • 機能とかかわらない領域の部分的な一致が非常に危険
  • 「嘘類似」の問題回避法
  1. 配列類似検索の対象は、信頼できるライブラリから順に使う
  2. 配列類似検索以外の機能予測方法を用いる
    機能に関わるタンパク質の部分配列
    • 機能に関わるタンパク質の部分配列(モチーフやドメイン)
    • Interpro: さまざまなタンパク質機能探索のための統合データベース
      http://www.ebi.ac.uk/interpro
  3. 注釈の「根拠 (evidence)」が明示できる方法で注釈する
    機能アノテーションの「根拠」を記載する方法が提唱されている
    • see: http://www.geneontology.org/ -> Documentation -> Evidence Code Guide
      • IDA (Inferred from Direct Assay)
      • TAS (traceable author statement)
      • IEA (Inferred from Electronic Annotation)
      • ISS (Inferred from Sequence or Structural similarity) etc.

_ 【実習】InterproScan・GO・CyanoGenesKazusaAnnotation

_ InterproScan

モチーフ、プロファイル検索のまとめがけ、Gene Ontorogyにまで到達可能な優れたアミノ酸配列解析総合サイト

http://www.ebi.ac.uk/InterProScan/

  • Enter or Paste a PROTEIN Sequence in any formatに以下の配列をコピペする (ctl-C then ctl-V)
>opsin Rh2(Drosophila melanogaster)
MERSHLPETPFDLAHSGPRFQAQSSGNGSVLDNVLPDMAHLVNPYWSRFAPMDPMMSKIL
GLFTLAIMIISCCGNGVVVYIFGGTKSLRTPANLLVLNLAFSDFCMMASQSPVMIINFYY
ETWVLGPLWCDIYAGCGSLFGCVSIWSMCMIAFDRYNVIVKGINGTPMTIKTSIMKILFI
WMMAVFWTVMPLIGWSAYVPEGNLTACSIDYMTRMWNPRSYLITYSLFVYYTPLFLICYS
YWFIIAAVAAHEKAMREQAKKMNVKSLRSSEDCDKSAEGKLAKVALTTISLWFMAWTPYL
VICYFGLFKIDGLTPLTTIWGATFAKTSAVYNPIVYGISHPKYRIVLKEKCPMCVFGNTD
EPKPDAPASDTETTSEADSKA
  • Submit Job をクリックしてジョブをスタート
  • グラフィクス表示とTable表示の両方でこの配列がもつモチーフ・プロファイルを確認

【実行が遅いときはここをクリック】あらかじめ検索した結果

  • 【発展】: どのようなプログラムが使われているのか?それぞれの詳細について調査し理解しましょう

_ GeneOntology (GO)

遺伝子機能注釈のための生物共通語彙を提供。evidence が明記されているのはすばらしいこと

http://www.geneontology.org

  1. キーワード「DNA binding circadian」で検索してみよう
  2. 結果のなかから CCA1, CIRCADIAN CLOCK ASSOCIATED 1 をクリックして遺伝子の詳細を見る
  3. 上部の「5 term associations→」リンクを開いてGene Associationとevidence codeを閲覧
  4. GO:0007623 の「circadian rhythm」をクリックしてGeneOntologyの詳細を見る
  5. Term Lineageの「circadian rhythm [243 gene products] 」のリンクをクリックし、
  6. このタームに関連する遺伝子のリストを表示する
    【ここでも、それぞれのevidence codeに着目してみよう】
  7. Evidence CodeをIDA (Inferrd from Direct Assay) に限定するfilterをかけてみる
  8. speciesをA. thalianaに限定してみるなどの操作を行ってみる
  9. IDA, TASなど、複数のEvidence codeの選択も可能。Macならcommand key+クリック,
  10. windowsの場合はCtrlかShiftあたりか?
  • 【発展】: Evidence Codeの詳細をGuide to GO Evidence Codesを参照して確認しよう。あなたにとって信頼に足るcodeはどこまでか

_ CyanoGenes

シアノバクテリアの遺伝子単位のコメント受付。オープンアノテーションの最初期の試み

http://www.kazusa.or.jp/cyanobase/Synechocystis/comments/

  • 【実習】: それぞれの遺伝子にどんなコメントがついているか、確認してみよう

_ KazusaAnnotation

統合DBプロジェクトにおける、オープンアノテーションへの挑戦。現在進行形

http://a.kazusa.or.jp

  • 【実習】: それぞれの遺伝子にどんなブックマークとコメントがついているか、確認してみよう

AJACS湘南/講習内容へもどる

 
Last-modified: 2008-05-30 (金) 16:44:10 (4764d)