MotDB


AJACS蝦夷/講習内容/part3

AJACS蝦夷/講習内容へもどる


目次


_ 自己紹介

_ 講師の中尾

  • 30代半ば。かずさディー・エヌ・エー研究所 特別研究員
  • 北大理化II→京大→東大医科研→産総研CBRC→かずさDNA研 「ゲノムスケール」の「情報」を扱ってきました。

_ 参加者アンケート

  • バイオインフォマティクスを使っている人:13
  • プログラミングをたしなむ人:3
  • おもにMacの人:6
  • おもにWindowsの人:18
  • ウェブブラウザはFireFox?の人:9
  • ウェブブラウザはSafariの人:3
  • データベースを良く利用する人:15
  • 統合データベースプロジェクトのウェブサイトを見たことがある人:
  • データベースを構築している人:2
  • データベースを構築したい人:5

_ 塩基配列の注釈(annotation)の基礎

_ ゲノムの注釈 genome annotation

  • 構造注釈 structural annotation
    遺伝子の構造、リピート配列構造などを記載したアノテーション
  • 機能注釈 functional annotation
    遺伝子の機能を記載したアノテーション

_ 遺伝子の「構造 structure」を予測すること

  • DNAは読めるが、それだけでは遺伝子はわからない。
  • ゲノムを読んだら遺伝子の構造を把握することがまず第一。

_ 遺伝子構造アノテーションの基礎

_ 類似配列検索

_ 真核生物のゲノム注釈

_ 原核生物よりも困難な理由

  • 遺伝子密度が低い
  • 遺伝子構造が複雑
    • エクソン=イントロン構造
    • エクソンはタンパク質を指定する情報が載っている「コード領域」
    • イントロンは転写後にスプライシングにより切り捨てられる「非コード領域」
    • イントロンが切り出されることをスプライシングという
    • イントロンが切り出される位置をスプライスサイトという
    • スプライスサイトをきちんとおさえないと、コード領域が「ズレ」てしまう

_ 真核生物は「コード領域予測+スプライスサイト予測の組み合わせ」

_ コード領域予測の方法

  • 配列類似+遺伝子予測法(原核生物と同じ)
  • expressed sequence tags (EST) を貼り付ける(mapping)方法
    • dbEST: http://www.ncbi.nlm.nih.gov/dbEST
    • 転写されたRNAを逆転写したものがcDNA (complementary DNA)
    • cDNAの端だけを重複をゆるして大量に読んだものがEST
    • 転写(transcription)されたRNAを網羅的に研究する→「transcriptome」である
  • 大量に存在するESTや、アミノ酸配列を貼り付けることで遺伝子を探す
    • GT-AGルールに従うのがキモ

_ 真核生物ゲノムの遺伝子発見の実際

  • 複数の解析方法の組み合わせによる画像化
  • 手作業による「編集」が必須である
  • それでも最大65%の精度
    実験の情報のフィードバックにより修正が必要

_ ゲノムブラウザとアノテーション

  • ゲノム配列は分子生物学の白地図、なんでも載せることができる
  • ゲノムブラウザは分子データのブラウザ
    • EST, cDNA, clone, contig, SNPs
    • 遺伝子モデル、シンテニー、リピート

_ データとビュー

  • データとデータベース
  • データベース ← データ+検索などの問い合わせ+ビュー

_ アノテーションの拡大解釈

_ 【実習】ゲノムブラウザの利用、アノテーションの閲覧

  • GeneViewTransViewProtView にそれぞれどのようなデータやアノテーションがあるか確認する。違いは何か?
  • ProtView の DAS Sources のチェックボックスをすべて入れて、update してみる。どこが変更されたか、どのようなアノテーションが追加されたか確認する。

AJACS蝦夷/講習内容へもどる

 
Last-modified: 2008-08-29 (金) 14:49:36 (4288d)