MotDB


AJACS12/thecla

「DNAデータベースの使い方」


AJACS蝦夷2 > DNAデータベースの使い方


_ DNAデータベース総覧と検索 (DDBJ/EMBL/GenBank?):http://lifesciencedb.jp/ddbj/

  • 統合ホームページ > データベース > DNAデータベース総覧と検索
  • [ナニコレ] DDBJ/EMBL/GenBank?(DNA塩基配列のデータベース)に登録されている全レコードをプロジェクト単位で分類。「生物種」と「研究の型」の二次元で分類。データを一括ダウンロード可能
  • http://lifesciencedb.jp/image/small_video_icon.png DNAデータベース総覧と検索を使い倒す

_ とりまく状況

  • 塩基配列は、GenBank?(NCBI)/EMBL/DDBJに蓄積され、公開されている
  • 【実習0-1】GenBank?に登録されている塩基配列の登録数はどのくらいだろうか?
    • NCBIにアクセスし、「All[Filter]」で検索してみる → 結果

      ←こたえはここをクリック

      およそ1億6700万件。正確には、167,207,342件[9/4現在]

  • 【実習0-2】GenBank?に登録されている塩基配列の総塩基数はどのくらいだろうか?
    • Statistics のページを見てみる → 結果

      ←こたえはここをクリック

      およそ1000億bp(別の言い方すると100GB分)。正確には、99,116,431,942bp

  • 【実習0-3】どのような形式(フォーマット)でデータが収められているだろうか

_ そこで DNAデータベース総覧と検索

  • ひとつひとつの遺伝子を見て行く時代は過去のもの。最近はプロジェクトにより大量の遺伝子が登録されている
    • → それらを一度にダウンロードして活用という場面も
  • DNAデータベース総覧と検索 (DDBJ/EMBL/GenBank?):http://lifesciencedb.jp/ddbj/ を使ってみよう
  • 【実習1】「生物群区分」で特定のカテゴリーを選ぶと、研究プロジェクト数が絞り込まれることで数が変化する。「生物群区分」で「ヒト」を選ぶ前と後で「研究の型別分類」の「機能RNA・RNAゲノム」の項目はいくつからいくつに変化するか?
  • 【実習2】「生物群区分」で「ヒト」、「研究の型別分類」で「mRNA」を選んで得られる研究プロジェクトのリストを、「研究プロジェクトの一覧」を「サイズ順」にすることでデータサイズの大きなプロジェクト順に並び替えなさい。トップ3にランキングされる研究プロジェクトはそれぞれ何か?
  • 【実習3】統合ホームページ中の「ダウンロード」のタブをクリックすると、国内のゲノム・ポストゲノムプロジェクト配列データのダウンロードページに辿り着ける。この中から興味のあるプロジェクトを選び(例えば、シロイヌナズナ (Riken2004年))、公開されている配列をFASTA形式で一括ダウンロードしなさい。
  • 【応用1】上の実習でわずか数クリックで実現した一括ダウンロードできることのメリットは何だろうか?それがない場合、どういった手続きをしないといけないかを考えてみなさい。

_ 遺伝子発現バンク(GEO)目次:http://lifesciencedb.jp/geo/

  • 統合ホームページ > データベース > 遺伝子発現バンク(GEO)目次
  • [ナニコレ] NCBIのGEO(Gene Expression Omnibus:mRNA発現情報のデータベース)に登録されている全レコードをプロジェクト単位で分類。「生物種」、「研究の型」、「部位」の三次元で分類。データを一括ダウンロード可能
  • http://lifesciencedb.jp/image/small_video_icon.png 遺伝子発現バンク(GEO)目次を使い倒す−その壱
  • 【実習4】「生物種」で特定の種を選ぶと、研究プロジェクト数が絞り込まれることで数が変化する。「生物種」で「ヒト」を選ぶ前と後で「研究の型」の「GeneChip?」(Affymetrixの発現アレイ)、「cDNAアレイ」、「オリゴアレイ」の項目はいくつからいくつに変化するか?また、「生物種」に「齧歯」を選ぶとそれぞれどうか?
  • 【実習5】右上の検索フォームで'hypoxia'と入力して検索したあとで、「生物種」で「ヒト」、「研究の型」で「GeneChip?」を選んで得られる研究プロジェクトのリストを表示せよ。「測定サンプル」のカラムの数字をクリックしてどのようなことが起こるか、確認してみよ。また、GSEで始まるGEOのエントリ(例えばGSE4725)をクリックするとNCBIのサイトに直接アクセスできるので、そのページにアクセスせよ。

ここから先の、GEOでのデータの解析方法については、遺伝子発現データベースを使い倒すにて詳しく紹介する。

ProjectE.010.png

_ その他の遺伝子発現データ総覧と目次

GEOがカバーしていない(発現データとしての配列データ;EST(Expressed Sequence Tags))、カバーしていても特化(専門化)していないために使いにくい(例えば、ヒト専用)遺伝子発現データに対してその中身を検索し閲覧するサービスがDBCLSで公開されているのでそれを紹介する。

_ ヒト統合ボディーマップ

5種類のヒト発現データ (iAFLP, Affymetrix GeneChip?, EST, SAGE-NCBIのタグマップ, SAGE-大久保研独自タグマップ)に対して対応するNCBIのUniGene?(ユニジーン)でデータを整理。対象生物種はヒトのみだが、複数の手法による客観的な遺伝子発現データの比較が可能。 http://okubolab.genes.nig.ac.jp/bodymap_i/

_ Bodymap-XS

分類学と解剖学による動物のESTカウント数データの統合サイト。 http://bodymap.jp/

_ 植物ESTボディーマップ

植物の各臓器、組織における遺伝子の発現量をESTを使って推定したデータベース。 http://lifesciencedb.jp/bodymap-plant/

_ 次世代シーケンサのデータについて


AJACS蝦夷2 > DNAデータベースの使い方


 
添付ファイル: fileProjectE.010.png 793件 [詳細]
 
Link: AJACS12(3865d) AJACS12/hono2(3867d)
Last-modified: 2009-10-13 (火) 21:09:43 (3831d)