MotDB


AJACS14.7

_ 統合データベース講習会: AJACS柏オンライン

目次

_ 遺伝子発現データベースに関する統合TV

 
 
 

遺伝子発現データベースを使い倒す    担当:小野浩雅

_ BioGPS

ヒト、マウス、ラットのさまざまな組織や細胞(株)における遺伝子発現プロファイルのデータベース

  • BioGPSはAffymetrix社製のマイクロアレイであるGeneChip?を用いた遺伝子発現プロファイルのデータベース。
  • GNF SymAtlas【参考動画】のメジャーアップデート版。
  • マウスのエキソンアレイのデータが追加されたので、遺伝子のスプライシングバリアント(Splicing variant)の発現状況も調べることが可能。
  • 検索した遺伝子に対して、種々の外部データベースに横断検索することができる。

_ 【実習】BioGPSを使ってある遺伝子の発現プロファイルを調べる

  • 【使い方参考動画】【講習会動画】http://lifesciencedb.jp/image/small_video_icon.png
  • 1. https://biogps.gnf.org/を開きます。
  • 2.骨格筋の分化決定遺伝子であるMyogenic differentiation 1(MyoD)の発現プロファイルを調べてみましょう。中央の検索窓に「myod」と入力し、「search」を押します。
  • 3. 表示された検索結果をクリックします。
  • 4. 最初はヒトのマイクロアレイデータが表示されます。
  • 5. マイクロアレイデータ左上の「Human(4654)」をクリックするとマウスやラットを選択できるので、「Mouse(17927)」をクリックしてマウスのデータを表示できます。
  • 6. MyoDはどの組織、細胞で強く発現しているでしょうか?
  • 7. 右上の「default rayout」をクリックすると、検索した遺伝子に関するマイクロアレイデータ以外のデータが閲覧できますが、どのようなデータが閲覧できるのか調べてみましょう。
  • 8. 左上の「Search」タグをクリックして検索画面にもどり、自分の興味ある遺伝子について同様に検索してみましょう。

_ NCBI Gene Expression Omnibus (GEO)

世界最大の遺伝子発現(マイクロアレイ)データベース(レポジトリ)

_ 【実習】GEOを使って、自分の興味のある遺伝子の(ある実験条件下における)発現状況を調べる

  • 【使い方参考動画】http://lifesciencedb.jp/image/small_video_icon.png
  • 1. http://www.ncbi.nlm.nih.gov/geo/を開きます。
  • 2.「Gene profiles」に自分の検索したい遺伝子名を入力します。
  • 3. 今回は例として「nanog」という遺伝子を検索してみましょう。入力終了後、「GO」をクリックします。
  • 4. GEOに登録されている様々な実験条件で行なわれたマイクロアレイ実験における「nanog」遺伝子の発現データが表示されます。
  • 5. 検索結果の右端にある画像をクリックすると、発現データの詳細をみることができます。
  • 6. 「Display values」をクリックすると、発現値を一覧できます。
  • 7. このサンプルでは、nanogはどういう細胞のどういう実験条件で発現が増減しているか調べてみましょう。
  • 8. ページ下部の「samples」に列挙されたリンクをクリックすると、そのサンプル(一枚のマイクロアレイ)の詳細を閲覧できます。
  • 9. リンク先のページの中ほどにある「series」のリンクをクリックすると、この実験全体の詳細情報が見られます。
  • 10. この実験全体の詳細情報ページの下部にある「Series Matrix File(s)」をクリックすると、この実験の正規化補正済みのマイクロアレイデータをダウンロードすることができます。

_ 【実習】データセットブラウザ(Dataset browser)を利用して、GEOに登録されているマイクロアレイデータを解析する

  • 【使い方参考動画1】http://lifesciencedb.jp/image/small_video_icon.png【使い方参考動画2】http://lifesciencedb.jp/image/small_video_icon.png
  • 1. http://www.ncbi.nlm.nih.gov/geo/を開きます。
  • 2.「Gene profiles」に自分の検索したい遺伝子名を入力します。
  • 3. 今回は例として「nanog」という遺伝子を検索してみましょう。入力終了後、「GO」をクリックします。
  • 4. GEOに登録されている様々な実験条件で行なわれたマイクロアレイ実験における「nanog」遺伝子の発現データが表示されます。
  • 5. 検索結果のアクセッション番号(今回は GDS2294)をクリックすると、解析用の「データセットブラウザ」が開きます。
  • 6. 「Expression profiles」をクリックすると、この実験データセットにおける個々の遺伝子発現状況を検索できるページに飛びます。
  • 7. 検索窓に表示されているアクセッション番号の後に続けて遺伝子名を追加(今回は例として Oct4 )すると、この実験データセット内におけるその遺伝子の発現データが検索できます。
  • 8. 「データセットブラウザ」の「Data Analysis Tools」では詳細なデータ解析が可能です。
  • 9. 「Find gene name or symbol:」のところに自分の興味ある遺伝子名を入れてみましょう。
  • 10. 「Find genes that are up/down for this condition(s):」の「GO」をクリックするとどのような遺伝子がヒットするでしょうか。
  • 11. 「Compare 2 sets of samples」では2群間で発現に差のある遺伝子を(統計学的に)検索できます。step1で発現量の違いを検出する方法を設定します。step.2で比較する2群の設定をします。step.3の「Query Group A vs. B」をクリックすると、検索が始まります。
  • 12. 「Cluster heatmaps」では、マイクロアレイデータ解析でよく用いられるヒートマップでのデータ表示が行なえます。分類方法としてHierarchical、Partitional (K-means/K-medians)、By location on chromosomeの3種類が選べますが、それぞれどのようにデータが分類されるか試してみましょう。
  • 13. 「Experiment design and value distribution」では実験データにおける発現の分布を参照できます。これにより、各サンプルのデータが互いに比較可能か(実験上のミスがないか)チェックすることができます。

_ 【実習】GEOを使って、自分の興味のあるマイクロアレイ実験データセットを検索&生データをダウンロードする

  • 【使い方参考動画】http://lifesciencedb.jp/image/small_video_icon.png
  • 1. http://www.ncbi.nlm.nih.gov/geo/を開きます。
  • 2. 画面中央の「Platforms」をクリックします。
  • 3. Platform(マイクロアレイの種類)の一覧画面が現れるので、上部の「FIND PLATFORM」をクリックします。
  • 4. platformの検索画面が現れるので、「Company name」に「Affymetrix」、「organism」に「Homo sapiens」を選択し、「FIND PLATFORM」をクリックします。
  • 5. Affymetrixのヒトのマイクロアレイの検索結果が表示されるので、中程にある「Affymetrix GeneChip? Human Genome U133 Plus 2.0 Array」の左端にある「GPL570」というIDをクリックします。
  • 6. 表示された画面の真ん中あたりにある「series」下の「More...」をクリックすると、登録されているデータセットを閲覧できます。
  • 7. ブラウザの検索ボタンなどを使って「reprogramming」という単語を検索するとどういうデータがヒットするでしょうか?
  • 8. ヒットしたデータの左端にあるIDをクリックすると、そのデータセットの詳細情報が閲覧できます
  • 9. ページ下部の「Download family」の中にある「Series Matrix File(s)」をクリックすると正規化済みのデータのダウンロードリンクが表示されます。
  • 10. ページ最下部の「Supplementary file」にあるリンクから生データをダウンロードすることができます。
  • 11. 自分の研究テーマに近い、また興味のあるマイクロアレイデータが利用可能か検索してみましょう。

_ 【参考】遺伝子発現バンク(GEO)目次、通称「GEO目次」

  • 使い方参考動画 http://lifesciencedb.jp/image/small_video_icon.png
  • NCBI GEO を日本語のインターフェイスで快適に使い、データの全容を俯瞰するための仕組み
  • 今後さらに使いやすくアップデート予定

_ Mouse Genome Informatics(MGI)

マウスに関する遺伝子、ゲノム、生物学的な情報を提供する統合データベース

_ 【実習】MGIを使ってある遺伝子の様々な実験条件で得られた発現データを閲覧する

_ 【参考】MGIでノックアウトマウス情報の有無を調べる

統合TVで紹介していますので興味ある方はぜひご覧ください。http://lifesciencedb.jp/image/small_video_icon.png

 
 
 

遺伝子発現データの生物学的な解釈    担当:仲里猛留

_ DAVID: The Database for Annotation, Visualization and Integrated Discovery

マイクロアレイデータの生物学的な解釈

microarray.analysis.005.png
  • 上で述べたマイクロアレイの結果の解析は、統計解析で、それらの遺伝子が生物学的にどういう意味を持つかわかりません。
  • そこで、Gene Ontologyの用語を付与することで、生物学的な解釈を行います。
  • 【参考動画】DAVIDを使ってマイクロアレイデータを解析するhttp://lifesciencedb.jp/image/small_video_icon.png

_ 【実習】DAVIDを用いて、発現データの結果を生物学的に解釈する

  • 1. 上部メニューの「Start Analysis」をクリック
  • 2. 画面左側バーで、probe IDリストをコピペ or ファイルを指定
    • 今回は、統合TVと同じ、NCBI GEOより取得した公共の遺伝子発現データ(GSE1657:Adipocyte Differentiation [Homo sapiens])を用いて、ヒトの脂肪細胞の分化過程で発現増加した上位500個の遺伝子群のリストを使って説明しています。
  • 3. リストのIDの種類タイプを選択 … 今回は、「AFFY_ID」と「Gene List」
  • 4. Submit List をクリック → 読み込まれる
  • 5. 今、アップロードしたリストは、左側バーの「List Manager」で「Uploaded List_1」として保存されています。削除やrenameもできます。
  • 6. 解析を続けます。真ん中の「Functional Annotation Tool」をクリック
  • 7. 今回は、Gene Ontologyでの解析を行います。「Gene Ontology」をクリック → Gene Ontologyでの解析の細かいメニューが表示されます
  • 8. 今回は、GOTERM_BP_ALL (BP=Biological Process)に注目します。その右の「Chart」をクリック → 結果がポップアップします
  • 9. P-value を2回クリックしてp-valueが小さい(統計的に有意である)順にしてみましょう … p-value小さい順は、一度やればしばらく覚えているので、次からはしばらくは必要ないです

    結果

    david.go_bp.png
  • [応用編] Pathways > KEGG_PATHWAY や Tissue Expression > UP_TISSUE なども見てみよう。生物学的にどういうことが言えるだろうか。
  • 参考:GO Terms Classification Counter (CateGOrizer)というのもあります。詳しくは、こちら

_ 【実習】Reactomeを使ってマイクロアレイデータの結果の解釈をする

  • 【使い方参考動画】http://lifesciencedb.jp/image/small_video_icon.png
  • 1. http://www.reactome.org/を開きます。
  • 2.上部の「Tools」から「SkyPainter?」をクリックします。
  • 3. 「参照」をクリックして、file090907_sample_U133A_adipo.txtをアップロードします。
  • 4.「Focus species」を「Homo Sapiens」に設定します。
  • 5.「Paint!」をクリックします。
  • 6.結果が表示されます。
  • 7.DAVIDやGO Terms Classification Counter (CateGOrizer)で出力された結果とどこがどう違うか考えてみましょう。

_ 次世代シーケンサのデータについて

  • 次世代シーケンサのデータは、中身は配列データですが、ある状態での遺伝子発現を塩基配列として検出することもでき、遺伝子発現データとしてもとらえられます
    • ゲノム解読として使う場合は、配列データとしてで、発現データを得るためにも用いることができる、ということです。
  • 次世代シーケンサによる測定結果(≠解析結果)も、登録、公開のしくみができている

_ 【実習】どのような形でデータが登録されているか見てみよう →

 
Last-modified: 2009-12-07 (月) 17:19:13 (3765d)