フリーのマイクロアレイ解析ソフトを使って解析データに異常がないか確認してみよう!

フリーのマイクロアレイ解析ソフトを使って解析データに異常がないか確認してみよう!

弊社が提供するフリーのソフトウェアにより、どなたでも自由に弊社マイクロアレイのデータを取り扱うことができるようになります。

今回はWeb上からダウンロードした次世代型発現解析マイクロアレイClariom D のデータを用いて、実験に問題がなかったかどうかの確認作業、いわゆるQC (Quality Check) の方法をご紹介します。

解析データに異常がないか確認する

前回ではWebからダウンロードしたマイクロアレイデータをExpression Console (EC) ソフトウェアに取り込み、CHP(チップ)ファイルと呼ばれる解析用ファイルの作成までおこないました。

作成されたCHPファイルの各種データはECによって読み込まれ、その値が設定されたreport thresholdから外れていないかどうか自動で判別されます。正常な場合は下図のように、「Within Bounds」と表示されます。

一方で、thresholdから外れた値がある場合は「Outside Bounds」と表示され、下図のようにハイライトされます。

このように、ユーザーは解析に用いられるマイクロアレイデータに異常値が含まれているかどうか、ECを使うことで簡便に判断することができます。

詳細は省略しますが、ユーザーはThreshold Testのレポートを見ることで、問題があった部分を特定することもできます。

シグナルヒストグラムを作成する

マイクロアレイの各プローブは、発現量に応じたシグナル値をもっています。1枚のマイクロアレイに載っている全プローブのシグナル値を概観するにはヒストグラムの作成が便利です。

実験に用いられた全マイクロアレイのシグナルヒストグラムを見比べることで、異常なサンプルがないか確認してみましょう。まず下図のようにすべてのCHPファイルが選択されていることを確認します。選択されていない場合は、チェックボックスにチェックを入れます。

次にECの画面右側にあるToolboxから、「QC: Signal Distribution」をクリックします。続いて、その中より「(1) Signal Histogram」を選択してください。

すると、下図のようなシグナルヒストグラムが作成されます。

上図のように、今回のサンプルデータのシグナルヒストグラムは全16サンプルにおいてそれほど大きく異なっていないことが分かりました。

サンプル間の相関係数を求める

ヒストグラムによるサンプルの比較はあくまでも全体として異常なものがないかの確認でした。今回のサンプルデータには4種類の臓器からのデータが入っていますので、当然臓器が異なればその発現パターンは異なるはずです(というよりも、その発現パターンの差をみたいがために、マイクロアレイを用いた網羅的な発現解析をおこなっているのでした)。

サンプル間のおおまかな比較をするためには相関係数を用いるのが便利です。ここでは16サンプル間どうしの相関係数を求め、それをヒートマップ表示する方法についてみていきましょう。

まずECの画面右側にあるToolboxから、「QC: Array Comparisons」をクリックします。続いて、その中より「(3) Pearson’s Correlation (Signal)」を選択してください。

すると、下図のような相関係数のヒートマップが表示されます。

ウィンドウの大きさを変更して図を拡大すると以下のように表示されます。

サンプルが異なっていても同じ臓器間での相関係数は1に近く(赤色)、多臓器どうしの相関係数は低い(青色)傾向がひと目で分かります。特にTestesサンプルは他の臓器と比べて相関係数が相対的に低いことから、発現パターンが他の3臓器と大きく異なっていることが予想されます。

主成分分析(PCA)をおこなう

マイクロアレイの解析データを用いて主成分分析をおこなうことで、サンプルの中で異常な傾向を示すものを見つけ出すことができます。ここではECを用いた主成分分析の方法をみてみましょう。

まずECの画面右側にあるToolboxから、「QC: Array Comparisons」をクリックします。続いて、その中より「(8) PCA Graph – Signal」を選択してください。

すると、下図のようなグラフが表示されます。

今回のサンプルデータは4種類の臓器から、それぞれ4つずつのサンプル (n=4) を元にして解析をおこなっています。上図の主成分分析の結果を見ると、同一臓器の4サンプルは固まって表示されており、なおかつ各臓器サンプルは互いに離れてプロットされていることが分かります。このことより、解析には使えないような異常値をもったサンプル (Outlier) は見当たらず、すべてのサンプルを用いて解析に進んで良さそうだと判断できます。

まとめ

今回はECを用いて解析データのQCをおこなってみました。

QCは一見すると地味な操作なようにも思われますが、取得したデータに異常がないかどうかを予めきちんと確認しておくことが、後々のデータ解析作業を進める上で極めて重要となります。

次回からいよいよTACソフトウェアを用いた発現解析に入ります。

この記事に関する、ご意見・ご質問がございましたら、下記フォームからご連絡ください。

お名前 (必須)

メールアドレス (必須)

勤務先・所属先

題名

メッセージ本文

 確認ページはございません。内容をご確認の上チェックを入れてください

トレーニング