4 2種類の糖鎖データより特異的な糖鎖部分構造を抽出!Glycan Kernel Tool

質量分析(MS)やMS/MS解析を通じてサンプルから得た多量の糖鎖構造を視覚的判断のみによって構造比較やプロファイルすることは困難です。
例えば、コントロール及びターゲットサンプルから得たデータの中から、特徴的な部分構造を抽出する作業には研究者の経験や技術、時間が多分に必要されます。
しかし、本研究室で開発されたGlycan Kernel Toolを利用すれば2種類の糖鎖データを比較分類して、特異的な糖鎖部分構造を抽出することができます。
例えば、質量分析(MS)やMS/MS解析を通じてコントロールサンプル及びターゲットサンプルから得た糖鎖構造群の中からどちらかのサンプルにのみ特異的に存在する糖鎖部分構造を予測することができるのです。

それでは実際にGlycan Kernel Toolを使ってみましょう!

まずはGlycan Kernel Toolの入力画面です。図1で示すように、Target dataとControl dataにKCF形式になっている二つの糖鎖構造群を入力します。

 

Kernel_entry

図1: Glycan Kernel Tool の入力画面 Data set Name: ユーザは任意のデータ名を入力する ことができます。RINGS へユーザ登録している場合には、ユーザはこのデータ名から入力及び 結果情報を参照することができます。Glycan Data: ターゲット及びコントロールデータとして、 KCF 形式で記述された糖鎖構造情報を直接書き込むことができます。または、テキストファイル を使用することも可能です。subtree size: 糖鎖構造を部分構造へと分解する際のサイズ (単糖数) を指定することができます。部分構造のサイズには 1 から 9 までを指定できます。また、結果はここで指定されたサイズに基づいて出力されます。

必要な情報を入力した後、runボタンを押すと、図2のような画面が表示されます。これは実行が始まったと示す画面で、Calculation ID番号が表示されます。Kernel Toolの計算の入力データが多いと数分〜4時間までかかる場合があるので、ブラウザーを閉じてもCalculation IDさえあれば結果を後で確認することができるのです。

Kernel_request

図2: Calculation ID の付与:入力画面の run ボタンをクリックした後、この画面が表示され Calculation ID が表示されます。入力した糖鎖構造数が 200 個を超える場合、計算に 10 分以上必 要となります。そのため、この ID を使用して計算結果を別途表示させます。図3がそのCalculation IDを入力する画面です。

Kernel_Result_Entry

図3: Calculation ID の入力画面:先ほど得た Calculation ID を入力します。もし、ユーザが異 なる Calculation ID を持っている場合、この画面からその ID を入力することもできます。

 

 

Kernel_processing

図4: 計算処理状況の確認画面:この画面では、ユーザは計算処理の状況を確認することができます。status が ”processing” であれば、計算がまだ終えていないことを示します (上図)。また、計算処理を終えていれば、status は ”calculation has been finished successfully” となり、結果画面 へのリンクが表示されます (下図)。

Kernel_Result

図5: 結果画面:画面上部には、Calculation ID、Data set name、糖鎖部分構造のサイズが表 示されます。その下に、本ツールの計算結果がスコアの高い順に表示されます。結果には、順位、スコア、layer 及び糖鎖部分構造が出力されます。スコアを比較することで、その構造が結果群の中でどの程度「特徴的糖鎖部分構造」であるか、という目安として使用できます。計算上、入力 データ中の糖鎖構造が部分構造に分解されるとき、還元末端を「1」とした時の還元末端からの深さ (layer) がその部分構造情報中に付与されます。

図4は計算途中(上)と計算が完了した時(下)の画面を示します。完了した場合は、結果画面へのリンクが表示されます。そして図5がその結果画面の例です。この結果から何がわかるかというと、入力したTarget dataに入っている糖鎖構造においてControl dataに入っている糖鎖構造に比べて、特徴的に現れる糖鎖の部分構造の一覧です。つまり、Control dataでは見られない糖鎖の部分構造がTarget dataには顕著に存在しているので、この結果に現れる糖鎖構造に関わる遺伝子や認識するたんぱく質がTarget dataにおいて重要な役割を果たすのかもしれない、ということです!