ゲノム解析ソフトウェア技術情報サイト

インシリコバイオロジー株式会社 公式技術情報サイト

Welcome, Guest
Username: Password: Secret Key Remember me
Questions from Users (IMC)
  • Page:
  • 1

TOPIC:

IMC: 大量のコンティグについての相同性検索方法 14 years 7 months ago #69

  • akr-sp-1212728882
  • akr-sp-1212728882's Avatar Topic Author
  • Online
  • Posts: 395
現在、in silico MolecularCloning Genomics Editionを使用しておりますが、相同性検索の方法について、お聞きしたいことがあります。

ある微生物のゲノムのドラフト解析結果の中に目的の遺伝子があるかどうかを以下のように検索しています。
約2000個のContig配列を読み込み、相同性検索(HMのアイコン)を行いました。このとき、近縁種の遺伝子の塩基配列をコピー&ペーストして検索を行うと、結果として、すべてのContigについて、相同性がない場合は0、相同性がある場合は1として表示されます。そして、1と表示されたContigを順番にクリックしていき、高い相同性を示すかどうかを確認しています。これでは、非常に手間がかかってしまいます。
そこで、検索結果の表示方法として、相同性が高い(E-valueが小さい)順番に表示させる方法はないのでしょうか?あるいは、E-valueが~以下の値の結果だけを表示させることは可能でしょうか?

「2010/09/24 T大学Kさんからの質問」代理投稿しました。-Forum Administrator-

Please Log in to join the conversation.

Last edit: by akr-sp-1212728882.

いくつか方法があります 14 years 7 months ago #70

  • akr-sp-1212728882
  • akr-sp-1212728882's Avatar Topic Author
  • Online
  • Posts: 395
2000ものコンティグに対して、HM機能による相同性検索をコピーアンドペーストで
作業されるは大変だと存じます。

いくつかの方法がありますが、まず、
1.Multiple FastA形式の2000個のコンティグを全部IMCに読み込みます。
2.MenuのEdit⇒Select Allを選択します。すると2000個全部が選択状態となります。
3.MenuのFile⇒Save as T-joinで2000個のコンティグを間に指定個数のN塩基を挿入して結合し、1つのファイルとして保存します。
4.このファイルに対して、バッチ相同性検索を行います。
  A.近縁種の注釈付き塩基配列(GenBank/EMBLフォーマット)をReference Feature Mapに読み込みます。File⇒Read Ref DNA
  B.ORF同定(Menu のGenome Analysis⇒ORF Extraction)およびアミノ酸翻訳(MenuのGenome Analysis⇒Translation)を実行します。
  C.バッチホモロジー検索を実行します。このとき、データベースReference Feature Mapに読み込んである近縁種のゲノムに指定します。
  D.検索には1日程度かかるかもしれません。
  E.終了すると、結果が各ORFに貼りつきます。
  F.BLボタンをクリックすると、E-Valueの段階別に各ORFがカラー表示されます。
5.このファイルに対して、アミノ酸配列マッピングを行います。
  A.近縁種のアミノ酸配列を用意します。
  B.3.で結合したファイルに対してアミノ酸配列マッピングを行います。
  C.相同性のある部分がフィーチャーとして登録されます。
6.4を核酸配列で行うこともできます。

何度かやりとりをさせていただき、最適の方法をお伝えしたいと存じます。

IMC Developer

Please Log in to join the conversation.

  • Page:
  • 1
Time to create page: 0.031 seconds