新年あけましておめでとうございます。寅年がはじまりました。研究室の装備もメンバーも揃うのはこれからですが、三島の研究室が正式にスタートしてはじめての年始です。
サメの種類で言うと、「トラ」といえば、Tiger+Shark=イタチザメ Galeocerdo cuvier と考えるべきかもしれませんが、ここでは、日本語のまま トラ+サメ=トラザメ Scyliorhinus torazame について少し書いておきます。
トラザメ Scyliorhinus torazame は、日本では学術研究において最も頻繁に扱われてきたサメの一種です。近海で捕獲しやすいこと、そして体が小さく卵生であることがおもな要因だと思われます。私の研究室でも、神戸理研での最初の時期に、ゲノム情報を読み取る対象として真っ先に選びました。いわゆるショートリード(イルミナ社のシークエンサで取得する100塩基や150塩基などの短いDNA配列のこと)で読み取っていた2013年あたりのことです。並行して、細胞あたりのDNA量を測定しましたが、その結果、一倍体ゲノムあたり約6.7ギガベース(Gb)、すなわち、ヒトの約2倍と、非常に大きなゲノムを持つ(=DNAの総塩基数が多い)ことが分かりました。これまで手掛けたイヌザメ(4.7Gb)やジンベエザメ(3.8Gb)と比べても長大です。その時点では、ゲノム情報としての完成度に大きな不満を感じながらも、分子進化学的な解析を行ったうえで、当時の成果はいったん出版することにしました(Hara et al., Nat. Ecol. Evol. 2018)。
時は流れ、昨年(2021年)のこと。不満だったゲノム配列の抜本的な改善のため、こういった際にうってつけの研究支援制度「先進ゲノム支援」に、最近主流のロングリード(Oxford Nanopore Technologies社やPacific Biosciences社のシークエンサで取得する、往々にして1万塩基を超えるDNA配列のこと)の大量取得を申請した結果、4月に晴れて採択となりました。具体的には、Pacific Biosciences社のSequel IIシークエンサでゲノムサイズの30倍のデータ量(HiFiリード)、つまり約200GbのDNA配列の読取りを計画しました。そして、この計画に従って取得された生データが、12月の最後の勤務日についに手元に届きました。さっそく配列の繋ぎあげ(アセンブリ)のための計算を行ったところ、きょう元旦までに有望な結果を得ることができました。こういった計算は、パラメータ設定を少し変えながら何度も試して、改善を試みることになります。まだ試行錯誤を要するとはいえ、取り組んできた他の軟骨魚類(サメやエイ)の種での仕上がりと比べると、これまで扱った中でゲノムサイズは最大であるにもかかわらず、かなりよい感触です。アセンブリが済めば、次に、DNAの核内3D構造をもとに染色体規模へ配列を組み上げる、スキャフォルディングというステップへ進めます。長鎖DNAの抽出やアセンブリ、そしてスキャフォルディングについての詳しい手法については、ご連絡いただければお答えします。また、トラザメ以外に軟骨魚類のどういった種に取り組んでいるかは、Squalomixコンソーシアムのページ(英語)をご覧ください。
というわけで、寅年のはじまりは、狙ったかのように、トラザメのゲノム情報の完成への大きな前進から、となりました。
ちなみに、上に記した、現時点での「かなりよい感触」について、ゲノム配列の評価ツールgVolante(ジーボランチ)による評価結果を、Sequel IIシークエンサによるHiFiリードのアセンブリの一例として、下に貼り付けておきます。クリックすると拡大表示されます。Core遺伝子のカバー率はイントロン長が大きめであるために過小評価になっていると推測します。また、配列中に「N」は一つも含まれません。それでいて、最長配列が17Mbを超え、また、N50長は3Mbを超えています。種によってはこの段階でのN50長が10Mbを超えたこともありましたが、ゲノムサイズが大きいトラザメで3Mbというのは悪い数字ではないとみています。
Comments