分子データと形態学的データ編集
クラドグラムの作成に使用される特性は、大まかにどちらかの形態学的に分類できます。 (synapsid頭蓋骨、温血、脊索、単細胞など)または分子(DNA、RNA、またはその他の遺伝情報)。 DNAシーケンシングが登場する前は、分岐解析では主に形態学的データが使用されていました。行動データ(動物用)も使用できます。
DNAシーケンスが安価で簡単になるにつれて、分子系統学は系統発生仮説を推測するためのますます一般的な方法になりました。節約基準の使用は、分子データから系統発生を推測するためのいくつかの方法の1つにすぎません。シーケンス進化の明示的なモデルを組み込んだ最尤法などのアプローチは、シーケンスデータを評価するための非ヘニジアンな方法です。系統発生を再構築する別の強力な方法は、ゲノムレトロトランスポゾンマーカーの使用です。これは、配列データを悩ます復帰の問題を起こしにくいと考えられています。また、ゲノムへの統合は完全にランダムであるとかつて考えられていたため、一般的にホモプラシーの発生率は低いと考えられています。ただし、少なくとも時々そうではないようです。
分岐学における共有派生形質。この図は、「A」と「C」を祖先の状態として示し、「B」、「D」と「E」を終末分類群に存在する状態として示しています。実際には、祖先の状態は事前にわかっていませんが(このヒューリスティックな例に示されているように)、端末で観察された共有状態のパターンから推測する必要があることに注意してください。この例の各端末には固有の状態があるため、実際には、祖先の状態について決定的なものを推測することはできません(観測されていない状態「A」と「C」の存在が非合理的な推測であるという事実を除いて! )
共有原始形質と共有派生形質編集
研究者は、どの文字状態が「祖先」(共有原始形質)であり、どの文字状態が派生(共有原始形質)であるかを決定する必要があります。文字の状態は、グループ化の証拠を提供します。この決定は通常、1つ以上の外群の文字状態と比較することによって行われます。外群とグループ内の一部のメンバーの間で共有される状態は、共有原始形質です。グループ内のサブセットにのみ存在する状態は、共有派生形質です。単一の端末に固有の文字状態(固有派生形質)は、グループ化の証拠を提供しないことに注意してください。外群の選択は、分岐解析の重要なステップです。外群が異なれば、トポロジが大きく異なるツリーが生成される可能性があるためです。
HomoplasiesEdit
ホモプラシーは、2人または複数の人が共有するキャラクターの状態です。共通の祖先以外の何らかの原因によるより多くの分類群。ホモプラシーの2つの主なタイプは、収斂(少なくとも2つの異なる系統における「同じ」キャラクターの進化)と復帰(祖先のキャラクター状態への復帰)です。北極圏の哺乳類のさまざまな系統の白い毛皮など、明らかにホモプラスチックである文字は、関係の理解に何も寄与しないため、系統発生分析に文字として含めるべきではありません。ただし、ホモプラシーは、文字自体の検査からは明らかではないことが多く(たとえば、DNAシーケンスの場合など)、最も節約的なクラドグラムでの不一致(非節約的な分布)によって検出されます。ホモプラスチックであるキャラクターには、まだ系統発生信号が含まれている可能性があることに注意してください。
収斂進化によるホモプラシーのよく知られた例は、キャラクター「翼の存在」です。鳥、コウモリ、昆虫の翅は同じ機能を果たしますが、それらの解剖学的構造からわかるように、それぞれが独立して進化しました。鳥、コウモリ、および翼のある昆虫が「翼の存在」という文字でスコアリングされた場合、ホモプラシーがデータセットに導入され、分析が混乱する可能性があり、関係の誤った仮説が生じる可能性があります。もちろん、そもそもホモプラシーが認識できる唯一の理由は、そのホモプラスチック分布を明らかにする関係のパターンを暗示する他の文字があるためです。
クラドグラムではないもの編集
クラドグラムは、共有派生形質のみに基づいて分類群をグループ化する分析の図式的な結果です。データを多少異なる方法で処理し、クラドグラムのように見えるがクラドグラムではない系統樹を生成する系統発生アルゴリズムは他にもたくさんあります。たとえば、UPGMAや近隣結合などのフェネティックアルゴリズムは、全体的な類似性によってグループ化し、共有派生形質とシンプレシオモルフィの両方をグループ化の証拠として扱います。結果の図は、クラドグラムではなくフェノグラムです。同様に、モデルベースの方法の結果(最大分岐順序と「分岐長」の両方を考慮に入れる可能性またはベイズアプローチ)は、グループ化の賛成または反対の証拠として、共有派生形質と固有派生形質の両方をカウントします。これらの種類の分析から得られた図も、クラドグラムではありません。
クラドグラムselectionEdit
「最良の」クラドグラムを識別するために利用できるいくつかのアルゴリズムがあります。ほとんどのアルゴリズムは、メトリックを使用して、候補クラドグラムがデータとどの程度一致しているかを測定します。ほとんどのクラドグラムアルゴリズムは、最適化と最小化の数学的手法を使用します。
一般に、クラドグラム生成アルゴリズムはコンピュータプログラムとして実装する必要がありますが、一部のアルゴリズムは、データセットが控えめな場合に手動で実行できます(たとえば、いくつかの種といくつかの特性)。
一部のアルゴリズムは、特性データが分子(DNA、RNA)である場合にのみ役立ちます。他のアルゴリズムは、特性データが形態学的である場合にのみ役立ちます。特性データに分子データと形態学的データの両方が含まれる場合は、他のアルゴリズムを使用できます。
クラドグラムまたは他のタイプの系統樹のアルゴリズムには、最小二乗、隣接結合、節約、最大可能性、ベイズ推定が含まれます。
生物学者は、特定の種類のクラドグラム生成アルゴリズムの節約という用語を使用することもあれば、すべての系統発生アルゴリズムの総称として使用することもあります。
最適化タスク(クラドグラムの作成など)を実行するアルゴリズムは、入力データ(種とその特性のリスト)が表示される順序に注意してください。さまざまな順序でデータを入力すると、同じアルゴリズムで異なる「最良の」クラドグラムが生成される可能性があります。このような状況では、ユーザーはさまざまな順序でデータを入力し、結果を比較する必要があります。
単一のデータセットで異なるアルゴリズムを使用すると、アルゴリズムごとに固有の定義があるため、異なる「最良の」クラドグラムが生成される場合があります。
可能なクラドグラムの数は天文学的な数であるため、アルゴリズムは、ソリューションが全体的に最良のソリューションであることを保証できません。プログラムが目的のグローバル最小値ではなくローカル最小値に落ち着く場合、最適ではないクラドグラムが選択されます。この問題を解決するために、多くのクラドグラムアルゴリズムは、シミュレーテッドアニーリングアプローチを使用して、選択したクラドグラムが最適なものである可能性を高めています。
基底位置は、根の根元(または根)の方向です。系統樹またはクラドグラム。基底クレードは、より大きなクレード内で分岐する(特定の分類学的ランクの)最も早いクレードです。