私たち人間を含む動物の行動は、一見自由に見えて、その根底には驚くほど合理的な原則が働いています。それは「エネルギー効率」を基準に最適な選択を導き出す、進化的に根差した行動原理です。餌を獲得するためにどれだけの労力を要するか、その労力が得られる栄養に見合うかどうか。そうした行動の費用対効果を測る“生存のコストパフォーマンス”が、進化の過程で磨き上げられてきたのです。
この考え方の基盤には、行動生態学における「最適採食理論(Optimal Foraging Theory)」があります。この理論は動物が限られた時間とエネルギーの中で、どのようにして餌を選び、採取するかを説明する枠組みです。1970年代にEric Charnovらによって提唱され、ある動物がある餌を選ぶ確率や採餌時間、移動戦略などが、どれほどエネルギー収支に基づいているかを定量的に示すことが可能となりました。たとえば、捕獲に高いコストがかかるが高栄養な獲物と、容易に獲得できるが低栄養の獲物のどちらを選ぶかは、状況に応じて選択されます。動物は計算機ではありませんが、進化の過程で選ばれてきた神経回路網は、こうした選択を最適化する方向へと導いています。

この効率志向の原則は餌の獲得行動にとどまらず、動物の学習過程にも反映されます。学習とは、ある状況に対して適応的な反応を形成する過程ですが、そのなかでも「強化学習(reinforcement learning)」と呼ばれる原理が広く認識されています。これは報酬をもたらす行動が繰り返され、罰や失敗につながる行動が回避されていくという基本的な構造を持ちます。動物は経験に基づき、同じ結果をもたらす複数の行動パターンの中から、より負担の少ない行動を選ぶようになります。これは心理学者エドワード・ソーンダイクによる「効果の法則(Law of Effect)」として古くから知られ、後にオペラント条件づけとして行動分析の基礎を築いたB.F.スキナーの研究にも引き継がれています。
興味深いことにこのような効率の追求は、行動の多様性と密接に関わっています。動物が新しい環境に直面した際、最初は手探りで多様な行動を試みます。これは「探索的行動(exploratory behavior)」と呼ばれ、未知の状況における適応戦略としてきわめて重要です。探索行動には当然ながらエネルギーコストが伴いますが、それでも多様な可能性を試すことで、新たな報酬源や安全な選択肢を見出すことができるのです。これは「行動的柔軟性(behavioral flexibility)」という形で生物の適応性を支える要素のひとつとされています。
こうした初期の探索フェーズを経て、動物は徐々に最も報酬効率の高い行動パターンへと収束していきます。この過程は行動の選択が外的要因(たとえば餌の有無や罰の有無)から内的要因(快・不快、効率感など)へと移行する現象を通して進みます。つまり、最初は外部からの結果により行動が導かれていたものが、やがて内部表象、すなわち「このやり方が楽でうまくいく」という内的基準に基づく行動選択にシフトしていくのです。これは「習慣化(habitual behavior)」とも関係し、脳科学的には前頭前野から線条体への神経活動の移行によって説明されています。
このような効率への収束と並行して、非効率的な行動は淘汰されていきます。ここで言う淘汰は必ずしも生存競争による死ではなく、神経活動や行動の選択肢としての“使用停止”を意味します。神経科学では「シナプス刈り込み(synaptic pruning)」という現象が知られていますが、これは発達過程において、使用頻度の低い神経結合が除去される現象です。逆に頻繁に使用される神経経路は強化され、情報の伝達効率が上がります。これはHebbの法則――「一緒に発火する神経細胞は結びつく(fire together, wire together)」という原則にも合致しており、行動の効率性が神経構造にまで刻み込まれていく過程と考えられます。

では、非効率な行動がなぜ残らないのか、という点に立ち返ってみましょう。それは単に「選ばれないから」に尽きます。選ばれないものは実行されず、実行されないものは強化されず、結果として忘却される。これは進化のスケールでも、個体の学習スケールでも同様に働く原理です。自然淘汰とは、生物集団における遺伝的多様性の淘汰ですが、学習における淘汰は行動の選択肢の中で生じます。James McClellandらが提唱する接続主義(connectionism)によれば、神経ネットワークにおける学習もまた、重みの調整と刈り込みによって実現されるため、実行されない、すなわちエラーとなるパターンはネットワークから排除されていきます。
ここで重要なのは効率とは必ずしも「最短」や「最速」ではなく、「報酬に対する負担が最も少ない」という点であることです。つまり、生物は最も“楽にうまくいく方法”を選ぶように設計されていると言えるでしょう。その過程で、無駄な努力や過度なリスクを避ける傾向が強まり、試行錯誤の中で非効率な選択肢は次第に消えていくのです。
結局のところ、学習とは“最適化の物語”であり、その背後にはエネルギー保存の法則に支えられた進化的合理性が存在します。人間の行動においても、選択の裏側には無意識的な効率の追求が常に働いており、非効率なルートは自然と消えていきます。そうした淘汰の過程こそが、生物が環境に適応し続けていける根拠なのです。



















