

| この記事でわかること |
|
| この記事の対象者 |
|
| 効率化できる業務 |
|
「どのAIを使っても、結局はプロンプト次第でしょ?」
もしあなたがそう思っているなら、少し注意が必要かもしれません。実は、AIモデルそのものが持つ「性格」の違いが、投資成績に決定的な差をもたらすことが明らかになったからです。
2026年3月、AI研究の権威である東京大学・松尾豊教授率いる松尾研究所が、驚くべき実証結果を発表しました。最新のLLM(大規模言語モデル)に株式投資の戦略を考えさせたところ、モデルによって「コツコツ型」から「一発逆転型」まで、明確な挙動の差が現れたのです。
この記事を読めば、以下の3点が明確になります。
- なぜClaudeが投資シミュレーションで最強だったのか
- GeminiとGPTが抱える、意外な「弱点」と「強み」
- 自社のDX推進や資産運用で、どのモデルを「相棒」にすべきか
AIを単なる道具としてではなく、その「個性」まで見抜いて使いこなす。そんな一歩進んだ戦略を解説します。
松尾研究所の実験:LLMに投資戦略を『改善』させた結果

松尾研究所が行ったのは、AIに「過去の投資データ」を見せ、その結果を分析させて「もっと儲かるコード(Python)」に書き換えさせる、という反復テストです。
実験の概要:TOPIX 500データを用いた反復学習
対象となったのは、2014年から2022年までのTOPIX 500(金融セクター除く)の日次データです。AIは過去の運用成績をフィードバックとして受け取り、「どうすればリスクを抑え、利益を最大化できるか」を何度も試行錯誤しました。
比較された8つのモデル(GPT-5, Gemini 3, Claude 4.5)
使用されたのは、2026年時点で最高峰とされる以下の3陣営・8モデルです。
- GPT系: GPT-5 nano / mini / 5
- Gemini系: Gemini 3 Flash / Pro (Preview版)
- Claude系: Claude 4.5 Haiku / Sonnet / Opus
「フィードバック内容」よりも「モデルの性格」が重要?
驚くべきことに、AIに与える情報(グラフを見せる、詳細なリスク指標を渡すなど)を工夫しても、最終的な利益の改善幅にはそれほど大きな影響はありませんでした。それよりも、「どのモデルを使ったか」という選択そのものが、パフォーマンスの8割を決めていたのです。
【徹底比較】主要3モデルの投資における『性格』の違い
実験の結果、3つのAI陣営には、まるで見慣れた同僚のような「性格の違い」がはっきりと現れました。
Claude 4.5:手堅く改善を積み上げる「秀才型」
今回の「投資王」に輝いたのは、Claude系、特に Claude Sonnet 4.5 でした。平均年率 14.12% という圧倒的な改善幅を記録しています。
Claudeの特徴は、既存の戦略をリスペクトしつつ、おかしな部分をピンポイントで修正する「堅実さ」にあります。「元々のロジックを壊さず、少しずつ精度を高めていく」というアプローチが、投資における安定した利益成長に直結しました。着実に成果を出したい企業の経営企画や、リスクを嫌う人事部などの業務に向いています。
Gemini 3:既存の枠を壊し新境地を拓く「冒険型」
GoogleのGeminiは、平均7%の改善を見せたものの、結果の「ムラ」が激しいのが特徴です。Geminiは、初期の戦略から大きく逸脱し、「全く新しい投資手法」を勝手に編み出そうとする傾向がありました。これが当たれば大きいのですが、外れると手痛い失敗を招きます。新規事業開発や、既存の枠組みを根本から変えたいDX推進部にとって、Geminiは最高の発想支援ツールになるでしょう。
GPT-5:安定を重視し変化を嫌う「保守型」
意外だったのが、OpenAIのGPT-5です。改善幅は-3%〜4%と、時としてマイナスになることさえありました。GPT-5は非常に「保守的」で、コードを修正するよう命じても「今のままで十分良いですよ」と言わんばかりに、ほとんど変更を加えない挙動を示しました。すでに完成されたシステムの保守や、絶対にミスが許されないガバナンス管理などには向いていますが、攻めの姿勢が必要なシーンでは物足りなさを感じるかもしれません。
AI活用における成功と失敗の分かれ道
なぜ、これほどまでに差が出たのでしょうか。研究チームは、AIに与える情報の「形式」が、モデルの「思考の質」を変えた点に着目しています。
なぜグラフを見せるとAIは賢くなるのか
実験では、テキストデータだけでなく「時系列グラフ」を画像として見せた際、AIの行動に変化が現れました。グラフを見たAIは、「市場が荒れている時はこの戦略、安定している時はあの戦略」と、状況に応じてロジックを動的に切り替える実装を行うようになったのです。これは、AIが「文脈(コンテキスト)」をより深く理解し始めた証拠と言えます。
モデル選択ミスが招く「機会損失」の具体例
例えば、着実な業務改善を求めてGeminiを採用すると、勝手にルールを変えられて現場が混乱するリスクがあります。逆に、大胆なイノベーションを期待してGPT-5を導入しても、現状維持の提案しか出てこず、高額な利用料だけが消えていくかもしれません。今回の研究データは、「目的」と「モデルの性格」を合致させることが、AI時代のDX戦略における最優先事項であることを示唆しています。
AI投資に関するよくある質問
Q1: AIに任せきりで本当に利益が出るのか? 結論から言えば、「AIに戦略を考えさせ、人間が最終判断する」というハイブリッド形式が最強です。今回の実験でも、AIはあくまで「戦略の改善案」をコードで提示する役割を担いました。全自動で放置するのではなく、AIの「性格」を理解した上で、その提案を吟味する目が必要です。
Q2: どのLLMが最も『ハルシネーション(嘘)』が少なかったか? 今回の実験では、Claudeが最も「既存コードとの整合性」を保っており、動作しないコードを生成するようなミスが少なかったと報告されています。信頼性が求められる金融実務において、Claudeが支持される大きな要因と言えるでしょう。
Q3: 投資以外(経営判断など)にもこの傾向は当てはまるか? 十分に当てはまると考えられます。既存事業の効率化ならClaude、新サービス・事業の創出ならGemini、コンプライアンス・安定運用ならGPTといった具合に、部署のミッションに合わせてAIを使い分けるのが、2026年以降のスタンダードになるはずです。
まとめ:次世代のDX・投資戦略に不可欠な「AIの目利き力」
東大・松尾研究所の研究が教えてくれたのは、AIは単なる「計算機」ではなく、それぞれに異なる「思考の癖」があるという事実です。
- Claudeは「堅実な改善」に強く、投資パフォーマンスもNO.1。
- Geminiは「大胆な探索」を得意とし、イノベーションの種を蒔く。
- GPTは「保守的な安定」を保ち、現状維持の質を高める。
もしあなたがDX推進や経営企画の担当者なら、まずは「この業務にふさわしい性格のAIは誰か?」という視点で、ツールを選び直してみてください。
次の一手として、まずは社内の小さなプロジェクトで、ClaudeとGeminiに同じ課題を与え、その「回答の癖」を比較することから始めてみてはいかがでしょうか?AIの性格を知ることは、未来の利益を知ることに他なりません。
引用
ITmediaAI+「株式投資にAIを使うと? Claudeは「コツコツ」、Geminiは「大胆」──見えた“性格の違い”」








