PJ38 Phase 10 計画 — 3モデル統合レビュー

Opus 4.6 GPT 5.5 Grok 4.20  | Phase 9 結果を踏まえた改善提案 | 2026-05-20

レビュワー構成

Opus 4.6 改善提案者

Phase 9 全結果 + コードベース + Vault ドキュメントを参照。16提案を優先度P0〜P5で整理。特に CatBoost 比較馬単戦略追加を具体的に設計。

トークン90,019
ツール使用22回
提案数16件
GPT 5.5 改善提案者

Phase 9 結果 + Vault内の既存分析レポート(oana-strategy-analysis-opus.md)を自主的に発掘・参照。パラメータ感度分析を独自に実施し定量的な推奨値を提示。

モデルgpt-5.5 (xhigh)
自主調査Vault + コード精査
提案数8件(定量付き)
Grok 4.20 ゼロベースレビュワー

過去の結果・数値を一切教えず、システム設計のみを提示。公平性担保のための独立レビュー。構造的欠陥の指摘に注力。

モデルgrok-4.20-non-reasoning
提供情報アーキテクチャのみ
提案数6領域・18サブ提案

3モデル合意事項

3モデルが独立に同じ結論に達した項目は信頼性が高い。

全モデル一致(3/3)

2モデル一致(2/3)

1. モデル改善提案

提案 提案者 期待インパクト 難易度 リスク 優先度
段階的 label_gain で LambdaRank 再設計 Grok Opus ★★★★★ 面×バリアント分裂(Phase 9 で確認済み) P2
CatBoost YetiRank 比較実験 Opus AUC +0.005〜0.015 学習時間2〜3倍 P2
ListMLE(PL直接最適化) Grok ★★★★(oana親和性高) 学習不安定 P3
Two-Stage Stacking(LR + WinCls メタラーナー) Opus AUC +0.003〜0.008 ネストCV必要・過学習リスク P3
条件付き特徴量の時間窓最適化 Opus Grok AUC +0.002〜0.005 P1
重馬場スペシャリスト特徴量 Opus Grok ROI +5〜10pp P2
Transformer / Set Transformer(中長期) Grok Opus AUC +0.01〜0.02 データ量不足リスク P5
WinCls axis_confidence フィルタ GPT ROI +5〜10pp CV予測出力追加が前提 P3

2. ベッティング戦略提案

提案 提案者 期待インパクト 難易度 備考
min_odds 30→15 に引き下げ GPT 利益3〜5倍増 / ROI 167〜177% 引数変更のみ ベット機会3倍増で統計確信度が P(ROI>100%)=99.9% に到達
min_ev = 3.0 GPT ROI +5〜13pp 引数変更のみ 低 EV 馬を除外。リスクなし
条件付き Kelly 分数最適化 Opus 利益額 +20〜40% オッズ帯別に Kelly 分数を変動(1/8〜1/2)
馬単(Exacta)戦略追加 Opus ROI +15〜30pp PL で P(1st,2nd) 計算可能。NL_O4 ETL が前提
ワイド戦略追加 Opus ROI +10〜20pp 控除率22.5%(馬連25%より有利)。ヘッジ用
VS 閾値の条件別(クラス別)動的設定 Opus ROI +5〜15pp G1: VS≥2.5 / OP: 2.0 / 1〜3勝: 1.5 / 新馬: 3.0
期待値ポートフォリオ最適化(二次計画法) Grok ★★★★ 共分散を考慮したベットサイズ配分
馬単「逆目」戦略 Opus 市場非効率性が umaren 以上 1番人気が2着に落ちるケースの過小評価を狙う
フィルタ多層化(エントロピー + レースクラス + 流動性) Grok ★★★★ VS だけでなく、確率分布のエントロピーでベット精度を上げる

3. リスク管理提案

ドローダウン制御(3モデル全合意・P0)
閾値アクション提案者
月次 -15%ベットサイズ 50% カットGrok
月次 -20%ベットサイズ 50% カットOpus
月次 -25%全停止Grok
月次 -30%一時停止(手動再開)Opus

推奨: -20% で半減、-30% で停止(Opus案)。Telegram 通知必須。

Kelly 基準の実装
モデル推奨
GPT1/4 Kelly 固定(bankroll 0.3%/点)
Opus条件付き Kelly(オッズ帯別 1/8〜1/2)
GrokFractional + Meta-Kelly(シャープレシオ連動)

Phase 1: GPT 案(1/4 固定)で開始 → Phase 2: Opus 案(条件付き)へ段階移行

追加リスク管理提案
提案提案者概要
Bayesian Performance AnalysisGrok結果を「スキル成分」と「ラック成分」に分解。運と実力の切り分け
モデル劣化検知 + 自動リトレインOpusECE / Brier Score 監視。閾値超過で自動リトレイン(最低30日間隔)
バンクロール月次リバランスOpus3戦略の残高ベースリバランス(Oracle bankroll_log テーブル)

4. データパイプライン提案

提案 提案者 期待インパクト 難易度
NL_KH 調教タイム取得・統合 Opus AUC +0.005〜0.010(最大未利用データ源)
馬体重トレンド特徴量 Opus ROI +3〜5pp
天候予報統合(気象庁API) Opus ROI +2〜5pp
pedigree_edges Gen2 修正(祖父データ接合) Opus AUC +0.002〜0.005
レースコンテキスト特徴量(能力指数分散・ペース予測) Grok ★★★★★ 中〜高
騎手・調教師コンテキスト適応力 Grok ★★★★

警告・落とし穴(Grok ゼロベース指摘)

Grok が独立レビューで指摘した構造的リスク

落とし穴深刻度対応方針
展開予想データリーク: JVLink の展開予想特徴量が事後データ(レース結果後に生成されたもの)を含んでいないか 最重大 TYB(前日予想)と SE(成績)の時系列を厳密に確認。Train/Test 境界で SE が Train に混入していないか検証
WF-CV の開催日単位漏れ: 同一開催日の異なるレースが Train/Val に分割されると情報漏洩 重要 現行の month 単位スプリットで同一開催日が跨る可能性を検証。日単位の厳密分割を検討
人気馬の Silent Bias: モデルが無意識に人気馬を過剰評価。オッズを使わなくても、枠順・馬体重・騎手実績が人気と相関する特徴量を経由して間接的にオッズ情報が漏入 重要 人気度をオフセット項として扱う GLM 的アプローチ、または残差学習を検討
Grok 独自視点: 「二値ラベル + LambdaRank は本質的に矛盾」

Grok は結果を知らない状態で、「二値ラベルで LambdaRank を回すのは本来の設計思想と矛盾する」と即座に指摘。 Phase 9 で Option B を検証した際の「面×バリアント分裂問題」とも整合する。 ただし Grok の「即時廃止」推奨は、Phase 9 で turf soft の赤字リスク(ROI 89%)が確認されている点を踏まえると時期尚早。 シャドーラン蓄積後の段階的移行が現実的

Phase 10 推奨ロードマップ

優先度 施策 主提案者 期待効果 時期
P0 ドローダウン制御(-20% 半減 / -30% 停止) 全モデル 破産確率 <0.1% 即時(実資金投入前)
P1 min_odds 30→15 引き下げ(シャドーランで検証) GPT 利益3〜5倍 シャドーラン並行
P1 1/4 Kelly ベットサイジング GPT bankroll 成長率最適化 シャドーラン並行
P1 特徴量の時間窓最適化(距離別・騎手30日窓追加) Opus Grok AUC +0.002〜0.005 シャドーラン並行
P1 VS 閾値の条件別化(クラス別動的設定) Opus ROI +5〜15pp シャドーラン並行
P2 CatBoost YetiRank 比較実験 Opus AUC +0.005〜0.015 シャドーラン100bet後
P2 ワイド戦略追加 Opus ROI +10〜20pp NL_O5 実 EV 稼働確認後
P2 重馬場スペシャリスト特徴量 Opus Grok ROI +5〜10pp 梅雨シーズン前
P2 馬体重トレンド特徴量 Opus ROI +3〜5pp シャドーラン並行
P3 条件付き Kelly(オッズ帯別 1/8〜1/2) Opus 利益額 +20〜40% 100bet 蓄積後
P3 展開予想データリーク検証 Grok 信頼性担保 CatBoost 実験と同時
P3 Two-Stage Stacking / ListMLE Opus Grok AUC +0.003〜0.008 CatBoost 評価後
P4 馬単(Exacta)戦略 Opus ROI +15〜30pp NL_O4 ETL 後
P4 NL_KH 調教タイム統合 Opus AUC +0.005〜0.010 jrvltsql スキーマ拡張後
P5 Transformer / Set Transformer Grok Opus AUC +0.01〜0.02 Phase 11 以降

Phase 10 の成功基準