🐴 馬脳 Umanou

競馬AI予想システム — Phase9 シャドーラン中

2026-05-19 現在 / JVLink + Oracle 23ai + LightGBM
現在のステータス
📡 シャドーラン中 ✅ Telegram通知 稼働 ✅ launchd 土日09:00 自動発火 ⚠️ 実エッジ未検証(要200-300bet) ⏳ 馬連/三連単オッズ未取得
システム全体フロー
🗄️
JVLink
競走・払戻・馬データ
🏛️
Oracle 23ai
全データ格納 DB
🔧
特徴量生成
72列 V17
🤖
LambdaRank
芝/ダート 別モデル
🎯
Calibration
Isotonic 補正
📊
EV計算
予測確率 ÷ 市場確率
📲
Telegram
シグナル通知
なぜオッズを学習データに使わないか
❌ オッズを特徴量に入れた場合
  • モデルが「市場の模倣」を学習してしまう
  • pred_prob ≈ 1/オッズ になる
  • EV が常に ≈ 1.0 になりエッジを検出できない
  • 「自分が市場より賢いか」が測定不能
✅ 現在の設計(オッズ完全分離)
  • モデルは馬の能力・状態だけで予測
  • 予測と市場が「独立した判断者」として機能
  • EV = モデル vs 市場 の差分を純粋に測定可能
  • 過大評価・過小評価を正直に診断できる
EV計算の流れ(事後的にオッズを使う)
モデル予測確率
0.23
÷
市場暗示確率
1/8.2倍 = 0.12
=
EV比率
1.87 ✓
EV≥1.2 → 購入候補
馬券戦略(3種類)
単勝
EV戦略
1頭を選んで1着を当てる。
モデルの予測確率とオッズを比較してEVがプラスの馬のみ購入。
EV = pred_prob × オッズ ≥ 1.2 かつ 4〜15倍が対象 Kelly式でベット額を決定
馬連
Harville理論確率
1・2着を順不同で当てる。
現在はHarville式で理論確率のみ計算。オッズデータ取得後にEV計算予定。
P(A,B) = P(A)×P(B)/(1−P(A)) + P(B)×P(A)/(1−P(B)) → 各レース top-3組を通知
三連単
Harville理論確率
1・2・3着を順番通りに当てる。
上位6頭の120通りからtop-6を算出。EV計算は馬連同様に今後の予定。
P(A,B,C) = P(A) × P(B)/(1−P(A)) × P(C)/(1−P(A)−P(B)) → 各レース top-6通りを通知
キャリブレーション診断(2026-05-19 実施)
0.82
AUC(CV / 2023年)
ランキング精度は高い。1着馬を上位に持ってくる能力はある。
−0.006
実エッジ(OOF 2660bet)
実勝率と市場暗示確率の差。ノイズレベル。大量データでは優位性が消える。
237.5%
バックテストROI(53bet)
サンプル数が少なすぎる。統計的に弱い仮説。
105.7%
OOF月次平均ROI(Calibrated turf)
9/12ヶ月でROI>100%。大量データではほぼトントン。
⚠️ 現在の判断: バックテストの好成績(237.5% ROI)は 53betの幸運な的中 による可能性が高い。 OOF 2660betでは実エッジがノイズレベル。 シャドーランで 200〜300bet 積むまで有効性は「仮説」扱い。 Calibrated turf の EV>2.0帯に実エッジ +0.009 あり、この帯に注目。

📡 シャドーラン — 今何をしているか

モデル構築完了(V17 / 72特徴量)
芝・ダート別 LambdaRank + Isotonic Calibration。pkl保存済み。
Telegram通知セットアップ完了
@Keiba_bet_alert_bot に単勝 + 馬連 + 三連単シグナルを自動送信。
シャドーラン中(5/19〜)
毎週土日 09:00 JST に launchd が自動発火。シグナルを通知するが実際には馬券を買わない。結果を記録して精度を検証する。
Go/No-Go判断(100bet累積時点)
実勝率・実エッジ・月別ROIを再診断。有意なエッジが確認できたら本番移行を検討。
馬連/三連単 EV計算(keiba-vm O2/O6取得後)
現在はHarville理論確率のみ。オッズデータ取得後に市場との比較が可能になる。
Telegram 通知イメージ(毎週土日に届く)
@Keiba_bet_alert_bot に届くメッセージのイメージ
🐴 馬脳シグナル 2026-05-24 (TURF) EV≥1.20 / 4–15倍 | 12R 【単勝】 345678 #5 サンプル p=0.234 6.2x EV=1.45 K=200円 234567 #3 テスト馬 p=0.198 8.4x EV=1.31 K=100円 【馬連 Harville / top-1 per race】 345678 5-8 28.4% 234567 3-7 24.1% 【三連単 Harville / top-1 per race】 345678 5-8-3 14.2% 234567 3-7-1 11.8% ⚠️ 馬連/三連単はHarville理論確率のみ(EV未計算)
※ 毎週土日 09:00 JST 自動送信 / シャドー期間中は通知のみ・馬券購入なし
モデルの特徴量(72列 V17)

🏇
基本特徴量(Fundamental)

馬齢・体重・増減 / 枠番・馬番 / 騎手ID / 過去着順(直近3走)/ 平均着順 / コース適性 / 距離適性 / 芝/ダート区分 / 斤量 / 頭数

📈
追加特徴量 V13〜V17

V13: CYB(調教師) / KAB(馬主) 連対率
V14: CHA(追い切り) / KKA(騎手) / UKC(血統)
V15: JRDB ペース指数
V16: TYB(調教) 外厩・格上
V17: グラフ特徴(騎手×馬×コース深層)

🚫
絶対に使わない情報

単勝オッズ — EV計算専用
馬連オッズ — EV計算専用(未取得)
三連単オッズ — EV計算専用(未取得)
人気順 — オッズと同等の情報

※ 入れると市場の模倣になりエッジが消える
今後のロードマップ

📅
5/24〜25(今週末)

✅ シャドーラン初回発火確認
✅ Telegram通知が届くか確認
📊 シグナル数・EV分布を記録

📅
6月(100bet累積後)

🔍 実エッジの再診断
📈 月別ROI確認
⚖️ Go/No-Go 判断
🖥️ keiba-vm O2/O6オッズ再DL

🎯
本番移行条件

実エッジ > +0.01(200bet以上)
月別ROIが6割以上の月で 100%超
馬連/三連単EV計算が可能な状態
Kelly推奨額の検証完了