麻雀牌のリアルタイム認識 → 立/倒 姿勢判定 → アガリ判定 → 役判定の自動化を目指す Mahjong Vision プロジェクトの
設計ボトルネック分析・公開モデル調査・転移学習評価・前処理パイプライン文書集
動画 ML パイプラインで遭遇した 5 つの構造的ボトルネック (B1〜B5: 公開モデル精度・推論コスト・データ密度・領域分離・3D 姿勢) と、 各々の解決アプローチ・代替案 (採用/不採用) を網羅した中核ドキュメント。実際の Roboflow 検知画像を 5 枚埋め込み。
現状参照している test-upsgd/mahjong-tiles-oc9zz を調査。
2023 年 8 月公開・訓練画像 29 枚のみの個人実験プロジェクトであり、商用採用実績なし。
ライセンス CC BY 4.0。データ規模 → 汎化性能の構造的限界が判明。
同型問題ドメイン (トランプ・チェス・将棋) の公開モデルを網羅調査。 Augmented Startups Playing Cards (10,100 枚) は麻雀の 350 倍規模。 Joseph Nelson Chess (Roboflow CEO) や Sona College Shogi を含む全 20+ モデルの比較。
トランプ検出モデルの重み・ノウハウを麻雀に転用する技術的評価。 「カードも牌も菱形に見える」幾何学的共通項で OBB 検出と透視変形ハンドリングが転移可能。 3 つのアプローチ (A: COCO 直接 / B: 2 段階 / C: 合成データ★推奨) を期待 mAP 付きで比較。
麻雀卓 (緑フェルト) 以外のオブジェクト (スコアボード・ZOZOTOWN・選手顔・観客席) を
HSV + 最大連結成分 + 凸包 + dilate で構造的に除外する前処理パイプライン。
実装スクリプト scripts/mask-table-region.py と Before/After デモ画像を含む。
本プロジェクトは 麻雀の役判定・点数計算を自動化する補助システム。 最終確認は人間が行う「補助役」として動作し、誤検出に強い設計を採用。 将来的には捨て牌・副露の連続トラッキングによる牌譜記録 (天鳳形式エクスポート)まで拡張。
| 区分 | 入力 | 出力 |
|---|---|---|
| 📷 映像 | 4K天井カメラ / M-League ダイジェスト | Web ダッシュボード + 動画オーバーレイ |
| 🎤 音声 | マイクアレイ (ツモ/ロン/ポン/チー) | 牌譜 DB (SQLite + 天鳳形式 export) |
| 🎴 物理 | RFID 点棒トレイ | 点棒移動の物理連動 |
| 領域 | 状態 | 備考 |
|---|---|---|
| 役判定エンジン (mahjong 2.0.0) | ✅ 完了 | 標準 30 役 36/36 PASS |
| CV→役判定 ブリッジ | ✅ 完了 | 4 fixture 7/7 PASS |
| 音声検出 (faster-whisper) | ✅ 完了 | ツモ/ロン/積も/栄和 パターン拡張 |
| 動画オーバーレイ (v5) | ✅ 完了 | 4 オーバーレイ全部入り |
| M-League イベント抽出 (Stage 1) | ✅ 完了 | 11分動画から 34 イベント検出 |
| カメラキャリブ基盤 | ✅ 完了 | 斜め上設置・チェスボード方式 |
| Roboflow 訓練データ準備 | ✅ 完了 | 499→201 枚フィルタ済 |
| Roboflow Workspace 作成 | 🔴 未着手 | 本番ブランチ開始ポイント |
| M-League 専用 ML 訓練 | 🔴 未着手 | MVP v1 (1 クラス) → v2 (34 クラス) |
| 卓上マスキング前処理統合 | 🟡 実装完了 / 統合待ち | scripts/mask-table-region.py 動作確認済 |
| 天井カメラ実機 | 🔴 未調達 | BOM 推奨 ¥34,780 |
~/shimanto-projects/mahjong-scorekeeping (private)docs/scripts/docs/roboflow-setup-guide.mdai-brushup-plans/plans/01-mleague-yolo-finetune.md