🀄 Mahjong Vision — 設計ドキュメント INDEX

麻雀牌のリアルタイム認識 → 立/倒 姿勢判定 → アガリ判定 → 役判定の自動化を目指す Mahjong Vision プロジェクトの
設計ボトルネック分析・公開モデル調査・転移学習評価・前処理パイプライン文書集

📅 最終更新: 2026-05-14 📚 ドキュメント数: 5 🌐 公開: mahjong-scorekeeping-docs.pages.dev

📑 ドキュメント一覧

1

設計ボトルネックと回避策

動画 ML パイプラインで遭遇した 5 つの構造的ボトルネック (B1〜B5: 公開モデル精度・推論コスト・データ密度・領域分離・3D 姿勢) と、 各々の解決アプローチ・代替案 (採用/不採用) を網羅した中核ドキュメント。実際の Roboflow 検知画像を 5 枚埋め込み。

CORE ボトルネック分析 40+ 代替案比較
2

公開モデル素性調査レポート

現状参照している test-upsgd/mahjong-tiles-oc9zz を調査。 2023 年 8 月公開・訓練画像 29 枚のみの個人実験プロジェクトであり、商用採用実績なし。 ライセンス CC BY 4.0。データ規模 → 汎化性能の構造的限界が判明。

調査レポート 素性追跡
3

類似公開モデル広域調査

同型問題ドメイン (トランプ・チェス・将棋) の公開モデルを網羅調査。 Augmented Startups Playing Cards (10,100 枚) は麻雀の 350 倍規模。 Joseph Nelson Chess (Roboflow CEO) や Sona College Shogi を含む全 20+ モデルの比較。

調査ログ 20+ モデル比較
4

トランプ→麻雀 転移学習 実現可能性

トランプ検出モデルの重み・ノウハウを麻雀に転用する技術的評価。 「カードも牌も菱形に見える」幾何学的共通項で OBB 検出と透視変形ハンドリングが転移可能。 3 つのアプローチ (A: COCO 直接 / B: 2 段階 / C: 合成データ★推奨) を期待 mAP 付きで比較。

NEW 転移学習 合成データ生成
5

卓上領域マスキング前処理

麻雀卓 (緑フェルト) 以外のオブジェクト (スコアボード・ZOZOTOWN・選手顔・観客席) を HSV + 最大連結成分 + 凸包 + dilate で構造的に除外する前処理パイプライン。 実装スクリプト scripts/mask-table-region.py と Before/After デモ画像を含む。

NEW 実装あり 前処理パイプライン

🎯 プロジェクト目標

本プロジェクトは 麻雀の役判定・点数計算を自動化する補助システム。 最終確認は人間が行う「補助役」として動作し、誤検出に強い設計を採用。 将来的には捨て牌・副露の連続トラッキングによる牌譜記録 (天鳳形式エクスポート)まで拡張。

区分入力出力
📷 映像4K天井カメラ / M-League ダイジェストWeb ダッシュボード + 動画オーバーレイ
🎤 音声マイクアレイ (ツモ/ロン/ポン/チー)牌譜 DB (SQLite + 天鳳形式 export)
🎴 物理RFID 点棒トレイ点棒移動の物理連動

📊 現状ステータス (2026-05-14)

領域状態備考
役判定エンジン (mahjong 2.0.0)✅ 完了標準 30 役 36/36 PASS
CV→役判定 ブリッジ✅ 完了4 fixture 7/7 PASS
音声検出 (faster-whisper)✅ 完了ツモ/ロン/積も/栄和 パターン拡張
動画オーバーレイ (v5)✅ 完了4 オーバーレイ全部入り
M-League イベント抽出 (Stage 1)✅ 完了11分動画から 34 イベント検出
カメラキャリブ基盤✅ 完了斜め上設置・チェスボード方式
Roboflow 訓練データ準備✅ 完了499→201 枚フィルタ済
Roboflow Workspace 作成🔴 未着手本番ブランチ開始ポイント
M-League 専用 ML 訓練🔴 未着手MVP v1 (1 クラス) → v2 (34 クラス)
卓上マスキング前処理統合🟡 実装完了 / 統合待ちscripts/mask-table-region.py 動作確認済
天井カメラ実機🔴 未調達BOM 推奨 ¥34,780

🗺 推奨閲覧順

  1. 設計ボトルネック (Doc 1) — まず全体像とボトルネックの構造を把握
  2. 公開モデル素性 (Doc 2) — 現状モデルの限界が「個人実験 29 枚」だと知る
  3. 類似モデル広域調査 (Doc 3) — 他ドメインから学べる選択肢の幅を理解
  4. 転移学習 (Doc 4) — トランプモデル活用 (合成データ生成) の具体提案
  5. 卓マスキング (Doc 5) — 推論前の前処理で false positive 50-70% 削減
各ドキュメントは独立して読めるよう設計してあるが、推奨順に読むと「なぜ自前訓練が必要か」「どう効率化するか」「どんな前処理を併用するか」が連続して理解できる構成。

🔗 関連リンク