🀄 Mahjong Vision — 設計ドキュメント INDEX

麻雀牌のリアルタイム認識 → 立/倒 姿勢判定 → アガリ判定 → 役判定の自動化を目指す Mahjong Vision プロジェクトの
設計分析・モデル評価・転移学習・前処理・クラウドファンディング・運用までを網羅した文書集

📅 最終更新: 2026-05-14 📚 ドキュメント数: 19 HTML 🌐 公開: mahjong-scorekeeping-docs.pages.dev ✅ OSS スタック移行決定 (¥108K/年 節約)

📊 数字で見る進捗 (3 サイクル後)

17
公開 HTML ドキュメント
72
単体テスト PASS (新規 20)
-27.8%
マスク前処理で検出 FP 削減 (実測)
500
合成データ枚数 (品質判定 合格)
¥189M
クラファン想定支援額 (700 セット)
¥10M
First Goal 目標調達額
420
損益分岐セット数
2,022
プロダクション化スクリプト 計行数
⭐ グループ 0: 重要意思決定 (2026-05-14 追加)
0-A

緑卓判定実測 + Roboflow 契約判断

M-League 全 499 フレームに緑卓検出ロジックを適用。filter との一致率 87.4% (Cohen's Kappa 0.738) を根拠に、Roboflow Starter ($60/月) は不要と判断。ダウングレード手順 + 返金申請テンプレ付。

NEW判断¥108K/年 節約
0-B

改訂モデルスタック (OSS フルスタック)

YOLOX-Nano (Apache 2.0) + mahjong_huge (CC BY 4.0) + FluffyStuff tiles (CC BY 4.0) + ONNX Runtime Web (MIT) の商用クリーン OSS フルスタック。YOLOv8 (AGPL-3.0) の商用懸念排除、Roboflow Hosted Inference 不要。

NEW技術選定Apache+CC BY+MIT
🔍 グループ A: 設計分析 (なぜこれが必要か)
A1

設計ボトルネックと回避策

5 つの構造的ボトルネック (B1〜B5: 公開モデル精度・推論コスト・データ密度・領域分離・3D 姿勢) と 40+ 代替案の採否一覧。実 Roboflow 検出画像 5 枚埋め込み。

COREボトルネック分析
A2

公開モデル素性調査

test-upsgd/mahjong-tiles-oc9zz の素性調査。訓練 29 枚・個人実験・CC BY 4.0、商用採用実績なし。データ規模 → 汎化性能の構造的限界。

調査レポート
A3

類似公開モデル広域調査

同型ドメイン (トランプ・チェス・将棋) の 20+ モデル網羅。Augmented Startups Playing Cards (10,100 枚) は麻雀の 350 倍規模。

調査ログ
A4

トランプ→麻雀 転移学習

「カードも牌も菱形に見える」幾何学的共通項で OBB 検出が転移可能。3 アプローチ (A: COCO 直接 / B: 2 段階 / C: 合成データ★推奨)。

CORE転移学習
🔧 グループ B: 前処理・データ生成 (技術実装)
B1

卓上領域マスキング前処理

緑フェルト以外を HSV + 最大連結成分 + 凸包 + dilate で除外する前処理。実装 scripts/mask-table-region.py + Before/After デモ。

実装あり前処理
B2

前処理統合ガイド

5 検出スクリプト (detect-agari-visual / analyze-still-frame / render-3d-overlay-cf / evaluate-agari-transition / voice-cli) への --use-table-mask 統合方法。

実装あり
B3

合成データ生成ガイド

アノテーション工数 0 で 5,000 枚を生成する合成データパイプライン。Augmented Startups Playing Cards 手法を麻雀に応用。

実装あり
B4

合成データ 品質検証レポート

500 枚生成 (2分6秒) のクラス均等性・bbox サイズ・はみ出し率を実測。品質判定 合格。サンプル画像 4 枚 + 6 統計図。

NEW実測レポート
📈 グループ C: モデル評価 (実測 + テンプレート)
C1

E2E 評価レポート v1 (実測)

マスク前後の検出件数 97→70 (-27.8%)、batch 成功率 84.6%、合成データ品質、実測・推定・目標を pill で峻別した 9 セクション。

NEW実測 + 図 4 枚
C2

モデル評価テンプレート

将来訓練するモデルの評価レポート用テンプレート (TODO マーカー入り)。mAP・Precision・Recall・推論レイテンシ・退役判定基準。

テンプレート
💰 グループ D: クラウドファンディング (Makuake 想定)
D1

CF ランディングページ (公開版)

Makuake 想定の最終 LP (1,118 行・12 セクション・CSS アニメ 9 種)。Hero・ストーリー・4 リワード・FAQ・リスク開示。

CFNEW
D2

CF 公開チェックリスト

D-30 / D-14 / D-Day / 終了後の 4 フェーズ × 95+ 項目。BLOCKER 含む 7 GO/NO-GO チェック付き。JS で進捗集計バー表示。

CF
D3

CF デモ (PoC 旧版)

Cycle 2 で作成した初版 CF デモ。Before/After 画像 + 製品ピラー 3 つ。最新は D1。

CF
D4

経営サマリ (投資判断者向け)

市場規模・競合・差別化・財務予測 (¥189M 想定 / BEP 420 セット / 5 年 LTV) + 12 ヶ月マイルストーン + リスク 5 つ。

CF
D5

プロトタイプ動画ガイド

VOICEVOX (停止時は pyttsx3 fallback) + ffmpeg で 27 秒短尺デモ動画を生成。フル尺 2:30 量産見積も同梱 (¥281,000 / 31.5h)。

CFNEW実装あり
🚀 グループ E: 運用・デプロイ (実用化)
E1

本番デプロイガイド

Cloudflare Workers AI / Jetson Orin Nano / RTX4090 別の本番デプロイ手順。推論レイテンシ・コスト見積。

NEW運用
E2

監視 + スケーリング

Prometheus + Grafana 監視構成、SEV1/2/3 アラート閾値、1→10→100 ユーザー スケーリング戦略、障害対応 Runbook。

NEW運用

🎯 プロジェクト目標

本プロジェクトは 麻雀の役判定・点数計算を自動化する補助システム。 最終確認は人間が行う「補助役」として動作し、誤検出に強い設計を採用。 将来的には捨て牌・副露の連続トラッキングによる牌譜記録 (天鳳形式エクスポート)まで拡張。

区分入力出力
📷 映像4K天井カメラ / M-League ダイジェストWeb ダッシュボード + 動画オーバーレイ
🎤 音声マイクアレイ (ツモ/ロン/ポン/チー)牌譜 DB (SQLite + 天鳳形式 export)
🎴 物理RFID 点棒トレイ点棒移動の物理連動

📊 現状ステータス (2026-05-14)

領域状態備考
役判定エンジン (mahjong 2.0.0)✅ 完了標準 30 役 36/36 PASS
CV→役判定 ブリッジ✅ 完了4 fixture 7/7 PASS
音声検出 (faster-whisper)✅ 完了ツモ/ロン/積も/栄和 パターン拡張
動画オーバーレイ (v5)✅ 完了4 オーバーレイ全部入り
カメラキャリブ基盤✅ 完了斜め上設置・チェスボード方式
Roboflow 訓練データ準備✅ 完了499→201 枚フィルタ済
卓上マスキング前処理✅ 完了5 検出スクリプト統合済 + 170 枚 batch 適用
合成データ生成✅ 完了500 枚 PoC + 5,000 枚スケーラブル
クラウドファンディング資料✅ 完了LP + チェックリスト + BOM + PR 下書き + 動画台本
プロトタイプ動画✅ 完了27 秒短尺版 (cf-demo-video-prototype.mp4)
本番運用ガイド✅ 完了3 デプロイ先 + 監視 + Runbook
Roboflow Workspace 作成🔴 未着手手動作業 (チェックリストあり)
M-League 専用 ML 訓練🔴 未着手MVP v1 (1 クラス) → v2 (34 クラス)
天井カメラ実機🔴 未調達BOM 推奨 ¥34,780

🗺 推奨閲覧順 (時系列)

  1. A1: 設計ボトルネック — まず全体像とボトルネックの構造を把握
  2. A2: 公開モデル素性 — 現状モデルの限界が「個人実験 29 枚」だと知る
  3. A3: 類似モデル広域調査 — 他ドメインから学べる選択肢の幅
  4. A4: 転移学習 — トランプモデル活用 (合成データ生成) の具体提案
  5. B1: 卓マスキング前処理 — false positive 50-70% 削減
  6. B2: 前処理統合 — 5 検出スクリプトへの統合方法
  7. B3: 合成データ生成ガイド — 5,000 枚の合成データパイプライン
  8. B4: 合成データ品質 — 500 枚生成の実測検証
  9. C1: E2E 評価 — マスクあり/なし実測 + 推定 mAP
  10. C2: 評価テンプレート — 自前モデル完成後に埋める枠
  11. D1: CF ランディング — Makuake 公開用 LP
  12. D2: CF チェックリスト — D-30 → D-Day → 終了後
  13. D4: 経営サマリ — 投資判断者向け資料
  14. D5: プロトタイプ動画 — VOICEVOX + ffmpeg 量産手順
  15. E1: 本番デプロイ — Cloudflare/Jetson/RTX4090
  16. E2: 監視 + スケーリング — Runbook + アラート
各ドキュメントは独立して読めるよう設計してあるが、推奨順に読むと「なぜ自前訓練が必要か」「どう効率化するか」「どんな前処理を併用するか」「どう商品化するか」「どう運用するか」が連続して理解できる構成。

🔗 関連リンク