🀄 Mahjong Vision — 設計ドキュメント INDEX

麻雀牌のリアルタイム認識 → 立/倒姿勢判定 → アガリ判定 → 役判定の自動化を目指す Mahjong Vision プロジェクトの
設計分析・モデル評価・転移学習・前処理・クラウドファンディング・運用までを網羅した文書集

📅 最終更新: 2026-05-14 📚 ドキュメント数: 19 HTML 🌐 公開: mahjong-scorekeeping-docs.pages.dev ✅ OSS スタック移行決定 (¥108K/年節約)

📊 数字で見る進捗 (3 サイクル後)

公開 HTML ドキュメント

単体テスト PASS (新規 20)

-27.8%

マスク前処理で検出 FP 削減 (実測)

500

合成データ枚数 (品質判定合格)

¥189M

クラファン想定支援額 (700 セット)

¥10M

First Goal 目標調達額

420

損益分岐セット数

2,022

プロダクション化スクリプト計行数

⭐ グループ 0: 重要意思決定 (2026-05-14 追加)

0-A

緑卓判定実測 + Roboflow 契約判断

M-League 全 499 フレームに緑卓検出ロジックを適用。filter との一致率 87.4% (Cohen's Kappa 0.738) を根拠に、Roboflow Starter ($60/月) は不要と判断。ダウングレード手順 + 返金申請テンプレ付。

NEW判断¥108K/年節約

0-B

改訂モデルスタック (OSS フルスタック)

YOLOX-Nano (Apache 2.0) + mahjong_huge (CC BY 4.0) + FluffyStuff tiles (CC BY 4.0) + ONNX Runtime Web (MIT) の商用クリーン OSS フルスタック。YOLOv8 (AGPL-3.0) の商用懸念排除、Roboflow Hosted Inference 不要。

NEW技術選定Apache+CC BY+MIT

0-C

🔴 LIVE: ブラウザ内検出デモ

ONNX Runtime Web でサーバーなしでブラウザ内推論。実モデル未配置時はデモモード fallback で UI 体験完成。画像 D&D / サンプル 6 枚 / 検出統計 + bbox 描画。CC BY 4.0 帰属表記同梱。

NEWLIVE デモ実装あり

0-D

YOLO と Roboflow の関係(図解)

Roboflow = 教材(写真+正解ラベル)、YOLO = それで学ぶ検出モデル。Mermaid 図でデータ→モデル→推論のパイプライン、学習時/実行時の違い、クラス順 remap までを図解。

NEW図解資料Mermaid

🔁 グループ P: 運用・PDCA 自動ループ (2026-06-11 追加)

P-1

🔁 PDCA 自動ループダッシュボード

索子/1索低画質認識を Plan→Do→Check→Act で自律改善。日々チェックリスト・ループ健全性(最終学習からの経過)・フィードバック蓄積バー・認識率履歴を表示。学習/評価/デプロイ結果は LINE・デスクトップ・メール へ通知。

NEW運用ダッシュボード実装あり

🔍 グループ A: 設計分析 (なぜこれが必要か)

設計ボトルネックと回避策

5 つの構造的ボトルネック (B1〜B5: 公開モデル精度・推論コスト・データ密度・領域分離・3D 姿勢) と 40+ 代替案の採否一覧。実 Roboflow 検出画像 5 枚埋め込み。

COREボトルネック分析

公開モデル素性調査

test-upsgd/mahjong-tiles-oc9zz の素性調査。訓練 29 枚・個人実験・CC BY 4.0、商用採用実績なし。データ規模 → 汎化性能の構造的限界。

調査レポート

類似公開モデル広域調査

同型ドメイン (トランプ・チェス・将棋) の 20+ モデル網羅。Augmented Startups Playing Cards (10,100 枚) は麻雀の 350 倍規模。

調査ログ

トランプ→麻雀転移学習

「カードも牌も菱形に見える」幾何学的共通項で OBB 検出が転移可能。3 アプローチ (A: COCO 直接 / B: 2 段階 / C: 合成データ★推奨)。

CORE転移学習

🔧 グループ B: 前処理・データ生成 (技術実装)

卓上領域マスキング前処理

緑フェルト以外を HSV + 最大連結成分 + 凸包 + dilate で除外する前処理。実装 scripts/mask-table-region.py + Before/After デモ。

実装あり前処理

前処理統合ガイド

5 検出スクリプト (detect-agari-visual / analyze-still-frame / render-3d-overlay-cf / evaluate-agari-transition / voice-cli) への --use-table-mask 統合方法。

実装あり

合成データ生成ガイド

アノテーション工数 0 で 5,000 枚を生成する合成データパイプライン。Augmented Startups Playing Cards 手法を麻雀に応用。

実装あり

合成データ品質検証レポート

500 枚生成 (2分6秒) のクラス均等性・bbox サイズ・はみ出し率を実測。品質判定合格。サンプル画像 4 枚 + 6 統計図。

NEW実測レポート

📈 グループ C: モデル評価 (実測 + テンプレート)

E2E 評価レポート v1 (実測)

マスク前後の検出件数 97→70 (-27.8%)、batch 成功率 84.6%、合成データ品質、実測・推定・目標を pill で峻別した 9 セクション。

NEW実測 + 図 4 枚

モデル評価テンプレート

将来訓練するモデルの評価レポート用テンプレート (TODO マーカー入り)。mAP・Precision・Recall・推論レイテンシ・退役判定基準。

テンプレート

💰 グループ D: クラウドファンディング (Makuake 想定)

CF ランディングページ (公開版)

Makuake 想定の最終 LP (1,118 行・12 セクション・CSS アニメ 9 種)。Hero・ストーリー・4 リワード・FAQ・リスク開示。

CFNEW

CF 公開チェックリスト

D-30 / D-14 / D-Day / 終了後の 4 フェーズ × 95+ 項目。BLOCKER 含む 7 GO/NO-GO チェック付き。JS で進捗集計バー表示。

CF デモ (PoC 旧版)

Cycle 2 で作成した初版 CF デモ。Before/After 画像 + 製品ピラー 3 つ。最新は D1。

経営サマリ (投資判断者向け)

市場規模・競合・差別化・財務予測 (¥189M 想定 / BEP 420 セット / 5 年 LTV) + 12 ヶ月マイルストーン + リスク 5 つ。

プロトタイプ動画ガイド

VOICEVOX (停止時は pyttsx3 fallback) + ffmpeg で 27 秒短尺デモ動画を生成。フル尺 2:30 量産見積も同梱 (¥281,000 / 31.5h)。

CFNEW実装あり

🚀 グループ E: 運用・デプロイ (実用化)

本番デプロイガイド

Cloudflare Workers AI / Jetson Orin Nano / RTX4090 別の本番デプロイ手順。推論レイテンシ・コスト見積。

NEW運用

監視 + スケーリング

Prometheus + Grafana 監視構成、SEV1/2/3 アラート閾値、1→10→100 ユーザースケーリング戦略、障害対応 Runbook。

NEW運用

🎯 プロジェクト目標

本プロジェクトは 麻雀の役判定・点数計算を自動化する補助システム。最終確認は人間が行う「補助役」として動作し、誤検出に強い設計を採用。将来的には捨て牌・副露の連続トラッキングによる牌譜記録 (天鳳形式エクスポート)まで拡張。

区分	入力	出力
📷 映像	4K天井カメラ / M-League ダイジェスト	Web ダッシュボード + 動画オーバーレイ
🎤 音声	マイクアレイ (ツモ/ロン/ポン/チー)	牌譜 DB (SQLite + 天鳳形式 export)
🎴 物理	RFID 点棒トレイ	点棒移動の物理連動

📊 現状ステータス (2026-05-14)

領域	状態	備考
役判定エンジン (mahjong 2.0.0)	✅ 完了	標準 30 役 36/36 PASS
CV→役判定ブリッジ	✅ 完了	4 fixture 7/7 PASS
音声検出 (faster-whisper)	✅ 完了	ツモ/ロン/積も/栄和パターン拡張
動画オーバーレイ (v5)	✅ 完了	4 オーバーレイ全部入り
カメラキャリブ基盤	✅ 完了	斜め上設置・チェスボード方式
Roboflow 訓練データ準備	✅ 完了	499→201 枚フィルタ済
卓上マスキング前処理	✅ 完了	5 検出スクリプト統合済 + 170 枚 batch 適用
合成データ生成	✅ 完了	500 枚 PoC + 5,000 枚スケーラブル
クラウドファンディング資料	✅ 完了	LP + チェックリスト + BOM + PR 下書き + 動画台本
プロトタイプ動画	✅ 完了	27 秒短尺版 (cf-demo-video-prototype.mp4)
本番運用ガイド	✅ 完了	3 デプロイ先 + 監視 + Runbook
Roboflow Workspace 作成	🔴 未着手	手動作業 (チェックリストあり)
M-League 専用 ML 訓練	🔴 未着手	MVP v1 (1 クラス) → v2 (34 クラス)
天井カメラ実機	🔴 未調達	BOM 推奨 ¥34,780

🗺 推奨閲覧順 (時系列)

A1: 設計ボトルネック — まず全体像とボトルネックの構造を把握
A2: 公開モデル素性 — 現状モデルの限界が「個人実験 29 枚」だと知る
A3: 類似モデル広域調査 — 他ドメインから学べる選択肢の幅
A4: 転移学習 — トランプモデル活用 (合成データ生成) の具体提案
B1: 卓マスキング前処理 — false positive 50-70% 削減
B2: 前処理統合 — 5 検出スクリプトへの統合方法
B3: 合成データ生成ガイド — 5,000 枚の合成データパイプライン
B4: 合成データ品質 — 500 枚生成の実測検証
C1: E2E 評価 — マスクあり/なし実測 + 推定 mAP
C2: 評価テンプレート — 自前モデル完成後に埋める枠
D1: CF ランディング — Makuake 公開用 LP
D2: CF チェックリスト — D-30 → D-Day → 終了後
D4: 経営サマリ — 投資判断者向け資料
D5: プロトタイプ動画 — VOICEVOX + ffmpeg 量産手順
E1: 本番デプロイ — Cloudflare/Jetson/RTX4090
E2: 監視 + スケーリング — Runbook + アラート

各ドキュメントは独立して読めるよう設計してあるが、推奨順に読むと「なぜ自前訓練が必要か」「どう効率化するか」「どんな前処理を併用するか」「どう商品化するか」「どう運用するか」が連続して理解できる構成。

🔗 関連リンク

📦 リポジトリ: ~/shimanto-projects/mahjong-scorekeeping (private)
📁 ドキュメント原稿: docs/ (markdown 5 ファイル)
🐍 実装スクリプト: scripts/ (mask, generate-synthetic, audit, batch, eval-* など)
🌐 公開ページ: mahjong-scorekeeping-docs.pages.dev
🎯 Roboflow セットアップ手順: docs/roboflow-workspace-setup-checklist.md
🚀 M-League ファインチューン計画: ai-brushup-plans/plans/01-mleague-yolo-finetune.md
🎬 プロトタイプ動画: crowdfunding/cf-demo-video-prototype.mp4 (git 追跡外)
📜 インシデント Runbook: docs/runbook-incident-response.md