解決しようとしている課題
スーパーの棚の値札は情報量が多く、フォーマットも統一されていない — 単価表示、kg当たり価格、セール札、プロモーションシール等、二次情報が溢れてる。認知機能に障害のある人、視覚に不自由のある人、高齢による認識困難がある人にとって、その中から「実際の値段」を選び取るのは思ってるより難しい。既存のアシスト系アプリはスマホ前提(対象ユーザーには操作難しい)か、1台€2,000〜€4,000(多くの福祉機関には手が届かない)のどちらか。
創業者は長年の現場経験を持つソーシャルワーカーで、**ボタン1つで誰でも使える専用端末**をゼロから作ろうとしてる。オフライン。月額無し。アカウント無し。個人データが端末外に出ない。
俺が作っているもの
- ラベルレイアウト検出 — OpenCVで値札領域を特定し、主価格を二次情報(単価、プロモオーバーレイ、バーコード帯)から分離。ドイツの複数スーパーで使われる異なるフォーマット規約に対応。
- OCRエンジン比較検証 — TesseractとPaddleOCRの精度をハードウェアコスト込みで比較。Tesseractは密集多価格ラベルのレイアウトが苦手、PaddleOCRはクリアに捌けるがシリコンパワーを要求。推奨ロジックの設計: €20のPi Zeroでいつ粘り、いつ€45のPi 4Bに上げ、いつ精度の頭打ちが切り替えを正当化するか。
- 上付き(superscript)セント抽出 — ドイツの値札は セント部分を小さな上付きで表記する慣例がある(例: 379 で €3.79)。上付きROIを独立に切り出して別パスでOCR、決定論的に結合 — エンジンが合成グリフ群を誤認する挙動を回避する。
- オンデバイス推論チューニング — モデル選定、スレッド、画像サイズ上限、メモリ予算をボタン押下インタラクションのレイテンシ内に収まるよう調整。
- ground-truth検証フレームワーク — 画像別のground-truthデータセット+再利用可能な精度計測スクリプト。パイプラインのイテレーションごとに同じ基準で数値比較できるようにして、勘で判断しない運用に。
なぜスマホアプリじゃないのか
スマホで技術的には実現可能 — Microsoft Seeing AI、Google Lookout、Be My Eyes、Envision Glasses等すでに存在する。でも対象ユーザー層はスマホを安定運用できない。複数ステップのアプリ起動、権限プロンプト、フロー壊すOSアップデート、注意を奪う通知、これらは認知サポートが必要な人にとって失敗点になる。**単機能・ボタン1つの専用端末**は、他のアシスト領域(服薬リマインダー、徘徊GPS、コミュニケーション補助)で既に実証されてるパターン。創業者はその教訓を**買い物の自立支援**領域に適用してる — 現状、手頃な価格帯の専用端末は存在しない空白ゾーン。
納品済み
- 複数のOCRパイプライン反復 — 密集グリッドラベル検出、クローズアップ単一ラベル処理、紙ラベル vs ESL(電子棚札)分岐。全てground-truthに対して計測済み。
- 正直なハード推奨メモ — Tesseractが多価格ラベルで精度の頭打ちに達する地点を実測で文書化し、エンジンを粘るより「ハード増強+PaddleOCR」の方が現実的な次手である理由を示した。
- E2Eテスト足場+ラベル分類タクソノミー — 創業者が独自に現場検証を続けられるよう、基準値付きで整備済み。
技術スタック
Python 3
OpenCV
NumPy
Tesseract
PaddleOCR
Raspberry Pi Zero 2W
Raspberry Pi 4B
ARM64 Linux
連結成分解析
Otsu閾値 / CLAHE
流通経路
このプロダクトは小売棚ではなく**福祉機関・社会福祉経由のディストリビューション**でエンドユーザーに届ける設計。創業者の教育学・心理学・ソーシャルワークのバックグラウンドが営業エンジン、俺の担当はそこから来た引き合いが実運用の台数に繋がるだけの堅牢なパイプラインを出荷すること。長期目標はアシスティブ・テクノロジー補助制度の対象製品化 — 本当に必要な人の手に届ける、贅沢品にしないための設計。