今回は、当Blogではこれまで取り上げてこなかったネタです。家計簿アプリのレシート認識機能について試してみます。これについてのネット記事は例えば 【2023年】レシート読み取り機能で比較!人気の家計簿アプリ5選 がありますが、当該の記事は実態としては「レシート読み取り機能を有する家計簿アプリの総合的比較」となっています。当Blogの今回の記事は、同じレシートをそれぞれの家計簿アプリで認識させたらどうなるのか? という点のみを比較してみたいと思います。
テスト対象は、マネーフォワードME、Zaim、おカネレコ、レシーピ、スマートレシート、Recemaru(レシマル)の6つです。Dr.Walletは、有料プランではレシートの品目データを人力入力し、無料プランではレシートの総額のみを人力入力する仕様であり、比較しても意味が無いので対象外です。
1.マネーフォワードME
- マネーフォワードMEのレシート撮影画面はレシートを表示する範囲が少し狭く設定されている。
- 3品目目の DCM養生テープ半透明 が 00gpcM養生テーブ牛透明 と認識されている

2.Zaim
- 3品目目の DCM養生テープ半透明 が DCM養住テーブ牛透明 と認識されている

3.おカネレコ
- レシート撮影画面の右下の【通常モード】を叩くと【長尺モード】になる。
- 撮影画面に写るレシートの横幅が少し狭くなる
- 第4品目の"3M"が認識されていない。店舗側が付けた記号として削除したようだ。

4.レシーピ
- 3品目目の DCM養生テープ半透明 が DCM養生テープ牛透明 と認識されている

5.スマートレシート
- 3品目目の DCM養生テープ半透明 が 00gpcM養生テーブ牛透明 と認識されている
- 4品目目の 3Mハイブリッドネット が 3Mハイプリッドネット と認識されている

6.Recemaru(レシマル)
- 3品目目の DCM養生テープ半透明 が DCM養生テーブ半透明 と認識されている
- 4品目目の 3Mハイブリッドネット が 3Mハイプリッドネット と認識されている

7.誤認識の傾向
まず、お断りしておきますが、撮影時の角度、撮影範囲、明るさなどの状況によってレシートの認識結果はかなり違ってきます。また、同じ状況で複数回撮影しても同じ結果にならないこともしばしばです。上記の結果はあくまで一例に過ぎないことをご承知おき下さい。
そのうえで、結果を総覧しますと…
- "009 DCM"を"00gpcM"と誤認識する⇒マネーフォワードME、スマートレシート
- "養生"を"養住"と誤認識する⇒Zaim
- "テープ"を"テーブ"と誤認識する⇒スマートレシート、Recemaru
- ”半透明"を"牛透明"と誤認識する⇒マネーフォワードME、Zaim、レシーピ、スマートレシート
- "ハイブリッド"を"ハイプリッド"と誤認識する⇒スマートレシート、Recemaru
という具合でして、「まあ、似たようなところを誤認識するんだな…」という印象です。特に、"半透明"が"牛透明"になってしまうケースが多く、今回の記事のタイトルにも使わせていただきました。また、スマートレシートとRecemaruに、"フ"の濁点・半濁点が正しく認識できないことがあるという共通の傾向があることも面白いですね。
8.今後の展望
最近のレシート認識用OCRエンジンはかなり高性能になっていることが判りました。が、今回テストに使用したレシートのように、濁点・半濁点が本体の文字に対して小さいフォントを使用しているとまだまだ認識できないこともあります。また、フォントによっては "q" と "g" と "9" を誤認識することもあるようです。
しかし…"半透明"が"牛透明"になる、というのはちょっと腑に落ちません。似てはいますが、こんなに誤認識するほどとも思えないんですがねえ。
また、レシートの宿命として、品名に、チェーン店特有の記号が入っていたり、欄の文字数が制限されていて、OCRが文字を正しく認識しても、それでもなおユーザーが品名を解釈するのに支障が出る、というのも困りものです。これは電子レシートになっても同じです(レシートに印字される文字列が電子データ化されるだけだから)。
これらの点、小売業界サイドで改善してくれないものでしょうか…。あまり期待できませんが、気長に待つことにしましょう。