Moshaご利用上の注意点と文字認識

こんにちは!もしゃ君です。

私たちはMoshaの認識エラーを分析し、日々改善しています。しかし現状ではまだまだMoshaがユーザーのお役に立ててないシーンがあるようです。大変申し訳ございません。

一方で私たちは上手く認識出来ない種類の画像には共通点があることに気付きました。それら認識失敗の要因をご利用の方々に注意して頂くことによってきっとMoshaが皆様のお役に立てると願っています。

ということでご利用上の注意3点をまとめます!

 

1.文字を拡大してスクリーンショットする。
パソコンは目が悪いため、小さい文字は読めません

文字認識を行う上で、画像にはある程度の解像度が必要です。
Moshaは100dpi~200dpi程度です。例えばこの画像は60dpi程度ですが、

f:id:Mosha:20140516214245p:plain

パソコンにはこう見えています(人間は普通にこれが読めてすごい)

f:id:Mosha:20140516214303j:plain

Moshaは最低これくらいの解像度(75dpi程度)が必要です(数式が入ると~200dpi程度必要)

f:id:Mosha:20140516214327p:plain

パソコンにはこう見える

f:id:Mosha:20140516214342j:plain
違いは一目瞭然で下の画像の方が綺麗です

2.文字のみを含んだ画像をアップする。
画像の中のどの部分が文字か?が意外と難しい

Moshaはとても素直なので、「認識する画像の中には文字しかない」と考えています。なので画像に背景や図、表などが入っていると、「なにコレ!?」と混乱して認識失敗してしまう訳ですね。
ちょっとおバカさんな感じですが、Moshaはまだ産まれ立ての赤ん坊なので今後どう成長するかは皆さんで見守っていきましょう。

※つまりこういう画像は上手く認識できません!

f:id:Mosha:20140502185319j:plain

※こうして文字部分のみトリミングしてください。
f:id:Mosha:20140516213730p:plain

トリミングにはPCの場合、SnapCrabなどのスクリーンショットツール、iPhone, Android(メーカ毎の仕様?)には標準で機能が含まれています。

ただこれに関しては現状改善中です!SWTという手法を用いてこんな画像から

f:id:Mosha:20140516212821j:plain

こんな感じに文字部分の抽出(ちょっと文字が消えてます汗)

f:id:Mosha:20140516212906p:plain

もう少しブラッシュアップが必要ですね。(SWTの手法について知りたい方はコメント下さい。今度時間の空いた時にアップします)

表の認識も今後アップデート予定!

3.その他認識出来ない文字たち

・下線付き文字
・□の空欄
・ルビがくっついている文字(接触文字)

Moshaについてわからない事、ここがダメだよ日本のクラウドサービス!などなど、どしどしメールまたはコメントで送って下さい!