ミグストラノート

ラノベ読みの日記です。VTuber,地球科学も。

話題のGoogleドキュメントで画像から文字を抽出するやり方

まずGoogleドライブに画像をアップロードします.

次に画像を右クリックして,アプリで開くからGoogleドキュメントを指定します.

f:id:okamurauchino:20180202122947p:plain

すると少し後に文字起こしされます.

f:id:okamurauchino:20180202123111p:plain

そしてこれが文字の大きさなどをそろえてあげたものです.

参考記事 街かど屋のおすすめメニュー - ミグストラノート

f:id:okamurauchino:20180202123152p:plain

だいたいうまく文字に起こされていますね.OCR優秀.「,と.」があまり拾えてませんね.とろたまがとるたまになっています.

手書きの議事録とかのときは単純なOCRに加えて,文章作成ソフトの文章校正 (画像の赤波線部分など) を組み合わせるのが今後のトレンドになるのかもしれません.


Googleドライブの公式のヘルプからの情報です.

PDF や写真のファイルをテキストに変換する - パソコン - Google ドライブ ヘルプ

ファイルを準備する 次のヒントを参考にするとファイルを最適な状態で準備できます。

形式: .JPEG、.PNG、GIF、PDF(複数ページのドキュメント)の各ファイル。 ファイルサイズ: ファイルは 2 MB 以下にします。 解像度: テキストの高さは 10 ピクセル以上にします。 向き: ドキュメントは正しい向きにします。画像の向きが間違っている場合は、回転させてから Google ドライブにアップロードします。 言語: Google ドライブではドキュメントの言語は検出されません。 フォントと文字セット: 最適な結果を得るには、Arial や Times New Roman のような一般的なフォントを使用します。 画質: 明るさが均一でコントラストがはっきりしたシャープな画像が最適です。 画像ファイルを変換する パソコンで drive.google.com を開きます。 目的のファイルを右クリックします。 [アプリで開く] 次へ [Google ドキュメント] をクリックします。 画像ファイルは Google ドキュメントに変換されますが、形式によっては移行できないこともあります。 太字、斜体、フォントサイズ、フォントタイプ、改行は通常保持されます。 リスト、表、列、脚注、巻末の注などは、検出されない可能性があります。


GoogleドキュメントのOCR機能の活用方法と聞くと,直大さんがエロゲキャラのなりきりTwitter botを作るために,ゲームの画像をスクリーンショットとして取得して,文字起こしをするのに使っていたのを思い出します.

f:id:okamurauchino:20180202124213p:plain

ちやほや駆動開発 ~めぐるちゃんになった1か月~ - chokudaiのブログ

Google Driveで画像を開いたと思ったら文字が全て書き起こされているという事態に衝撃の人々「マジかよ!」「あ!ホントだ」 - Togetter