OCRオーシーアール (Optical Character Recognition)

▼ ざっくり言うと

画像の中の文字を読み取って、テキストに変換する技術のことです。

▼ もうちょっと詳しく

紙の書類をスマホで撮ると文字データになる、PDFから本文を取り出せる、領収書の数字を読み取って家計簿アプリに入る、ぜんぶOCRです。コンピュータが画像を読む、というやつ。

昔のOCRは「手書き文字に弱い」「罫線に翻弄される」「漢字を勝手に違う字にする」など、現場で罵詈雑言を浴びる定番ジャンルでしたが、AIの登場でかなり改善しました。最近はLLMが直接画像を読んでくれるので、専用OCRツールという仕事が静かに消えつつある、という事情もあります。

昔のOCRに泣かされた経験のある人ほど、今のAIの精度に感慨を覚えます。

あなたの読了: 0 / 388