OCR (Optical Character Recognition)
▼ ざっくり言うと
画像の中の文字を読み取って、テキストに変換する技術のことです。
▼ もうちょっと詳しく
紙の書類をスマホで撮ると文字データになる、PDFから本文を取り出せる、領収書の数字を読み取って家計簿アプリに入る、ぜんぶOCRです。コンピュータが画像を読む、というやつ。
昔のOCRは「手書き文字に弱い」「罫線に翻弄される」「漢字を勝手に違う字にする」など、現場で罵詈雑言を浴びる定番ジャンルでしたが、AIの登場でかなり改善しました。最近はLLMが直接画像を読んでくれるので、専用OCRツールという仕事が静かに消えつつある、という事情もあります。
昔のOCRに泣かされた経験のある人ほど、今のAIの精度に感慨を覚えます。
あなたの読了: 0 / 388 語

