レシートOCR

レシートOCR

類似度を用いてレシートOCRの精度を上げる

以前作成したレシート画像から品目や価格を読み取りCSV化する仕組みについて、品目の判定精度が低く困っていた。そこで、読み取った品目と過去履歴の品目との類似度を求める仕組みを組み込むことで、品目判定の精度が上がったのでやったことを記録する。 ...
レシートOCR

レーベンシュタイン距離の求め方を整理する

これは、類似度を用いてレシートOCRの精度を上げるで文字列間の類似度を判定するために使用した、レーベンシュタイン距離について自分の理解のためにまとめた記事となる。 レーベンシュタイン距離とは レーベンシュタイン距離は、文字列間の類似度を距離...
レシートOCR

OpenCVを利用した矩形検出の試行錯誤_エッジ検出・適応的閾値処理

前記事で示したOpenCVを用いた矩形検出の改善案のうち、ここでは下記2案の内容について記載する。 ・改善案3 エッジ検出を使う・改善案4 適応的閾値処理を使う 環境 Python 3.7.8OpenCV-Python 4.5.1.48 改...
レシートOCR

OpenCVを利用した矩形検出の試行錯誤_減色・色空間の変更

前記事で示したOpenCVを用いた矩形検出の改善案のうち、ここでは下記2案の内容について記載する。レシートを白・背景を黒に2値化できるような変換を目指す。 ・改善案1 減色する・改善案2 HSV色空間にする 環境 Python 3.7.8O...
レシートOCR

OpenCVを利用した矩形検出の試行錯誤

以前作ったレシートのOCRアプリを改善するため、OpenCVを利用した矩形検出について試行錯誤を行った。 環境 Python 3.7.8OpenCV-Python 4.5.1.48 課題設定 レシートOCRアプリにおいて、一部のレシートが正...
レシートOCR

レシートを読み取ってCSVに変換するデスクトップアプリを作った

こんな感じで、レシートを検知して切取り → 1枚ずつOCR → 誤って読み取ったところの修正・付加情報の追加を手作業で受け付け → CSVで保存 …という流れをGUI上で行えるようにした。 コードはこちら: きっかけ 元々手作業でレシートの...