レシートOCR

類似度を用いてレシートOCRの精度を上げる

以前作成したレシート画像から品目や価格を読み取りCSV化する仕組みについて、品目の判定精度が低く困っていた。そこで、読み取った品目と過去履歴の品目との類似度を求める仕組みを組み込むことで、品目判定の精度が上がったのでやったことを記録する。 ...

2022/08/17

レシートOCR自由研究

これは、類似度を用いてレシートOCRの精度を上げるで文字列間の類似度を判定するために使用した、レーベンシュタイン距離について自分の理解のためにまとめた記事となる。レーベンシュタイン距離とはレーベンシュタイン距離は、文字列間の類似度を距離...

2022/08/17

レシートOCR自由研究

前記事で示したOpenCVを用いた矩形検出の改善案のうち、ここでは下記2案の内容について記載する。・改善案3 エッジ検出を使う・改善案4 適応的閾値処理を使う環境 Python 3.7.8OpenCV-Python 4.5.1.48 改...

2021/05/11

レシートOCR自由研究

前記事で示したOpenCVを用いた矩形検出の改善案のうち、ここでは下記2案の内容について記載する。レシートを白・背景を黒に2値化できるような変換を目指す。・改善案1 減色する・改善案2 HSV色空間にする環境 Python 3.7.8O...

2021/05/11

レシートOCR自由研究

以前作ったレシートのOCRアプリを改善するため、OpenCVを利用した矩形検出について試行錯誤を行った。環境 Python 3.7.8OpenCV-Python 4.5.1.48 課題設定レシートOCRアプリにおいて、一部のレシートが正...

2021/05/11

レシートOCR自由研究

こんな感じで、レシートを検知して切取り → 1枚ずつOCR → 誤って読み取ったところの修正・付加情報の追加を手作業で受け付け → CSVで保存 …という流れをGUI上で行えるようにした。コードはこちら：きっかけ元々手作業でレシートの...

2020/12/09

レシートOCR自由研究