Post

택시 영수증 이미지에서 데이터 추출하는 파이썬 프로그램 개발하기

택시 영수증 이미지에서 데이터 추출하는 파이썬 프로그램 개발하기

Introduction

지난 글에서 OPENAI의 Vision api를 사용하는 파이썬 코드 스니펫을 살펴보았다.

이제는 파이썬 코드를 활용하여 실제 프로그램 제작에 착수하였다.

상황 진단

  • 상황1: 택시영수증의 앞면에는 거래 일시와 결제 금액이 있음. 동일한 영수증의 뒷면에는 날짜, 사람이름, 이동내역이 적혀있음

  • 상황2: 현재는 사원이 일일이 택시 영수증을 받아서, 기존 엑셀 파일에 raw data sheet에 입력을 하고 있음. 그 기존 엑셀 파일은 raw data만 입력되면, 그 뒤에 사람별 사용 금액, 사용 날짜, 회사 내부 결재보고용 기안문 등의 후처리는 자동화가 되어 있는 상태임.

문제 정의

  • 사진으로 찍힌 영수증 파일을 Vision api를 활용하여 데이터를 추출하여 csv로 정리하면 완료.

솔루션

  • 영수증의 앞면과 뒷면을 사진을 찍어서 정리해놓으면, 영수증 1개에 대한 사진 2장을 1개의 쌍(Pair)으로 구성하여야함
  • 사전 작업지시: 사진을 찍을 때 순서대로 찍어서 이름 내림차순 순서대로 정렬하게 해야함. 파일1과 파일2가 자동으로 pair가 되도록 프로그램을 구성했음
  • 웹개발보다는 간단한 프로그램 개발을 통해서 로컬에서 손쉽게 실행되도록 하였음

  • 이미 자동화된 엑셀을 사용 중에 있음. -> 굳이 후처리를 프로그램이 해줄 필요는 아직 없음.

최종 추출내역:

이미지

This post is licensed under CC BY 4.0 by the author.