AI-OCRサービスの構築

2024 Project
AI-OCRサービスの構築
Client : AI系スタートアップ会社様
Web Development,AI / 2024
|
CATEGORY
Web Development,AI
YEAR
2024
OVERVIEW
AI系スタートアップ企業様にて、最先端AI技術を活用したOCRサービスの構築を担当しました。明治期〜昭和初期の近代書籍における旧字体・異体字の認識から、縦書き・横書き・多段組・挿絵・図表を含む複雑なレイアウトの読み取りまで対応し、透明テキスト付PDFの生成機能も実装。金融・医療・法律・出版・図書館・行政機関など幅広い業界でのデジタル化を支援するサービスを構築しました。
CHALLENGE
市販のOCRでは対応できなかった明治〜昭和初期の近代文字(旧字体・異体字)の高精度な認識が求められました。また、書籍特有の縦書き・横書き混在、多段組、挿絵・図表を含む複雑なレイアウトへの対応、さらに大量の書類を効率的にデジタル化するためのスケーラブルなシステム設計が課題でした。
SOLUTION
公的機関のOCRエンジンをコアとして活用し、独自のAIモデルによる近代文字認識・異体字変換機能を開発。本文や図表の位置を自動判定する多段組対応機能を搭載し、複雑な読み順・白抜き・色付文字にも対応。さらに透明テキスト付PDF生成機能を実装し、デジタル化後のデータ検索・分析を可能にするWebアプリケーションとして提供しました。
RESULT
市販OCRを大幅に上回る読み取り精度を達成し、現代活字資料に対しても市販OCRを上回る精度を実現。公共図書館をはじめとする公共機関での導入実績を獲得し、金融・医療・出版・行政など幅広い業界でのデジタル化推進に貢献しています。
REFERENCES
本プロジェクトの情報は、当社の実績に基づき作成しています。記載の技術名・製品名は各社の商標または登録商標です。
- Python
- TypeScript
- Next.js
- AWS