Bini-log

  • 홈
  • 태그
  • 방명록

비전 1

[논문읽기-1] OCR-free Document Understanding Transformer - 번역

OCR-free Document Understanding Transformer 문서 이미지를 이해하는 것은 복잡한 기능인 텍스트 읽기와 문서의 전체적인 이해능력을 필요로하기 때문에 핵심적이지만 어려운 작업이다. 현재 시각적 문서 이해(Visual Document Understanding, VDU) 방법은 텍스트 읽기 작업을 외부 OCR(광학 문자 인식) 엔진에 위탁하고 OCR 출력물에 초점을 맞추어 이해 작업을 수행한다. 이러한 OCR 기반 접근 방식은 유망한 성능을 보여주었지만, 1) OCR 사용에 따른 높은 계산 비용, 2) 언어 또는 문서 유형에 대한 OCR 모델의 제한성, 3) OCR 오류 전파로 인한 후속 과정의 문제 등이 있다. 이러한 문제를 해결하기 위해 본 논문에서는 문서 이해 트랜스포머(..

AI 2023.06.06
이전
1
다음
더보기
프로필사진

인공지능(자연어처리) 개발자 / AI(NLP) Developer

Calendar

«   2025/05   »
일 월 화 수 목 금 토
1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 31
  • 분류 전체보기 (31)
    • 미국생활 (4)
    • 해외여행 (1)
    • 끄적임 (2)
    • AI (12)
    • 코딩이야기 (11)
      • 코딩테스트 (1)
      • Github (1)
      • IT 5분 잡학사전 (9)
    • 에즈마이야(Ezemiah) (1)

최근글과 인기글

  • 최근글
  • 인기글

방문자수Total

  • Today :
  • Yesterday :

최근댓글

Copyright © Kakao Corp. All rights reserved.

티스토리툴바