본문 바로가기

전체 글74

XML, Cross-lingual Language Model Pretraining 리뷰 Abstract 최근 English Natural Language Understanding(NLU)를 위한 pre-train의 효율성을 입증. ⇒ 본 연구에서는 영어에서 더 나아가 다국어로 확장하고, cross-lingual pre-training의 효과 cross-lingual language models (XLMs) 학습 방법 monolingual - unsupervised learning cross-lingual - supervised learning (parallel data 사용) → cross-lingual classification, unsupervised, supervised 기계 번역에 대해 SOTA 달성 performance XNLI에서 4.9% absolute accuracy unsu.. 2022. 2. 22.
Learning Deconvolution Network for Semantic Segmentation 논문 리뷰 DeconNet에 대해 알아보자 원 논문은 여기에서 확인 할 수 있다. Abstract VGG 16 레이어 네트워크에서 채택된 convolution layer위에 네트워크를 학습시킴 Deconvolution Network는 Deconvolution 및 Unpooling layer로 구성 기존의 Fully Connected Network가 가지고 있는 한계점을 극복하기 위해 심층 deconvolution네트워크와 proposal-wise prediction을 통합하였다. 결과, Detail한 측면과 Mutiple scales한 측면에서 기존 대비 많은 효과가 있었다. Introduction Convolution Neural Network(CNN)은 image classification, object det.. 2021. 12. 15.
Semactic Segmentation 기초 개념 본 포스팅은 Case By Case Tistory를 복습한 것임을 밝힙니다. 우선, Semantic Segmentation에 대해 알아보기 이전에, Computer Vision의 대표적 Task 2가지인 Object Detection과 Image Segmentation의 차이에 대해 알고 있어야 합니다. 해당 그림을 보면, Object Detection은 여러 객체(Multiple Objects)를 감싸는 Bounding Box(테두리 박스)를 각각 만드는 Localization을 수행하고, 이 Bounding Box가 가지는 객체(class)가 무엇인지에 대해 Classification을 수행합니다. 반면 Segmentation은 Bounding Box 없이 객체의 포토샵 누끼를 따듯 경계선을 정확히 .. 2021. 12. 15.
[python] 한글 파일 텍스트 파일로 변환하기 hwp to txt 한글파일(.hwp) 파일을 python 분석에 사용하기 위하여 텍스트 파일(.txt)로 변환해야 하는 경우가 있습니다. 이를 위한 두가지 방법에 대해 알아보겠습니다. 1. olefile 먼저 한글에서 테스트 파일을 하나 생성해줍니다. (test.hwp) 다음으로 olefile을 임포트 하여 hwp안의 내용을 읽습니다. import olefile f = olefile.OleFileIO('test.hwp') # olefile로 한글파일 열기 encoded_text = f.openstream('PrvText').read() # PrvText 스트림 안의 내용 꺼내기 (유니코드 인코딩 되어있음) decoded_text = encoded_text.decode('utf-16') # 유니코드이므로 utf-16으로 디.. 2021. 12. 8.