본문 바로가기

Language/Python3

파이썬 자료형 - 정수형, 실수형 정수형 실수형 지수표현 방식 : 1e9 = 유효숫자 * 10 ** 지수 실수형을 저장하기 위해 4byte, 8byte 의 고정된 메모리 크기를 할당하므로, 컴퓨터는 실수를 표현하는 정확도에 한계를 가짐 e.g. 0.3 + 0.9 = 0.88888888889 => a != 0.9 round()를 통해 정확한 실수 값을 가지도록 함 다양한 연산자 / : 나누기 % : 나머지 (e.g. 홀짝 검사) // : 몫 ** : 제곱 (e.g. 제곱근 1 ** 0.5) 2023. 1. 17.
[Pytorch] Freeze Network: no_grad, requires_grad 차이 블로그 글을 많은 부분 참고했다. [PyTorch] Freeze Network: no_grad, requires_grad 차이 모델 Freeze 하는 방법에 대해 정리한 글입니다. nuguziii.github.io 모델 Freeze 하는 방법에 대해 정리한 글이다. ULMFiT, Adapter, P-tuning 등의 architechture에서 처럼 일부 모델을 freeze 시키고 다른 모델의 일부에 대해서만 paramter update를 하고싶은 경우가 있다. 대표적으로 transfer learning이나 generative adversarial network의 경우가 있다. 이럴 경우에 파이토치에서 사용하는 no_grad 와 requires_grad 에 대한 차이점을 기록한다. 첫번째 경우, 위 그림.. 2022. 3. 14.
[python] 한글 파일 텍스트 파일로 변환하기 hwp to txt 한글파일(.hwp) 파일을 python 분석에 사용하기 위하여 텍스트 파일(.txt)로 변환해야 하는 경우가 있습니다. 이를 위한 두가지 방법에 대해 알아보겠습니다. 1. olefile 먼저 한글에서 테스트 파일을 하나 생성해줍니다. (test.hwp) 다음으로 olefile을 임포트 하여 hwp안의 내용을 읽습니다. import olefile f = olefile.OleFileIO('test.hwp') # olefile로 한글파일 열기 encoded_text = f.openstream('PrvText').read() # PrvText 스트림 안의 내용 꺼내기 (유니코드 인코딩 되어있음) decoded_text = encoded_text.decode('utf-16') # 유니코드이므로 utf-16으로 디.. 2021. 12. 8.