본문 바로가기

카테고리 없음

Python arepl extension 사용시 surrogates issues 해결

파이썬 extensions에 대한 추천을 받아 arepl을 다운 받았다.

 

이 글은 arepl이라는 확장 프로그램을 사용했을 때 생긴 문제점에 대한 글이다.

 

영어로 python 코드를 짰을 때 arepl을 돌리는 건 문제가 없지만

 

한글이 하나라도 들어가는 순간 arepl은 encoding issues를 던지면서 동작이 멈춰버린다.

 

구글링을 해보니, 다른 국가의 사람들 (중국..)의 이슈 분석이 있긴 했다.

 

해당 코멘트를 살펴보면 terminal에서는 동작이 문제가 없다고 얘기하는 듯 했다.

 

내 생각은 arepl이 utf-8로 받아들여야 하는데 vs-code상에서 작성되는 문자들은 utf-8로 인식이 안되는 모양인 듯 보였다.

 

vscode에서 아무리 encoding을 utf-8로 설정해봤지만 씨알도 안먹혔다. [ 다른 인코딩도 건드려봤다..]

 

그러다 시스템의 인코딩 방식이 무엇인지 고민하게 되었다.

 

예전에도 vscode를 이용할 때 euc-kr와 utf-8로 스트레스를 받은적이 있는지라..

 

https://studyforus.tistory.com/167

 

한글 인코딩 종류 및 문제점 파악하기 (UTF-8 vs. EUC-KR)

인코딩 방식 이해하기 한글 인코딩 종류 윈도우를 기본 운영체제로 사용하였을 때는 전혀 느끼지 못했던 인코딩 방식이 웹서버를 운영하면서 인코딩 표준을 따라가다 보니 여러 문제점이 생겼�

studyforus.tistory.com

다음의 링크에서 대략적인 문제점을 알게 되었다.

 

무엇이 이유인지는 모르겠지만 vscode에서 내가 한국말을 쓰는 순간 그 문자는 utf-8이 아닌 모양인듯 했다.

[ 아마도 윈도우에서 설정한 인코딩 방식으로 접근되는 듯 하다. ]

 

utf-8로 인식하게 해야 했고, 이에 대한 자료를 찾던중 시스템의 인코딩 방식을 utf-8로 처리해야하는 방법을 시도해보게 되었다.

 

https://post.naver.com/viewer/postView.nhn?volumeNo=16967132&memberNo=1834

 

윈도우10 한글깨짐 제어판 설정 방법 : 세계 언어 지원을 위해 Unicode UTF-8

[BY 세아향] 어느날 갑자기 윈도우10 노트북의 한글 깨짐 현상이 발생했다. 원래 문제라는 것이 사용 중...

m.post.naver.com

"제어판"에 들어가서 "시계 및 국가"로 들어간다. 

 

"날짜, 시간 또는 숫자 형식 변경"으로 들어간 후 

 

"관리자 옵션"에 들어가서 "시스템 로캘 변경"을 클릭한다.

 

Beta~~에 빈박스라면 체크하고 재부팅하면 된다.

 

이후에는 arepl이 한국어에도 잘 작동했다.

 

혹시 나와 같은 사람이 있을까 이 이슈 사안을 올려본다. 

 

뭔지는 모르겠는데, UTF-8이 아니어서 생기는 문제가 참 많나보다. [ 특히 데이터베이스나, 웹 서버 쪽...]

 

유니코드 개념도 언젠간 빠삭하게 정리해서 익혀야하는데... 그것 외에도 할게 많다.

 

지금 당장만 봐도 파이썬만 죽어라 공부하고 NLP를 배워야 하니..

성공샷을 올려본다.

반응형