Python arepl extension 사용시 surrogates issues 해결
파이썬 extensions에 대한 추천을 받아 arepl을 다운 받았다.
이 글은 arepl이라는 확장 프로그램을 사용했을 때 생긴 문제점에 대한 글이다.
영어로 python 코드를 짰을 때 arepl을 돌리는 건 문제가 없지만
한글이 하나라도 들어가는 순간 arepl은 encoding issues를 던지면서 동작이 멈춰버린다.
구글링을 해보니, 다른 국가의 사람들 (중국..)의 이슈 분석이 있긴 했다.
해당 코멘트를 살펴보면 terminal에서는 동작이 문제가 없다고 얘기하는 듯 했다.
내 생각은 arepl이 utf-8로 받아들여야 하는데 vs-code상에서 작성되는 문자들은 utf-8로 인식이 안되는 모양인 듯 보였다.
vscode에서 아무리 encoding을 utf-8로 설정해봤지만 씨알도 안먹혔다. [ 다른 인코딩도 건드려봤다..]
그러다 시스템의 인코딩 방식이 무엇인지 고민하게 되었다.
예전에도 vscode를 이용할 때 euc-kr와 utf-8로 스트레스를 받은적이 있는지라..
https://studyforus.tistory.com/167
한글 인코딩 종류 및 문제점 파악하기 (UTF-8 vs. EUC-KR)
인코딩 방식 이해하기 한글 인코딩 종류 윈도우를 기본 운영체제로 사용하였을 때는 전혀 느끼지 못했던 인코딩 방식이 웹서버를 운영하면서 인코딩 표준을 따라가다 보니 여러 문제점이 생겼�
studyforus.tistory.com
다음의 링크에서 대략적인 문제점을 알게 되었다.
무엇이 이유인지는 모르겠지만 vscode에서 내가 한국말을 쓰는 순간 그 문자는 utf-8이 아닌 모양인듯 했다.
[ 아마도 윈도우에서 설정한 인코딩 방식으로 접근되는 듯 하다. ]
utf-8로 인식하게 해야 했고, 이에 대한 자료를 찾던중 시스템의 인코딩 방식을 utf-8로 처리해야하는 방법을 시도해보게 되었다.
https://post.naver.com/viewer/postView.nhn?volumeNo=16967132&memberNo=1834
윈도우10 한글깨짐 제어판 설정 방법 : 세계 언어 지원을 위해 Unicode UTF-8
[BY 세아향] 어느날 갑자기 윈도우10 노트북의 한글 깨짐 현상이 발생했다. 원래 문제라는 것이 사용 중...
m.post.naver.com
"제어판"에 들어가서 "시계 및 국가"로 들어간다.
"날짜, 시간 또는 숫자 형식 변경"으로 들어간 후
"관리자 옵션"에 들어가서 "시스템 로캘 변경"을 클릭한다.
Beta~~에 빈박스라면 체크하고 재부팅하면 된다.
이후에는 arepl이 한국어에도 잘 작동했다.
혹시 나와 같은 사람이 있을까 이 이슈 사안을 올려본다.
뭔지는 모르겠는데, UTF-8이 아니어서 생기는 문제가 참 많나보다. [ 특히 데이터베이스나, 웹 서버 쪽...]
유니코드 개념도 언젠간 빠삭하게 정리해서 익혀야하는데... 그것 외에도 할게 많다.
지금 당장만 봐도 파이썬만 죽어라 공부하고 NLP를 배워야 하니..
성공샷을 올려본다.