본문 바로가기

AI/Machine Learning

csv파일 다루기.

반응형

공공데이터 셋에서 파일 다운로드 했을 때 , 실제로 jupyter로 불러오면 원하는 포맷 출력이 안되는 경우가 

있는데, 이는 쉼표 대신 공백을 사용하고 있는것과 , 칼럼이름을 한글로 사용하고 있는경우 굉장히 불편해 진다.

따라서 우선 첫작업으로 ,은 구분자가 되므로 1,000 같은 표현은 사용해서는 안된다.

따라서 바꾸기 버튼에서 모든 , 를 제거 후에 공백 지정후에 공백을 ,로 바꿔준다.

그 다음에 필요 없는 튜플들을 삭제해 주고, 칼럼이름을 영어로 다시 rename 시켜준다.

반응형