본문 바로가기

AI/Machine Learning

정렬, 데이터 프레임 기법.

반응형

bike["area"].value_counts().sort_index().tolist()

 

이렇게 해주면 bike["area"]에서 중복 값에 대한 갯수들을 뽑아주고 

sort_index()를 하면 index별로 즉 이름값의 오름차순으로 정렬이 된다.

ㄱ,ㄴ,ㄷ..... 순

그리고 tolist()가 붙게 되면 그중에 숫자 값 즉 count값이 리스트로 뽑아진다.

z = park["size"].sort_index().keys().tolist()

 

같은 방식으로 정렬 후에 keys()로 하면 문자 값 즉 value값이 리스트로 뽑아진다.

 

data = {"name" : z,
        "park" : x,
        "count" : y }
df = pd.DataFrame(data, columns = ["name", "park","count"])

 

데이터를 그냥 변수에서 df["name"] =  같이 칼럼을 마음대로 열어서 지정은 불가능 하고

pandas를 이용하여 , 데이터 프레임을 만들어 주고 그때 생성된 열에 들어갈 데이터를 담을 변수를 넣어 줘야 한다.

 

x = park.sort_values(by = 'area')

데이터 셋 전체에서 어떤 칼럼을 기준으로 정렬하기.

반응형

'AI > Machine Learning' 카테고리의 다른 글

하이퍼 파라미터 조정법  (0) 2019.10.15
데이터 셋의 임의의 칼럼의 행 데이터 뽑기.  (0) 2019.10.05
csv파일 다루기.  (0) 2019.10.04
파이썬 유니코드 에러  (0) 2019.10.04
파이썬 개발환경 구축.  (0) 2019.09.14