AI/Machine Learning (32) 썸네일형 리스트형 Linear Regression 3 보호되어 있는 글입니다. Regression, Classification , Neural Network 개념 머신러닝 Regression 연속적인 데이터 값을 학습하여 이후에 임의의 값이 올 경우 어떤 값이 올지를 예측하는 패턴 Classfication 데이터의 분포를 학습해서 임의의 데이터가 올 경우에 이 데이터가 어떤 분포에 속하는지 알아 내는 것 딥러닝 Neural Network 인간의 뉴런과 비슷한 방식으로 작동 뉴런의 이전 뉴런의 출력을 각각 인풋으로 받아 모두 더함. 이 값이 threshold를 넘으면 다음 뉴런으로 전달 인풋 1 부터 n까지 적당한 가중치를 곱해서 더한 뒤 특정 값을 넘을 때 전달. 하이퍼 파라미터 조정법 첫 번째, 초매개변수 값의 범위를 10의 거듭제곱 단위, 로그스케일로 대략적으로 설정한다. 두 번째, 설정된 범위에서 초매개변수의 값을 무작위로 추출한다. 세 번째, 샘플링한 초매개변수 값을 사용하여 학습하고, 검증 데이터로 정확도를 평가한다. 네 번째, 2~3번째 단계를 반복하여, 그 정확도 결과를 보고 초매개변수의 범위를 좁혀간다. 데이터 셋의 임의의 칼럼의 행 데이터 뽑기. importances_df["importances"].values[0] #importances_df 데이터 셋에서 importances 칼럼의 첫 번째 데이터. 이름 string값으로 정렬 하는것은 df.sort_values(by ="name") 숫자 값을 기준으로 정렬 df.sort_values("count",ascending =False) csv파일 다루기. 공공데이터 셋에서 파일 다운로드 했을 때 , 실제로 jupyter로 불러오면 원하는 포맷 출력이 안되는 경우가 있는데, 이는 쉼표 대신 공백을 사용하고 있는것과 , 칼럼이름을 한글로 사용하고 있는경우 굉장히 불편해 진다. 따라서 우선 첫작업으로 ,은 구분자가 되므로 1,000 같은 표현은 사용해서는 안된다. 따라서 바꾸기 버튼에서 모든 , 를 제거 후에 공백 지정후에 공백을 ,로 바꿔준다. 그 다음에 필요 없는 튜플들을 삭제해 주고, 칼럼이름을 영어로 다시 rename 시켜준다. 정렬, 데이터 프레임 기법. bike["area"].value_counts().sort_index().tolist() 이렇게 해주면 bike["area"]에서 중복 값에 대한 갯수들을 뽑아주고 sort_index()를 하면 index별로 즉 이름값의 오름차순으로 정렬이 된다. ㄱ,ㄴ,ㄷ..... 순 그리고 tolist()가 붙게 되면 그중에 숫자 값 즉 count값이 리스트로 뽑아진다. z = park["size"].sort_index().keys().tolist() 같은 방식으로 정렬 후에 keys()로 하면 문자 값 즉 value값이 리스트로 뽑아진다. data = {"name" : z, "park" : x, "count" : y } df = pd.DataFrame(data, columns = ["name", "park","co.. 파이썬 유니코드 에러 한글 사용시, 아래처럼 에러 메시지가 나오는 경우 UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc1 in position 26: invalid start byte encoding='cp949' 를 추가해준다. bike = pd.read_csv("bike.csv",encoding='CP949') 그리고 맨위에 주석 추가. #-*- coding:utf-8 -*- 파이썬 개발환경 구축. 1. 파이썬 공식 홈페이지에서 파이썬 다운로드 후 시스템 설정에서 path-편집에서 파이썬이 저장된 경로의 주소를 입력시킨 후 cmd 창에서 python 명령어 입력시 버전이 나옴을 확인. 2. pip install jupyter로 주피터 노트북 설치후 jupyter notebook 명령어로 웹창에서 주피터 개발환경이 열림. 이때 cmd 창을 닫으면 서버연결이 닫히므로 주의. 주피터에서 python 파일을 생성 할때는 빈 디렉토리를 만들고 그안에서 만들어야함. 3. 라이브러리 설치 1) 데이터 구조 제공 패키지 pip install pandas 2) 수학 및 과학 연산 제공 패키지 pip install numpy 3) 데이터 분석결과 시각화 도구 pip install matplotlib pip insta.. 이전 1 2 3 4 다음