본문 바로가기

분류 전체보기

(1196)
kaggle 그림으로 데이터 분석 import seaborn as sns #그림을 그림. import matplotlib.pyplot as plt #그림을 그릴 판을 만듬 _,banana = plt.subplots(2,1,figsize =(20,12)) #변수 두개가 필요한데 하나는 안써도 되므로, _이렇게 사용해도됨. #매개변수로 들어가는건 1,2 = 1열 2행, figuresize sns.boxplot(train["year"],train["count"],ax = banana[0]) #아까 쓴 변수(그림판)에 count에 관하여 그림을 그림. sns.distplot(np.log(train["count"]),ax = banana[1]) boxplot 같은 경우는 x축과 y축을 설정해서 칼럼관계에 대해서 분석이 가능하고, distplot은..
Store Item Demand Forecasting Challenge 2회차 38.34583 - > 14.49390 (251/461) 1. 그냥 생각없이 칼럼을 추가하는 것이 아니고 date 에 포함된 것중에 group으로 묶였을 때 값의 변화에 따라 sales에 영향을 주는 칼럼만을 추가함. 2. 하이퍼 파라미터를 조절함 150으로 하니까 14점대 까지 내려갔고 300까지 올렸으나 그이상에서는 미비한 차이만 존재 했음. 3. 로그로 정규분포처럼 만들어봤는데 오히려 역효과 근데 표에서도 봤듯이 애초에 정규분포와 비슷한 형태였음. 그렇다면 데이터값을 건드리는 것이 좋은점보다 안좋은 점이 더 커지는 듯 하다. 의문) 그냥 어떤 칼럼에 의해 원하는 목표값이 달라진다면 의미있는 칼럼인가? 이걸 표로 확인하는 법이 뭐였지? # This Python 3 environment comes wi..
백준 7576번 토마토 문제 철수의 토마토 농장에서는 토마토를 보관하는 큰 창고를 가지고 있다. 토마토는 아래의 그림과 같이 격자 모양 상자의 칸에 하나씩 넣어서 창고에 보관한다. 창고에 보관되는 토마토들 중에는 잘 익은 것도 있지만, 아직 익지 않은 토마토들도 있을 수 있다. 보관 후 하루가 지나면, 익은 토마토들의 인접한 곳에 있는 익지 않은 토마토들은 익은 토마토의 영향을 받아 익게 된다. 하나의 토마토의 인접한 곳은 왼쪽, 오른쪽, 앞, 뒤 네 방향에 있는 토마토를 의미한다. 대각선 방향에 있는 토마토들에게는 영향을 주지 못하며, 토마토가 혼자 저절로 익는 경우는 없다고 가정한다. 철수는 창고에 보관된 토마토들이 며칠이 지나면 다 익게 되는지, 그 최소 일수를 알고 싶어 한다. 토마토를 창고에 보관하는 격자모양의 상자들..
백준 2331번 반복수열 문제 다음과 같이 정의된 수열이 있다. D[1] = A D[n] = D[n-1]의 각 자리의 숫자를 P번 곱한 수들의 합 예를 들어 A=57, P=2일 때, 수열 D는 {57, 74(=5^2+7^2=25+49), 65, 61, 37, 58, 89, 145, 42, 20, 4, 16, 37, …}이 된다. 그 뒤에는 앞서 나온 수들(57부터가 아니라 58부터)이 반복된다. 이와 같은 수열을 계속 구하다 보면 언젠가 이와 같은 반복수열이 된다. 이때, 반복되는 부분을 제외했을 때, 수열에 남게 되는 수들의 개수를 구하는 프로그램을 작성하시오. 위의 예에서는 {57, 74, 65, 61}의 네 개의 수가 남게 된다. 입력 첫째 줄에 A(1 ≤ A ≤ 9999), P(1 ≤ P ≤ 5)가 주어진다. 출력 첫째 ..
백준 1972번 놀라운 문자열 문제 대문자 알파벳으로만 이루어져 있는 문자열이 있다. 이 문자열에 대해서 ‘D-쌍’이라는 것을 정의할 수 있는데, 이 문자열에 포함되어 있는, 거리가 D인 두 문자를 순서대로 나열한 것을 이 문자열의 D-쌍이라고 한다. 예를 들어 문자열이 ZGBG라고 하자. 이 문자열의 0-쌍은 ZG, GB, BG가 되고, 이 문자열의 1-쌍은 ZB, GG가 되며, 이 문자열의 2-쌍은 ZG가 된다. 문자열의 길이가 N이라고 할 때, 0-쌍부터 (N-2)-쌍까지가 정의됨을 알 수 있다. 만일 정의되는 D에 대해, 어떤 문자열의 모든 D-쌍들이 서로 다를 때, 이 문자열을 D-유일하다고 한다. 위의 예를 보면, 0-쌍들은 ZG, GB, BG로 모두 다르다. 따라서 이 문자열은 0-유일하며, 마찬가지로 1-유일하고, 2-..
백준 10769번 행복한지 슬픈지 문제 승엽이는 자신의 감정을 표현하기 위해서 종종 문자 메시지에 이모티콘을 넣어 보내곤 한다. 승엽이가 보내는 이모티콘은 세 개의 문자가 붙어있는 구조로 이루어져 있으며, 행복한 얼굴을 나타내는 :-) 와 슬픈 얼굴을 나타내는 :-( 가 있다. 혜성이는 승엽이의 이모티콘을 귀여운 척이라고 생각해 매우 싫어하므로, 승엽이의 문자가 오면 전체적인 분위기만 판단해서 알려주는 프로그램을 작성하고 싶다. 입력 첫 줄에 최소 1개에서 최대 255개의 문자들이 입력된다. 출력 출력은 다음 규칙에 따라 정해진다. 어떤 이모티콘도 포함되어 있지 않으면, none 을 출력한다. 행복한 이모티콘과 슬픈 이모티콘의 수가 동일하게 포함되어 있으면, unsure 를 출력한다. 행복한 이모티콘이 슬픈 이모티콘보다 많이 포함되어 있..
Bike Sharing Demand (2) 성능 개선 2회차 0.38 300등 안으로 진입. 성능 개선 1) 필요한 데이터 찾기. 연관성을 그림이나 groupby를 사용하여 시각화 시켜 확인. 2) 앙상블 기법 = 두가지의 feature로 result가 될 수 있는 값을 만드는 방법. 3) 새로운 머신러닝 모델 사용하기. ->과제 # This Python 3 environment comes with many helpful analytics libraries installed # It is defined by the kaggle/python docker image: https://github.com/kaggle/docker-python # For example, here's several helpful packages to load in import numpy as..
백준 11650번 좌표 정렬하기 문제 2차원 평면 위의 점 N개가 주어진다. 좌표를 x좌표가 증가하는 순으로, x좌표가 같으면 y좌표가 증가하는 순서로 정렬한 다음 출력하는 프로그램을 작성하시오. 입력 첫째 줄에 점의 개수 N (1 ≤ N ≤ 100,000)이 주어진다. 둘째 줄부터 N개의 줄에는 i번점의 위치 xi와 yi가 주어진다. (-100,000 ≤ xi, yi ≤ 100,000) 좌표는 항상 정수이고, 위치가 같은 두 점은 없다. 출력 첫째 줄부터 N개의 줄에 점을 정렬한 결과를 출력한다. 거저 먹는 문제. 동기에게 설명하면서 복습. #include #include #include using namespace std; int N; vector vec; int main(void) { ios::sync_with_stdio(fals..