[Python] 판다스 오퍼레이션: &, |, apply(함수명)
판다스 오퍼레이션 - Pandas Opertations - 엄청 중요! - 데이터는 행이다. Ex) 경력이 3년 이상인 사람의 데이터를 가져오시오 - 경력이 3년 이상인 행 - 결과가 Ture, False로만 나와서, iloc는 사용불가 - loc[행,렬] - 데이터는 행 - df[ df['Years of Experience']>=3 ] ㄴ 이렇게 해도 되지만, 나중에 헷갈리므로, 이렇게 쓰지 않기를 권장한다. Ex) 경력이 3년 이상인 사람의, 이름과 시급 정보를 가져오시오 df.loc[ df['Years of Experience']>=3 , ['Employee Name','Salary [$/h]'] ] - 조건문과 비교 기호는 같다. ㄴ 다만, ‘and’와 ‘or’는 다르게 표기한다. ㄴ and =>..
더보기
[Python] 판다스: head(), tail(), describe(), info(), astype(), contains(), isin()
- 앞 줄만 간단 읽기: 판다스 데이터프레임 변수명.head() ㄴ 괄호 안에 아무 데이터도 없을 시, 기본 5행을 출력한다. ㄴ 괄호 안에 숫자 입력시, 해당 숫자만큼의 행을 앞에서부터 출력한다. - 뒷 줄만 간단 읽기: 판다스 데이터프레임 변수명.tail() ㄴ 괄호 안에 아무 데이터도 없을 시, 기본 5행을 출력한다. ㄴ 괄호 안에 숫자 입력시, 해당 숫자만큼의 행을 뒤에서부터 출력한다. - e +03 : e를 10으로 보면 된다. 10의 3승이라는 뜻 - 데이터 전반 내용 요약본: 판다스 데이터프레임 변수명.describe() ㄴ 갯수, 평균, 표준편차, 최소값, 최대값 ,사분위를 볼수 있다. ㄴ 50%: 중앙값이라는 뜻 - 문자열에 .describe() 时 ㄴ누가 어떤게 제일 많이 나온다. 등등..
더보기
[Python] 판다스 데이터 프레임: loc(), iloc(), rename(), append(), drop(), set_index(), reset_index()
레이블과 인덱스 - Accessing and Deleting elements in Pandas Series - 판다스에서 2차원을 데이터 프레임이라고 한다. - 용어 ㄴ 왼쪽 진한 글자가 인덱스 ㄴ 위쪽 진한 글자가 컬럼 ㄴ 안에 있는 데이터는 밸류 ㄴ DataFrame, index, Columns, values - NaN(Not a Number): 해당 항목에 값이 없음을 뜻함 ㄴ NaN은 실제로 우측과 같음: np.nan ㄴ NaN도 데이터에 포함임 데이터 프레임에서 데이터를 억세스 하는 방법 - Accessing Elements in Pandas DataFrames - 중요한부분! import pandas as pd items2 = [{'bikes': 20, 'pants': 30, 'watches'..
더보기