ㅁ 판다스
import pandas as pd
ㅇ 판다스가 제공하는 데이터 -: Series(1차원), DataFrame(2차원)
Seires = index + value로 이루어진 1차원데이터
DataFrame = 행과 열로 이루어짐
ㅇ Series
-- 생성하기
Series명 = pd.Seires(데이터값)
-- 활용
Series명.values
: Series 안의 values값 확인하기
Series명.index
인덱스 값 확인하기 (보통 인덱스 번호에 별도의 이름을 주고 확인할때 씀)
Series명.name = 'a'
변수명이 뭘 의미하는 데이터인지 이름주기
Series명.index.name = 'b'
인덱스번호에 이름주기
(ex)
population = pd.Series ([0, 10, 20] )
-->> 인구라는 변수명으로 value값 0명, 10명, 20명을 줌
population =( pd.Series ([10,20,30], index = ['서울', '부산' ,'광주'] ))
-->> 인덱스번호에 이름을 줘서 서울 인구 =0... 이런식으로 생성
population.index.name = '도시정보'
-->> 인덱스가 어떤 자료를 나타내는지 표시함
population.name = '인구데이터'
-->> 이 데이터는 인구수를 나타내는 자료임을 설명
---------------------------------------------------------------------------------
인덱싱은 변수명[인덱스번호] 혹은 변수명[지정한 이름]으로 가능
슬라이싱은 변수명[시작인덱스 : 끝인덱스+1] 혹은 변수명[시작이름:끝이름]
boolean 인덱싱은 조건문으로 적은 논리연산자값을 어디랑 비교할지 적어줘야함
-->>
population>=20이라는 인구수 20명이상이 참인 도시만 확인하려는
조건식을 적었다면 population[조건식]의 형태로!
dictionarty 형태로 생성하면 index값이 key값, value값이 value값이 됨
비어있는 데이터를 없앨때는 변수명.notnull()
비어있는 데이터 출력은 변수명.isnull()
추가하고 싶다면 그냥 변수명[새로운 인덱스명] = value값 으로 생성
수정도 똑같이 변수명[바꾸고싶은 인덱스명] = value로 변경하기
삭제는 del 변수명[인덱스명]
'Python > Python' 카테고리의 다른 글
카톡데이터 접근 실습 [ .info( ) 데이터 확인 / str.replace( ), str.split( ) / .value_counts( ) / plt.figure( ), plt.scatter( ), plt.grid( ) / loc 인덱싱과 boolean인덱싱 활용 / ] (0) | 2022.07.28 |
---|---|
Pandas Library 최종실습 - 범죄현황 데이터 (0) | 2022.06.13 |
Numpy 라이브러리 (넘파이에서 제공하는 범용함수 sum, mean, sqrt / 영화 평점 데이터 실습) (0) | 2022.06.08 |
for문을 이용한 영화 리뷰 분석하기 (0) | 2022.06.02 |
반복문 while문과 for문 / range()를 이용한 반복문 범위 설정 (0) | 2022.05.31 |