본문 바로가기
Python/Python

Pandas 라이브러리 [Series 데이터 생성 / 내부 데이터 확인 / 인덱싱, 슬라이싱 / 데이터 추가, 갱신 / ]

by leehii 2022. 6. 8.

ㅁ 판다스

import pandas as pd



ㅇ 판다스가 제공하는 데이터 -: Series(1차원), DataFrame(2차원)

 

Seires = index + value로 이루어진 1차원데이터

DataFrame = 행과 열로 이루어짐

 

ㅇ Series 

 


-- 생성하기


Series명 = pd.Seires(데이터값)

 



-- 활용

Series명.values

:  Series 안의 values값 확인하기

 


Series명.index

인덱스 값 확인하기 (보통 인덱스 번호에 별도의 이름을 주고 확인할때 씀)


Series명.name = 'a' 

변수명이 뭘 의미하는 데이터인지 이름주기

 


Series명.index.name = 'b'  

인덱스번호에 이름주기

(ex)


population = pd.Series ([0, 10, 20] )
-->> 인구라는 변수명으로 value값 0명, 10명, 20명을 줌

population =( pd.Series ([10,20,30], index = ['서울', '부산' ,'광주'] ))
-->> 인덱스번호에 이름을 줘서 서울 인구 =0... 이런식으로 생성

 

population.index.name = '도시정보'

-->> 인덱스가 어떤 자료를 나타내는지 표시함




population.name = '인구데이터' 

-->> 이 데이터는 인구수를 나타내는 자료임을 설명

 

 

---------------------------------------------------------------------------------



인덱싱은 변수명[인덱스번호] 혹은 변수명[지정한 이름]으로 가능


슬라이싱은 변수명[시작인덱스 : 끝인덱스+1] 혹은 변수명[시작이름:끝이름]


boolean 인덱싱은 조건문으로 적은 논리연산자값을 어디랑 비교할지 적어줘야함


-->> 

population>=20이라는 인구수 20명이상이 참인 도시만 확인하려는 

조건식을 적었다면 population[조건식]의 형태로!



dictionarty 형태로 생성하면 index값이 key값, value값이 value값이 됨
비어있는 데이터를 없앨때는 변수명.notnull()
비어있는 데이터 출력은 변수명.isnull()

 


추가하고 싶다면 그냥 변수명[새로운 인덱스명] = value값 으로 생성
수정도 똑같이 변수명[바꾸고싶은 인덱스명] = value로 변경하기
삭제는 del 변수명[인덱스명]