Python/Python
Pandas 라이브러리 [Series 데이터 생성 / 내부 데이터 확인 / 인덱싱, 슬라이싱 / 데이터 추가, 갱신 / ]
leehii
2022. 6. 8. 14:14
ㅁ 판다스
import pandas as pd
ㅇ 판다스가 제공하는 데이터 -: Series(1차원), DataFrame(2차원)
Seires = index + value로 이루어진 1차원데이터
DataFrame = 행과 열로 이루어짐
ㅇ Series
-- 생성하기
Series명 = pd.Seires(데이터값)
-- 활용
Series명.values
: Series 안의 values값 확인하기
Series명.index
인덱스 값 확인하기 (보통 인덱스 번호에 별도의 이름을 주고 확인할때 씀)
Series명.name = 'a'
변수명이 뭘 의미하는 데이터인지 이름주기
Series명.index.name = 'b'
인덱스번호에 이름주기
(ex)

population = pd.Series ([0, 10, 20] )
-->> 인구라는 변수명으로 value값 0명, 10명, 20명을 줌
population =( pd.Series ([10,20,30], index = ['서울', '부산' ,'광주'] ))
-->> 인덱스번호에 이름을 줘서 서울 인구 =0... 이런식으로 생성
population.index.name = '도시정보'
-->> 인덱스가 어떤 자료를 나타내는지 표시함
population.name = '인구데이터'
-->> 이 데이터는 인구수를 나타내는 자료임을 설명
---------------------------------------------------------------------------------
인덱싱은 변수명[인덱스번호] 혹은 변수명[지정한 이름]으로 가능
슬라이싱은 변수명[시작인덱스 : 끝인덱스+1] 혹은 변수명[시작이름:끝이름]
boolean 인덱싱은 조건문으로 적은 논리연산자값을 어디랑 비교할지 적어줘야함
-->>
population>=20이라는 인구수 20명이상이 참인 도시만 확인하려는
조건식을 적었다면 population[조건식]의 형태로!
dictionarty 형태로 생성하면 index값이 key값, value값이 value값이 됨
비어있는 데이터를 없앨때는 변수명.notnull()
비어있는 데이터 출력은 변수명.isnull()
추가하고 싶다면 그냥 변수명[새로운 인덱스명] = value값 으로 생성
수정도 똑같이 변수명[바꾸고싶은 인덱스명] = value로 변경하기
삭제는 del 변수명[인덱스명]
