데이터 분석/자료구조 4

자료구조 - 세트 (set)

# 집합 자료형 set() # 중복된 데이터를 제거하고 순서는 랜덤으로 반환한다. (인덱스는 못 씀!) s1 = set([1,2,3,4]) s2 = set([3,4,5,6]) return s1 & s2 # 교집합 -> {4, 5, 6} return s1.intersection(s2) # 교집합 -> {4, 5, 6} return s1 | s2 # 합집합 -> {1, 2, 3, 4, 5, 6} return s1.union(s2) # 합집합 -> {1, 2, 3, 4, 5, 6} return s1 – s2 # 차집합 -> {1, 2} return s2 – s1 -> {5, 6} return s1.difference(s2) # 차집합 -> {1, 2} return s2.difference(s1) -> {5, ..

자료구조 - 튜플 (tuple)

튜플(Tuple) 튜플은 리스트와 비슷하지만, 한 번 선언되면 아이템 변경(수정, 삭제 등)이 불가능하다. ‘()’를 이용해서 선언하고, 데이터의 구분은 ‘,’를 이용한다. 또한, 리스트와 마찬가지로 숫자, 문자 등 모든 종류의 데이터를 같이 저장할 수 있으며 튜플 안에 또 다른 튜플을 저장할 수도 있다. in / not in 키워드 in과 not in 키워드를 이용하면 문자열, 리스트, 튜플 등에서 아이템의 존재 유무를 알 수 있다. 튜플 결합 튜플은 아이템 변경이 불가능하기 때문에 리스트처럼 extend는 사용할 수 없고, 덧셈 연산자만 사용할 수 있다. name3 = name1 + name2와 같이 튜플1과 튜플2가 더해진 새로운 튜플이 만들어진다. 이때, name1 튜플 안에 있는 ‘홍길동’이라는..

자료구조 - 리스트 (list)

리스트(List) 자료구조에 대해 하나씩 살펴보자면 먼저, 리스트란 배열과 같이 여러 개의 데이터를 나열한 자료구조이다. []를 이용하여 선언하고, 데이터의 구분은 ‘,’를 이용한다. 리스트 안에는 숫자, 문자, 논리형 등 모든 기본 데이터를 함께 저장할 수 있다. datas = [10, 20, 30, [40, 50, 60]]와 같이 리스트에 또 다른 컨테이너 자료형 데이터를 저장할 수도 있다. 인덱스(Index) 인덱스란 아이템에 자동으로 부여되는 번호표이며, 0부터 시작한다. students[0]과 같이 인덱스를 이용하여 리스트 아이템을 조회할 수 있다. 이때, 인덱스로 조회한 데이터의 타입은 해당 데이터의 종류에 따라 list 타입이 아닌 str, int, float 등으로 나타난다. len() l..

자료구조 - 자료형

자료구조란 여러 개의 데이터가 묶여있는 자료형을 컨테이너 자료형이라고 하고, 이러한 컨테이너 자료형의 데이터 구조를 자료구조라고 한다. 자료구조는 각각의 컨테이너 자료형에 따라 차이가 있으며, 파이썬의 대표적인 컨테이너 자료형으로는 리스트(List), 튜플(Tuple), 딕셔너리(Dic), 세트(Set)가 있다. # List (데이터 변경 가능) students = [‘홍길동’, ‘박찬호’, ‘박승철’, ‘김지은’] # Tuple (데이터 변경 불가) jobs = (‘의사’, ‘속기사’, ‘전기기사’, ‘회계사’) # Dic (key 값에 해당하는 value 값으로 이루어진 구조) scores = {‘kor’:88, ‘eng’:91, ‘mat’:95, ‘sci’:90} # Set (중복된 자료 허용X) ..