Languages/python
-
[python] 파이썬을 이용한 빅 데이터 실습 10 - 데이터 정렬Languages/python 2021. 11. 1. 15:09
정렬 어떤 값을 기준으로 어떤 값의 순서를 매기는 행위 sort_values() 데이터의 값을 기준으로 정렬하는 함수 sort_values() 로우 인덱스나 컬럼 인덱스들을 정렬해 주는 함수 sort_values() , sort_values() -> 동일한 인자들을 제공 (by=None, axis=0, ascending=True, inplace=False, kind='quicksort', na_position='last') by=None : 정렬한 기준 변수 -> 필수지정 axis=0 : index or columns(default) ascending=True : Ture -> 오름차순 , False -> 내림차순 inplace=False : 정렬 결과를 원본에 반영할 것인지 True -> 반영 Fasl..
-
[python] 파이썬을 이용한 빅 데이터 실습 9 - 데이터 통합Languages/python 2021. 11. 1. 14:53
컬럼 값을 기준으로 합치기 merge() -인자값 두 개의 데이터프레임에 동일한 컬럼명으로 merge를 하고 싶은 경우 -> on 인자에 컬렴명 사용 두 개의 데이터프레임에 서로 다른 컬럼명으로 merge를 하고 싶은 경우 ->left_on 과 right_on 에 각각 해당하는 컬럼명 기입 merge() 인자 옆에 적힌 값 = 인자의 기본값 기본값이 없는 경우 함수 사용할 때 인자값을 꼭 입력해야 함. 미입력시, 오류 발생 기본값이 있는 경우 인자값을 입력하지 않으면, 기본값으로 함수가 실행됨 예시) DataFrame.merge(left, right, how='inner', on=None, left_on=None, right_on=None, ... how 부터는 없어도 함수 동작은 가능함 how 인자 어..
-
[python] 파이썬을 이용한 빅 데이터 실습 7 - DataFrame , 계층색인Languages/python 2021. 11. 1. 13:43
실행결과는 복사 붙여넣기이므로 이상해도 양해부탁드립니다. DataFrame 고차원 데이터 다루기 계층 색인(다중 색인) 여러 개의 인덱스가 계층을 이루고 있기 때문에 계층 색인 혹은 다중 색인이라고 한다. 계층색인을 데이터프레임에 적용하여 3차원 이상의 고차원 데이터를 처리 가능 import pandas as pd from pandas import Series, DataFrame import numpy as np 샘플 데이터 생성 로우 인덱스 학생들에 대한 정보를 담고 있는 단순 1차원 인덱스 컬럼 인덱스 다중 색인(계층 색인) # 샘플 데이터 생성 np.random.seed(0) df = pd.DataFrame(np.random.randint(50, 100, (5, 6)), columns=[[2019,..
-
[python] 파이썬을 이용한 빅 데이터 실습 6- DataFrameLanguages/python 2021. 10. 30. 19:13
실행결과는 복사 붙여넣기이므로 이상해도 양해부탁드립니다. 데이터프레임에 새로운 컬럼 추가하기 df4 = DataFrame({'Class': ['IoT','Network', 'Economy','Big Data', 'Cloud'], 'Year': [2018, 2017, 2018, 2018, 2019], 'Price': [100, 125, 132, 312, 250], 'Location': ['Korea','Korea', 'Korea', 'US','Korea']}, index=['C01','C02','C03', 'C04', 'C05']) df4 컬럼 추가하기 1 내가 추가하고자 하는 컬럼의 명을 지정해 준 후 데이터 값을 할당해준다. limitStudent 컬럼(정원)을 추가하고, 값을 모두 40으로 저장 df..
-
[python] 파이썬을 이용한 빅 데이터 실습 5- DataFrameLanguages/python 2021. 10. 30. 18:50
데이터 프레임 조회하기 테스트 데이터 프레임 생성 df4 = DataFrame({'Class': ['IoT','Network', 'Economy','Big Data', 'Cloud'], 'Year': [2018, 2017, 2018, 2018, 2019], 'Price': [100, 125, 132, 312, 250], 'Location': ['Korea','Korea', 'Korea', 'US','Korea']}, index=['C01','C02','C03', 'C04', 'C05']) df4 실행결과 원하는 열(컬럼)만 조회하기 -Class만 조회하기 색인 기호 대괄호([])안에 색인하고자 하는 컬럼 인덱스의 이름을 지정해준다 df4['Class'] 실행결과 C01 IoT C02 Network C03..
-
[python] 파이썬을 이용한 빅 데이터 실습 4- DataFrameLanguages/python 2021. 10. 30. 18:04
DataFrame 주요속성과 함수 실습 DataFrame 속성 조회하기(속성을 조회할 때에는 ()를 사용하지 않으니 주의!!!!) 값이 들어있는 데이터프레임 생성 # 3. 사전 타입 데이터를 이용하여 데이터 프레임 생성하기 인구통계 = {'서울': [950, 945, 938.5], '대전':[50, 151, 145], '대구':[85, 88, 92], '부산':[180, 187, 192], '광주':[74, 80, 80] } df3 = DataFrame(data = 인구통계, index = [2018,2019,2020]) df3 실행결과 df3 데이터프레임 생성 서울대전대구부산광주 2018950.0508518074 2019945.01518818780 2020938.51459219280 index : 데이..
-
[python] 파이썬을 이용한 빅데이터 실습 3 - DataFrameLanguages/python 2021. 9. 12. 23:08
DataFrame Serires 1차원 형태의 데이터(값,value)와 인덱스(index 인덱스의 라벨로 표현) 로 구성 DataFrame 2차원 형태의 데이터(값,value)와 2개의 인덱스(index) 로 구성 데이터 타입의 제약 x #표와 같다고 보면 됌 로우 인덱스와 칼럼 인덱스의 차이점 1. 로우 인덱스는 데이터 순서가 존재하지만 (숫자 , 문자 인덱스로 색인이 가능하다) 칼럼 인덱스는 데이터 순서가 없다 2. 대부분의 함수에서 axis(축) 인자 제공 axis = 0 이면 로우 인덱스 axis = 1이면 칼럼 인덱스 실습해보자 인덱스 변경
-
[python] 파이썬을 이용한 빅데이터 실습 2 조건 색인Languages/python 2021. 9. 12. 21:32
인덱스를 활용하여 내가 원하는 데이터 선택하기 조건 색인(불리언 색인)을 활용하여 내가 원하는 데이터 선택하기1 조건색인 불리언 색인 혹은 Fancy 색인 indexing Series indexing Series 전체 데이터 중에서 내가 원하는 데이터만 선택해 오는 방법임 1) 특정 인덱스 선택하기 숫자 인덱스와 인덱스 라벨 모두 가능 sample = pd.Series([85, 90, 75, 55, 45, 90, 95, 85, 90, 100], index = ['a','b','c','d','e','f','g','h','i','j']) sample a 85 b 90 c 75 d 55 e 45 f 90 g 95 h 85 i 90 j 100 dtype: int64 01. 숫자 인덱스인 경우 sample[2] ..