Python
-
[python] 파이썬을 이용한 빅 데이터 실습 10 - 데이터 정렬Languages/python 2021. 11. 1. 15:09
정렬 어떤 값을 기준으로 어떤 값의 순서를 매기는 행위 sort_values() 데이터의 값을 기준으로 정렬하는 함수 sort_values() 로우 인덱스나 컬럼 인덱스들을 정렬해 주는 함수 sort_values() , sort_values() -> 동일한 인자들을 제공 (by=None, axis=0, ascending=True, inplace=False, kind='quicksort', na_position='last') by=None : 정렬한 기준 변수 -> 필수지정 axis=0 : index or columns(default) ascending=True : Ture -> 오름차순 , False -> 내림차순 inplace=False : 정렬 결과를 원본에 반영할 것인지 True -> 반영 Fasl..
-
[python] 파이썬을 이용한 빅 데이터 실습 9 - 데이터 통합Languages/python 2021. 11. 1. 14:53
컬럼 값을 기준으로 합치기 merge() -인자값 두 개의 데이터프레임에 동일한 컬럼명으로 merge를 하고 싶은 경우 -> on 인자에 컬렴명 사용 두 개의 데이터프레임에 서로 다른 컬럼명으로 merge를 하고 싶은 경우 ->left_on 과 right_on 에 각각 해당하는 컬럼명 기입 merge() 인자 옆에 적힌 값 = 인자의 기본값 기본값이 없는 경우 함수 사용할 때 인자값을 꼭 입력해야 함. 미입력시, 오류 발생 기본값이 있는 경우 인자값을 입력하지 않으면, 기본값으로 함수가 실행됨 예시) DataFrame.merge(left, right, how='inner', on=None, left_on=None, right_on=None, ... how 부터는 없어도 함수 동작은 가능함 how 인자 어..
-
[python] 파이썬을 이용한 빅 데이터 실습 8 - 데이터 입출력카테고리 없음 2021. 11. 1. 14:23
외부에서 제공해주는 데이터 사용하기 파일에서 데이터 읽어오기 import pandas as pd from pandas import Series, DataFrame csv파일 데이터 입출력 csv 파일 읽기 - read_csv() 파일은 현재 사용하는 쥬피터 실습 파일이 넣어진 파일 안에 ex1의 파일이 존재한단 하의 실습입니다. 보통은 c드라이브에 들어있습니다. pd.read_csv('data/ex1.csv') 실행결과 abcdmessage 01234hello 15678world 29101112foo sep인자 활용하기 각각을 columns으로 쪼개고 싶을 때 인자값(sep)을 사용 - 특정 구분자를 기준으로 필드들이 구분되어 있는 csv형태의 파일은 모두 처리 가능하므로 파일의 확장자는 상관이 없다 p..
-
[python] 파이썬을 이용한 빅 데이터 실습 7 - DataFrame , 계층색인Languages/python 2021. 11. 1. 13:43
실행결과는 복사 붙여넣기이므로 이상해도 양해부탁드립니다. DataFrame 고차원 데이터 다루기 계층 색인(다중 색인) 여러 개의 인덱스가 계층을 이루고 있기 때문에 계층 색인 혹은 다중 색인이라고 한다. 계층색인을 데이터프레임에 적용하여 3차원 이상의 고차원 데이터를 처리 가능 import pandas as pd from pandas import Series, DataFrame import numpy as np 샘플 데이터 생성 로우 인덱스 학생들에 대한 정보를 담고 있는 단순 1차원 인덱스 컬럼 인덱스 다중 색인(계층 색인) # 샘플 데이터 생성 np.random.seed(0) df = pd.DataFrame(np.random.randint(50, 100, (5, 6)), columns=[[2019,..
-
[python] 파이썬을 이용한 빅 데이터 실습 6- DataFrameLanguages/python 2021. 10. 30. 19:13
실행결과는 복사 붙여넣기이므로 이상해도 양해부탁드립니다. 데이터프레임에 새로운 컬럼 추가하기 df4 = DataFrame({'Class': ['IoT','Network', 'Economy','Big Data', 'Cloud'], 'Year': [2018, 2017, 2018, 2018, 2019], 'Price': [100, 125, 132, 312, 250], 'Location': ['Korea','Korea', 'Korea', 'US','Korea']}, index=['C01','C02','C03', 'C04', 'C05']) df4 컬럼 추가하기 1 내가 추가하고자 하는 컬럼의 명을 지정해 준 후 데이터 값을 할당해준다. limitStudent 컬럼(정원)을 추가하고, 값을 모두 40으로 저장 df..
-
[python] 파이썬을 이용한 빅 데이터 실습 5- DataFrameLanguages/python 2021. 10. 30. 18:50
데이터 프레임 조회하기 테스트 데이터 프레임 생성 df4 = DataFrame({'Class': ['IoT','Network', 'Economy','Big Data', 'Cloud'], 'Year': [2018, 2017, 2018, 2018, 2019], 'Price': [100, 125, 132, 312, 250], 'Location': ['Korea','Korea', 'Korea', 'US','Korea']}, index=['C01','C02','C03', 'C04', 'C05']) df4 실행결과 원하는 열(컬럼)만 조회하기 -Class만 조회하기 색인 기호 대괄호([])안에 색인하고자 하는 컬럼 인덱스의 이름을 지정해준다 df4['Class'] 실행결과 C01 IoT C02 Network C03..
-
[python] 파이썬을 이용한 빅 데이터 실습 4- DataFrameLanguages/python 2021. 10. 30. 18:04
DataFrame 주요속성과 함수 실습 DataFrame 속성 조회하기(속성을 조회할 때에는 ()를 사용하지 않으니 주의!!!!) 값이 들어있는 데이터프레임 생성 # 3. 사전 타입 데이터를 이용하여 데이터 프레임 생성하기 인구통계 = {'서울': [950, 945, 938.5], '대전':[50, 151, 145], '대구':[85, 88, 92], '부산':[180, 187, 192], '광주':[74, 80, 80] } df3 = DataFrame(data = 인구통계, index = [2018,2019,2020]) df3 실행결과 df3 데이터프레임 생성 서울대전대구부산광주 2018950.0508518074 2019945.01518818780 2020938.51459219280 index : 데이..
-
[python] 파이썬을 이용한 빅데이터 실습1 - SeriesLanguages/python 2021. 9. 12. 20:50
jupyter notebook 사용하여 실습 https://www.anaconda.com/products/individual Anaconda | Individual Edition Anaconda's open-source Individual Edition is the easiest way to perform Python/R data science and machine learning on a single machine. www.anaconda.com 에서 다운로드 가능하다 빅데이터 관련 기술 데이터 소스 - 수집 -저장 - 처리 - 분석 - 표현 사용하는 언어는 python 1991년 귀도 반 로썸이 발표한 인터프리티 언어 비단뱀이라는 뜻 파이썬(python) 특징 간결하고 가독성이 높은 문법 인터프리티언..