라이브러리 4

Matplotlib의 기본이해

Matplotlib는 파이썬의 데이터 시각화 라이브러리로 다양한 유형의 그래프를 생성할 수 있습니다. 다음은 Matplotlib를 사용하여 그릴 수 있는 7가지 주요 그래프 유형과 그래프가 어떤 데이터 시각화에 효과적인지 설명 및 예시 파이썬 코드입니다. 선 그래프 (Line Plot): 데이터 포인트 간의 연속적인 관계를 시각화하는 데 사용됩니다. 예시: 시간에 따른 주식 가격의 변화를 표시 import matplotlib.pyplot as plt x = [1, 2, 3, 4, 5] y = [10, 15, 13, 18, 20] plt.plot(x, y) plt.xlabel('시간') plt.ylabel('주식 가격') plt.title('주식 가격 변화') plt.show() 막대 그래프 (Bar Pl..

Numpy 라이브러리 리뷰 (1/2)

행렬계산, 데이터 인덱싱, 배열변환 등에서 많은 편의를 제공하는 numpy를 리뷰하는 시간을 갖겠습니다. 가급적 예시의 코드들을 '직접 써보며' 확인하신다면, 학습효과가 배가될 것으로 생각합니다. 일반적인 리스트나 튜플에서 배열에 대한 연산이 쉽지않습니다. numpy의 강점입니다. numpy는 난수생성과 그 난수의 조건 슬라이싱, 값교체 등에서 편리한 기능을 제공합니다. np.where와 그냥 인덱싱을 통한 값 호출 시, 배열 구조 자체가 달라집니다. 이는 파이썬을 활용한 계산에서 숙지해야 할 사항인 것 같아 내용을 담았습니다. 그러면 numpy 적용 시 주의해야 할 사항은 무엇이 있을까요? 화면보시죠. 하나의 자료형만을 담습니다. 그래서 배열에서 정수와 실수가 섞인 경우 전부 정수 혹은 실수로 바뀝니다..

Pandas library

Pandas는 파이썬 라이브러리 중 하나로, 데이터를 쉽고 빠르게 정리하고 분석할 수 있는 도구입니다. Pandas와 함께 자주 사용되는 라이브러리인 NumPy는 다차원 배열 객체를 제공하는 반면, Pandas는 표 형식의 데이터 작업을 위해 설계된 DataFrame 객체를 사용합니다. Series는 Pandas의 1차원 배열 객체로, 데이터 값과 해당 값의 위치를 대표하는 인덱스로 구성됩니다. 시리즈는 1차원 배열 객체이며 데이터 값(value)와 그 값의 위치를 대표하는 인덱스(index)로 이루어져 있습니다. 예시는 아래 코드 예시를 확인하실 수 있습니다. DataFrame은 2차원 자료 구조로, 행과 열이 있는 테이블 형식을 띄며, 각 열은 서로 다른 값 유형을 가질 수 있습니다. 각 열과 행은 ..