일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- 카카오 코테
- 스프링
- 카카오
- 시스템호출
- thymeleaf
- 프로그래머스
- 구조체배열
- python
- 코딩테스트
- Spring
- 컴포넌트스캔
- 카카오 알고리즘
- 가상면접사례로배우는대규모시스템설계기초
- @Autowired
- C++
- nestjs typeorm
- 파이썬
- spring boot
- 해시
- OpenCV
- git
- TypeORM
- C언어
- Nodejs
- 코테
- 알고리즘
- @Component
- AWS
- nestJS
- nestjs auth
- Today
- Total
목록파이썬 (5)
공부 기록장 💻
12. 데이터 시각화 matplotlib을 이용한 시각화 정보 시각화는 특잇값을 찾아내거나, 데이터 변형이 필요한지 알아보거나, 모델에 대한 아이디어를 찾기 위한 과정의 일부이다. 파이썬은 다양한 시각화 도구를 제공하고 있는데, matplotlib 기반의 도구들을 살펴보자. 2D 그래프를 위한 desktop package로, 파이썬에서 매트랩과 유사한 인터페이스를 2002년 지우너하기 시작했다. pdf, svg, jpg, png, bmp, gif 등 일반적으로 널리 사용되는 벡터 포맷과 래스터 포맷으로 그래프를 저장할 수 있다. matplotlib과 함께 seaborn 이라는 새로운 데이터 시각화 라이브러리도 살펴보자. 1. matplotlib API 간략하게 살펴보기 matplotlib을 다음과 같은 ..
CH7. 데이터 정제 및 준비 pandas 라이브러리는 데이터를 원하는 형태로 가공하는 작업을 유연하고 빠른 고수준의 알고리즘과 처리 기능을 제공 결측치, 중복 데이터, 문자열 처리 그리고 다른 분석 데이터 변환에 대한 도구들을 다루어보자 1. 누락된 데이터 처리하기 (Handling Missing Data) 누락 데이터를 처리하는 일은 데이터 분석 애플리케이션에서 흔히 발생하는 일이며, pandas의 설계 목표 중 하나는 누락 데이터를 가능한 한 쉽게 처리할 수 있도록 하는 것이다. 산술 데이터의 경우 pandas는 누락된 값을 쉽게 찾을 수 있도록 하기 위해 누락된 데이터를 실숫값인 NaN으로 취급한다. 분석을 위해 데이터를 정제하는 과정에서 결측치 자체를 데이터 수집 과정에서의 실수나 결측치로 인한..
Python for Data Analysis CH5. Panadas 데이터 분석을 위한 파이썬 판다스 라이브러리 Pandas 자료구조 파이썬에서 쉽고 빠르게 데이터를 분석하고 다루기 위한 자료구조와 도구들을 포함함 기존 python 라이브러리와 가장 큰 차이는, for문을 사용하지 않고 데이터를 처리하거나 배열 기반의 함수를 제공하는 등 NumPy 배열 기반 계산 스타일을 많이 차용하여, 테이블 기반 및 이종의 데이터를 쉽게 다룰 수 있게 된다는 점 NumPy와 다른 점은, pandas는 표 형식의 데이터나 다양한 형태의 데이터를 다루는데 초점을 맞춰 설계했다는 점 (Numpy는 단일 산술 배열 데이터를 다루는데 특화되어 있음) 다른 산술 계산 도구인 Numpy 와 SciPy , 분석 라이브러리인 sta..
Python for Data Analysis CH4. Numpy 데이터 분석을 위한 파이썬 CH4. Numpy NumPy 배열이란? Numpy : Numerical Python, 파이썬에서 산술 계산을 위한 가장 중요한 필수 패키지 중 하나 특징 ndarray : 배열 중심의 빠른 산술 연산을 지원하는 다차원 배열, 브로드캐스팅 기능 지원 (행렬 연산) 반복되는 루프를 가지지 않고, 전체 배열에서의 빠른 연산을 지원 디스크에 배열 데이터를 읽고 쓰기 위한 도구와 메모리에 적재된 파일을 다루는 도구 지원 선형 대수, random number 생성, 푸리에 변환 등 고급 수학 연산 지원 C, C++ 로 작성된 라이브러리를 C API를 사용해 NumPy 와 연동 데이터 분석을 위한 NumPy 벡터 배열 상에서..
Python for Data Analysis (데이터 분석을 위한 파이썬) 3장. 내장 자료구조, 함수, 파일 정리 CH3. 내장 자료구조, 함수, 파일 자료구조와 순차 자료형 1. 튜플 1차원의 고정된 크기를 가지는 변경 불가능한 순차 자료형 tup = tuple(['foo', [1,2,], True]) tup[1].append(3) nested_tup = (1,2,3), (4,5,6) print(tuple('string')) # ('s', 't', 'r', 'i', 'n', 'g') print(tup[0]) # 인덱스로 접근 가능 튜플에서 값 분리하기 (대입 연산자 사용) tup = (4..