티스토리 뷰
⊙ 파이썬 문법 활용 결과물 미리 알아보기
*데이터 분석의 모든 과정에서 사용
설명 : 데이터 불러오기, 저장하기, 전처리, 시각화, 계산 등 모든 과정에서 사용
목적 : 데이터 분석을 파이썬으로 하기 위한 문법 이해
결과물 : 데이터 분석의 모든 과정 수행
*기대효과
데이터 관리 : 방대한 데이터를 불러오고 저장하는 것
데이터 전처리 : 데이터에 문제가 있는지 살펴보고 분석하기 좋게 전처리하는 과정에서 사용한다. (pandas, scipy)
데이터 시각화 : 데이터를 불러오거나 분석한 후에 데이터 형태를 살펴보기 위해 시각화(matplotlib, seaborn)
데이터 계산 : 다양한 통계적인 계산을 수행하거나 직접 만든 수식을 적용하기도 하고 머신러닝이나 딥러닝을 함꼐 사용
⊙ Colab 주요 단축키
코드 실행 : shift + enter
새 코드 셀 추가 : ctrl + M + A
코드 셀 삭제 : ctrl + M + D
코드 셀 분할 : ctrl + M + - 하이픈
셀 유형 변경 : ctrl + M + M 코드 셀을 마크다운 셀로 변경
⊙ 출력문
* print 함수
화면에 값을 출력하는 데 사용된다. 괄호 안에 출력하고자 하는 값을 넣고, 여러 값을 출력할 경우엔 쉼표로 구분한다.
x = 10
print("변수 x의 값은", x, "입니다.")
콤마를 이용하면 여러 개의 출력을 한꺼번에 할 수 있다.
⊙ 파이썬의 핵심 "변수"
* 변수란?
변수는 값을 저장하는 공간으로, 사용하기 전에 선언되어야 한다.
변수를 선언할 때에는 변수를 지정하고, 할당 연산자(=)를 사용하여 값을 할당한다.
변수는 어떠한 값이든 할당할 수 있으며, 변수명을 사용하여 해당 값에 접근할 수 있다.
변수는 값을 다양한 연산에 사용할 수 있다.
# 변수 선언과 할당
age = 25
name = "Alice"
# 변수 사용
print(name) # "Alice" 출력
print("나이:", age) # "나이: 25" 출력
# 변수를 사용한 연산
double_age = age * 2
print("나이의 두 배:", double_age) # "나이의 두 배: 50" 출력
* 변수의 자료형
주요 자료형 : 정수(int), 실수(float), 문자열(str), 리스트(list), 튜플(tuple), 딕셔너리(dict)등이 있다.
특히 Sequence Type에 해당하는 자료형은 자주 사용
* Sequence Type
'순서대로 나열된 자료형'. 문자, 리스트, 튜플 모두 순서대로 값들이 나열된 데이터 자료형들이다.
* 문자열
문자열은 작은 따옴표, 큰 따옴표로 감싸서 선언한다.
# 문자열 변수 선언
name = "Alice"
greeting = 'Hello, World!'
# 문자열 연산
full_greeting = greeting + " My name is " + name
print(full_greeting) # "Hello, World! My name is Alice" 출력
- 문자열과 메서드 사용해보기
메서드 : 함수를 사용하는 방법 중 하나
# 문자열 메서드 활용
sentence = "python programming is fun"
print(sentence.upper()) # 대문자로 변환하여 출력
sentence.upper()
*숫자열
정수(int)나 실수(float) 형태의 숫자열은 그냥 변수에 할당하면 된다.
# 숫자열 변수 선언
num1 = 10
num2 = 3.14
- 숫자열 연산 : 합, 차, 곱하기, 나누기, 몫, 나머지
# 숫자열 연산
sum_result = num1 + num2
diff_result = num1 - num2
product_result = num1 * num2
division_result = num1 / num2
integer_division_result = num1 // num2
remainder_result = num1 % num2
print("합:", sum_result)
print("차:", diff_result)
print("곱:", product_result)
print("나누기:", division_result)
print("정수 나누기:", integer_division_result)
print("나머지:", remainder_result)
- abs() : 절댓값 반환 | round () : 반올림 값 반환
# 숫자열 함수와 메서드 활용
num3 = -7.89
abs_result = abs(num3) # 절댓값 계산
round_result = round(num3) # 반올림 계산
print("절댓값:", abs_result)
print("반올림:", round_result)
* 정수형과 실수형의 차이점
- 정수형 Integer
정수형은 소수점 이하의 부분이 없는 숫자. int 형으로 표현되며 연산 결과도 항상 정수
- 실수형 Float
실수형은 소수점 이하의 숫자를 포함하는 숫자. 연산결과도 소수점 이하를 포함한 실수로 나온다.
* 불리언 Boolean
주어진 조건이 참 또는 거짓을 나타내는 데 사용된다.
조건식을 평가하는 데 매우 중요하며 데이터 분석에서도 자주 활용
# 비교 연산자를 사용하여 Boolean 값 비교
x = 10
y = 5
greater_than = x > y
print(greater_than) # True 출력
* NaN 결측값
Not a Number 데이터에서 결측지(missing value)를 나타내는 특수한 값.
주로 수치형 데이터에서 발생하며, 특히 데이터 과학이나 머신 러닝 분야에서 데이터 정제 및 처리 과정에서 자주 다루어진다.
NaN은 정의할 수 없는 수치값을 나타낸다. 예를 들어, 0으로 나누는 연산이나 유효하지 않은 수학적 연산 결과를 나타낼 때 사용된다. 데이터 프레임과 같은 데이터 구조에서는 결측치를 표현할 때 사용된다.
- 예시
# 0으로 나누는 연산
result = 1 / 0
print(result) # 출력: Infinity
import math
# 유효하지 않은 수학적 연산
result = math.sqrt(-1)
print(result) # 출력: nan
제곱근 함수 (0보다 커야하지만 -1이기 때문에 출력 X)
* 입력문
input() 함수는 사용자로부터 키보드로 입력을 받는 함수
이 함수를 사용하면 사용자와 상호작용하여 프로그램을 만들 수 있다.
name = input("이름을 입력하세요: ")
print("안녕하세요,", name, "님!")
num1 = int(input("첫 번째 숫자를 입력하세요: "))
num2 = int(input("두 번째 숫자를 입력하세요: "))
sum = num1 + num2
print("두 숫자의 합은", sum, "입니다.")
input 함수로 입력된 숫자는 문자로 인식되기 때문에 int()로 문자열을 정수로 변환하고 합을 구하게 되는 것
QUIZ
1) 숫자 자료형 값을 변수에 저장하고 출력하기
다음 두 수의 합을 구하여 출력하세요. 첫 번째 수 15 두 번째 수 27
first = 15
second = 27
print(first + second)
>>> 42
2) 다음 문장을 변수에 담고 출력하기
"python은 데이터 분석과 인공지능 분야에서 매우 인기 있는 프로그래밍 언어입니다."
string = "Python은 데이터 분석과 인공지능 분야에서 매우 인기 있는 프로그래밍 언어입니다."
print(string)
'자습메모 > 파이썬 자습' 카테고리의 다른 글
데이터 분석 파이썬 종합반_4주차 (1) | 2024.12.16 |
---|---|
데이터 분석 파이썬 종합반_3주차 (1) | 2024.12.11 |
데이터 분석 파이썬 종합반_2주차 (3) | 2024.12.10 |
파이썬 문법 뽀개기_2주차 (3) | 2024.12.09 |
파이썬 문법 뽀개기_1주차 (1) | 2024.12.09 |