티스토리 뷰

⊙ 파이썬 문법 활용 결과물 미리 알아보기

 

*데이터 분석의 모든 과정에서 사용

설명 : 데이터 불러오기, 저장하기, 전처리, 시각화, 계산 등 모든 과정에서 사용

목적 : 데이터 분석을 파이썬으로 하기 위한 문법 이해

결과물 : 데이터 분석의 모든 과정 수행

 

*기대효과

데이터 관리 : 방대한 데이터를 불러오고 저장하는 것

데이터 전처리 : 데이터에 문제가 있는지 살펴보고 분석하기 좋게 전처리하는 과정에서 사용한다. (pandas, scipy)

데이터 시각화 : 데이터를 불러오거나 분석한 후에 데이터 형태를 살펴보기 위해 시각화(matplotlib, seaborn)

데이터 계산 : 다양한 통계적인 계산을 수행하거나 직접 만든 수식을 적용하기도 하고 머신러닝이나 딥러닝을 함꼐 사용

 

Colab 주요 단축키

 

코드 실행 : shift + enter

새 코드 셀 추가 : ctrl + M + A

코드 셀 삭제 : ctrl + M + D

코드 셀 분할 : ctrl + M + - 하이픈

셀 유형 변경 : ctrl + M + M 코드 셀을 마크다운 셀로 변경

 

 출력문

 

* print 함수

화면에 값을 출력하는 데 사용된다. 괄호 안에 출력하고자 하는 값을 넣고, 여러 값을 출력할 경우엔 쉼표로 구분한다.

x = 10
print("변수 x의 값은", x, "입니다.")

 

콤마를 이용하면 여러 개의 출력을 한꺼번에 할 수 있다.

 

파이썬의 핵심 "변수"

 

* 변수란?

변수는 값을 저장하는 공간으로, 사용하기 전에 선언되어야 한다.

변수를 선언할 때에는 변수를 지정하고, 할당 연산자(=)를 사용하여 값을 할당한다. 

변수는 어떠한 값이든 할당할 수 있으며, 변수명을 사용하여 해당 값에 접근할 수 있다.

변수는 값을 다양한 연산에 사용할 수 있다. 

 

# 변수 선언과 할당
age = 25
name = "Alice"
# 변수 사용
print(name)  # "Alice" 출력
print("나이:", age)  # "나이: 25" 출력

# 변수를 사용한 연산
double_age = age * 2
print("나이의 두 배:", double_age)  # "나이의 두 배: 50" 출력

 

* 변수의 자료형 

주요 자료형 : 정수(int), 실수(float), 문자열(str), 리스트(list), 튜플(tuple), 딕셔너리(dict)등이 있다.

특히 Sequence Type에 해당하는 자료형은 자주 사용

* Sequence Type

'순서대로 나열된 자료형'. 문자, 리스트, 튜플 모두 순서대로 값들이 나열된 데이터 자료형들이다.

 

* 문자열 

문자열은 작은 따옴표, 큰 따옴표로 감싸서 선언한다.

# 문자열 변수 선언
name = "Alice"
greeting = 'Hello, World!'
# 문자열 연산
full_greeting = greeting + " My name is " + name
print(full_greeting)  # "Hello, World! My name is Alice" 출력

 

- 문자열과 메서드 사용해보기

메서드 : 함수를 사용하는 방법 중 하나

# 문자열 메서드 활용
sentence = "python programming is fun"
print(sentence.upper())         # 대문자로 변환하여 출력

sentence.upper()

 

*숫자열

정수(int)나 실수(float) 형태의 숫자열은 그냥 변수에 할당하면 된다. 

# 숫자열 변수 선언
num1 = 10
num2 = 3.14

 

- 숫자열 연산 : 합, 차, 곱하기, 나누기, 몫, 나머지 

# 숫자열 연산
sum_result = num1 + num2
diff_result = num1 - num2
product_result = num1 * num2
division_result = num1 / num2
integer_division_result = num1 // num2
remainder_result = num1 % num2

print("합:", sum_result)
print("차:", diff_result)
print("곱:", product_result)
print("나누기:", division_result)
print("정수 나누기:", integer_division_result)
print("나머지:", remainder_result)

 

- abs() : 절댓값 반환 | round () : 반올림 값 반환

# 숫자열 함수와 메서드 활용
num3 = -7.89
abs_result = abs(num3)   # 절댓값 계산
round_result = round(num3)  # 반올림 계산

print("절댓값:", abs_result)
print("반올림:", round_result)

 

* 정수형과 실수형의 차이점

- 정수형 Integer

정수형은 소수점 이하의 부분이 없는 숫자. int 형으로 표현되며 연산 결과도 항상 정수 

- 실수형 Float

실수형은 소수점 이하의 숫자를 포함하는 숫자. 연산결과도 소수점 이하를 포함한 실수로 나온다.

 

* 불리언 Boolean

주어진 조건이 참 또는 거짓을 나타내는 데 사용된다.

조건식을 평가하는 데 매우 중요하며 데이터 분석에서도 자주 활용

# 비교 연산자를 사용하여 Boolean 값 비교
x = 10
y = 5

greater_than = x > y
print(greater_than)  # True 출력

 

* NaN 결측값

Not a Number 데이터에서 결측지(missing value)를 나타내는 특수한 값.

주로 수치형 데이터에서 발생하며, 특히 데이터 과학이나 머신 러닝 분야에서 데이터 정제 및 처리 과정에서 자주 다루어진다.

 

NaN은 정의할 수 없는 수치값을 나타낸다. 예를 들어, 0으로 나누는 연산이나 유효하지 않은 수학적 연산 결과를 나타낼 때 사용된다. 데이터 프레임과 같은 데이터 구조에서는 결측치를 표현할 때 사용된다.

 

 - 예시

# 0으로 나누는 연산
result = 1 / 0
print(result)  # 출력: Infinity

import math

# 유효하지 않은 수학적 연산
result = math.sqrt(-1)
print(result)  # 출력: nan

제곱근 함수 (0보다 커야하지만 -1이기 때문에 출력 X)

 

* 입력문

 

input() 함수는 사용자로부터 키보드로 입력을 받는 함수

이 함수를 사용하면 사용자와 상호작용하여 프로그램을 만들 수 있다.

name = input("이름을 입력하세요: ")
print("안녕하세요,", name, "님!")
num1 = int(input("첫 번째 숫자를 입력하세요: "))
num2 = int(input("두 번째 숫자를 입력하세요: "))
sum = num1 + num2
print("두 숫자의 합은", sum, "입니다.")

input 함수로 입력된 숫자는 문자로 인식되기 때문에 int()로 문자열을 정수로 변환하고 합을 구하게 되는 것

 

QUIZ

1) 숫자 자료형 값을 변수에 저장하고 출력하기

다음 두 수의 합을 구하여 출력하세요. 첫 번째 수 15 두 번째 수 27

first = 15
second = 27
print(first + second)

>>> 42

2) 다음 문장을 변수에 담고 출력하기

"python은 데이터 분석과 인공지능 분야에서 매우 인기 있는 프로그래밍 언어입니다."

string = "Python은 데이터 분석과 인공지능 분야에서 매우 인기 있는 프로그래밍 언어입니다."
print(string)
«   2025/04   »
1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
TAG more
글 보관함