본문 바로가기

Python4

[pandas] pd.get_dummies() : 데이터전처리/가변수 만들기 [pandas] pd.get_dummies() : 가변수 만들기 머신러닝을 할 때 기계가 이해할 수 있도록 모든 데이터를 수치로 변환해주는 전처리 작업이 필수적이다. 예를들어, 숫자가 아닌 object형의 데이터들이 있다면 (요일-월, 화, 수, 목, 금과 같은) 1️⃣ 먼저 수치형 데이터로 변환을 해주고 (0,1,2,3,...) 2️⃣ 그다음 수치화된 데이터를 가변수화하여 나타내 준다면 기계학습에 적합한 데이터의 형태로 가공된다. 그렇다면, 수치형 데이터로만 바꾸면 될텐데 왜 굳이 더미로 가변수화해야하는걸까? 왜냐하면, 수치형 데이터로만 변환을 하게 되면 서로 간의 관계성이 생기게 된다. 예를 들어, 월요일을 1, 화요일을 2, 수요일을 3이라고 단순하게 수치형 데이터로 변환하게 되면 해당 데이터들 간.. 2020. 6. 25.
[Python] 완전 초보를 위한 파이썬(3) : 함수 알아보기 [Python] 완전 초보를 위한 파이썬(3) : 함수 알아보기 1. 내장 함수(built-in function) - 대표적으로 len, sum, range 등이 있음 - len: 입력된 값의 길이(length)를 계산하는 함수 - sum : 입력된 값의 합을 계산하는 함수 - range : 정수를 입력받으면 리스트를 생성하는 함수 2. 사용자 정의 함수 선언 형태는 아래와 같습니다. def 함수이름(매개변수) : 함수의 내용 return 리턴값 - 정의를 위해 def 키워드 사용 (definition) - 파라미터 정의 (함수에 입력으로 전달하는 값을 의미, argument 또는 parameter라고 함) 💡 함수의 이름정의(naming)는 중요하다 : 어떤 기능을 하는 함수인지 이름을 보고 알 수 있.. 2020. 6. 2.
[Python] 완전 초보를 위한 파이썬(2) : 반복문(Loop) 알아보기 [Python] 완전 초보를 위한 파이썬(2) : 반복문(Loop) 알아보기 💡 반복문(loop)이란? 이름 그대로 반복적인 작업을 가능하게 해주는 구문입니다. 비슷한 작업이 여러 번 반복되는 것을 한 줄 한 줄 작성하지 않고, 반복문을 통해 간결하게 표현할 수 있습니다. 파이썬에서는 조건문이 참인지 거짓인지에 따라 반복을 진행하는 while문과 리스트(list)나 튜플(tuple)과 같은 컬렉션 타입의 요소들을 하나씩 가져오며 반복을 수행하는 for문이 존재합니다. 예를 들어, 1~10까지 반복하여 출력해야 하는 상황이 있다고 가정합니다. 이때, 반복문을 사용하지 않을 경우에는 아래와 같이 작성해야 할 것입니다. print(1) print(2) print(3) print(4) print(5) print.. 2020. 6. 2.
[완전 초보를 위한 파이썬] 파이썬(Python)을 시작해보자 [완전 초보를 위한 파이썬] 파이썬(Python)을 시작해보자 파이썬은 배우기 쉬운 언어로 잘 알려져 있습니다. 실제로 C언어나 JAVA를 공부했던 사람들이라면, 출력문이 print("Hello World!"); 이렇게 print 한단어로 끝난다는 것이 얼마나 간단한지 느낄 수 있겠죠.😲 그래서 프로그래밍이나 코딩을 처음하는 분들도 비교적 쉽게 시작하실 수 있을 것 같아 완전 초보 입문자를 위한 파이썬을 기초부터 포스팅해보려고 합니다! 변수 파이썬의 큰 장점은 변수의 형태를 자동 추론하기 때문에 지정해주지 않아도 된다는 것입니다. 다른 언어의 경우, 아래와 같이 문자열의 경우 String 숫자중에서도 크기가 얼마나 되는지, 정수인지 실수인지에 따라 각각 다른 변수형을 선언해줘야합니다.(내가 적은 값과 선.. 2019. 12. 9.