목록전체 글 (307)
코딩하는 해맑은 거북이
해당 글은 아래의 3가지를 다룬다. 1. 문자열.isalpha() 2. 문자열.isdigit() 3. 문자열.isalnum() 1, 문자열.isalpha() 해당 문자열이 모두 문자로 구성되어있다면 True를 리턴한다. x1 = 'ABCDEFG' print(x1.isalpha()) x2 = '안녕하세요' print(x2.isalpha()) x3 = '20대입니다' print(x3.isalpha()) True True False 2. 문자열.isdigit() 해당 문자열이 모두 숫자로 구성되어있다면 True를 리턴한다. x1 = '123456789' print(x1.isdigit()) x3 = '20대입니다' print(x3.isdigit()) True False 3. 문자열.isalnum() 해당 문자열..
해당 글은 ord 함수와 chr 함수에 대해서 다룬다. 1. ord(문자) 한 개의 문자를 인자로 받고, 문자에 해당하는 유니코드 정수를 반환하는 함수 data1 = ord('A') print(data1) data2 = ord('B') print(data2) data3 = ord('a') print(data3) data4 = ord('b') print(data4) 65 66 97 98 2. chr(정수) 한 개의 정수를 인자로 받고, 정수에 해당하는 유니코드 문자를 반환하는 함수 data1 = chr(65) print(data1) data2 = chr(66) print(data2) data3 = chr(97) print(data3) data4 = chr(98) print(data4) A B a b

해당 글은 아래의 3가지를 다룬다. 1. Normalization 2. Normalization을 왜 할까? 3. Normalization의 종류 Normalization : 데이터의 범위를 사용자가 원하는 범위로 제한하는 것. 예를 들어, 이미지의 데이터의 경우 픽셀 정보를 0~255 사이의 값으로 가지는데, 이를 255로 나누어주면 0.0~1.0 사이의 값을 가지게 된 다. 이러한 행위를 Feature들의 Scale을 정규화(Normalization) 한다고 한다. 이를 Min-Max Normalization 이라고 부르기도 한다. 다른 경우는 Scaling을 넘어서 표준정규분포를 갖게 하고 싶으면 데이터의 평균과 표준편차를 사용하면 된다. 이 경우는 표준화(Standardization) 라고 하며,..

본 게시물의 내용은 '데이터 분석을 위한 통계 기초 개념(메타코드M)' 강의를 듣고 요약하여 작성하였다. 1. 통계 - 모집단(Population) : 통계학에서 관심/조사의 대상이 대는 개체의 전체 집합 - 모수(Parameter) : 모집단에 대한 수치적 요약 - 표본(Sample) : 모집단을 적절히 대표하는 모집단의 일부 - 통계량(Statistic) : 표본에 대한 수치적 요약 → 통계 : 표본에서 추출한 표본통계량을 통해서 모집단의 모수를 추정하는 것 2. 자료의 종류 1) 범주형 자료 - 명목형 자료 : 단순히 속성을 분류하는 자료 (혈액형) - 순서형 자료 : 상대적인 크기 비교 (만족도,학력) 2) 양적 자료 - 이산형 자료 : 셀 수 있음 (빈도 수, 불량품의 수) - 연속형 자료 : ..

본 게시물의 내용은 '확률 및 통계(이상화 교수님)' 강의를 듣고 작성하였다. 1. Definition of RV(Random Variables, 확률변수) Sample space에 w1. w2, ... 가 있을 때, 각각이 적어도 1개의 real number를 반드시 대응한다. X(w) → x 여기서 x에 해당하는 값을 확률변수(Random Variables)이라 한다. - RV : real numbers, mapping each outcome of random experiment to a real value → x = X(w) Probability → 숫자의 개념으로 즉, function 으로 다루자 P(A) → P(x) ex) tossing a coin 동전을 던지는 경우, 앞면(H), 뒷면(T)가..

해당 글은 아래의 3가지를 다룬다. 1. 선형회귀(Linear Regression) 2. 로지스틱 회귀(Logistic Regression) 3. 소프트맥스 회귀(Softmax Regression) 1. 선형회귀(Linear Regression) : 1개 이상의 독립변수 x와 종속변수 y의 선형 관계를 모델링한 것. 선형회귀는 주어진 데이터로부터 y와 x의 관계를 가장 잘 나타내는 선을 그리는 일을 말한다. 선을 결정하는 것은 w와 b의 값이므로 선형회귀에서 해야할 일은 결국 적절한 w와 b를 찾는 것이다. 1) 단순 선형 회귀 분석(Simple Linear Regression Analysis) 독립변수가 1개인 선형회귀로, w는 머신러닝에서는 가중치(weight), 별도로 더해지는 값 b를 편향(bia..