목록AI (80)
코딩하는 해맑은 거북이
본 게시물의 내용은 '인공지능(AI) 기초 다지기(부스트코스)' 강의를 듣고 작성하였다. 해당 글은 4-3. 시각화 툴 / 통계학 맛보기 2가지 파트를 다룬다. 1. 파이썬 시각화 툴 2. 통계학 맛보기 1. 파이썬 시각화 툴 추후 업데이트 예정 2. 통계학 맛보기 모수가 뭐에요? 통계적 모델링은 적절한 가정 위에서 확률분포를 추정(inference)하는 것이 목표이며, 기계학습과 통계학이 공통적으로 추구하는 목표이다. 그러나 유한한 개수의 데이터만 관찰해서 모집단의 분포를 정확하게 알아낸다는 것은 불가능하므로, 근사적으로 확률분포를 추정할 수 밖에 없다. → 예측모형의 목적은 분포를 정확하게 맞추는 것보다는 데이터와 추정 방법의 불확실성을 고려해서 위험을 최소화하는 것이다. 데이터가 특정 확률분포를 따..
본 게시물의 내용은 '인공지능(AI) 기초 다지기(부스트코스)' 강의를 듣고 작성하였다. 해당 글은 4-2. Pandas II / 확률론 맛보기 2가지 파트를 다룬다. 1. Pandas II 2. 확률론 맛보기 1. Pandas II Groupby I ▶ Groupby df.groupby(묶음의 기준이 되는 컬럼)[적용받는 컬럼].적용받는연산() - SQL groupby 명령어와 같음 - split → apply → combine - 과정을 거쳐 연산함 # 예제 데이터 ipl_data = {'Team': ['Riders', 'Riders', 'Devils', 'Devils', 'Kings', 'kings', 'Kings', 'Kings', 'Riders', 'Royals', 'Royals', 'Rider..
본 게시물의 내용은 'RNN 첫걸음(부스트캠프 AI Tech)' 강의를 듣고 작성하였다. 시퀀스 데이터 이해하기 시퀀스 데이터 : 순차적으로 들어오는 데이터 소리, 문자열, 주가 등의 데이터를 시퀀스(sequence) 데이터로 분류한다. 시계열(time-series)데이터는 시간 순서에 따라 나열된 데이터로 시퀀스 데이터에 속한다. 시퀀스 데이터는 독립동등분포(i.i.d.; independently and identically distributed) 가정을 잘 위배하기 때문에 순서를 바꾸거나 과거 정보에 손실이 발생하면 데이터의 확률분포도 바뀌게 된다. 개가 사람을 물었다. 사람이 개를 물었다. 2개의 문장이 있을 때, 첫번째 문장은 많이 발생할 수 있는 일이다. 두 번째은 문법적으로 맞지만, 위치를 바..
본 게시물의 내용은 'CNN 첫걸음(부스트캠프 AI Tech)' 강의를 듣고 작성하였다. Convolution 연산 이해하기 지금까지 배웠던 다층신경망(MLP)은 각 뉴런들이 선형모델과 활성함수로 모두 연결된 (fullyconnected)구조이다. 각 성분 \(ℎ_i\) 에 대응하는 가중치 행 \(W_i\) 이 필요하고, 만일 i 가 바뀌면 사용되는 가중치도 바뀐다. 가중치 행렬의 크기와 학습시켜야 하는 파라미터 갯수가 커지게 된다. 그러나, convolution 연산은 커널(kernel)이라는 고정된 가중치 행렬을 사용하고 고정된 커널을 입력벡터 상에서 움직여가면서 선형모델과 합성함수가 적용되는 구조이다. 중요한 특징은 입력벡터 x를 모두 다 활용하는 것이 아닌 커널 사이즈 k 만큼 추출하고 움직여가면..
본 게시물의 내용은 '딥러닝 기초 다지기(부스트코스)' 강의를 듣고 작성하였다. 해당 글은 4. Recurrent Neural Networks (RNN) 2가지 파트를 다룬다. 1. Sequential Models - RNN 2. Sequential Models - Transformer 1. Sequential Models - RNN - Sequential Model Sequential 데이터를 처리하는데 가장 큰 어려움은 분류문제는 우리가 얻고 싶은 정보는 하나의 label일 경우가 많은데 Sequential 데이터는 길이가 언제 끝날 지 모른다. 받아들여야하는 입력의 차원을 알 수 없다는 것이다. 그래서 몇 개의 입력들이 들어오든 상관없이 모델이 동작할 수 있어야 한다. 1) Naive sequenc..
본 게시물의 내용은 '딥러닝 기초 다지기(부스트코스)' 강의를 듣고 작성하였다. 해당 글은 3. Convolutional Neural Networks (CNN) 3가지 파트를 다룬다. 1. CNN - Convolution은 무엇인가? 2. Modern CNN - 1x1 convolution의 중요성 3. Computer Vision Applications 1. CNN - Convolution은 무엇인가? - Convolution I : 전체이미지, K : 적용하고자 하는 필터 하나의 output 값은 적용하고자 하는 필터를 이미지의 적절한 위치에 도장을 찍는다고 생각하면 된다! 값을 위치에 맞는 것끼리 곱한 최종 합 + bias가 output으로 나오게 된다. 2D convolution 연산은 적용하고자..