KNOU STUDYREAD

한국방송통신대학교 통계데이터과학과 블로그

CS & Department of Statistics and Data Science

통계데이터과학과 및 컴퓨터과학 독서 76

09. 딥러닝 16-18장

정규화(normalization) : 데이터의 폭이 클 경우 적절한 겂으로 분산 정도를 변경하는 과정 MNIST 손글씨 인식하기(데이터 전처리)from tensorflow.keras.datasets import mnist from tensorflow.keras.utils import to_categorical import matplotlib.pyplot as plt import sys # MNIST 데이터셋을 활용 # X_train, y_train : 학습에 사용될 학습셋 데이터 # X_test, y_test : 테스트에 사용될 테스트셋 데이터 (X_train, y_train), (X_test, y_test) = mnist.load_data() # 학습셋과 테스트셋이 각 몇개의 이미지인지 출력 print..

08. 딥러닝 13-15장

과적합(Overfitting) : 훈련에 사용한 데이터에 진행된 학습이 지나치게 진행된 것을 의미. 이는 일반화 오류를 크게 할 수 있으며 복잡도가 오히려 증가할 수 있다. 1) 층이 너무 많을 때 발생 2) 변수가 복잡할 때 발생 3) 테스트와 학습 데이터의 중복일때 발생과적합(Overfitting) 방지 방법 : 학습을 할 때 사용할 데이터셋과 테스트 전용 데이터셋을 구분. 주로 학습셋과 테스트셋을 분리하기 위해 사이킷런을 사용하고 여기서 train_test_split() 함수를 적용한다.from sklearn.model_selection import train_test_split # 학습셋과 테스트셋을 각각 구분, 0.3은 전체 데이터의 30%를 테스트셋으로, 나머지 70(0.7)은 학습셋으로 나눔..

07. 딥러닝 10-12장

2강 - 폐암 환자 수술 생존율 예측 딥러닝 모델 설계하기 model = Sequential() # 딥러닝 구조 설계 model.compile() # 컴파일. model.fit() # 모델 수행 from tensorflow.keras.models import Sequential from tensorflow.keras.layers import Dense import numpy as np !git clone https://github.com/taehojo/data.git Data_set = np.loadtxt("./data/ThoraricSurgery3.csv", delimiter=",") X = Data_set[:,0:16] y = Data_set[:,16] model = Sequential() model..

06. 딥러닝 7-9장

1) 퍼셉트론 : 인간의 실제 신경단위인 뉴런을 본 떠 이를 바탕으로 한 인공신경망(신경망)을 만들게 되고 실제 장치화 한 것. 다수의 입력값에 별도의 가중치를 조절할 수 있으며 이를 바탕으로 출력값을 구할 수 있으며 '학습'이 가능하게 됨. 퍼셉트론, 이를 보완한 아달라인의 등장과 여전히 극복하지 못한 한계 -> XOR 해결 문제 발생 -> 다층 퍼셉트론, 오차 역전파 기법 발생으로 해결2) 다층 퍼셉트론 (MLP): XOR 문제를 해결할때 각각 NAND, OR 연산과정을 한번 더 거쳐 문제를 해결하며 이 사이에 '은닉층' 이라는 입력층과 출력층 사이의 중간층을 만들어 문제를 해결할 수 있게 됨. 은닉층에서 모은 값은 활성화 함수를 통해 다음 단계로 보내지며 각 활성화 함수로는 시그모이드함수 (σ(x)..

05. 딥러닝 6장

로지스틱 회귀 : 참과 거짓, 둘 중 하나로 판단해야할 때 딥러닝에서 주어진 데이터를 놓고 쓰임. 예시 : 5장의 공부한 시간과 공부한 성적 사이를 선형회귀적으로 표현하는 문제가 아닌 시험 결과 여부가 합/불합격만 존재할경우 공부시간 2 4 6 8 10 12 14 합격여부 불 불 불 합 합 합 합 합격을 1, 불합격이 0일때 좌표 평면에 그리면 일정한 기울기를 가지는 일차 방정식이 아니기에 1.과 0으로 구분된 선을 그리기 어려움. 따라서 1과 0을 이어주는 S자 그래프 형태로 그려지게됨 -> 시그모이드 함수를 통해 로지스틱 회귀를 풀어낼 수 있음. 선형회귀에서 평균 제곱 오차 함수를 사용해 보정했다면, 로지스틱 회귀는 교차 엔트로피 오차 함수를 이용. # 필요한 기본 라이브러리 세팅 import num..

04. 딥러닝 5장

1. 경사하강법 : 일정한 곡면을 가진 2차함수가 있을 때 경사의 가장 완만한 부분은 봉우리 지점(가장 볼록한 부분)에 도달했을때 기울기가 가장 작다. 이 그래프에서 가장 완만한 지점의 값을 기울기 a라고 할 때, m의 위치에 있다면 임의의 기울기 a1, a2, a3...인 식으로 각각의 m을 구한다. 이때의 미분 기울기를 이용하는 방법을 경사 하강법이라고 한다. 따라서, 기울기가 0인 지점, 미분값이 0인 지점을 찾으면서 임의의 수를 대입하는데 이때 적절한 학습률을 설정해서 구해야한다. import numpy as np import matplotlib.pyplot as plt # 이전단원 학생별 공부시간별 점수 x = np.array([2, 4, 6, 8]) # 공부시간 x y = np.array([8..

03.딥러닝 3-4장

1. 딥러닝 기본적인 두 가지 계산 원리 : 선형 회귀, 로지스틱 회귀 2. 독립변수와 종속변수 : 선형회귀에서 독립변수를 이용해 종속변수의 결과를 예측하고 설명함 ex. 학생들의 중간고사 성적이 [ ] 에 따라 다 다르다 독립변수 종속변수 성적을 변하게하는 [ ] 부분. 이 부분을 정보(사교육비, 공부하는데 들인 시간, 학생의 개인 역량 등 많은 부분이 이 안에 정의될 수 있음). 즉, 독립적으로 변할 수 있는 미지의 X 값을 의미함. 성적인 부분. 사교육비, 공부량, 학생당 성취 도 등 다양한 독립변수 X에 따라 결정되는 최종 성적을 의미함. 독립변수 X에 따라 변화가 종속적으로 일어나는 변수. 즉, 독립변수에 따라 종속적으로 변할 수 있는 값 Y를 의미함. 3. 단순 선형 회귀(Simple Line..

02. 딥러닝 2장

1. 폐암 수술 환자 생존율 예측from tensorflow.keras.models import Sequential from tensorflow.keras.layers import Dense import numpy as np !git clone https://github.com/taehojo/data.git Data_set = np.loadtxt("./data/ThoraricSurgery3.csv", delimiter=",") X = Data_set[:,0:16] y = Data_set[:,16] model = Sequential() model.add(Dense(30, input_dim=16, activation='relu')) model.add(Dense(1, activation='sigmoid')) ..

01. 딥러닝 1장

1. 인공지능, 머신러닝, 딥러닝 인공지능 머신러닝 딥러닝 머신러닝과 딥러닝을 아우르는 전체적인 인공지능의 토대 인공지능의 범주 안에 속함 인공지능과 머신러닝의 범주 안에 속함. 2. 딥러닝 실행을 위한 필수 3요소 : 데이터, 컴퓨터, 프로그램 데이터 컴퓨터 프로그램 딥러닝에서 예측/판별을 위해 사용하는 자료 딥러닝을 실행할 경우 일반 컴퓨터(CPU)로 사용할 것인지 고속그래픽컴퓨터(GUI)로 처리할 것인지 선택하는 수행도구. 데이터와 이를 수행할 컴퓨터를 가지고 직접적으로 딥러닝을 구동하기 위한 프로그래밍 언어로 설계하는 것. * 딥러닝을 하는데 사용하는 데이터를 따라 구분할 수 있는 키가 있는지의 여부로 다르게 나뉨. 지도학습 비지도학습 데이터를 식별하거나 구분할 수 있는 키를 가진 데이터를 이용해..

09. 인프라 엔지니어

서버 엔지니어 : 기술 동향 분석, 시스템 용량 산정, 기술 적정성 분석, 제품 선정과 도입 등 인프라 전반에 걸친 업무 수행. 시스템 운영과 장애 대응도 담당 스토리지 엔지니어 : 스토리지 공간/성능 관리 및 부가적인 백업 작업을 수행하고 관리를 담당. 스토리지 성능 리포트를 작성해 컨트롤러 사용률과 디스크 엑세스 정도를 보고하며 불필요한 경우 클렌징 하는 등의 업무를 담당 데이터베이스 관리자 : 운영체제의 이해와 데이터베이스 전반적인 지식 요구. 네트워크 엔지니어 : 주요 장비를 구성, 확인하며 효율적인 관리를 담당. 각 PT(Presentation), AP(Application), DB(Database) 서버인지 파악하여 각 장 비의 운영 기술과 특성 지식 요구 미들웨어 엔지니어 : 웹 서버, WA..