Home
Posts
Cancel

강화학습 - MDP

[인공지능] Markov Decision Process, MDP 순차적 행동 결정 문제에 대해 정의하는 방법. MDP의 구성 요소 상태 : 시간 t 에서 상태 s 일 때, 확률변수 St = s 라고 정의한다. 행동 : 시간 t 에서 행동 a 일...

Preview Image

강화학습 - Reinforcement Learning(2)

[인공지능] Model Free & Q-Learning Dynamic Programming 강화학습의 토대가 되는 동적 프로그래밍(Dynamic Programming)은 학습이 아니라 전체 큰 문제를 작은 문제로 나누어 풀 수 있도록 계획하여 연산을 빠르게 하는 것. 정책 반복...

Preview Image

강화학습 - Reinforcement Learning(1)

[인공지능] 가치 함수 & 벨만 방정식 < 2019-10-09 내용 개정 > 그림 출처 - David Silver 교수님의 RL course 강의 내용](http://www0.cs.ucl.ac.uk/staff/d.silver/web/Teaching.html) 강화학습의 목적은 에이전트...

벡터(Vector)

벡터(Vector) 벡터는 크기(magnitude)와 방향(direction) 정보를 담고있다. 스칼라(Scalar)는 크기만 담고 있다. 단위벡터(Unit Vector) : 크기가 1인 벡터, 정규화(Normalize)를 통해 벡터를 단위벡터로 만든다. \(|\vec u| = \sqrt{u_x^2 + u_y^2 + u_z^2} \\...

행렬(Matrix)

벡터(Vector) 벡터는 크기(magnitude)와 방향(direction) 정보를 담고있다. 스칼라(Scalar)는 크기만 담고 있다. 행렬(Matrix) 정방행렬(Square Matrix) : \(N \times N\) 인 행렬. 전치행렬(Transpose Matrix) : 행과 열을 바꾼 행렬. \(A= ...

템플릿 패턴(Template Pattern)

[디자인 패턴] 템플릿 게임 프로그래밍 패턴 더 빠르고 깔끔한 게임 코드를 구현하는 13가지 디자인 패턴을 참고하여 작성하였습니다. 템플릿 패턴은 공통적인 메소드를 차례대로 실행하도록 기반클래스에서 정의하고 메소드의 구현은 각 파생클래스에서 담당하는 기법이다. 구현 아래 내용은 템플릿 패턴을 구현하기 위한 예시를 보여준다. 디자인 패턴은 코드가...

팩토리 패턴(Factory Pattern)

[디자인 패턴] 팩토리 게임 프로그래밍 패턴 더 빠르고 깔끔한 게임 코드를 구현하는 13가지 디자인 패턴을 참고하여 작성하였습니다. 팩토리 패턴은 팩토리 메소드 패턴과 추상 팩토리 패턴 2가지 기법으로 나누어진다. 팩토리 메소드 패턴은 객체 생성을 담당하는 메소드를 만드는 기법 어떤 객체를 생성할지는 매개변수로 전달한다. ...

싱글턴 패턴(Singleton Pattern)

[디자인 패턴] 싱글턴 게임 프로그래밍 패턴 더 빠르고 깔끔한 게임 코드를 구현하는 13가지 디자인 패턴을 참고하여 작성하였습니다. 싱글턴 패턴은 오직 한 개의 객체(Instance)만 갖도록 보장하며, 어디서든 접근할 수 있는 전역 접근점을 제공하는 기법이다. 구현 아래 내용은 싱글턴 패턴을 구현하기 위한 예시를 보여준다. 디자인 패턴은 코드...

Preview Image

관찰자 패턴(Observer Pattern)

[디자인 패턴] 관찰자 게임 프로그래밍 패턴 더 빠르고 깔끔한 게임 코드를 구현하는 13가지 디자인 패턴을 참고하여 작성하였습니다. 이미지 출처 객체 상태를 계속해서 판단하는 관찰자(Observer) 클래스와. 관찰을 당하는 객체를 나타내는 대상(Subject) 클래스로 이루어진다. 구현 아래 내용은 관찰자 패턴을 구현하기 위한 예시를 보...

분산과 표준편차(Variance & Standard Deviation)

[20.01.11 updated] 다음과 같은 수열이 있을 때, [[-10, 0, 10, 20, 30]] 평균 [average = \frac{-10 + 0 + 10 + 20 + 30}5 = \frac{50}5 = 10] 편차 평균과 각 숫자(변량)의 차이를 나타낸 값. 편차의 합은 항상 0 이다. \(deviation = number...