MoonBug

고정 헤더 영역

글 제목

메뉴 레이어

MoonBug

메뉴 리스트

  • 홈
  • 태그
  • 방명록
  • 분류 전체보기
    • Portfolio
      • Toy Project
      • 쥐돌이볼링
    • Trip
    • Cooking
    • Game
    • Diary
      • 잡생각
    • C++
      • Baekjoon
      • Programmers
      • 개념공부
      • STL
    • Study
      • Linux
      • Graphics
      • UNREAL
      • Computer Network
      • 강화학습
      • Algorithm
      • OS

검색 레이어

MoonBug

검색 영역

컨텐츠 검색

공부

  • 강화학습 필기노트 - 4 상태 가치 함수 V, 행동 가치 함수 Q, 벨만 방정식 Bellman equation

    2023.01.12 by J2on

  • < 백준 BaekJoon : 2908번 상수 > C++

    2022.01.22 by J2on

  • < 백준 BaekJoon : 1152번 단어의 개수 > C++

    2022.01.22 by J2on

  • < 백준 BaekJoon : 15596번 정수 N개의 합 > C++

    2021.10.01 by J2on

  • < 백준 BaekJoon : 8958번 OX퀴즈 > C++

    2021.09.25 by J2on

  • < 백준 BaekJoon : 1546번 평균 > C++

    2021.09.19 by J2on

  • < 백준 BaekJoon : 2577번 숫자의 개수 > C++

    2021.09.19 by J2on

강화학습 필기노트 - 4 상태 가치 함수 V, 행동 가치 함수 Q, 벨만 방정식 Bellman equation

https://www.youtube.com/watch?v=7MdQ-UAhsxA&list=PL_iJu012NOxehE8fdF9me4TLfbdv3ZW8g&index=4 본 필기노트는 위 영상을 바탕으로 합니다. 다시 강화학습은 Expacted Return을 Maximize하는 것이라 언급. State value function (상태 가치 함수, V) 지금부터 기대되는 return. (지금 Stae 부터) 지금 state에 대한 value, 가치를 매겨주는 것 일반적으로 x에 대한 기댓값은 왼쪽과 같이 나타낸다. 말로 풀자면, x의 결괏값 f(x)의 기댓값은 f(x)와 x가 일어난 확률 p(x)의 곱을 적분한 것과 같다. 이를 바탕으로 현재 state S_(t)에 대하여 수식으로 나타낸다면, 여기서의 G_(..

Study/강화학습 2023. 1. 12. 17:01

< 백준 BaekJoon : 2908번 상수 > C++

> https://www.acmicpc.net/problem/2908 2908번: 상수 상근이의 동생 상수는 수학을 정말 못한다. 상수는 숫자를 읽는데 문제가 있다. 이렇게 수학을 못하는 상수를 위해서 상근이는 수의 크기를 비교하는 문제를 내주었다. 상근이는 세 자리 수 두 www.acmicpc.net 문제가 길지만 요약하면 입력받은 정수 A, B를 시작과 끝을 뒤집은 후 대소를 비교하는 문제이다. * 정수의 조건 - 두 수는 같지 않다. - 세 자리 수이다. - 0이 포함되어 있지 않다. > #include using namespace std; // 정수를 입력받아 뒤집어 주는 함수 // 10으로 나눈 나머지 구하기 → NUM을 10으로 나누어 주기 를 반복하면 각 자릿수를 구할 수 있다. int re..

C++/Baekjoon 2022. 1. 22. 20:09

< 백준 BaekJoon : 1152번 단어의 개수 > C++

> https://www.acmicpc.net/problem/1152 1152번: 단어의 개수 첫 줄에 영어 대소문자와 공백으로 이루어진 문자열이 주어진다. 이 문자열의 길이는 1,000,000을 넘지 않는다. 단어는 공백 한 개로 구분되며, 공백이 연속해서 나오는 경우는 없다. 또한 문자열 www.acmicpc.net 입력된 문자열이 몇 개의 단어로 이루어져 있는지 출력하는 문제 * 주어지는 문자열 - 길이 #include using namespace std; int main() { // 문자열을 입력받을 char배열을 선언 후 '0'으로 초기화 char word[1000001]; for (char& ch:word){ ch = ..

C++/Baekjoon 2022. 1. 22. 19:14

< 백준 BaekJoon : 15596번 정수 N개의 합 > C++

https://www.acmicpc.net/problem/15596 15596번: 정수 N개의 합 C++17, Java 8, Python 3, C11, PyPy3, C99, C++98, C++11, C++14, Python 2, PyPy2, Go, C99 (Clang), C++98 (Clang), C++11 (Clang), C++14 (Clang), C11 (Clang), C++17 (Clang) www.acmicpc.net 이 문제는 함수구현 문제다 그냥 말 그대로 문제가 요구하는 함수를 작성하면 된다. \> #include long long sum(std::vector &a) { long long ans = 0; for (int num:a){ ans += num; } return ans; } 함수구현..

C++/Baekjoon 2021. 10. 1. 19:33

< 백준 BaekJoon : 8958번 OX퀴즈 > C++

연속해서 맞춘 횟수만큼 점수를 더 주는 문제 https://www.acmicpc.net/problem/8958 8958번: OX퀴즈 "OOXXOXXOOO"와 같은 OX퀴즈의 결과가 있다. O는 문제를 맞은 것이고, X는 문제를 틀린 것이다. 문제를 맞은 경우 그 문제의 점수는 그 문제까지 연속된 O의 개수가 된다. 예를 들어, 10번 문제의 점수 www.acmicpc.net 1. 테스트 케이스의 수를 입력받는다. 2. 테스트 케이스만큼 반복문을 돌린다. 3. 테스트 케이스를 입력받는다. 4. O가 나왔을 때마다 Stack 변수를 더해주고 Score에 Stack 만큼 점수를 쌓는다. #include #include using namespace std; int main() { int TestCount; st..

C++/Baekjoon 2021. 9. 25. 19:09

< 백준 BaekJoon : 1546번 평균 > C++

추석 연휴는 참 행복하다. 군인인 나는 불행하다. 이 문제는 모든 점수를 최고점을 100점으로 보았을 때의 점수로 변환해 평균을 구하는 문제이다. https://www.acmicpc.net/problem/1546 그닥 어려운 문제는 아니다. 1. 최고점을 찾는다. 2. 최고점을 기준으로 한 각각의 변환된 점수를 구한다. 3. 다 더해서 평균을 구해준다. 단, 하나 생각해야 할 것이 있다면 소숫점을 사용하기 때문에 float이나 double을 적절히 사용해야 한다는것? #include using namespace std; int main() { int Subject; cin >> Subject; float ScoreArray[Subject]; int Max = 0; for (int i=0; i < Subj..

C++/Baekjoon 2021. 9. 19. 19:08

< 백준 BaekJoon : 2577번 숫자의 개수 > C++

0-9까지의 숫자들을 10칸의 배열로 생각하면 크게 어렵지 않은 문제. https://www.acmicpc.net/problem/2577 2577번: 숫자의 개수 첫째 줄에 A, 둘째 줄에 B, 셋째 줄에 C가 주어진다. A, B, C는 모두 100보다 크거나 같고, 1,000보다 작은 자연수이다. www.acmicpc.net 1. 0-9로 생각할 배열을 만든다. 2. input을 받아 모두 곱한다. 곱한 값 → Result 3. 각각 숫자가 나올때마다 해당하는 배열의 위치에 +1을 해준다. Ex) 3 → [3]++ #include int main() { int NumA; int NumB; int NumC; int Result; int NumArray[10] = {0,}; scanf("%d %d %d",..

C++/Baekjoon 2021. 9. 19. 18:55

추가 정보

인기글

최신글

페이징

이전
1
다음
TISTORY
MoonBug © Magazine Lab
페이스북 트위터 인스타그램 유투브 메일

티스토리툴바