1일 1개념정리 24.08.09.금 ~
큰 결정에 큰 동기가 따르지 않을 때도 있다. 하지만 큰 결심이 따라야 이뤄낼 수 있다.
무조건 무조건 1일 1개의 개념 정리하기 !!!!!!!!!!!!!!!!!!!!!!!!!!!!!
#88. LSTM ( Long Short-Term Memory )
LSTM은 시계열 데이터(시간 순서에 따라 관측된 데이터)를 처리하는데 특화된 신경망 구조이다. 사실 몇번 들어보기나 했지, ai를 전공하지 않아 잘 모른다. 이번에는 일반인이 이해할 정도로만 정리겸 공부해보려 한다. 전문지식X, 내용 정리만O

LSTM
LSTM(Long Short-Term Memory)은 사람의 기억과 비슷한 방식으로 데이터를 처리한다고 보면 된다. LSTM 자체가 시간 순서에 따라 관측된 데이터를 처리한다. 근데 이때 필요없는 부분은 과감히 지우기도 한다. 그래서 편식쟁이다.
- 순서가 중요한 데이터를 처리한다. ex) LSTM은 대화의 앞뒤 맥락을 기억하며 처리한다.
- 우리가 들은 문장, 본 동영상의 흐름, 날씨 변화 같은 데이터를 이해하는 데 쓰임
LSTM의 핵심 아이디어
LSTM은 데이터를 처리하면서 어떤 것은 기억하고, 어떤 것은 잊어버린다. 이를 LSTM 안에 있는 "게이트"라는 시스템이 처리한다. 중요한 정보를 선택적으로 기억하여 장/단기 정보를 효과적으로 학습한다.
1. 망각 게이트 = 잊어야 하는 것 선택
- "이건 중요하지 않으니까 잊어버리자!"
- ex. 과거 대화를 기억할 때, "안녕하세요" 같은 기본 인사는 중요하지 않으니까 버림
2. 입력 게이트 = 기억해야 할 것을 선택
- "이건 중요하니까 기억하자!"
- ex. 대화에서 중요한 단어들 저장함. 약속시간, 장소 등
3. 출력 게이트 = "지금" 필요한 것을 꺼냄
- "지금 당장 필요한 정보는 이거다!"
- ex. 대화 흐름을 이어가기 위해 지금 기억해야 할 단어를 꺼냄.
예시
실생활 대입
- 중요한 정보 노트에 메모, 시간 지나면 지움
- 영화보러 가는 약속을 떠올릴 때, 영화제목(= 안중요하니까 지움), 주말에 약속 있음(= 중요하니까 기억) 이런 식으로 진행된다.
기술 사용 예시
- 음성 인식 : 맥락을 이해하고 "내일 날씨 어때?"를 대답할 수 있음
- 번역 : I love you를 "사랑해"로 번역하면 문장의 순서, 단어 중요도 등을 기억
- 주식 예측 : 과거 주식 데이터의 흐름을 기억해서, 앞으로의 변화를 예측합니다.
- 글쓰기 도우미 : 사용자가 쓴 문맥을 기억해 다음에 어떤 단어가 올지 추천합니다.
반응형
'1일 1개념정리 (24년 8월~12월) > 네트워크, 클라우드' 카테고리의 다른 글
1일1개 (92) - 자기 옷에 이름쓰고 다니는 애기 패킷 (0) | 2024.11.25 |
---|---|
1일1개 (90) - OOOcast 통신방식 (31) | 2024.11.23 |
1일1개 (85) - 서버없는 컴퓨팅 (0) | 2024.11.18 |
1일1개 (84) - 아이스크림 무인매장 속 비동기 처리 (0) | 2024.11.17 |
1일1개 (73) - 기사님 시청역으로 가주세요 (가는 길은 모름) (0) | 2024.11.06 |