본문 바로가기
  • 시 쓰는 개발자
1일 1개념정리 (24년 8월~12월)/네트워크, 클라우드

1일1개 (88) - 편식쟁이 AI

by poetDeveloper 2024. 11. 21.

1일 1개념정리 24.08.09.금 ~ 

 

큰 결정에 큰 동기가 따르지 않을 때도 있다. 하지만 큰 결심이 따라야 이뤄낼 수 있다.

무조건 무조건 1일 1개의 개념 정리하기 !!!!!!!!!!!!!!!!!!!!!!!!!!!!!


#88. LSTM ( Long Short-Term Memory )

LSTM은 시계열 데이터(시간 순서에 따라 관측된 데이터)를 처리하는데 특화된 신경망 구조이다. 사실 몇번 들어보기나 했지, ai를 전공하지 않아 잘 모른다. 이번에는 일반인이 이해할 정도로만 정리겸 공부해보려 한다. 전문지식X, 내용 정리만O

 

LSTM

LSTM(Long Short-Term Memory)은 사람의 기억과 비슷한 방식으로 데이터를 처리한다고 보면 된다. LSTM 자체가 시간 순서에 따라 관측된 데이터를 처리한다. 근데 이때 필요없는 부분은 과감히 지우기도 한다. 그래서 편식쟁이다.

  • 순서가 중요한 데이터를 처리한다. ex) LSTM은 대화의 앞뒤 맥락을 기억하며 처리한다.
  • 우리가 들은 문장, 본 동영상의 흐름, 날씨 변화 같은 데이터를 이해하는 데 쓰임

 

LSTM의 핵심 아이디어

LSTM은 데이터를 처리하면서 어떤 것은 기억하고, 어떤 것은 잊어버린다. 이를 LSTM 안에 있는 "게이트"라는 시스템이 처리한다. 중요한 정보를 선택적으로 기억하여 장/단기 정보를 효과적으로 학습한다.

 

1. 망각 게이트 = 잊어야 하는 것 선택

  • "이건 중요하지 않으니까 잊어버리자!"
  • ex. 과거 대화를 기억할 때, "안녕하세요" 같은 기본 인사는 중요하지 않으니까 버림

2. 입력 게이트 = 기억해야 할 것을 선택

  • "이건 중요하니까 기억하자!"
  • ex. 대화에서 중요한 단어들 저장함. 약속시간, 장소 등

3. 출력 게이트 = "지금" 필요한 것을 꺼냄

  • "지금 당장 필요한 정보는 이거다!"
  • ex. 대화 흐름을 이어가기 위해 지금 기억해야 할 단어를 꺼냄.

 

예시

실생활 대입

  1. 중요한 정보 노트에 메모, 시간 지나면 지움
  2. 영화보러 가는 약속을 떠올릴 때, 영화제목(= 안중요하니까 지움), 주말에 약속 있음(= 중요하니까 기억) 이런 식으로 진행된다.

기술 사용 예시

  1. 음성 인식 : 맥락을 이해하고 "내일 날씨 어때?"를 대답할 수 있음
  2. 번역 : I love you를 "사랑해"로 번역하면 문장의 순서, 단어 중요도 등을 기억
  3. 주식 예측 : 과거 주식 데이터의 흐름을 기억해서, 앞으로의 변화를 예측합니다.
  4. 글쓰기 도우미 : 사용자가 쓴 문맥을 기억해 다음에 어떤 단어가 올지 추천합니다.
반응형