호기심을 넘어 성장하는 기록

  • 홈
  • 태그
  • 방명록

데이터 사이언스 스터디/딥러닝 1

[Deep Learning] Transformer: Attention Is All You Need 요약

자연어 처리 딥러닝 모델Seq2Seq한계점RNN 기반 모델 : 시퀀스 데이터를 처리할 때 시간 축으로 순차적으로 처리하면서 hidden state에 시퀀스의 정보를 담아가기 때문에 시간에 따라 오래된 정보가 일부 소실될 수 있다는 문제가 있음. (vanishing gradient problem)CNN 기반 모델 : 입력 데이터에 대해 고정된 크기의 필터를 적용하는 구조이기 때문에 입력 데이터의 길이나 구조가 다양한 경우 처리에 제약이 있음. (자연어 처리 분야에서 입력 데이터의 길이나 구조가 다양한 경우가 많음)Transformer현대의 자연어 처리 네트워크에서 핵심Attention 기법만 잘 활용해도 자연어 처리 task에서 좋은 성능을 얻을 수 있다.RNN이나 CNN을 전혀 필요로 하지 않음. 1...

데이터 사이언스 스터디/딥러닝 2024.12.11
이전
1
다음
더보기
프로필사진

  • 분류 전체보기 (39)
    • AI MBA (서강대, 24.03~25.06) (2)
    • AI School 8기 (LIKELION, 22... (13)
    • 데이터 사이언스 스터디 (7)
      • 선형대수학 (0)
      • 통계 (4)
      • 머신러닝 (2)
      • 딥러닝 (1)
    • Projects (0)
    • Tech (8)
      • Linux(Ubuntu) (0)
      • Bigdata Platform (3)
      • DBMS (1)
      • Airflow (0)
      • Docker, Kubernetes (3)
      • MLOps (1)
    • Programming language (3)
      • Python (0)
      • R (2)
      • SQL (1)
    • 회고,리뷰 (4)
      • 회고,리뷰,정보공유 (3)

Tag

hive, drm엑셀작업, HiveQL, xlwings, rjava, 직장인대학원, 의사결정나무, 데이터분석회고, 빅데이터대학원, 서강대mba, ntile함수 #상위n%쿼리, ML, AIMBA, 코호트분석, rjava오류해결, 머신러닝, 퍼널분석, 파이썬업무자동화, 블로그이전, DecisionTree,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

페이스북 트위터 플러그인

  • Facebook
  • Twitter

Archives

Calendar

«   2025/07   »
일 월 화 수 목 금 토
1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30 31

방문자수Total

  • Today :
  • Yesterday :

Copyright © Kakao Corp. All rights reserved.

티스토리툴바