[논문이해] Block-Skim: Efficient Question Answering for Transformer

논문명: Block-Skim: Efficient Question Answering for Transformer

Block-Skim: Efficient Question Answering for Transformer

Transformer models have achieved promising results on natural language processing (NLP) tasks including extractive question answering (QA). Common Transformer encoders used in NLP tasks process the hidden states of all input tokens in the context paragraph

arxiv.org

아이디어만 기억하고자, 간단히 정리합니다

아이디어

문서의 모든 내용을 넣지 말고, 필요 없는 걸 제거하자
사견: 문서에서 필요한 내용을 선별하는 방법 이외에도 필요 없는 걸 제거하는 방법도 있다는 걸 기억하자

우선 블록 단위로 나누는데, 블록은 32개 토큰 단위로 묶인다. (즉, 문장 단위처럼 예쁘게 잘리지 않는다.)
상단에서 attention heatmap 을 block 단위별로 추출하고, CNN 을 통과하여 0과 1, 즉 쓸지 말지를 결정한다.
위 결과를 토대로 해당 블록을 쓸지 말지 결정하는 구조다.

저작자표시 (새창열림)

'NLP > 논문이해' 카테고리의 다른 글

[논문이해] Dataset Distillation with Attention Labels for Fine-tuning BERT (0)	2023.08.18
[논문이해] Query2doc: Query Expansion with Large Language Models (0)	2023.08.10
[논문이해] What learning algorithm is in-context learning? Investigations with linear models (2)	2023.08.04
[논문이해] Why Can GPT Learn In-Context? Language Models Implicitly Perform Gradient Descent as Meta-Optimizers (0)	2023.07.31
[논문이해] Ground-Truth Labels Matter: A Deeper Look into Input-Label Demonstrations (0)	2023.07.24

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

자연어천재만재

[논문이해] Block-Skim: Efficient Question Answering for Transformer

아이디어

'NLP > 논문이해' 카테고리의 다른 글

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역

[논문이해] Block-Skim: Efficient Question Answering for Transformer

아이디어

'NLP > 논문이해' 카테고리의 다른 글

'NLP/논문이해' Related Articles

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역