Home Paper Review. Bidirectional LSTM-CRF Models for Sequence Tagging@arXiv' 2015
Post
Cancel

Paper Review. Bidirectional LSTM-CRF Models for Sequence Tagging@arXiv' 2015

Abstract

  • LSTM 레이어와 CRF 레이어를 이용하여 LSTM-CRF 모델을 만듦

  • BI-LSTM 레이어와 CRF 레이어를 이용하여 BI-LSTM-CRF 모델을 만듦

  • BI-LSTM-CRF 모델을 이용하면 POS tagging태스크에서 높은 성능을 도달할 수 있음

Introduction

CRF란

Feature Function

Proposed Method

Models

LSTM-CRF Model

BI-LSTM-CRF Model

Experiments

Conclusions & Reviews

  • POS tagging과 같이 규칙이 있는 알고리즘일 경우 CRF를 사용하는 것이 의미가 있음 (예. 부사 뒤에 부사가 올 수 없음)

  • CRF의 feature function을 정의하기 위해서는 모든 경우의 수를 고려해야함

  • Feature function이 많아질수록 연산량이 많아 속도가 느려질 텐데 보통 몇 개인지 궁금함

  • CRF를 사용하면 속도가 많이 느려질 텐데 속도에 대한 실험 결과가 없어 아쉬움

Reference