COSMIC: COmmon Sense knowledge for eMotion Identification in Conversations (Findings of EMNLP 2020)
[논문링크] -> https://aclanthology.org/2020.findings-emnlp.224.pdf
- Findings는 메인 컨퍼런스는 아니지만, 아쉽게 떨어진 좋은 논문들을 의미한다고 보면 됨
- 이 논문은 DialougeRNN이라는 다른 연구와 비슷한 방식으로 진행이 됨.
- 핵심은 speaker tracking, listener tracking, context tracking 세 가지 요소가 있음
- Speaker은 화자의 감정 상태가 업데이트 되는 state
- Listener은 다른 사람의 감정 상태가 업데이트 되는 state
- Context는 이를 통합하는 state로 생각하면 된다
- 여기서 사용되는 feature vector는 2가지가 있다.
- RoBERTa 모델을 문장 단위의 감정분석에 학습을 한다.
- 이 모델로 발화의 feature을 뽑는 것
- Context independent feature라고 명명한다. → 발화당 feature가 하나.
- 세부적으로는, 마지막 4개의 layers의 activations을 추출
- 이 4개의 vectors의 평균을 취하여 얻는다.
- commonsense feature로 ATOMIC이라는 상식 그래프에 해당하는 데이터세트로, 학습된 모델의 feature
- https://mosaickg.apps.allenai.org/model_comet2020_people_events
Mosaic Knowledge Graphs
Demo of COMET 2020, a knowledge base construction engine that learns to produce new nodes and connections in commonsense knowledge graphs, on ATOMIC 2020.
mosaickg.apps.allenai.org
- 감정을 인식할 발화를 말한 사람이 speaker가 되는 것
- 다른사람들은 listener가 되는 것
- 직관적인 개념은 서로의 발화가 서로의 상태에 연락을 준다는 것!
- x는 RoBERTa vectors을 의미함
- CSK : commonsense knowledge
- 3가지 타입의 commonsense vectors을 사용한 것
- intent, effect, reaction
- Speaker state
- Internal state, external state (q, r)
- Intent state (i), Context state (c)