AI 12

[논문리뷰] Summarization is (Almost) Dead; 요약 (거의) 죽음

Summarization is (Almost) Dead 논문 발표일 : 2023년 9월 18일 Peking University, Wangxuan Institute of Computer Technology Xiao Pu, Mingqi Gao, Xiaojun Wan Abstract LLM(대형 언어 모델) 요약 생성에 대한 평가 새로운 데이터 셋을 개발, 사람이 평가하는 실험을 진행 Zero-shot 생성능력을 다섯가지 다른 요약 작업을 통해 평가한다. 결과: LLM이 생성한 요약이 인간이 작성한 요약/세밀하게 튜닝된 모델이 생성한 요약보다 명확하게 선호됨 LLM이 생성한 요약은 일관성이 뛰어나며 extrinsic hallucinations 인스턴스도 적다. 요약 작업에서 성능이 만족스럽게 나왔고 텍스트 요..

AI 2023.09.29

[논문읽기-2] ChatGPT is fun, but it is not funny! Humor is still challenging Large Language Models

ChatGPT is fun, but it is not funny! Humor is still challenging Large Language Models (ChatGPT 웃긴데 안 웃김! 유머는 아직 LLM에서 넘어야 할 산이다.) 논문출처 : https://arxiv.org/pdf/2306.04563v1.pdf 논문저자 : Sophie Jentzsch, Kristian Kersting 논문발행일 : 2023년 6월 7일 논문 내용: ChatGPT의 유머감각에 대해 여러가지 실험을 진행한 결과 논문 읽기 전 알고 있으면 좋은 내용 : NLP, LLM, ChatGPT 등 자연어처리 관련 기술 https://arxiv.org/pdf/2306.04563v1.pdf Abstract 유머는 인간 커뮤니케이션에서 ..

AI 2023.06.13

[논문읽기-1] OCR-free Document Understanding Transformer - 번역

OCR-free Document Understanding Transformer 문서 이미지를 이해하는 것은 복잡한 기능인 텍스트 읽기와 문서의 전체적인 이해능력을 필요로하기 때문에 핵심적이지만 어려운 작업이다. 현재 시각적 문서 이해(Visual Document Understanding, VDU) 방법은 텍스트 읽기 작업을 외부 OCR(광학 문자 인식) 엔진에 위탁하고 OCR 출력물에 초점을 맞추어 이해 작업을 수행한다. 이러한 OCR 기반 접근 방식은 유망한 성능을 보여주었지만, 1) OCR 사용에 따른 높은 계산 비용, 2) 언어 또는 문서 유형에 대한 OCR 모델의 제한성, 3) OCR 오류 전파로 인한 후속 과정의 문제 등이 있다. 이러한 문제를 해결하기 위해 본 논문에서는 문서 이해 트랜스포머(..

AI 2023.06.06

[텍스트 생성 요약] BART 알아보기

BART Denoising Sequence-to-Sequence Pre-training for Natural Language Generation, Translation, and Comprehension (2019, ACL, Facebook) Transformer의 bidirectional Encoder와 autoregressive Decoder 둘다 활용한 seq2seq 형태의 모델 자연어이해(NLU)와 자연어생성(NLG)에서 모두 좋은 성능 각각 Transformer의 Encoder와 Decoder만 활용한 BERT 및 GPT의 단점을 해결 사전학습단계 텍스트를 임의적인 noising 적용을 통해 오염 원본 텍스트를 복원하기 위해 seq2seq모델 학습 사전 학습 단계 중 텍스트 noising의 유연성..

AI 2023.04.27

[텍스트 생성 요약] Pointer Generator 모델에 대해 알아보기

Pointer Generator Get To The Point: Summarization with Pointer-Generator Networks(2017, ACL, Google) Seq2seq RNN 기반 모델의 발전된 형태 Hybrid pointer-generator network: Pointing 메커니즘을 통해 새로운 단어를 생성 Coverage : 요약문을 생성하는 시점을 기준으로 포함된 정보에 대해서는 그 다음 단계에서 token의 생성 확률을 낮춤에 따라 새로운 token을 포함하게 함 Seq2seq RNN Encoder, Decoder, attention distribution와 context vector, vocabulary distrubution으로 구성 RNN Encoder : sou..

AI 2023.04.25

[Text Extraction] NLP for Indian Languages - 인도 언어를 위한 NLP 라이브러리

인도에는 사용되고 있는 언어가 여러 개 있습니다. 인도 언어의 자연어처리를 위한 중요한 3가지 라이브러리에 대해 알아보도록 하겠습니다. 1. iNLTK(Natural Language Toolkit for Indic Languages) Natural Language Toolkit for Indic Language로, NLTK Python 패키지에 해당하며 인도언어용 NLP Toolkit입니다. Tokenization, Word Embeddings, Text completion, Similarity of sentences 등 제공합니다. 설치 : pip install inltk 12개의 언어 지원 – Hindi(hi), Pungabi(pa), Sanskrit(sa), Gujarati(gu), Kannada(..

AI 2023.03.03

[IBM]Machine Learning with Python : course introduction

coursera에 무료 수강권이 있어서 Machine Learning 수업을 시작하였다. IBM에서 진행하는 강의이고 수료시 자격증이 주어진다. Feundamentals of Machine Learning with Python 본 강의에서는 머신러닝 개념 및 특징과 머신러닝 알고리즘에 대해 소개한다. Applications of machine learning 머신러닝으로 여러 가지 일을 할 수 있다. 자율주행차, 사이버보안, 주식 시장 예측 그리고 의학 진단 등이다. Course breakdown 코스는 다음과 같이 진행된다. 1. 머신러닝 소개 그리고 회귀(regression) 2. 분류(classification) 3. 클러스터링(clustering) 4. 파이널 프로젝트 (final project)..

AI 2023.01.31

COSMIC: COmmon Sense knowledge for eMotion Identification in Conversations (Findings of EMNLP 2020)

COSMIC: COmmon Sense knowledge for eMotion Identification in Conversations (Findings of EMNLP 2020) [논문링크] -> https://aclanthology.org/2020.findings-emnlp.224.pdf Findings는 메인 컨퍼런스는 아니지만, 아쉽게 떨어진 좋은 논문들을 의미한다고 보면 됨 이 논문은 DialougeRNN이라는 다른 연구와 비슷한 방식으로 진행이 됨. 핵심은 speaker tracking, listener tracking, context tracking 세 가지 요소가 있음 Speaker은 화자의 감정 상태가 업데이트 되는 state Listener은 다른 사람의 감정 상태가 업데이트 되는 sta..

AI 2022.12.09

MELD : A Multimodal Multi-Party Dataset for Emotion Recognition in Conversations, ACL 2019

MELD : A Multimodal Multi-Party Dataset for Emotion Recognition in Conversations, ACL 2019 Multimodal : text, audio 기반의 데이터셋, 얼굴 사진은 align은 안되어있음 (scene만 제공) Multi-Party : 다화자간의 대화 (2명 이상) 대화 속 감정인식에서 상당히 많이 쓰이는 데이터세트이며, 우리가 실습할 데이터이기도 하다. 기존에 EmotionLines라는 ERC 데이터세트가 있는데, 이를 잘못된 부분을 필터링하고 멀티모달로 확장 Friends 티비 프로그램에서 수집한 데이터세트 다화자간 데이터이지만, 필터링을 통해 두 명의 대화로 만든 버전도 존재 A | B | A | C | B ⇒ A | B | A..

AI 2022.12.09

[Notion(노션)] Introducing Notion AI 한글 번역 및 Notion AI 소개

정말 흥미로운 소식이 나왔네요. Notion에서 인공지능을 활용하여 Notion workspace에 적용한다고 하는 데 어떤 점이 새롭게 바뀔지 함께 살펴보도록 하겠습니다. Notion AI 소개 목차 1) Reference 2) 들어가며 3) Notion AI로 현재 할 수 있는 것 4) 대기번호 받기 5) 마무리 1) Reference 이 글은 아래 링크를 참조하였습니다. https://www.notion.so/blog/introducing-notion-ai Introducing Notion AI Notion AI launches today in private alpha. Here’s what you can do with it, and where you can sign up to get access...

AI 2022.11.18