민공지능/논문(5)
-
KLUE: Korean Language Understanding Evaluation(2)
2 Source Corpora 벤치마크 설정 시 흔히 사용되는 기존 데이터셋을 함께 구성하지 않고 KLUE를 처음부터 구축한다. 우리는 사용 가능한 텍스트 리소스를 조사하고 과정을 문서화하여 일부 corpora만 선택하는 방법과 이유를 더 잘 이해할 수 있도록 한다. 우리는 최근에 제안된 문서 프레임워크, 데이터시트 및 데이터 설명을 채택한다. 이러한 프레임워크를 기반으로 protocol을 자세히 설명하는 데 필요한 추가 정보를 문서화 및 제공한다. 2.1 Corpora Selection Criteria 우리는 작업별 corpora가 파생되고 주석이 달린 corpus 자료를 구축하기 위해 corpora를 소싱할 때 두 가지 기준을 고려한다. 첫 번째 기준은 접근성이다. KLUE의 주요 목적은 향후 NLP..
2021.07.12 -
Multi-Path and Group-Loss-Based Network for Speech Emotion Recognition in Multi-Domain Datasets
Multi-Path and Group-Loss-Based Network for Speech Emotion Recognition in Multi-Domain Datasets(2021), Kyoung Ju Noh *, Chi Yoon Jeong , Jiyoun Lim, Seungeun Chung, Gague Kim, Jeong Mook Lim and Hyuntae Jeong Abstract SER(Speech emotion recognition, 음성 감정 인식)은 일상 생활에서 개인의 감정을 자연스럽게 인식하는 방법이다. SER 모델을 실제 애플리케이션에 배포하려면, 감정 라벨로 태그가 지정된 데이터셋의 부족 및 보이지 않는 대상 도메인에 대한 SER 모델의 취약한 일반화와 같은 몇 가지 주요 과제를 극복..
2021.07.02 -
Speech emotion recognition using deep 1D & 2D CNN LSTM networks
보호되어 있는 글입니다.
2021.06.16 -
GAN(Generative adversarial network)
Generative Adversarial Networks Proceedings of the 27th International Conference on Neural Information Processing Systems 2014 Ian J. Goodfellow, Jean Pouget-Abadie, Mehdi Mirza, Bing Xu, David Warde-Farley, Sherjil Ozair, Aaron Courville, Yoshua Bengio https://ysbsb.github.io/gan/2020/10/07/Generative-Adversarial-Networks.html GAN 논문 리뷰 - Generative Adversarial Networks (NIPS2014) | mocha's mac..
2021.05.29 -
GPT-2 (Metrics : PPL, BPB, BPC)
GPT-2 논문에서 dataset 평가기준으로 PPL, BPB, BPC가 있다. PPL(Perpelxity) 'perplexed'는 '헷갈리는'과 비슷한 의미를 가진다. 특정 확률 모델이 실제로 관측되는 값을 얼마나 잘 예측하는지를 뜻한다. * PPL은 낮을수록 모델의 성능이 좋다. * 확률 모델이 다른 모델에 비해 얼마나 개선되었는지 평가할 때 쓴다. * 동일 모델 내 파라미터에 따른 성능 평가할 때 주로 사용한다. * 토픽 모델링 기법이 얼마나 빠르게 수렴하는지 확인할 때 사용한다. BPC(bits-per-character) 문자를 인코딩하는 데 필요한 평균 비트 수의 양을 정확히 측정한다. 압축 방법의 성능을 측정한 것이기 때문에 문자 당 비트 수가 적을수록 압축 방법이 더 효과적이다. 생성 언어 ..
2021.05.28