전체 글(54)
-
kochat_config.py
PROC PROC = { 'logging_precision': 5, # 결과 저장시 반올림 소수점 n번째에서 반올림 'model_dir': BASE['root_dir'] + "saved{_}".format(_=_), # 모델 파일, 시각화 자료 저장 경로 'visualization_epoch': 50, # 시각화 빈도 (애폭마다 시각화 수행) 'save_epoch': 10 # 저장 빈도 (에폭마다 모델 저장) } proc은 Processor의 줄임말로, 다양한 모델들의 학습/테스트를 수행하는 함수인 fit()과 추론을 수행하는 함수인 predict() 등을 수행하는 클래스 집합입니다. 현재 지원하는 프로세서는 총 4가지로 아래에서 자세하게 설명합니다. from abc import abstractmetho..
2021.07.13 -
KLUE: Korean Language Understanding Evaluation(2)
2 Source Corpora 벤치마크 설정 시 흔히 사용되는 기존 데이터셋을 함께 구성하지 않고 KLUE를 처음부터 구축한다. 우리는 사용 가능한 텍스트 리소스를 조사하고 과정을 문서화하여 일부 corpora만 선택하는 방법과 이유를 더 잘 이해할 수 있도록 한다. 우리는 최근에 제안된 문서 프레임워크, 데이터시트 및 데이터 설명을 채택한다. 이러한 프레임워크를 기반으로 protocol을 자세히 설명하는 데 필요한 추가 정보를 문서화 및 제공한다. 2.1 Corpora Selection Criteria 우리는 작업별 corpora가 파생되고 주석이 달린 corpus 자료를 구축하기 위해 corpora를 소싱할 때 두 가지 기준을 고려한다. 첫 번째 기준은 접근성이다. KLUE의 주요 목적은 향후 NLP..
2021.07.12 -
3. Understanding Audio Signals for Machine Learning
Audio signal - Analog signal 시간에 대한 연속적인 값 진폭에 대한 연속적인 값 - Digital signal 개별적인 값의 순서 data point는 가능한 모든 실수가 아니라 제한된 수의 값만 취할 수 있다. Analog to digital conversion 샘플링(sampling) 양자화(Quantization)
2021.07.07 -
2. Intensity, Loudness, and Timbre
sound power(소리 파워) 에너지가 전달되는 속도 음원에서 방출되는 단위 시간당 에너지 전력을 와트로 표시한다. (W) sound intensity(소리 강도) 단위 면적당 sound power W에 제곱미터를 나눈 값으로 측정할 수 있다. = W/㎡ Threshold of hearing Intensity level Logarithmic scale 강도의 척도 : dB(데시벨) 3dB씩 올라갈때마다 강도가 두 배가 된다. Loudness 소리 강도의 주관적 인식 소리의 주파수와 길이에 따라 달라진다. 예) 3dB은 100ms로 지속되지만 3dB보다 작은 강도의 소리는 600ms까지 지속된다. 듣는 사람 나이에 따라 영향을 받는다(강도는 같지만 음량은 다르다) 측정 방법 : phons Timbre ..
2021.07.07 -
Multi-Path and Group-Loss-Based Network for Speech Emotion Recognition in Multi-Domain Datasets
Multi-Path and Group-Loss-Based Network for Speech Emotion Recognition in Multi-Domain Datasets(2021), Kyoung Ju Noh *, Chi Yoon Jeong , Jiyoun Lim, Seungeun Chung, Gague Kim, Jeong Mook Lim and Hyuntae Jeong Abstract SER(Speech emotion recognition, 음성 감정 인식)은 일상 생활에서 개인의 감정을 자연스럽게 인식하는 방법이다. SER 모델을 실제 애플리케이션에 배포하려면, 감정 라벨로 태그가 지정된 데이터셋의 부족 및 보이지 않는 대상 도메인에 대한 SER 모델의 취약한 일반화와 같은 몇 가지 주요 과제를 극복..
2021.07.02 -
1. sound & waveform
sound 물체의 진동으로 생긴다. 진동은 공기 분자를 진동하게 한다. 기압의 변화는 파동을 일으킨다. = 소리는 에너지를 전달하는 파동 mechanical wave 소리는 기계적 파동이며 에너지는 한 지점에서 다른 지점으로 이동한다. 기계적 파동은 파동이 팽창할 수 있는 매개체가 필요하다. waveform frequency : 주파수 intensity : 강도 timbre : 음색 주파수(frequency)가 높을수록 소리가 높아지며, 진폭(amplitude)이 클수록 소리가 커진다. picth 주파수에 대한 로그 인식과 비슷하다. (주파수는 선형(linear) 방식이 아니라 로그(log) 방식이다.) 두 개의 주파수가 2의 거듭제곱만큼 서로 다르면 유사하게 인식된다. Cents 옥타브는 1200 ce..
2021.07.01