민공지능(51)
-
2. Intensity, Loudness, and Timbre
sound power(소리 파워) 에너지가 전달되는 속도 음원에서 방출되는 단위 시간당 에너지 전력을 와트로 표시한다. (W) sound intensity(소리 강도) 단위 면적당 sound power W에 제곱미터를 나눈 값으로 측정할 수 있다. = W/㎡ Threshold of hearing Intensity level Logarithmic scale 강도의 척도 : dB(데시벨) 3dB씩 올라갈때마다 강도가 두 배가 된다. Loudness 소리 강도의 주관적 인식 소리의 주파수와 길이에 따라 달라진다. 예) 3dB은 100ms로 지속되지만 3dB보다 작은 강도의 소리는 600ms까지 지속된다. 듣는 사람 나이에 따라 영향을 받는다(강도는 같지만 음량은 다르다) 측정 방법 : phons Timbre ..
2021.07.07 -
Multi-Path and Group-Loss-Based Network for Speech Emotion Recognition in Multi-Domain Datasets
Multi-Path and Group-Loss-Based Network for Speech Emotion Recognition in Multi-Domain Datasets(2021), Kyoung Ju Noh *, Chi Yoon Jeong , Jiyoun Lim, Seungeun Chung, Gague Kim, Jeong Mook Lim and Hyuntae Jeong Abstract SER(Speech emotion recognition, 음성 감정 인식)은 일상 생활에서 개인의 감정을 자연스럽게 인식하는 방법이다. SER 모델을 실제 애플리케이션에 배포하려면, 감정 라벨로 태그가 지정된 데이터셋의 부족 및 보이지 않는 대상 도메인에 대한 SER 모델의 취약한 일반화와 같은 몇 가지 주요 과제를 극복..
2021.07.02 -
1. sound & waveform
sound 물체의 진동으로 생긴다. 진동은 공기 분자를 진동하게 한다. 기압의 변화는 파동을 일으킨다. = 소리는 에너지를 전달하는 파동 mechanical wave 소리는 기계적 파동이며 에너지는 한 지점에서 다른 지점으로 이동한다. 기계적 파동은 파동이 팽창할 수 있는 매개체가 필요하다. waveform frequency : 주파수 intensity : 강도 timbre : 음색 주파수(frequency)가 높을수록 소리가 높아지며, 진폭(amplitude)이 클수록 소리가 커진다. picth 주파수에 대한 로그 인식과 비슷하다. (주파수는 선형(linear) 방식이 아니라 로그(log) 방식이다.) 두 개의 주파수가 2의 거듭제곱만큼 서로 다르면 유사하게 인식된다. Cents 옥타브는 1200 ce..
2021.07.01 -
역전파(backpropagation), 경사하강법 계산
역전파 : https://www.youtube.com/watch?v=8300noBbCRU 경사하강법 : https://www.youtube.com/watch?v=YIgLpsJ-1J4
2021.06.22 -
Speech emotion recognition using deep 1D & 2D CNN LSTM networks
보호되어 있는 글입니다.
2021.06.16 -
error 해결
vscode에서 복사 붙여넣기 하면 ctrl+/이 안먹히고 글이 안지워지는 현상이 있었는데 찾아보니 이게 한컴입력기로 되어있어서 그랬다. Microsoft입력기로 바꿔주면 해결! [konlpy 오류] module 'tweepy' has no attribute 'StreamListener' → /가상환경 경로/lib64/python3.6/site-packages/konlpy/stream/twitter.py 들어가서 class CorpusListener(tweepy.StreamListener): -> class CorpusListener(tweepy.Stream):으로 변경해준다.
2021.06.16