분류 전체보기(58)
-
librosa.feature
librosa.feature.chroma_stft 리턴 값 chromagram : np.ndarray [shape=(n_chroma, t)] Normalized energy for each chroma bin at each frame. librosa.feature.chroma_stft(y=None, sr=22050, S=None, norm=inf, n_fft=2048, hop_length=512, win_length=None, window='hann', center=True, pad_mode='reflect', tuning=None, n_chroma=12, **kwargs) import librosa y1, sr1 = librosa.load('C:/nmb/nmb_data/we/testvoice_F2.wa..
2021.04.03 -
음성 데이터2(Mel Spectrogram, MFCCs, Chroma Frequencies)
Mel Spectrogram 주파수 특성이 시간에 따라 달라지는 오디오를 분석하기 위한 특징 추출 기법 Mel-scale(Melody scale) pitch에서 발견한 사람의 음을 인지하는 기준(threshold)을 반영한 scale 변환 함수 Pitch = 음의 높낮이(진동수 Hz의 크고 작음과는 다르다.) : Pitch는 보다 추상적인 개념이다. 사람은 소리의 Hz가 저주파일 때 더 민감하게 인지하고, 고주파로 갈수록 둔감해진다는 점에서 출발한 개념이다. 이를 just-noticeable differences(==threshold)라고 한다. 귀의 구조로 인한 차이 출처: https://hyongdoc.tistory.com/402 [Doony Garage] 사람은 200Hz와 1200Hz 소리는 쉽게..
2021.04.03 -
음성 데이터 (오디오 파일 이해, 2D Sound Waves, Fourier Transform, Spectrogram)
동일한 조건 속에서 혼성 목소리를 분석하기 위해 '실내 사람 간 2m 이상 거리 두기. 거리두기 지침에 따라 이 자리는 비워주세요.'라는 문장을 각각 5초씩 녹음했다. (환경소음은 동일하지 않다) 오디오 파일 이해하기 y: 소리가 떨리는 세기(진폭)를 시간 순서대로 나열한 것 Sampling rate: 1초당 샘플의 개수, 단위 Hz 또는 kHz import librosa import numpy as np y1, sr1 = librosa.load('C:/nmb/nmb_data/we/testvoice_F1_high.wav') y2, sr2 = librosa.load('C:/nmb/nmb_data/we/testvoice_F1.wav') y3, sr3 = librosa.load('C:/nmb/nmb_data/..
2021.04.03 -
[음성 기초 지식] 2. 음성 데이터 분석
Sound? 소리는 일반적으로 진동으로 인한 공기의 압축으로 생성 압축이 얼마나 됐느냐에 따라서 표현된 것이 바로 Wave(파동) → 파동은 진동하며 공간/매질을 전파해 나가는 현상 1. Amplitude(Intensity) : 진폭(강도) -소리의 크기와 관련 - 소리의 크기는 음압 변화의 비율로 표현 - bel : 소리 크기(음압)에 대한 단위, 실제 사용 시에는 bel값을 10배 한 decibel(dB=데시벨)을 사용 2. Frequency : 주파수(단위 : Hertz) = 소리의 높낮이 - 소리가 얼마나 압축되어 있는가? - 1초 동안의 진동 횟수 - 주파수가 높으면 높은 소리, 낮으면 낮은 소리 3. Tone Color, Timbre : 음색 - 기음/기본 주파수 : 소리의 높낮이를 구분할 수..
2021.04.01