민공지능(51)
-
[이것이 취업을 위한 코딩 테스트다 with 파이썬] 2-1강(그리디 알고리즘, 예제)
그리디 알고리즘 그리디 알고리즘(탐욕법)은 현재 상황에서 지금 당장 좋은 것만 고르는 방법을 의미한다. 매 순간 가장 좋아보이는 것을 선택하며, 현재의 선택이 나중에 미칠 영향에 대해서는 고려하지 않는다. 일반적인 그리디 알고리즘은 문제를 풀기 위한 최소한의 아이디어를 떠올릴 수 있는 능력을 요구한다. 그리디 해법은 그 정당성 분석이 중요하다. 단순히 가장 좋아 보이는 것을 반복적으로 선택해도 최적의 해를 구할 수 있는지 검토한다. 그리디 알고리즘은 위와 같이 단순히 매 상황에서 가장 큰 값만 고르는 방식어서 일반적인 상황에서 그리디 알고리즘은 최적의 해를 보장할 수 없을 때가 많다. 하지만 코딩 테스트에서의 대부분의 그리디 문제는 탐욕법으로 얻은 해가 최적의 해가 되는 상황에서, 이를 추론할 수 있어야..
2021.04.27 -
[이것이 취업을 위한 코딩 테스트다 with 파이썬] 1-2강(문자열, 튜플, 사전, 집합 자료형)
* 유튜브를 보고 정리한 내용입니다. 이것이 취업을 위한 코딩 테스트다 with 파이썬, 저자 나동빈 백슬래시(\)는 escape 문자를 만들기 위해 사용할 수 있으며, 파이썬 문법이 정해놓은 약속 data = "Don't you know \"python\"?" print(data) # Don't you know "python"? a = "Hello" b = "World" print(a+ " " +b) #Hello World a = "String" print(a * 3) # StringStringString a = "ABCDEF" print(a[2:4]) # CD a[2] = 'a' # 'str' object does not support item assignment # 문자열 자료형은 원소 할당을 지원..
2021.04.27 -
[이것이 취업을 위한 코딩 테스트다 with 파이썬] 1-1강(수 자료형, 리스트 자료형)
* 유튜브를 보고 정리한 내용입니다. 이것이 취업을 위한 코딩 테스트다 with 파이썬, 저자 나동빈 시간 복잡도를 표현할 때는 빅오(Big-O) 표기법을 사용한다. N개의 데이터의 합을 계산하는 프로그램 예제 array = [3,5,1,2,4] # 5개의 데이터(N=5) # array 변수에 리스트 객체 할당 summary = 0 # 합계를 저장할 변수 # 모든 데이터를 하나씩 확인하며 합계를 계산 for x in array: summary += x # 결과 출력 print(summary) # 15 수행 시간은 데이터의 개수 N에 비례할 것임을 예측할 수 있다. 시간 복잡도 : O(N) a = 5 b = 7 print(a+b) # 상수 연산이므로 시간 복잡도는 O(1)로 표현할 수 있다. 2중 반복문 ..
2021.04.27 -
STT
제일 중요한 것은 UTF-8 AM이 중요한 모델이기 때문에 전사할 때 일관성 있게 작업해야 한다. AM 모델에 들어가는 데이터가 크게 2가지로 되어 있다. (front end는 음성을 전 처리하는 부분이다.) 프론트 앤드 결과를 보통 이미지라고 표현하는데, 이미지로 표현한 것을 특성 추출하고 분류하는 모델이다. 음성이 가지는 요소가 아주 중요하다. 글자가 가진 요소는 별로 중요하지 않음. linear - mel - mfcc로 가는데 갈수록 정보가 날아간다. tts에서는 mel을 보통 쓴다. 오른쪽 밑의 그림이 초록색 부분. 딥러닝 모델. 성능 차이가 크지 않다. 이 모델 자체는 굳이 안 쓰고 있다. 이 부분이 제일 중요하다. 멜 스펙트로그램에서부터 하이레벨의 글자에 가까운 특성 추출하는 것이 이 단계 지..
2021.04.26 -
Speech VGG
SpeechVGG 모델은 음성 처리에 좋은 전이학습 모델이다. # Block 1 x = layers.Conv2D(64, (3, 3), activation='relu', padding='same', name='block1_conv1')(img_input) x = layers.Conv2D(64, (3, 3), activation='relu', padding='same', name='block1_conv2')(x) x = layers.MaxPooling2D((2, 2), strides=(2, 2), name='block1_pool')(x) ' ' ' # Block 5 x = layers.Conv2D(512, (3, 3), activation='relu', padding='same', name='block5_c..
2021.04.25 -
librosa.feature
librosa.feature.chroma_stft 리턴 값 chromagram : np.ndarray [shape=(n_chroma, t)] Normalized energy for each chroma bin at each frame. librosa.feature.chroma_stft(y=None, sr=22050, S=None, norm=inf, n_fft=2048, hop_length=512, win_length=None, window='hann', center=True, pad_mode='reflect', tuning=None, n_chroma=12, **kwargs) import librosa y1, sr1 = librosa.load('C:/nmb/nmb_data/we/testvoice_F2.wa..
2021.04.03