분류 전체보기(58)
-
error 해결
vscode에서 복사 붙여넣기 하면 ctrl+/이 안먹히고 글이 안지워지는 현상이 있었는데 찾아보니 이게 한컴입력기로 되어있어서 그랬다. Microsoft입력기로 바꿔주면 해결! [konlpy 오류] module 'tweepy' has no attribute 'StreamListener' → /가상환경 경로/lib64/python3.6/site-packages/konlpy/stream/twitter.py 들어가서 class CorpusListener(tweepy.StreamListener): -> class CorpusListener(tweepy.Stream):으로 변경해준다.
2021.06.16 -
GAN(Generative adversarial network)
Generative Adversarial Networks Proceedings of the 27th International Conference on Neural Information Processing Systems 2014 Ian J. Goodfellow, Jean Pouget-Abadie, Mehdi Mirza, Bing Xu, David Warde-Farley, Sherjil Ozair, Aaron Courville, Yoshua Bengio https://ysbsb.github.io/gan/2020/10/07/Generative-Adversarial-Networks.html GAN 논문 리뷰 - Generative Adversarial Networks (NIPS2014) | mocha's mac..
2021.05.29 -
Language(python, C/C++, Java)
python 가독성이 높고 쉬운 문법 덕택에 다른 프로그래밍 언어보다 빠른 습득이 가능하다는 특징이 있다. 스크립트 언어(script language) 컴파일 과정 없이 interpreter(해석기)가 소스 코드를 한 줄씩 읽고 곧바로 실행하는 스크립트 언어이다. (컴파일 언어는 인간이 작성한 코드를 기계어로 번역해 실행하는 것으로 실행 및 수정에 비교적 많은 시간을 소요하지만, 한 번 기계어로 번역되면 빠른 실행 속도를 보여준다. 동적 타이핑(dynamic typing) 변수의 자료형을 지정하지 않고 단순히 선언만해도 값을 지정할 수 있다. 독립적인 플랫폼(Platform-independent) Linux, Unix, Windows, Mac 등 대부분의 운영체제(Operating System, OS)에..
2021.05.29 -
code 기록
실행할 때마다 같은 결과를 출력하기 위해 설정 #필요한 라이브러리 불러오기 import numpy as np import tensorflow as tf np.random.seed(3) tf.random.set_seed(3)
2021.05.29 -
머신 러닝(Machine Learning)?
머신러닝은 기존 데이터를 이용해 아직 일어나지 않은 미지의 일을 예측하기 위해 만들어진 기법이다. 머신러닝은 주어진 데이터로부터 결과를 찾는 것에 초점을 맞추는 것이 아니라, 주어진 데이터로부터 규칙성을 찾는 것에 초점이 맞추어져 있다. 이런 과정을 학습(training)이라고 한다. 머신러닝 기술을 적용해서 대용량의 데이터를 분석하면 겉으로는 보이지 않던 패턴을 발견할 수 있다. 이를 데이터 마이닝(data mining)이라고 한다. 머신러닝 시스템의 종류 학습하는 동안의 감독 형태나 정보량에 따라 지도 학습, 비지도 학습, 준지도 학습, 강화 학습 등 네 가지 주요 범주가 있다. 지도학습 알고리즘에 주입하는 훈련 데이터에 label(레이블)이라는 원하는 답이 포함된다. classification(분류..
2021.05.29 -
GPT-2 (Metrics : PPL, BPB, BPC)
GPT-2 논문에서 dataset 평가기준으로 PPL, BPB, BPC가 있다. PPL(Perpelxity) 'perplexed'는 '헷갈리는'과 비슷한 의미를 가진다. 특정 확률 모델이 실제로 관측되는 값을 얼마나 잘 예측하는지를 뜻한다. * PPL은 낮을수록 모델의 성능이 좋다. * 확률 모델이 다른 모델에 비해 얼마나 개선되었는지 평가할 때 쓴다. * 동일 모델 내 파라미터에 따른 성능 평가할 때 주로 사용한다. * 토픽 모델링 기법이 얼마나 빠르게 수렴하는지 확인할 때 사용한다. BPC(bits-per-character) 문자를 인코딩하는 데 필요한 평균 비트 수의 양을 정확히 측정한다. 압축 방법의 성능을 측정한 것이기 때문에 문자 당 비트 수가 적을수록 압축 방법이 더 효과적이다. 생성 언어 ..
2021.05.28