Natural_Language_Processing ; NLP

-> 일반적으로 전이학습을 사용함.

-> 목적 : 문장 이해X, 연산이나 처리O

학습된 모델로 문장 분류, 요약, 문장 생성, 번역 등의 작업 수행 (generator의 형태) sequential 모델에서는 처리가 안됨.

대량의 말뭉치(Corpus - 모델링을 위하여 특정 목적을 가지고 수집한 언어의 표본)는 대부분 비정형. 문장을 단어, 글자, 형태소 등 어느 수준으로 잘라야 하는가?

통상 단어 수준으로 자르는데, tokenization 함.

숫자로 변환: Vectorization = Encoding

Language Model

Bag of Words

n-gram TF-IDF(Term Frequency - Inverse Document Frequency

But 귤, 오렌지, 사과를 비교할 땐?

cf. 단순히 빈도수만 가지고 유사성의 의미를 구분할 수 있겠느냐?

Similarity 단어나 문장 간 유사도를 비교.

단어나 문장을 벡터로 변환 후 유사도를 비교 방법 (피타고라스의 정리와 유사)

Embedding 중앙 단어로 주변 단어를 학습 시킴

pix2pix를 사용한 GAN (예제) (0)	2023.02.08
Generative Adversarial Network < GAN > (0)	2023.02.07
DT Digital Transformation직무 (0)	2023.02.07
Recurrent Neural Network ; RNN (0)	2023.02.02
CNN Animal(Dogs and Cats) Categorical GPU (0)	2023.01.31

Welcome_to_my_la-la-Land