
stroigo라는 서비스를 이용해서 엘라스틱의 벡터 서치 학습을 시작했다. 이 터미널은 리눅스 환경이라고 함.
Relevance in Elasticsearch
Score

- 검색 결과는 기본적으로 score에 의해 정렬된다.
- 엘라스틱 서치의 스코어링 알고리즘은 기본적으로 BM25/BM25F 임.
- 이는 TF-IDF, 그리고 field length에 영향을 받음.
Vector Search

Introduction to vector search

- 벡터 임베딩의 목표는 텍스트나 이미지를 유사도를 판별하기 위해서이다.
- 텍스트나 이미지를 벡터화하는 방법은 임베딩 툴을 이용하거나 모델을 이용하는 방법이 있다.
- 임베딩 모델은 대표적인게 word2vec이나 GLoVE등이 있다
- 언어 모델은 트랜스포머 베이스의 Bidirectional Encoder등이 있다.(BERT)