본문 바로가기
DataBase

Inverted Index

by orioncsy 2023. 4. 5.

Inverted Index

개념

Inverted Index(역인덱스)

  • 내용과 그것이 위치한 위치를 자료구조로 표현한 것

인덱스와의 차이

  • 방향성에 차이가 존재
  • 인덱스는 doc Id와 내용을 매핑하지만 역 인덱스는 내용과 그 내용이 위치한 doc Id를 매핑한다.

검색 방식

인덱스

  • 전통적인 RDBMS에서는 like 검색을 사용
  • 매핑되는 내용 중에 찾으려는 내용을 row마다 탐색한다.
  • 데이터가 많으면 검색 대상이 증가하여 검색 시간이 증가한다.

역인덱스

  • elastic search에서 사용
  • 데이터를 저장할 때 내용을 파싱 하여 추출된 키워드를 텀(term)이라고 하고 이 키워드를 통해 검색
  • 데이터가 늘어나도 역인덱스가 가리키는 id가 증가하기 때문에 탐색 속도가 상대적으로 빠르다.

Reference

https://esbook.kimjmin.net/06-text-analysis/6.1-indexing-data

https://medium.com/@lunay0ung/basics-인덱스와-역인덱스-inverted-index-a95573836189

'DataBase' 카테고리의 다른 글

Anomaly  (0) 2023.04.12
Stored Procedure  (0) 2023.04.10
Join  (0) 2023.04.03
SQL  (0) 2023.03.13
MongoDB  (0) 2023.03.04