채니의 개발일기

정보검색: Rocchio 알고리즘이란 본문

정보학/정보검색

정보검색: Rocchio 알고리즘이란

윤채니챈 2023. 6. 4. 17:31
728x90
반응형

Rocchio 알고리즘

1. 정보 검색에서 사용되는 유사성 채점 알고리즘

2. 벡터 공간 모델을 기반으로 하며, 사용자가 피드백한 관련 문서와 비관련 문서의 중심 벡터를 계산하여 검색 쿼리를 수정하는 방식. 

 

#Racchio알고리즘 공식

 

  • 은 수정된 쿼리 벡터
  • 는 원래 쿼리 벡터
  • 는 관련 문서 벡터
  • 는 비관련 문서 벡터
  • 은 관련 문서 집합
  • 은 비관련 문서 집합
  • , , 는 각각 원래 쿼리, 관련 문서, 비관련 문서에 대한 가중치

Rocchio 알고리즘 특징


- 계산 시간이 짧고 메모리가 크지 않아도 된다
- 노이즈에 취약하고 클래스의 사이즈가 다를 경우 제대로 작동하지 않을 수 있다
- 경계선이 불분명한 경우에도 데이터를 핸들링 가능

 

728x90
반응형