정보학/정보검색
정보검색: Rocchio 알고리즘이란
윤채니챈
2023. 6. 4. 17:31
728x90
반응형
Rocchio 알고리즘
1. 정보 검색에서 사용되는 유사성 채점 알고리즘
2. 벡터 공간 모델을 기반으로 하며, 사용자가 피드백한 관련 문서와 비관련 문서의 중심 벡터를 계산하여 검색 쿼리를 수정하는 방식.
#Racchio알고리즘 공식
- 은 수정된 쿼리 벡터
- 는 원래 쿼리 벡터
- 는 관련 문서 벡터
- 는 비관련 문서 벡터
- 은 관련 문서 집합
- 은 비관련 문서 집합
- , , 는 각각 원래 쿼리, 관련 문서, 비관련 문서에 대한 가중치
Rocchio 알고리즘 특징
- 계산 시간이 짧고 메모리가 크지 않아도 된다
- 노이즈에 취약하고 클래스의 사이즈가 다를 경우 제대로 작동하지 않을 수 있다
- 경계선이 불분명한 경우에도 데이터를 핸들링 가능
728x90
반응형