본문 바로가기

정보검색론6

정보검색론 제 12장. 유사도 계산 숭실대학교 정보검색연구실 - 정보검색론(2003) 이준호 교수님 교제를 메모하기 위한 글입니다. 제 12장. 유사도 계산 정보 검색 시스템의 중요한 기능들 중 하나는 문서와 질의 사의의 관련 정도를 나타내는 유사도를 계산하고계산된 유사도에 따라 문서에 순위를 부여하는 것이다. 각각의 문서 벡터와 질의 벡터의 내적으로 유사도를 계산하고, 이러한 유사도에 따라 문서에 우선순위를 부여한다면 질의 처리 시간은 정보 검색 시스템에 입력된 문서들의 수와 비례한다. 문서의 수가 증가할 수록 느려진다는 문제점이 발생하는 것이다.이러한 문제점을 개선하기 위하여 렉시콘 파일과 포스팅 파일로 구성되는 역파일을 이용하여 질의와 문서 사이의 유사도를 계산하는 방법들이 개발되었으며 이러한 방법들에 대해서 알아 보겠다. 12.1 .. 2018. 4. 18.
정보검색론 제 11장. 정합성 피드백 숭실대학교 정보검색연구실 - 정보검색론(2003) 이준호 교수님 교제를 메모하기 위한 글입니다. 제 11장. 적합성 피드백 적합성 피드백이란 보다 많은 적합 문서 그리고 보다 적은 비적합 문서를 검색할 수 있도록 불완전한 초기 질의를 보완하여 질의를 자동으로 재성성하는 기법이다. 사용자들이 검색 할 때 그들이 지니고 있는 문제점조차도 정확하게 표현할 줄 모른다. 이러한 상태를 "비정상적인 지식의 상태"라고 불렀다. 이러한 불확실성은 정보 검색 과정의 본질인 것. 따라서 불완전한 초기 질의는 보완되어야 한다. 적합성 피드백에 대부분의 연구들은 질의를 가중치가 부여된 검색어들의 벡터로서 표현하는 벡터 질의 환경에서 수행되었다. 이러한 연구들은 새로운 질의의 재구성과정에서 적합 문서들에 출현한 검색어들의 가중.. 2018. 4. 18.