더그 커팅은 아파치 루씬을 1999년에 개발하였다.[6] 처음에는 SourceForge 웹 사이트에서 다운로드 할 수 있었다. 2001년 9월에 아파치 소프트웨어 재단의 자카르타 프로젝트에 합류하여 2005년 2월에 자체 최상위 아파치 프로젝트가 되었다. 루씬이라는 이름은 더그 커팅의 아내의 중간 이름과 그의 할머니의 이름이다.[7]
아파치 루씬은 이전에 Lucene.NET, 아파치 머하웃, 티카 및 너치와 같은 여러 하위 프로젝트를 포함시켰다. 이 프로젝트들은 현재 최상위 프로젝트로 독립한 상태이다.
2010년 3월 아파치 솔 검색 서버는 루씬의 하위 프로젝트로 합류하고 개발자 커뮤니티가 통합되었다.
주요 기능
전문 검색(Full text) 색인 및 검색 기능을 필요로 하는 모든 응용 프로그램에 적합하지만 루씬은 웹 검색 엔진 및 로컬 단일 사이트 검색 구현에서의 유용성으로 널리 알려져 있다.[8][9]
루씬은 또한 추천 시스템을 구현하는데 사용되고 있다.[11] 예를 들어, 루씬의 'MoreLikeThis' 클래스는 유사한 문서에 대한 추천을 생성할 수 있다.
루씬 논리 아키텍처의 핵심은 텍스트를 가지고 있는 필드를 포함하는 문서의 개념이다. 이러한 유연성이 루씬의 API가 파일 형식과 독립적으로 만들어주었다. PDF, HTML, 마이크로소프트 워드, 마인드맵 및 오픈도큐먼트 뿐만 아니라 많은 다른 정보(이미지 제외)의 텍스트 정보는 추출 할 수 있는 한 모두 색인을 생성할 수 있다.[12]
루씬 기반 프로젝트들
루씬 그 자체는 색인 및 검색을 제공하는 라이브러리이며, 웹 크롤러나 HTML 구문 분석 등의 기능은 포함하지 않는다. 하지만 다양한 프로젝트가 루씬의 기능을 확장한다.
↑Kamphuis, Chris; de Vries, Arjen P.; Boytsov, Leonid; Lin, Jimmy (2020), 〈Which BM25 do You Mean? A Large-Scale Reproducibility Study of Scoring Variants〉, Jose, Joemon M.; Yilmaz, Emine; Magalhães, João; Castells, Pablo, 《Advances in Information Retrieval》, Lecture Notes in Computer Science (영어), 12036, Cham: Springer International Publishing, 28–34쪽, doi:10.1007/978-3-030-45442-5_4, ISBN978-3-030-45441-8, PMC7148026
↑Grand, Adrien; Muir, Robert; Ferenczi, Jim; Lin, Jimmy (2020), 〈From MAXSCORE to Block-Max Wand: The Story of How Lucene Significantly Improved Query Evaluation Performance〉, Jose, Joemon M.; Yilmaz, Emine; Magalhães, João; Castells, Pablo, 《Advances in Information Retrieval》, Lecture Notes in Computer Science (영어), 12036, Cham: Springer International Publishing, 20–27쪽, doi:10.1007/978-3-030-45442-5_3, ISBN978-3-030-45441-8, PMC7148045
↑J. Beel, S. Langer, and B. Gipp, “The Architecture and Datasets of Docear’s Research Paper Recommender System,” in Proceedings of the 3rd International Workshop on Mining Scientific Publications (WOSP 2014) at the ACM/IEEE Joint Conference on Digital Libraries (JCDL 2014), London, UK, 2014
↑Perner, Petra (2007). 《Machine Learning and Data Mining in Pattern Recognition: 5th International Conference》. Springer. 387쪽. ISBN978-3-540-73498-7.