각 캐릭터 포지셔닝합니다 강조표시된 조각을 구할 수 있을까요? 데릭쉐퍼드와 일치시킵니다 강조표시된 텍스트 백됩니다 소스 문서 및 문자 위치를 할 것이라고 할 수 있습니다.
예를 들면 다음과 같습니다.
curl "localhost:9200/twitter/tweet/_search?pretty=true" -d '{
"query": {
"query_string": {
"query": "foo"
}
},
"highlight": {
"fields": {
"message": {"number_of_fragments": 20}
}
}
}'
이 되돌려줍니다 하이글리트:
"highlight" : {
"message" : [ "some <em>foo</em> text" ]
}
만약 필드 메시지에 매칭됨 문서 있었다:
"Here is some foo text"
알 수 있는 방법이 있는 스니핏 챨 8 시에 끝나며 챨 21 로 시작합니다 일치하는 필드이므로?
필드 " message"; 있습니다.
"term_vector" : "with_positions_offsets",
"index_options" : "positions"
우리는 원래 텍스트 확장 이렇게 됐지.
>. [1] [2] [3] [4] 우리는 인덱스화할 some\ 텍스트
그럼 우린 정의하시려면 사용자 정의 어낼라이저 호스트당:
"char_filter": {
"remove_tags": {
"type": "pattern_replace",
"pattern": "\\[[0-9]+\\]",
"replacement": ""
현재 우리가 알고 있는 우리는 강조표시된 스니핏 내려받습니다 위치 태그 및 텍스트 나타납니다. 하지만 그 작동됨!
내가 준 한 풀러 오토메이티드 here