Elasticsearch를 사용하는 자바 어플리케이션을 만들기 위해서는
적절한 client api를 사용하는 방법을 찾아보게 될 것인데,
Transport client와 Rest client를 사용할 수 있다.
Transport client는 곧 삭제될 예정이기 때문에 Rest client를 사용하는 코드를 작성하려고 한다.
High Level Rest Client를 사용하여 여러 연산을 구현해보자.
Java High Level REST Client 는 최소 자바 8을 요구한다. Client와 엘라스틱 서치 버전도 동일하게 맞춰야 한다. 엘라스틱 서치 버전과 client 버전을 완전히 동일하게 맞출 필요는 없지만 엘라스틱 버전이 client 버전 보다 높아야 한다.
예를 들면 Client 버전이 6.0 이라면 엘라스틱 서치 버전은 6.x는 호환이 가능하다. 하지만 그렇지 않을 경우 호환이 되지 않을 수 있다.
implementation group: 'org.elasticsearch.client', name: 'elasticsearch-rest-high-level-client', version: '6.8.2'
RestHighLevelClient는 내부적으로 제공된 builder를 이용한 request를 수행하기 위해 low-level client를 만든다.
low-level client는 커넥션 풀을 유지하고 스레드들을 시작하기 때문에 high-level client를
사용이 끝나게 되면 close를 해야 한다.
@Configuration
public class ElasticSearchConfig {
@Bean
public RestHighLevelClient restHighLevelClient() {
return new RestHighLevelClient(RestClient.builder(new HttpHost(host, port, protocal)));
}
}
// host: localhost, port: 9200, protocal: http
여러가지 Search API에 대해 알아보자.
아래는 SearchReqeust의 기본적인 형태이다.
SearchRequest searchRequest = new SearchRequest();
SearchSourceBuilder searchSourceBuilder = new SearchSourceBuilder();
searchSourceBuilder.query(QueryBuilders.matchAllQuery()); // SearchSourceBuilder에 모든 쿼리 추가
searchRequest.source(searchSourceBuilder);
SearchRequest에 optional arguments를 추가하여 검색의 범위를 지정할 수 있다.
SearchRequest searchRequest = new SearchRequest("animal");
// 인덱스 animal만 검색 하도록 설정
검색 동작을 제어하는 대부분의 옵션은 SearchSourceBuilder에서 설정 할 수 있다.
SearchSourceBuilder sourceBuilder = new SearchSourceBuilder();
sourceBuilder.query(QueryBuilders.termQuery("user", "mike"));
// user가 mike인 쿼리 생성
sourceBuilder.from(0); // default 0
sourceBuilder.size(5); // default 10
sourceBuilder.timeout(new TimeValue(60, TimeUnit.SECONDS));
만약 집계 값만 필요한 경우, size를 0으로 설정하거나, fetchSource 를 false로
설정하면 불필요한 응답값을 가져오지 않아도 되어서 검색 성능을 향상시킬 수 있다.
// java
sourceBuilder.size(0);
// kibana
GET my-index/_search
{
"size": 0
}
// java
sourceBuilder.fetchSource(false);
// kibana
GET my-index/_search
{
"_source": false
}
검색 쿼리는 QueryBuilder 객체로 만들어진다. QueryBuilder는 엘라스틱 서치의 Query DSL에서
제공되는 검색 쿼리 타입을 모두 가지고 있다.
SearchRequest searchRequest = new SearchRequest("summary-20230503");
SearchSourceBuilder searchSourceBuilder = new SearchSourceBuilder();
// QueryBuilder를 이용하여 Query DSL 생성
BoolQueryBuilder boolQueryBuilder = QueryBuilders.boolQuery();
boolQueryBuilder.filter(QueryBuilders.termQuery("name", "kaven"));
boolQueryBuilder.filter(QueryBuilders.termsQuery("category", "a", "b", "c"));
boolQueryBuilder.filter(QueryBuilders.rangeQuery("createdAt").gte("2023-05-01").lte("2023-05-04"));
searchSourceBuilder.query(boolQueryBuilder);
searchSourceBuilder.size(0); // Set size to 0 since we only care about count
searchRequest.source(searchSourceBuilder);
SearchResponse searchResponse = client.search(searchRequest, RequestOptions.DEFAULT);
long count = searchResponse.getHits().getTotalHits();
System.out.println("Count: " + count);
아래 예제를 통해 집계 값도 구현해보자. 이름이 kaven 인 document들을 찾고, quantity 값의 합계와 id의 갯수를 집계하는 예제이다.
GET summary/_search
{
"query": {
"bool": {
"filter": [
{
"term" : {
"name": "kaven"
}
}
]
}
},
"aggs": {
"aggs-quantity": {
"sum": {
"field": "quantity"
}
},
"aggs-value-count": {
"value_count": {
"field": "id"
}
}
}
}
이를 자바로 구현해보면, 아래와 같이 구현할 수 있다.
SearchSourceBuilder searchSourceBuilder = new SearchSourceBuilder();
searchSourceBuilder.query(
QueryBuilders.boolQuery()
.filter(QueryBuilders.termQuery("name", "kaven"))
);
searchSourceBuilder.aggregation(AggregationBuilders.sum("aggs-quantity").field("quantity"));
searchSourceBuilder.aggregation(AggregationBuilders.count("aggs-count-value").field("id"));
searchSourceBuilder.size(0);
SearchRequest searchRequest = new SearchRequest("summary");
searchRequest.source(searchSourceBuilder);
SearchResponse searchResponse = client.search(searchRequest, RequestOptions.DEFAULT);
Sum quantitySumAgg = searchResponse.getAggregations().get("aggs-quantity");
ValueCount countValueAgg = searchResponse.getAggregations().get("aggs-count-value");
System.out.println("aggs-quantity: " + quantitySumAgg.getValue());
System.out.println("aggs-count-value: " + countValueAgg.getValue());
Count Api에 대해 살펴보자.
CountRequest는 쿼리에 매치되는 갯수를 가져오는데 사용된다.
위에서 언급한 SearchSourceBuilder를 사용해서 SearchReqeust을 사용하는 방법과
유사하게 사용할 수 있다.
기본 형태로는 아래와 같이 사용 가능하다.
// 모든 인덱스(indices)에 대해 CountRequest를 생성한다.
CountRequest countRequest = new CountRequest();
// 대부분 search parameters는 SearchSourceBuilder를 추가한다.
SearchSourceBuilder searchSourceBuilder = new SearchSourceBuilder();
// match_all 를 추가
searchSourceBuilder.query(QueryBuilders.matchAllQuery());
// countRequest에 SearchSourceBuilder를 추가한다.
countRequest.source(searchSourceBuilder);
CountReqeust는 또한, optional arguments를 아래와 같이 사용할 수 있다.
// index를 request에 제한 할 수 있다.
CountRequest countRequest = new CountRequest("blog")
.routing("routing") // routing parameter를 설정한다.
.indicesOptions(IndicesOptions.lenientExpandOpen()) // IndicesOptions 설정은 사용 할 수 없는 인덱스가 확인되는 방식과 와일드 카드식이 확장되는 방식을 제어한다.
.preference("_local"); // 로컬 샤드를 선호하는 검색을 실행한다. 기본값은 샤드 전체에서 무작위로 하는 것.
SearchSourceBuilder를 이용한 쿼리를 생성하여 CountReqeust를 실행해보자.
SearchSourceBuilder sourceBuilder = new SearchSourceBuilder();
sourceBuilder.query(QueryBuilders.termQuery("user", "mike"));
위의 예제는 QueryBuilder를 사용하여 user가 mike인 쿼리를 생성하였다.
그후 SearchSourceBuilder는 CountReqeust에 추가되어 실행 시킬 수 있다.
CountRequest countRequest = new CountRequest();
countRequest.indices("blog", "author"); // index : blog, author 지정
countRequest.source(sourceBuilder);
더 자세한 쿼리는 Building Queries를 참조해보자.
CountReqeust를 실행했을 때, client는 CountResponse를 반환 될 때까지
기다리게 된다.
CountResponse countResponse = client
.count(countRequest, RequestOptions.DEFAULT);
CountReqeust는 위의 방법과는 다르게 비동기적으로 실행할 수도 있다. 아래와 같이
요청과 리스너를 비동기 카운트 메서드에 전달하여 응답 또는
잠재적 실패를 처리하는 방법을 지정할 수 있다.
client.countAsync(countRequest, RequestOptions.DEFAULT, listener);
아래와 같이 ActionListener는 수행 후 성공적으로 완료되었다면 onResponse가 실행될 것이고, 실패한다면 onFailure가 실행된다.
ActionListener<CountResponse> listener =
new ActionListener<CountResponse>() {
@Override
public void onResponse(CountResponse countResponse) {
}
@Override
public void onFailure(Exception e) {
}
};
count API 호출을 실행하여 반환되는 CountResponse는 HTTP 상태 코드 또는 hits의 수(적중 수), 카운트 실행
자체에 대한 세부 정보를 제공한다.
long count = countResponse.getCount(); // 갯수
RestStatus status = countResponse.status(); // HTTP Status
Boolean terminatedEarly = countResponse.isTerminatedEarly(); // 일찍 종료되었는지 여부
Response는 또한 기본 검색의 영향을 받은 총 샤드수와 성공한 샤드와 실패한 샤드에 대한 정보도 같이 제공한다.
실패한 샤드는 아래와 같이 반복문을 통해 처리 할 수도 있다.
int totalShards = countResponse.getTotalShards();
int skippedShards = countResponse.getSkippedShards();
int successfulShards = countResponse.getSuccessfulShards();
int failedShards = countResponse.getFailedShards();
for (ShardSearchFailure failure : countResponse.getShardFailures()) {
// failures should be handled here
}
Reference
https://www.elastic.co/guide/en/elasticsearch/client/java-rest/current/java-rest-high-search.html
https://velog.io/@jakeseo_me/%EB%B2%88%EC%97%AD-%EC%97%98%EB%9D%BC%EC%8A%A4%ED%8B%B1%EC%84%9C%EC%B9%98%EC%99%80-%ED%82%A4%EB%B0%94%EB%82%98-%EC%8B%A4%EC%9A%A9%EC%A0%81%EC%9D%B8-%EC%86%8C%EA%B0%9C%EC%84%9C
https://medium.com/@sourav.pati09/how-to-use-java-high-level-rest-client-with-spring-boot-to-talk-to-aws-elasticsearch-2b6106f2e2c