**엘라스틱 서치(Elastic Search)**를 다운로드 후 실행하면, 엘라스틱 노드(node)를 기존의 가용 클러스터 혹은 새 클러스터와 조인할 수 있습니다. 단일(single) 노드인 클러스터를 방금 막 생성했다고 가정해 봅시다. 아직 아무런 정보가 없으므로, 인덱스를 생성해야겠죠.
인덱스를 생성 할 때 (인덱스는 첫번째 문서에 인덱싱 할 때 자동으로 생성됨) 얼마나 많은 샤드로 구성할지 지정할 수 있습니다. 만약, 숫자를 지정하지 않을 경우 기본값은 5 primaries가 됩니다. 이게 무슨 뜻일까요?
이는 엘라스틱 서치가 5개의 기본(primary) 샤드를 데이터에 포함하고 있음을 나타냅니다.
문서를 인덱싱 할 때마다, 엘라스틱 서치는 해당 문서를 보관(hold)할 기본 샤드를 결정하고 거기에 인덱싱 합니다. 기본 샤드는 데이터의 사본이 아니라 데이터입니다. 다중 샤드는 단일 머신에서 병렬처리 할 때 도움이 되는데, 같은 클러스터에서 또 다른 엘라스틱 서치 인스턴스를 실행하면, 샤드는 클러스터 전체에 골고루 분산(distributed)될 것입니다.
노드 1이 3개의 샤드만 가지고 있는 경우)
나머지 2개의 샤드가 새로 시작된 노드로 이동)
왜 이런 일이 발생했는가?
엘라스틱 서치는 분산 검색엔진이기 때문에 다중 노드/머신을 사용해 대량의 데이터를 다룰 수 있습니다. 모든 엘라스틱 서치 인덱스는 데이터가 저장된 최소 1개 이상의 기본 샤드로 구성됩니다. 하지만 모든 샤드는 비용이 발생하므로 성장할 것 같지 않은(no foreseeable growth) 단일 노드를 가지고 있다면 단일 형태의 primary 샤드를 사용하십시오. ———————————————————————————————————————————
또 다른 형태의 샤드는 레플리카입니다. 기본값은 1이고, 모든 기본 샤드가 똑같은 데이터를 포함할 다른 샤드로 복사됩니다. 레플리카는 검색 성능을 높이고, 노드 장애 대응(fail-over)을 위해 사용됩니다. 레플리카 샤드는