본문 바로가기
NoSQL/HBase

HBase 기본 정보, 요구사항, 제한사항, 설치, 최적화 설정 및 시작 방법

by Lohen 2016. 2. 5.
1. 개요

1. 웹사이트
HBase 홈
HBase 매뉴얼
소스코드 보기 
HBase 다운로드
바이너리 패키지 다운로드
HBase 책 예제
HBase Jira
HBase Community
Wiki
FAQ
Mailing List


2. 요구사항

1. 하드웨어
1.1. CPU
- 마스터 : 듀얼 쿼드코어 2.0~2.5GHz
- 슬레이브 : 듀얼 쿼드코어 2.0~2.5GHz 
1.2. 메모리
- 마스터 : 24GB
- 네임노드 : 8GB (1GB/100TB 또는 1GB/inode 1M)
- 부 네임노드 : 8GB (네임노드와 동일하게 구성)
- 잡트래커 : 2GB
- HBase 마스터 : 4GB
- 운영체제 : 2GB
- 슬레이브 : 24GB 이상
- 데이터노드 : 1GB
- 태스크트래커 : 1GB
- HBase 리전 서버 : 12GB ~ 16GB (자바 성능상 이 이상은 권장하지 않음)
- 태스크 시행 : 인스턴스당 1GB
- 주키퍼 : 1GB
- 운영체제 : 2GB
1.3. 디스크
- 마스터 : 4 X 1 TB SATA, RAID 0+1 구성 (2TB 가용)
- 슬레이브 : 6 X 1 TB SATA, JBOD 구성
- RAID 기능이 있는 디스크는 고장 감지에 탁월하므로 사용, 그러나 하둡 파일시스템의 레플리케이션 정책을 신뢰할 수 있으므로 RAID 구성까지는 필요 없음
1.4. 섀시
- 마스터 : 기가비트 이더넷 / 듀얼 PSU / 1U 또는 2U
- 슬레이브 : 기가비트 이더넷 / 싱글 PSU / 1U 또는 2U

2. 소프트웨어
2.1. 운영체제
- 64비트 리눅스계열 운영체제 권장
- 윈도우즈 권장하지 않음
2.2. 파일시스템
- ext3, XFS 사용해도 무방하나 ext4 권장
2.3. 자바
- 1.6+ 오라클 버전


3. 제한사항




4. 설치

1. 바이너리 설치
- 타르볼을 아무 디렉토리에 풀어놓음

2. 데이터 디렉토리 설정
- /conf/hbase-site.xml 파일

<property>
<name>hbase.rootdir</name>
<value>file:///<PATH>/hbase</value>
</property>


- 디폴트는 /tmp로 지정되는데 OS에 따라 재부팅시 /tmp를 삭제하는 경우도 있으므로 다른 곳으로 바꿔주는 작업.

3. 책 예제 설치
3.1. 소스코드 클론

$ git clone git://github.com/larsgeorge/hbase-book.git

3.2. 메이븐 빌드

$ mvn package

3.3. 각 예제 실행

$ cd chXX
$ bin/run.sh 예제_클래스_이름

- run.sh는 예제 실행에 필요한 라이브러리를 준비하여 조합해주는 전처리 작업을 수행해주는 스크립트


5. 최적화 설정

1. 클러스터

1.1. DNS

- 자신의 IP를 확인할 때는 루프백 주소가 아닌 호스트명을 사용하므로, hosts 파일이나 DNS를 올바르게 설정해준다.

1.2. NTP

- 클러스터 노드간 시간차가 발생하면 데이터 쿼리에 문제가 생기거나 클러스터 관리시 비정상 동작을 할 수 있음

- 시스템 시간을 동기화하기 위해 NTP를 실행하거나 시간 동기화 애플리케이션을 사용한다.


2. 운영체제

2.1. 파일 핸들

ulimit -n : 디폴트는 1,024. 10,000개 이상으로 설정

2.2. 스와피니스

- 스와피니스 설정값을 줄이거나 비활성화하여 스와핑 발생을 줄이거나 없앤다.


3. 하둡 설정

3.1. 동시처리 파일 상한 조정

- conf/hdfs-site.xml의 dfs.datanode.max.xcievers 프로퍼티 값을 최소 4096으로 설정


4. HBase 설정

- HBase /conf 참조


5. 기타

5.1. 다른 주키퍼 앙상블 사용하기

- conf/hbase-env.sh

HBASE_MANAGES_ZK=false

- hbase-site.xml OR

ensemble location

client port

- configure zoo.cfg and add to HBase classpath


6. 시작

1. 단일 모드
- 클러스터 구성하지 않고 단일 모드 실행

$ bin/start-hbase.sh

- 디폴트 설정으로 실행되며 하둡 파일시스템을 사용하지 않고 로컬 파일시스템을 사용하는 단일 모드 실행

2. 분산 모드
2.1. conf/hbase-site.xml 파일 설정
2.1.1. 분산 모드 켜기

<property>
<name>hbase.cluster.distributed</name>
<value>true</value>
</property>

2.1.2. 하둡 파일시스템의 네임노드 및 데이터 저장 위치 설정

<property>
<name>hbase.rootdir</name>
<value>hdfs://namenode.foo.com:9000/hbase</value>
</property>

2.2. conf/regionservers 파일
- 리전서버가 실행되는 모든 장치 목록
- 한 줄에 하나씩 명시
2.3. 주키퍼 설정
2.3.1. conf/hbase-env.sh 파일

HBASE_MANAGE_ZK=true

2.3.2. conf/hbase-site.xml 파일

<property>
<name>hbase.zookeeper.property.clientPort</name>
<value>2222</value>
</property> 

<property>
<name>hbase.zookeeper.quorum</name>
<value>rs1.foo.com,rs2.foo.com, ...</value>
</property>
<property>
<name>hbase.zookeeper.property.dataDir</name>
<value>/var/zookeeper</value>
</property>

2.4. 하둡 파일시스템 실행
2.5. 시작 스크립트 실행

$ bin/start-hbase.sh

- 단일 모드에서와 같은 방식으로 실행

3. 상태 확인
3.1. 로그 파일 : /logs 디렉토리
3.2. 웹 UI
- 마스터 : http://master.foo.com:60010
- 리전서버 : http://region.foo.com:60030
3.3. 셸

$ /bin/hbase shell 실행


4. HBase 정지

$ bin/stop-hbase.sh

 

  - 모드 불문 동일 

 

 

출처: http://bankienkate.tistory.com/10

Hbase 설치  HBase / NoSQL 

2012.07.26. 15:22  수정  삭제

복사http://firstrokn.blog.me/40164232404

전용뷰어 보기

Hbase 설치

 
Hbase 설치는 간단하다.

다운받아서 리눅스 상에 압축을 풀어준 후 약간의 설정만 해주면 된다.

자세한 설명은 아래 링크 참조


1 다운로드 사이트
(만약 여기가 접근이 안된다면 http://hbase.apache.org/ 에서 최신 버전을 다운로드하자.)

2 압축 풀기
: tar xfz hbase-*-tar.gz
(여기서 hbase-*-tar.gz는 자신이 받은 파일명으로 입력)

3 Hbase 설정하기(Stand-Alone)
- 압축푼 디렉토리/conf/hbase-site.xml을 vi로 열어서 다음 부분을 수정한다.
<configuration>
<property>
<name>hbase.rootdir</name>
<value>file:///hbase가설치된디렉토리/data가 저장될 디렉토리명</value>
</property>
</configuration>

4 Hbase 데몬 실행 및 종료
./bin/start-hbase.sh
./bin/stop-hbase.sh

5 hbase 쉘 실행 및 테스트 테이블 생성
./hbase shell
create 'test', 'cf' - 테이블 생성
list 'table' - 테이블 리스트 출력
put 'test', 'row1', 'cf', 'value1' - 테이블에 데이터 넣기
scan 'test' - 테이블 출력


6 hbase 실행 확인
: 정상적으로 작동한다면 아래 링크에서 마스터 정보와 테이블 정보 등을 확인 할 수 있다.
 
 


반응형

'NoSQL > HBase' 카테고리의 다른 글

Hbase 리뷰  (0) 2016.02.05
HBase 완전-분산 (Full Distributed) 방식 설치  (0) 2016.02.05
hbase api 사이트 (영문)  (0) 2016.02.05
HBase, BigTable, Cassandra Schema Design  (0) 2016.02.05
hbase Schema 이해하기 위한 링크들  (0) 2016.02.05