본문 바로가기

About 배우고 익히는법/최신 트랜드

(2)
Hadoop이란? 하둡의 화두는 '분산' 입니다. 하둡은 두가지 큰 요소의 결합입니다. '처리(계산)' 와 '저장' 입니다. 즉 '분산처리' 와 '분산저장' 이라고 보면 됩니다. 여러개의 저가형 컴퓨터를 마치 하나인것 처럼 묶어주는 기술이라고 보면 됩니다. (그래서 계산 능력과 저장 공간을 늘립니다) 분산저장 하둡 파일시스템(HDFS: Hadoop Distributed File System) 을 이용해서 파일을 적당한 블록 사이즈 (64MB)로 나눠서 각 노드 클러스터(각각의 개별 컴퓨터) 에 저장합니다. 또한 데이타 유실의 위험이나 사람들이 많이 접근할때 (Access) 할때의 부하처리를 위해서 각 블록의 복사본 (Replication)을 만들어 둡니다. 보통 복사본은 최소 3카피 정도입니다. 왜 이렇게 하냐면 고성능 ..
NOSQL이란? NOSQL이란? No SQL Not ONLY SQL Non-Relational Operation Database SQL RDBMS는 클라우드 컴퓨팅 환경에서 발생하는 빅데이터를 효과적으로 저장, 관리하는데 여러 가지 문제점이 발생하고 있는 상황에 직면 이런 문제점을 보완하기 위해 새로운 저장기술이 필요하게됨 이러한 배경에서 태어난것이 NoSQL nosql의 장점 및 단점 하드웨어 확장에 제약이 없다. 저렴한 비용으로 분산 병렬처리가 가능하다. 메모리 mapping기능을 통해 읽고 쓰기가 빠르다. 비정행 데이터구조로 설계비용이 감소한다. join인 없는 구조로 simple하고 성능이 빠르다. 기존의 하드웨어를 활용하여 구축할 수 있다. RDBMS를 사용한 많은 시간이 흐르면서 성능/관리면에서 안정기에 접어..