대규모 데이터 처리 입문 썸네일형 리스트형 [대규모 서비스를 지탱하는 기술] 대규모 데이터 처리 입문 '대규모 서비스를 지탱하는 기술' 이란 책을 정리한 내용입니다. 대규모의 기준은? 하테나 북마크의 데이터 규모를 예로 들었다 레코드 수 데이터 크기 entry 테이블 : 1,520만 엔트리 엔트리 : 3GB bookmark 테이블 : 4,500만 북마크 북마크 : 5.5GB tag 테이블 : 5,000만 태그 태그 : 4.8GB HTML : 200GB 이상 Google이나 Yahoo와 비교햇을때는 하테나는 대규모~중규모 수준이다. entry 테이블을 인덱스없이 조회시 약 200초가 걸린다. select url from entry use index(hoge) where eid = 9615899 대규모 데이터는 어떤 점이 어려운가? 메모리 내에서 계산이 불가할 경우, 디스크에 있는 데이터를 검색하게 된다. .. 더보기 이전 1 다음