Outsider's Dev Story

Stay Hungry. Stay Foolish. Don't Be Satisfied.
RetroTech 팟캐스트 44BITS 팟캐스트

[Book] 구글을 지탱하는 기술

구글을 지탱하는 기술

구글을 지탱하는 기술 - 8점
니시다 케이스케 지음, 김성훈 옮김, 전병국 감수/멘토르

어쨌든 현재 최고의 IT기업이라고 할 수 있는 구글이 사용하는 기술에 대해서 설명된 책입니다. 웹에 몸담고 있는 사람이라면 웹개발자라면 한 번쯤은 생각해 보았을 만한 구글은 어떻게 이 많은 데이터를 이럴게 빨리 검색해 줄까, 어떻게 크롤링하는 걸까? 이 많은 데이터를 어떻게 유지할까? 하는데에 대한 궁금증을 풀어줄 만한 책입니다.

책의 초기에는 IT지식이 없는 사람도 읽을 수 있게 쉽게 쓰여져 있다고 하지만 상당히 쉽게 작성된 것은 사실이지만 사실 개발의 기반 지식이 없다면 많은 부분은 이해하기 어려울 것 같습니다. 아무래도 데이터베이스, 분산시스템등의 대한 얘기이므로 전문적인 얘기등은 상당히 들어가 있지만 깊은 지식이 없어서 "아~ 이렇구나"하는 정도로는 이해할 정도로 쉽게 쓰여져 있기는 합니다. 물론 기술을 파헤쳐서 지식을 얻는 책은 아니기 때문에 소설책 읽는 기분으로 간단히 읽는 정도로는 괜찮다고 생각합니다.



구글의 기술에 대해서 많은 부분이 공개되지는 않았지만 그동안 내놓은 많은 논문을 토대로 저자가 여러가지 연구를 통해서 구글의 기술에 대해서 정리해 놓았습니다.

구글의 대표적인 것은 아무래도 검색이기 때문에 검색에 대해서 간단히 설명한 뒤에 구글이 가진 분산기술들인 분산파일시스템 GFS, 분산스토리지 시스템 Bigtable, 분산잠금시스템 Chubby에 대해서 설명하고 이름도 유명한 MapReduce와 분산처리용 프로그래밍 언어 Sawzall에 대해서 설명하고 있습니다.

책의 마지막에서는 구글의 운용비용의 대해서 설명해주고 있습니다. 대충 구글만 보아도 이거 운영하는데 장난아니겠다는 생각이 들기는 하지만 구체적으로 구글이 짓고 있는 데이터센터를 중심으로 하드웨어는 어떻게 구성하고 얼마나 드는지 진기료는 얼마나드는지 데이터센터를 유지하기 위해서 어떤 노력을 하고 있고 비용은 얼마나 드는지에 대해서 설명하고 있습니다.


평소 구글에 대해서 궁금증을 가지고 있었다면 한번 읽어볼 만한 책인듯 합니다. 특히 Hadoop도 보면서 내용파악하기가 쉽지 않았었는데 구글의 분산기술을 오픈소스로 구현하는 프로젝트가 Hadoop이기 때문에 Hadoop에 관심이 있다면 참고용으로 읽어볼만한 책입니다.

2009/09/23 15:10 2009/09/23 15:10