[DW2.0: 클라우드 컴퓨팅의 시작, 다음 세대를 위한 데이터웨어하우스 설계]에는 삼성SDS BI 구축사례를 부록으로 담고 있으며, 저자의 동의를 얻어 W.H Inmon의 강의노트를 CD로 제공하고 있습니다.
“ |
오랫동안 데이터웨어하우스에 대한 새로운 재정의가 필요했습니다. DW2.0이 이 정의를 명확하게 해 줄 수 있습니다. - Dan Meers(Freddie Mac社 부사장)
“ |
이 새로운 역작은 DW의 개념을 총괄적으로 업데이트하는 바이블로 데이터 생명주기 관리, 비정형 데이터, 메타데이터 관리에 대한 명확한 청사진을 제시합니다. - Marvin Adams,(Fidelity Investments社 사장)
2세대 데이터웨어하우스의 시대가 시작되었습니다. 이 책에는 이 분야의 창시자로서 기업에서 필요로 하는 각종 데이터를 어떻게 관리할 수 있는지에 대해 기술적인 관점과 아키텍처 관점으로 설명하고 있습니다. 그렇다고 이러한 새로운 내용이 검증이 되지 않았다거나 불확실한 내용은 전혀 없습니다. 오늘날 여러분의 회사에서 직면하고 있는 문제에 대한 실용서로서 바로 활용할 수 있는 내용으로 DW2.0의 적용효과를 단기간 내에 받을 수 있을 겁니다.
처음 이 도서를 기획했을 때가 클라우드 컴퓨팅에 대해서 막 관심을 갖기 시작할 때입니다. 이 도서를 추천해 주신 분께서 이 도서가 클라우드 컴퓨팅과 밀접한 연관이 있다고 말씀해 주셨습니다. 그래서 이 도서의 제목에 '클라우드컴퓨팅의 시작'이라는 부제를 달았는데, 이 점에 대해서 낚시성 제목이라고 생각하시거나 적합하지 않다고 생각하시는 독자들도 있을 것이라 생각됩니다.
이 도서에서 다루는 기술에 대해서 좀더 자세히 말씀 드리기 위해 저의 부족한 지식을 적는 것보다 나을 듯하여 역자 중에 한 분인 이지면 책임님과 도서 기획 단계에서 e-mail로 나눈 대화를 간략하게 실어 보겠습니다. – 앞 부분의 인사말들은 생략하였습니다.
問 |
도서에 대한 대략적인 내용은 검토해 보았습니다. 정확한 내용을 모두 파악한 것은 아니나 기업에서 정보 관리를 맡고 있는 관리자들에게 필요한 도서라는 생각이 듭니다.
여러 가지 바쁘시겠지만, 좀더 정확한 내용을 파악할 수 있도록 첨부해서 보내드리는 양식을 작성해서 보내주시면 감사하겠습니다.
이미 알고 계시겠지만, 이메일에서 언급하신 것과 같이 기업에서 관리하는 정보의 양이 엄청나게 증가 하면서 작년부터 Cloud Computing에 대한 관심이 높아지고 있습니다.
저의 얕은 지식으로는 이 도서가 Cloud Computing의 기본이 되는 기술을 다루고 있다고 생각됩니다만, Cloud Computing과 이 도서를 연관시킬 수 있을까요? 혹 그렇다면, 자세한 설명을 부탁 드립니다.
후략…
答 |
이지면 : 중략…
김이사님이 말씀하셨듯이, Cloud Computing을 위한 기본이 되는 기술을 다루는 것이 정확합니다. 저희 팀에서 내부적으로 Cloud Computing 시장을 대비해서 Business Intelligence 영역의 사업을 준비하고 있으며, DW는 BI의 핵심적인 정보 영역을 다루는 부분입니다.
기존의 Bill Inmon이 제시한 Data Warehouse의 개념은 단순히 기업의 업무 시스템에서 발생하는 정형 데이터 (Structured Data) 중심의 데이터 저장고를 만들고, 이를 기반으로 분석시스템을 붙여서 정보를 분석할 수 있도록 하는데 초점이 맞춰져 있었습니다.
Cloud Computing은 서로 다른 물리적인 위치에 존재하는 자원을 가상화 기술을 통해 통합해서 인터넷을 통해 서비스를 제공하고 사용할 수 있는 기술을 의미합니다. 여기에서 기업에서 사용하는 각종 시스템 기능과 정보 자원을 공유할 수 있는 기반을 제공하는데 서비스 지향 아키텍처가 근간으로 시스템 기능 및 자원 등의 체계를 잡게 됩니다.
DW2.0은 이러한 Application을 지원하는 기업의 정보 아키텍처라고 보시면 될 듯 합니다.
초창기 Bill Inmon의 DW 개념은 기업에서 발생되고 사용하는 정보 가운데 약 20%에 해당되는 정형데이터를 중심으로 했습니다만, DW2.0의 개념에서는 나머지 80%에 해당되는 비정형 데이터, 즉 컨텐츠, 도큐먼트 등 다양한 데이터를 포함하고 있고, 이러한 엄청난 양의 기업 데이터를 어떻게 효과적으로 공유할 수 있는 수준의 Data로 분류하고 처리하고 관리할 것인지에 대한 이야기를 하고 있습니다. 즉, 사용자가 활용할 수 있는 데이터의 수준의 세분화 수준(Granuality)에 따라 서비스를 구성할 수 있는 체계를 기반으로 합니다. 또한, Data Center의 관점에서 어떻게 정보를 관리하고(Information Life Cycle Management) 운영을 할 것인가를 논하고 있습니다.
Cloud Computing 하에서는 기업에서 발생하는 데이터를 전사적으로 관리하여 필요할 경우 서비스를 제공할 수 있는 (On-Demand Service) 관리체계를 기반으로 합니다.
또한, 이러한 DW2.0체계를 기반으로 정리되고 관리되는 데이터를 기반으로 Business Intelligence 시스템, 즉 각종 분석을 필요로 하는 Application에 필요한 데이터를 제공할 수 있는 체계를 확보할 수 있게 됩니다.
이미 IBM의 경우는 Information On-Demand라는 사상으로 Data Warehouse 구축을 위한 각종 Software Vendor를 인수/합병하고, FileNet과 같은 비정형 데이터를 대상으로 하는 Contents Management System S/W Vendor도 인수하였습니다. 이를 Websphere라는 SOA의 기본이 되는 Middleware를 기반으로 통합하고, Infor 2.0이라는 이름으로 서비스를 제공하고 있습니다. 이는 Bill Inmon의 DW2.0과 동일한 사상을 가지고 있다고 보시면 될 듯 합니다.
Oracle도 IBM과 동일하게 사업체계를 구성하고 있습니다. 첫째, SOA를 기반으로 하는 Application의 통합, 둘째, Information Driven Architecture, 그리고 Grid Computing입니다. SAP도 Business Object라는 Global No.1 BI Vendor를 인수하여 그들의 제품 라인에 Enterprise 2.0을 지원하는 Information Architecture를 구성하고 있습니다.
Bill Inmon의 DW2.0 개념은 이렇게 시장에서는 이미 Vendor를 중심으로 Driven되고 있습니다. 여기에 가장 중심이 되는 개념이 잘 정리되어 있다고 보시면 될 듯합니다.
앞선 메일에서 이사님께서 관리자에게 필요할 것이라고 보셨지만, 비단 관리자뿐만 아니라, Information 분야에서 일하는 개발자에게도 상당히 중요한 기본 개념을 제공하는 책으로 보고 있습니다.
후략…
'책 이야기' 카테고리의 다른 글
97 Thnigs Every Software Architecture Should Know (3) | 2009.12.04 |
---|---|
Using Google App Engine (4) | 2009.12.01 |
한국어판 MySQL 4/e (3) | 2009.11.02 |
능률적인 프로그래머 : 프로그래머 생산성의 비밀 (1) | 2009.09.29 |
해킹! 침해사고 분석 (1) | 2009.02.21 |