누가 내 치즈를 옮겼을까?

|



누가 내 치즈를 옮겼을까
국내도서
저자 : 스펜서 존슨(Spencer Johnson) / 이영진역
출판 : 진명출판사 2001.01.15
상세보기



누가 내 치즈를 옮겼을까?


"The Present"의 저자 스펜서 존슨의 첫번째 책이다. 

"선물" 책에서 느낀점이 많아서 이책도 읽게 되었다. 나에게 "마쉬멜로 이야기" 책과 같은 부류였다.

즉, 읽지 않았지만 왠지 읽은 책같은 느낌?... 그러고 보면 참 책을 안 읽고 살았다는 것 다시금 느낀다


이책에서는 두마리의 쥐와 두명의 사람이 등장한다. 

다들 알겠지만 두마리의 쥐(스니프,스커리)는 미로에서 치즈가 항상 없어질 것을 대비하고 있지만 두명의 사람은 치즈가

항상 그곳에 있을줄 알고( 그렇게 믿고 싶어한다...) 미래에 대해서 대비하지 않고 현실에만 안주하고 있다.

실제로 치즈창고에서 치즈가 다 썩고 없어진다음에도 한명의 사람(헴)은 현실을 받아들이지 않고 아무런 행동도 

안하고 현실이 바뀌기만을 바랐다. 반면 허라는 친구는 현실을 받아들이고 미로를 헤메면서 다른 치즈를 찾아다닌다.


책에서 요약한 내용을 적어본다.


<변화에 대처하는 방법>


변화는 항상 일어나고 있다.

변화는 치즈를 계속 옮겨놓는다.


변화를 예상하라.

치즈가 오래된 것인지 자주 냄새를 맡아 보라.


변화에 신속히 적응하라.

사라져버린 치즈에 대한 미련을 빨리 버릴수록,

새 치즈를 보다 빨리 발견할 수 있다.


자신도 변해야 한다.

치즈와 함께 움직여라.


변화를 즐기라.

모험에서 흘러나오는 향기와 새 치즈의 맛을 즐겨라.


신속히 변화를 준비하고 그 변화를 즐기라.

변화는 치즈를 계속 옮겨 놓는다.



+'치즈'는 기업으로 생각하면 캐시카우 일것이며 개인에 적용하면 안정된 직장, 연금, 보험, 돈이되는 일 등이 될 것이다.

과거의 치즈는 노동력에 기반한 생산품이 었다면 현재는 다양하게 치즈가 존재한다. 

먼저 발견한 사람이 그것을 먼저 맛을 볼 것이다. 하지만 항상 같은 양과 같은 맛은 아닐 것이다. 

현실에 안주하지 않고 새로운 치즈를 계속 찾아야만 한다.


+너무나도 간단하지만 너무나도 명백한 진리같다. 과거의 지식으로만 사고를 하게 되면 썩은 치즈와 같을 것이다. 

새로운 것을 받아들이고 과거의 지식을 편집과 수정,추가를 통해서 새로운 지식으로 갈고 닦아야 미래에 대비할 수가 있을 것이다.



And

서른아홉, 피아노를 배우기 시작했다.

|


서른아홉, 피아노를 배우기 시작했다
국내도서
저자 : 서진
출판 : 엔트리(메가북스) 2015.04.20
상세보기



서른아홉, 피아노를 배우기 시작했다 - 서진



YES24에서 읽을 만한 책들을 쇼핑하던 중에 눈에 들어와서 충동구매한책.

나도 늦은 나이에 피아노를 배워서 어떤 동질감으로 책을 구매했다. 피아노는 항상 치고 싶었지만

어릴때 안배우면 못배우는 줄로만 알았었다. 특히 왼손 오른손 따로 건반을 칠 엄두가 나질 않았다.

역시 하면 안되는 것이 없다. 비록 어릴때 배워서 잘하는 친구들과 비교를 못하겠지만 뭐든 열심히 노력하면

안되는 것이 없다는 것을 피아노를 배우면서 느꼈었다.


이책에서도 서진이라는 작가는 39살이라는 나보다 늦은나이에 피아노를 배우기 시작했다.

지금은 100곡 작곡이라는 프로젝트를 진행할 정도니 잘친다.~ 

어릴때부터 일기쓰는 것을 습관이 들어서 현재까지 일기를 쓴다고 했다.(담임선생님이 다른 것은 몰라도 일기는 철저하게 검사했다고 한다.. 후 덜덜) 그것을 바탕으로 이책을 만들었다.

하루 하루의 단상들로 구성된 책이다. 


읽기 참 편했던 책이며 느낀점들도 소소하게 있었다.

무엇보다도 자기하고 싶은 것을 하는 모습이 멋있었다. 공부를 잘해서 좋은 대학에 전망이 좋은 공대를 갔지만 대학원에서 갑자기 회의를 느껴서 다 포기하고 해외를 가서 작가의 길로 들어섰다. 책 "웰컴 투 더 언더그라운드"를 통해서 <한겨례>에서 문학상을 받았다. 자기가 평생동한 하던 일을 포기하고 다른길을 선택하는 것이 참 어려운 결정인데, 그걸 이겨내고 공대생이 문학상까지 받았다니 실로 대단하다...

역시 일기의 힘인가? (같이 구매한 유시민의 "글쓰기 특강"에서 목차를 먼저 봤는데 일기를 쓰는게 글을 잘 쓰는 데 도움이 된다고 했다.)


자신의 생각들을 잘 정리해서 블로그나 사이트를 이용해서 다른사람들과 생각을 공유하는 것은 참 의미있어 보인다.

(이책의 저자도 홈페이지를 운영하면서 생활의 단상들이나 여행일지라던가 음악들을 올린다.)

만약 그것이 개인적인 에세이나 생각들이면 이책 처럼 에세이집으로 편이 되고, 정보전달이면 전문서적이 되어서

책으로 만들어 질 수있으니 열심히 블로깅에 힘써야 겠다.


또 어찌될지 모른다. 

나도 "스타크래프트로 배우는 디자인패턴" 이나 "지극히 개인적인 독후감"처럼 책을 내는 날이 올지도?



And

[빅데이터] 6. Bayesian Belief Networks

|

Bayesian Belief Networks


 Naïve Bayesian classifier에서는 속성간에 독립적이라는 가정으로 분류를 했었다. 하지만 속성간에 서로 영향을 주는

 경우에는 나이브 베이즈 분류기를 사용하지 못 한다. Bayesian Belief Networks는 속성간에 의존을 허용한다.



1.      기본 개념 및 메커니즘.


n  Naïve Bayesian classifier는 클래스 조건 독립(class conditional independence)를 가정해서 분류를 했다

   만약 이 가정이 맞다면 다른 모든 분류기 보다 가장 정확하다. 하지만 실제적으로는 그렇지 않다

   변수들간에 종속성이 존재하게 된다.


n  Bayesian Belief Networks는 다른 말로 belief networks, bayesian networks, probalilistic networks라고도 하는데 여기서는 간단히 belief networks라고 한다.


n  Belief Networks(신뢰 네트워크) 2가지의 요소(component)로 구성이 된다. 하나는 directed acyclic graphconditional probability tables(CPT)이다.


n         


n  유도된 비순환 그래프(directed acyclic graph)의 각 노드 들은 랜덤변수를 나타낸다

   변수는 이산 또는 연속성을 갖는 값일 수가 있다.


n  노드들은 실제 속성일 수도 있지만 숨겨진 변수(hidden values)도 있다. 예를 들어서 메디컬 데이터에서 증후군(syndrome)은 많은 증상(symptoms)들을 나타낸다.


n  각각의 선들은 확률적인 의존성을 나타낸다. 만약 선이 Y에서  Z  그려졌다면, Y는 부모 또는 직전의 전임자(immediate predecessor)라고 부르고 Z Y의 자손(descendant)이라고 부른다.


n  각각의 변수는 부모가 주어졌을 때 변수의 자손이 아닌 것에는 조건 독립(conditionally independent)이다.


n  (a)의 그림에서 폐암(LungCancer)는 가족력과 흡연하는지에 따라서 영항을 받게 된다. 주의 할점은 만약 환자가 폐암이란 것이 주어졌을 때(알때) PositiveXRay는 가족력과 흡연 변수에 독립적이게 된다. 즉 이미 폐암이라는 것을 알 때 가족력과 흡연은 추가적인 정보를 제공해주지 않기 때문에 독립적이다. 폐암은 부모가 주어졌을 때 폐기종(Emphysema)와 독립적이다.


n  신뢰 네크워크는 각각의 변수에 대해서  하나의 conditional probability table(CPT)을 갖는다. (b)는 폐암에 대한 CPT를 보여주는데 좌측상단과 우측하단은 각각 다음 식으로 표현이 된다.



n  각각의 변수(variable)은 부모가 주어졌을 때 그것의 자손이 아닌 것에 대해서는 조건적으로 독립적이므로 아래의 식처럼 각각의 확률을 구해서 곱하면 확률을 구할 수가 있다.



여기에서     X의 변수들의 특정한 조합의 확률을 나타내고,   

는 각각의 변수Y에 대한 CPT에 해당하는 항목들이다.


n  신뢰 네트워크는 많은 잘 알려진 문제점에 대한 모델로 사용되어 왔다. 하나의 예로 유전자 연관 분석(genetic linkage analysis)가 있다(예를 들어서 유전자를 염색체에 매핑하는것)


n  또한 컴퓨터 비전(Computer vision)(예를 들어서, 이미지 복구나 스테레오 비전)에서도 Belief Networks를 사용해서 많은 혜택을 보았다. 이외에도 문서와 텍스트 분석, 의사 지원 시스템 민감도 분석등에서 사용되어지고 있다.



2.      Training Belief Networks.


n  신뢰 네크워크를 Training하는 데에는 많은 방법이 있다. Network topology( layout of nodes and arcs)는 사람에 의해서 만들어 지거나 아니면 자료로부터 추론되어서 구성되어질 수 있다. 


n  만약에 network topology를 알고 있고 변수가 명확하다면 network를 훈련하는 것은 쉽다. 하지만 변수가 명확하지 않고 숨겨져 있을 때는 변수를 찾는데는 다양한 방법이 존재한다. 여기에서는 gradient descent(경사도 하강법)를 설명한다. –이것을 계산해주는 패키지 소프트웨어가 있다.


n  경사도 하강법 greedy hill-climbing을 사용한다. 반복할 때마다 가장 가파른 경사도를 선택해서 값을 업데이트 해주고 다시 수행을 반복해서 최적의 값으로 수렴하게 한다.


n  Gradient descent 방법


-초기   는 임의의 값으로 설정이 된다.


     Compute the gradients



데이터 튜플에서 각각의 변수에 대해서 부모의 확률을 구해서    로 나눈 값들을 모두 합해서 구해준다.


     Take a small step in the direction of the gradient



  learning late를 의미하며 수렴속도를 조절한다. 이 값은 작은 상수이다.

1번에서 구한 값을 기존의    에 더해서 새로운 가중치를 생성한다.

이렇게 해서 극대점(확률이 가장 높아지는 지점)을 찾는다.


     Renormalize the weights

가중치가 확률이기 때문에 0에서 1범위 안에 들어야 한다. 따라서 이 범위를 벗어날 수 있으므로 

재정규화를 해준다.



참고문헌:Data Mining Concepts and Techniques, 3rd Edition, Jiawei Han & Micheline Kamber

저작권 문제가 발생시 삭제될 수 있습니다.

And