[출처: 나, 블로그 연구, 그 첫번째 이야기 #2]


우리는 흔히 무언가를 말하거나 자신의 주장을 펼치때 손쉽게 사용하는 방법으로 "비교법"을 사용한다.

비교라는 것은 비교대상의 특정 부분을 원대상과 견주어 놓고서 비교하는것며, 비교를 통해서 우리가 이전에는 잘 인지 못하였던 부분이나 어떠한 경향을 쉽게 도출해낼수가 있다.


그래서 생각해보았다.

(먼저, 생각이라는 것은 연구를 하기 위한 가장 기본적인 도구이다. "어떻게 생각하는가?" 가 해당 테스크의 퍼포먼스를 결정하고, 그 일을 앞으로 올바른 방향성으로 이끌어 가기도 한다. 따라서 이제부터, 말하는 생각이라는 단어는 단순히 생각이 아니라 수 많은 고민과 다양한 직관력을 가지고서 대상을 분석하고 연구를 하는것이라고 전제하겠다)

나는 주로 마인드맵식 나열법이라고 생각의 덩어리들을 자유롭게 풀어놓는 방법을 사용한다.

그리고 이들간의 연관성을 찾아서 서로 연결하고 분류하여 새로운 그들만의 그룹을 만드는 작업을 하고 이들 그룹에는 대표성을 지는 이름을 붙인다. 이 이름이라는것은 아직 정형화되지 않는 나의 생각을 하나의 개념으로 한정짓는 작업이기에 자칫하면 생각의 방향성을 고정시킬수가 있다. 따라서 신중을 기해서 태깅을 해야한다. 다시 본론으로 돌아가서, 나는 아래와 같은 절차를 거쳐서 생각해보았다. 그리고 답을 달수있는 부분에서 "->" 를 넣어서 나 스스로 답을 달아 보았다.

*앞으로 계속해서 답을 채워나갈 예정이다*


1) 어떻게 하면 기존 블로그들의 특징을 잘 분류할수있을까?..

2) 주제를 한정시켜서 쉬운 분류작업부터 시도해볼까? 

3) 혹시 나와같은 생각을 가진 기존 사례는 없었는가? 여기에 해답이 없겠는가?  

    -> 만약있다면..그리고 아주 뛰어난 분석과 결론이 도출되었다면, 본 연구는 접어야 한다..ㅠㅠ 이는 선행조사라고 할수 있으며 무언가를 연구를 하는 동시에 내가 목표로하는 것과 동일의 주제가 존재하는지 혹은 경쟁적인 연구사례가 존재하는지 찾아보는 것으로 연구를 위해서 매우 중요하다. 하지만 본 "블로그 탐구"에서는 그저 탐구만을 하기로 했기에 기존 사례가 존재하더라도 무시하고 오히려 참고하여 [날마다 연구]를 끝까지 해보도록 하겠다.


4) 블로그의 게시글들의 공통점은 무엇인가?

5) 효과적인 블로그 글들의 검색방법은 무엇일까?

6) 상위 검색 글들은 어떤 비밀이 숨겨져 있는가? (글의 패턴, 글자수, 그림의 수, 공백의 크기 등등)
7) 네이버에서의 상위글들과 다음에서의 상위글들은 어떻게 다른가? 그렇다면 구글은?

8) 블로그의 랭킹은 어떻게 달라지는가?

9) 블로그 유입자를 늘리기 위해선 무엇이 필요한가?

10) 블로그의 정의란 무엇일까?... 블로그를 하는 사람의 마인드는? 목적은?...블로그를 찾는 사람의 마음은?

11) 우리는 주로 언제 블로그를 찾거나 블로그를 하는가?

12) 블로거 (블로그를 유지 보수 하는 온라인사용자) 들의 유형은? 타입은? 

13) 그들은 주로 언제 글을 쓰는가?

14) 글의 주제에 따른 태그는 무엇을 다는가?

15) 파워블로거들의 분포는? 네이버, 다음, 티스토리 등등..

16) 검색엔진들이 친철하게 대해주는 유입자들은? 블로거들은?

17) 검색엔진들 (네이버, 다음, 구글 등등) 의 관점에서 바라본 블로그의 글들은 무엇일까?

18) 그날의 인기글이 되는 비법은? 상위 노출의 비밀! 또한 왜 쓸데없는 정보를 가진 글들이 상위에 노출되는가? (낚시글)

19) 방문자들의 관점에서 바라본 블로그

20) 상업성 블로그와 취미 블로그의 구별법?



최대한의 연상 생각법(하나의 생각들이 꼬리를 물고 늘어지면서 확장되고 다양한 아이디어를 창출할수 있는 방법. 기존의 연상기억법에 착안) 을 통하여 위와 같은 질문들을 짧은시간 약 10분만에 도출해냈다. 이제 이 간단한 몇가지들의 질문들을 다시 재분류하고 쓸만한 정보와 앞으로의 방향성들을 찾아보면 아래와 같다.


그룹화 -> 간결화 - > 주제 도출 -> 앞으로의 방향성 도출 


[Group1: 인과 관계에 따른 분석이 필요함]

5), 8), 11)


[Group2: 특이성을 도출해야함]

6), 7), 9), 16), 18)


[Group3: 나름의 정의를 내려야 함]

1), 2), 12), 17), 19) 


[Group4: 유사사례 검색법]

3), 4), 10), 13), 14), 15), 20)


위의 4가지 그룹화가 가능했으며, 이들에 대한 블로그 분석에 대한 아이디어들은 아래와 같은 순서로 진행될때 가장 좋은 효과를 보일것 같다.


G3 - G4 - G1 - G2


그리고 결론적으로 이들 블로그의 분석을 통하여 지향하는 것은 단순히 "파워 블로그가 되는법"을 찾는것이 아니라 "파워 블로그처럼 유익한 글들을 포스팅하는 법"이 될것이다. 따라서 이제부터 위의 질문들에 대한 답들을 찾아볼 것이다.






[출처: 나, 블로그 연구, 그 첫번째 이야기 #1]


우리는 모두가 연구가이다.




- 아침 출근길의 최단거리를 찾기위해서 지하철 승강장 번호를 계산하여 승차하는 사람들.

- 조금이라도 더 저렴한 가격으로 장을 보기 위해서 'g' 당 가격, 동일 상품의 타사제품 비교, 할인/적립을 제공하는가 등등을 따져보는 주부들

- 1초의 기록단축을 위해서 자신의 자세와 호흡법 등을 분석하고, 심지어 트레이닝 슈트와 신발까지 맞춤제작을 하는 운동선수들.. 


이들을 모두 하나의 공통된 주제로 다시 모아서 말을 하자면,  자신이 정의한 문제를 해결하기 위해서 솔루션을 찾는 사람, 즉, 연구가 라고 할수 가 있다.


그렇다면, 연구란 무엇일까?..



연구는 어떻게 이루어 지는것일까?



예를들어, 일상적인 연구주제를 찾다가 나는 블로그라는 매력적인 주제를 발견하였다.

블로그를 하는 사람들은 모두다 자신만의 블로그에 글을 쓰는 일 (포스팅)을 한다. 모두 제각각 글을 쓰고 싶은대로 적는 것 같지만..분석을 해보면 일정한 규칙과 그들의 패턴이 존재한다.  


(글 작성시간, 글의 양, 글의 구성, 사진의 위치, 상업성과 비 상업성, 인기키워드, 이 모두들 어우르는 플랫폼이라는 양식 =블랫폼 (여기서 나는 이렇게 부르도록 하겠다.) - 인기있는 파워블로그의 글은 다르다?! 다르다. 사진부터. 공백부터 다르다. 이를 내가 분석해도 되는지 모르겠다.. 혹시나 이들의 밑천이 드러나는 것은 아닐까?..아니 그럴리 없다! 누가 보더달도 이는 Open 소스 이기때문이다. 자바처럼. 나는 방향만 제시할뿐,..결국 이를 활용하는것은 이글을 읽는 사람들의 몫,

재능나눔에 대한 나의 생각. 예를 들면 크몽. 우리는 앞으로 이렇게 발전해야한다. 자신의 만의 특화된 흥미거리를 취미로 연결시켜야 하며 이것을 통하여 수익을 창출해야하는 시대가 올것이다.)

(같은 글이지만, 어느글이 더욱 눈에 잘 들어오는가?...생각을 넣는것과 그냥 쓰인 글의 차이는 어떤가? 

고민한 만큼 글의 질이 다르다)


따라서, 공학적인 연구뿐만 아니라서 일상적인 연구로써, 블로그라는 주제안에서 내가 생각하는 분석법을 이용하여 이제부터  나는 특정 블로그들의 총체적인 패턴을 나 나름대로의 분류기준으로 통하여 점수를 매기고 이를 통계내어서 일정한 경향성과 이들의 성공 비결들을 찾아가는 연구를 시작해보겠다.


(자신있게..출발하지만..과연 그 끝은..ㅠ...)





'Any Notion > Routine laboratory ' 카테고리의 다른 글

[날마다 연구] #2 분류기준의 선정  (0) 2015.01.08

* 추계적 과정의 의미는? 수학적으로 일부의 결과를 가지고 전체의 결과를 예상하여 계산하는 것.


위키에서 설명하는 Renewal theory의 의미는 아래와 같다. 


Renewal theory is the branch of probability theory that generalizes Poisson processes for arbitrary holding times. Applications include calculating the best strategy for replacing worn-out machinery in a factory and comparing the long-term benefits of different insurance policies.


Renewal theory는 푸아송과정을 모체로하는 확률이론의 한 분야이다. 본 이론이 쓰이는 예는, 공장에서 낡아빠진 장비의 교체 주기를 계산하거나, 전구의 수명이 다하는 것을 예상하여 아 주 긴주기에서의 교체주기를 예상하여 손이익을 계산하고자 할때 사용 될 수 있다. 


Introduction

A renewal process is a generalization of the Poisson process. In essence, the Poisson process is a continuous-time Markov process on the positive integers (usually starting at zero) which has independent identically distributed holding times at each integer i (exponentially distributed) before advancing (with probability 1) to the next integer:i+1. In the same informal spirit, we may define a renewal process to be the same thing, except that the holding times take on a more general distribution. (Note however that the independence and identical distribution (IID) property of the holding times is retained).



푸아송을 배울때 알게되는 Inter-arrival time 이라는 개념이 본  Renewal theory를 설명할 때 사용되었으므로 푸아송을 참고하기 바란다.  Renewal theory는 holding time을 제외한 더욱 일반적인 분포라고 볼수가 있다. 


Formal definition[edit]

Sample evolution of a renewal process with holding times Si and jump times Jn.

Let S_1 , S_2 , S_3 , S_4 , S_5, \ldots  be a sequence of positive independent identically distributed random variables such that

 0 < \mathbb{E}[S_i] < \infty.

We refer to the random variable S_i as the "ith" holding time. \mathbb{E}[S_i] is the expectation of S_i.

Define for each n > 0 :

 J_n = \sum_{i=1}^n S_i,

each J_n referred to as the "nth" jump time and the intervals

[J_n,J_{n+1}]

being called renewal intervals.

Then the random variable (X_t)_{t\geq0} given by

 X_t = \sum^{\infty}_{n=1} \mathbb{I}_{\{J_n \leq t\}}=\sup \left\{\, n: J_n \leq t\, \right\}

(where \mathbb{I} is the indicator function) represents the number of jumps that have occurred by time t, and is called a renewal process.


holding times S1~Sn은 각각 IID를 따르는 Random variable을 의미하며 그 평균값은 0보다 큰 양의 값이다.

그냥 간단히 말해서, 예를들어, 푸아송 분포에서 미리 선정한 arrival rate값에 따라 사건을 발생시켰을때의 각 사건들의 발생은 서로 IID하며 그때의 사건마다 주기는 J1~ Jn까지라고 할수가 있다.


*Holding time이란? 만약 어떤 공장에서 사용하나 기계들이 존재할 때, 다른 하나의 기계가 고장나기전 하나의 기계가 고장났을때, 두 고장시간 사이의 시간간격이라고 볼 수 있다. (기계의 고장=이벤트로 볼수가 있으므로, 두 이벤트가 발생할때, 그 두 이벤트 발생시간 사이의 시간간격을 말한다.)


만약 어느 특정한 사건 n시점에서의 사건으로가서 생각해보자. 

Jn은 n번째가 되기에 필요한 Si [1,n] 시간의 모든 합이라 할수있으며, 

Jn에서 그 다음 사건인 n+1 사이의 interval은 [Jn,Jn+1] 이라고 정의하며, 이를 renewal intervals라고 부른다. 


Random variable Xt 는 위와 같이 정의되는데, Jn이 시간 t 안에 포함된다면 그때의 최 상한선 값을 Xt라고 부르며

이를 renewal process라고 한다. 

Renewal-reward processes[edit]

Let W_1, W_2, \ldots be a sequence of IID random variables (rewards) satisfying

\mathbb{E}|W_i| < \infty.\,

Then the random variable

Y_t = \sum_{i=1}^{X_t}W_i

is called a renewal-reward process. Note that unlike the S_i, each W_i may take negative values as well as positive values.

The random variable Y_t depends on two sequences: the holding times S_1, S_2, \ldots and the rewards W_1, W_2, \ldots These two sequences need not be independent. In particular, W_i may be a function of S_i.



Y축 값 W1~Wn 값들은 IID 조건을 만족하며 유한할때,

이때 Random variable Yt는 1부터 Xt 까지의 모든 W값들의 합 으로 정의된다.

W는 -와 +값으로 표현이 가능하며, 이를테면 손해와 이득에 대한 표현이 가능한 변수이다. 

따라서 Wi = rewards 는 시간 t에서 연속적인 cost의 losses/gains의 총합을 말한다.



+ Recent posts