Review: 교수님 논문 중 self-consistency

Author

SEOYEON CHOI

Published

February 18, 2024

Enhancement of variational mode decomposition with missing values

Modified Variational Mode Decomposition

In this section, we propose a new decomposition procedure by coupling a concept of self-consistency (Tarpey and Flury, 1996; Lee and Meng, 2005) and a thresholding of periodogram by the hard thresholding discussed in Section 2.3.1.

First, we consider the self-consistency principle for estimating IMFs when facing missing data.

일단 결측값이 있는 IMF1 를 추정하기 위하여 self-consistency의 원리를 봤다.

  • 1 이 논문에서 구하고자 하는 값인듯

  • Tarpey and Flury (1996) introduced the self-consistency as a fundamental concept in statistics, which is inspired by Hastie and Stuetzle (1989) for developing principal curves.

    Tarpey and Flury는 self-consistency를 주요 곡선을 개선하기 위하여 Hastie and Stuetzle에 inspire 받아 통계학의 원리적인 개념으로서 소개했다.

    Further, Lee and Meng (2007) considered a self-consistent regression estimator with incomplete data.

    Lee and Meng는 incomplete dat로 self-consistent regression estimator를 고려했다.

    They proposed an estimate \(\hat{f}_{obs}\) of the underlying obs function \(f\) given observed data \(x_{obs}\) that is the solution of the following self-consistent equation

    그들은 관찰 데이터 \(x_{obs}\)가 제시되었을때 underlying obs function \(f\)으로 \(\hat{f}_{obs}\)를 추정하는 방법을 제안했다.

    그것은 다음의 self-consistent equation 의 solution이다.

    \(E(\hat{f}_{com} | x_{obs} , f = \hat{f}_{obs}) = \hat{f}_{obs} \dots\)(1)

    where \(\hat{f}_{com}\) denotes an estimate of \(f\) based on the hypothetical complete data \(x_{com} = (x_{obs},x_{mis})\) and \(x_{mis}\) is missing data, and \(E(·)\) denotes the expectation operator.

    \(\hat{f}_{com}\)은 가상의 complete data인 \(x_{com} = (x_{obs},x_{mis})\)에 기반하여 \(f\)의 추정치로 쓰였고, \(x_{mis}\)는 결측값이다. 그리고 \(E(·)\)는 expectation operator이다.

    • 결측값이 있는 x에서 x_com을 hat_f_com의 expectation으로 추정

    We note that \(x_{mis}\) is not available in practice.

    \(x_{mis}\)는 실제로 이용가능하지 않음.

    Moreover, Lee and Meng (2007) suggested that the above equation provides a way to obtain a “best” incomplete-data estimator \(\hat{f}_{obs}\) by simply using the corresponding complete-data procedure that computes \(\hat{f}_{com}\).

    (1)을 제안했던 Lee and Meng은 단순하게 \(\hat{f}_{com}\)을 계산하는 crresponding complete data procedure을 사용함으로써 ’best’한 incomplete-data estimator인 \(\hat{f}_{obs}\)를 구하는 방법을 제공한다.

    • ex) missing이 있을때. obs+missing값 0처리 로 regression구하고 missing 값만 그 regression 결과로 바꿔서.. 반복하는 법

    By considering that the above equation does not depend on the method for estimation, it can be applicable for VMD procedure with missing data.

    그 (1)이 estimation에 의존하지 않는다는 것을 고려함으로써 결측값을 가진 VMD procedure2에 적용할 수 있다.

  • 2 교수님 논문에서 제안한 방법

  • Thus, under our framework, the self-consistency equation can be expressed as

    그러므로 self-consistency equation은 확장될 수 있다.

    \(E[\hat{u}_{k,com} | \{ f\{n\} : n \in O \} ,\{ u_k \} = \{ \hat{u}_{k,obs} \} ] = \hat{u}_{k,obs}, k=1,\dots, K \dots\)(2)

    In here \(\hat{u}_{k,com}\) denotes an estimate of \(u_k\) from complete data and \(\hat{u}_{k,obs}\) is an estimate based on observed data.

    여기서 \(\hat{u}_{k,com}\)는 complete data의 \(u_k\)의 추정치이고, \(\hat{u}_{k,obs}\)는 관찰값에 기반한 추정치이다.

    In practice, the missing values \(\{ f(n) : n \in M\}\) are not available, and thus, given imputed values \(\{ \tilde{f}(n) : n \in M \}\), we obtain an estimated complete dataset \(\{ \hat{f} ( n ) \} = \{ f(n) : n \in O ) \} \cup \{ \tilde{f} ( n ) : n \in M \}\) and consider the corresponding decomposition as

    결측값은 없어서 f tilde의 imputed value를 사용했다. 이것은 corresponding decomposition으로 구한 estimated complete dataset에서 얻었다.

    • M은 결측값 인덱스
    • O는 관측값 인덱스
    • 즉 관측값 + 결측값 대체한 값

    \(\hat{f} ( n ) = \sum^{K}_{k=1} \hat{u}_k (n), k=1, \dots, K \dots\)(3)

    A simple and fast way to implement (2) and (3) may be an iterative algorithm with updating \(\{ \tilde{f}^{(l)}(n) : n \in M \}\) and decomposing \(\hat{f}^{(l)}(n) = \sum_{k=1}^{K} \hat{u}_{k}^{(l)} (n)\).

    (2),(3)을 하려면 값을 반복적인 알고리즘으로 업데이트하고 분해하는 것이다.

    ~Finally, by embedding the above iterative procedure and Algorithm 2 into Algorithm 1, we propose a procedure of MVMD in the presence of missing values.~

    ~Note that the following stopping rule is used for criterion of convergence, for some > 0,~