5  Ecuaciones diferenciales estocásticas.

5.1 Formulación y Teoremas de Existencia y Unicidad

Definición 5.1 Un proceso \(Y = \{Y_t\}_{t \geq 0}\) es una semimartingala si admite la descomposición canónica \[Y_t = Y_0 + Y_t^c + \sum_{s \leq t} \Delta Y_s,\] donde:

  • \(Y_0\) es \(\mathcal{F}_0\)-medible.

  • \(Y^c = (Y_t^c)_{t \geq 0}\) es decir, la parte continua de la descomposición de Itô.

  • \(\Delta Y_s := Y_s - Y_{s-}\) es el salto de \(Y\) en el instante \(s\); por convención, \(Y_{s-} = \lim_{r \uparrow s} Y_r\).

  • \(\sum_{s \leq t} |{\Delta Y_s}|^2 < \infty\) c.s. en compactos ( Protter (2005) Cap. II).

5.1.1 Teorema de existencia y unicidad global de una solución fuerte para la EDE con difusión y saltos

Definición 5.2 \(\{x_t\}_{t\geq0}\) es una solución \((\mathcal{F}_t-)\) de
\[\begin{split} x_t = x_0 &+ \int_0^t b(s,x_s,\omega)\,ds + \int_0^t \sigma(s,x_s,\omega)\,dw_s \\ & \ \ \ \ \ \ \ \ \ \ \ + \int_0^t\int_Z R(s,x_{s-},z,\omega)\,\tilde{N}_t(ds,dz), \qquad t\geq 0 \end{split} \tag{5.1}\] si y solo si \(\{x_t\}_{t\geq}0\) satisface la Ecuación 5.1. en el caso que \(x_t\in \mathcal{F}_t^{\omega_s}, \forall t \geq 0,\) donde \(\mathcal{F}_t^{\omega_s}\) es la \(\sigma\)-álgebra generada por \(\omega_s, s\leq t\), es una solución fuerte

Consideramos el espacio: \[\begin{split} \small S_{\mathcal{F}}^{2,loc}(R) = \left\lbrace\begin{array}{c}f(t,\omega):f(t,\omega) \text{\ es \ } \mathcal{F}_t- \text{adaptada, de valor real, tal que} \\ \mathbb{E} [sup_{t\in[0,T]} |f(t,\omega)|]^2 < \infty, \forall T < \infty \end{array}\right\rbrace \end{split} \tag{5.2}\]

Teorema 5.1 ( Existencia y unicidad global de una solución fuerte (condiciones de Lipschitz y crecimiento lineal global).). Suponga que:

  1. \(b\) y \(\sigma : [0,\infty) \times \mathbb{R} \times \Omega \to \mathbb{R}\),\(R : [0,\infty) \times \mathbb{R}\times Z \times \Omega \to \mathbb{R}\) son conjuntamente medibles y \(\mathcal{F}_t\) -adaptadas, donde además \(R\) es \(\mathcal{F}_t\)-predecible, tales que \(P\)-c.s.: \[|b(t,x,\omega)| \leq \widetilde{c} (t)(1 + |x|),\] \[|\sigma(t,x,\omega)|^2 + \int_Z |R(t,x,z,\omega)|^2 \pi(dz) \leq \widetilde{c}(t)(1 + |x|^2),\]

  2. \[|b(t,x_1,\omega) - b(t,x_2,\omega)| \leq \widetilde{c}(t) |x_1 - x_2|,\] \[|\sigma(t,x_1,\omega) - \sigma(t,x_2,\omega)|^2 + \int_Z |R(t,x_1,z,\omega) - R(t,x_2,z,\omega)|^2 \pi(dz) \leq \widetilde{c}(t) |x_1 - x_2|^2,\] donde \(\widetilde{c}(t)\) satisface las mismas condiciones que en 1°;

  3. \[x_0 \in \mathcal{F}_0, \quad E|x_0|^2 < \infty.\] Entonces la Ecuación 5.1 tiene una solución única por trayectoria, \(\mathcal{F}_t\)-adaptada, \(\{x_t\}_{t \geq 0} \in S_{\mathcal{F}}^{2,\text{loc}}(\mathbb{R}^d)\).

En el caso en que \(b(t,x,\omega)\) y \(\sigma(t,x,\omega)\) sean \(\mathcal{F}_t^{w,\tilde{N}}\)-adaptadas, y \(R(t,x,z,\omega)\) sea \(\mathcal{F}_t^{w,\tilde{N}}\)-predecible, entonces la solución también es \(\mathcal{F}_t^{w,\tilde{N}}\)-adaptada, es decir, es una solución fuerte.

Demostración. Para algún \(T < \infty\) fijo, se define la norma: \[\| (x_{\cdot}) \|_M^2 = \sup_{t \in [0,T]} e^{-b_0 A(t)} \mathbb{E}[|x_t|^2],\] donde: - \(A(t) := \int_0^t 4\widetilde{c}(s) ds\), - \(b_0 \geq 0\) es una constante que se elegirá más adelante para hacer que el operador sea contractivo, - \(\widetilde{c}(s)\) es la función no aleatoria que aparece en las hipótesis \(1\) y \(2\) (crecimiento lineal y Lipschitz)

Entonces, el espacio sobre el cual se aplica el principio de contracción es: \[H = \left\{ \{x_t\} \in B :B \in L_{\mathfrak{F}}^{2}(\mathbb{R}), \ \| (x_{\cdot}) \|_M < \infty \right\}.\] Sea \(\Phi: H \to H\) el operador definido por: \[(\Phi(x))_t = x_0 + \int_0^t b(s, x_s, \omega)\,ds + \int_0^t \sigma(s, x_s, \omega)\,dW_s + \int_0^t \int_Z R(s, x_{s-}, z, \omega)\,\tilde{N}(ds, dz).\] y sea \(X_t = x_t^{(1)} - x_t^{(2)}\), y \(Y_t = (\Phi(x^{(1)}))_t - (\Phi(x^{(2)}))_t\). Entonces para un \(\omega\) fijo \[Y_t = \int_0^t [b(s, x_s^{(1)}, \omega) - b(s, x_s^{(2)}, \omega)]\,ds + \int_0^t [\sigma(s, x_s^{(1)}, \omega) - \sigma(s, x_s^{(2)}, \omega)]\,dW_s\] \[+ \int_0^t \int_Z [R(s, x_{s-}^{(1)}, z, \omega) - R(s, x_{s-}^{(2)}, z, \omega)]\,\tilde{N}(ds, dz).\] Por comodidad \[Y_t = \int_0^t \Delta b_s\,ds + \int_0^t \Delta \sigma_s\,dW_s + \int_0^t \int_Z \Delta R_s(z)\,\tilde{N}(ds, dz),\] donde \(\Delta b_s := b(s, x_s^{(1)}) - b(s, x_s^{(2)}), \Delta \sigma_s := \sigma(s, x_s^{(1)}) - \sigma(s, x_s^{(2)}), \Delta R_s(z) := R(s, x_{s-}^{(1)}, z) - R(s, x_{s-}^{(2)}, z)\) Puesto que la función \(f(y) = y^2\) tiene derivadas \(f'(y) = 2y, \ \ f''(y) = 2\), al aplicar la fórmula de Itô para semimartingalas con saltos, obtenemos \[Y_t^2 = Y_0^2 + 2 \int_0^t Y_s \, dY_s^c + \int_0^t d\langle Y^c \rangle_s + \sum_{s \leq t} \left[ Y_s^2 - Y_{s-}^2 - 2 Y_{s-} \Delta Y_s \right],\] donde: - \(dY_s^c = \Delta b_s \, ds + \Delta \sigma_s \, dW_s\) es la parte continua, - \(d\langle Y^c \rangle_s = (\Delta \sigma_s)^2 \, ds\) es la variación cuadrática de la parte continua, - \(\Delta Y_s = \int_Z \Delta R_s(z) \, N(\{s\}, dz)\) es el tamaño del salto en el instante \(s\). Al reescribir a la versión integral ya desarrollada y aplicar la formula de itô para \(f(y) = y^2\) aplicada a \(Y_t\) \[|Y_t|^2 = 2 \int_0^t Y_s \, \Delta b_s \, ds + 2 \int_0^t Y_s \, \Delta \sigma_s \, dW_s + \int_0^t |\Delta \sigma_s|^2 \, ds + 2 \int_0^t \int_Z Y_s \, \Delta R_s(z) \, \tilde{N}(ds, dz)\]

\[+ \int_0^t \int_Z |\Delta R_s(z)|^2 \, N(ds, dz).\] Aplicando valor esperado y sus propiedades \[\begin{aligned} \mathbb{E}[ |Y_t|^2] = {}& \mathbb{E}\left[2 \int_0^t Y_s \, \Delta b_s \, ds \right] +\mathbb{E}\left[ 2 \int_0^t Y_s \, \Delta \sigma_s \, dW_s \right] \\ & +\mathbb{E}\left[ \int_0^t |\Delta \sigma_s|^2 \, ds + 2 \int_0^t \int_Z Y_s \, \Delta R_s(s,z) \tilde{N}(ds, dz)\right] \end{aligned}\] \[\mathbb{E}\left[\int_0^t \int_Z |\Delta R_s(z)|^2 \, N(ds, dz)\right]\] Dado que los valores esperados de las integrales respecto a \(dW_s\) y \(\widetilde{N}\) son martingalas, \[\mathbb{E}\left[ \int_0^t Y_s \, \Delta \sigma_s \, dW_s \right] = 0,\] \[\mathbb{E} \left[ \int_0^t \int_Z Y_s \, \Delta R_s(z) \, \tilde{N}(ds, dz)\right] = 0,\] y puesto que \(\mathbb{E}[N(ds,dz)] = \pi(dz)ds,\) se reduce a \[\mathbb{E}[|Y_t|^2] = \mathbb{E}\left[\int_0^t \left(2Y_s \, \Delta b(s) \, + |\Delta \sigma(s)|^2 + \int_Z |\Delta R_s(s,z)|^2 \, \pi ( dz)\right) ds\right].\] Nótese que para el primer término, al aplicar la desigualdad de Cauchy-Schwarz \(2Y_s\Delta b(s)\leq 2|Y_s||\Delta b(s)|,\) y por las hipótesis de Lipschitz

\[|\Delta b(s) |\leq \widetilde{c}(s)|X_s|, \ \ |\Delta \sigma(s)|^2 + \int_z |\Delta R(s.z)|^2 \pi(dz) \leq \widetilde{c}(s)|X_s|^2.\] Además usando la desigualdad \(2ab \leq a^2 + b^2\), se tiene que \[2Y_s\Delta b(s) \leq 2|Y_s |\widetilde{c}(s)|X_s| \leq \widetilde{c}(s)(|Y_s|^2 + |X_s|^2),\] aplicando valor esperado y tomando el supremo \[\mathbb{E}[|{Y_t}|^2] \leq \int_0^t \widetilde{c}(s) \left( \mathbb{E}[|{Y_s}|^2] + \mathbb{E}[|{X_s}|^2] \right) ds.\] \[\mathbb{E}\!\left[ \sup_{0 \leq r \leq t} |{Y_r}|^2 \right] \leq \int_0^t \widetilde{c}(s) \left( \mathbb{E}\!\left[ \sup_{0 \leq r \leq s} |{Y_r}|^2 \right] + \!\left[ \sup_{0 \leq r \leq s} |{X_r}|^2 \right] \right) ds. \tag{5.3}\]

Como se ha eliminado la parte estocástica al tomar el valor esperado anteriormente, se procederá a obtener un acotamiento determinista.

Sea

\[u(t) := \mathbb{E}\!\left[ \sup_{0 \leq r \leq t} |{Y_r}|^2 \right], \qquad v(t) := \mathbb{E}\!\left[ \sup_{0 \leq r \leq t} |{X_r}|^2 \right],\]

entonces podemos reescribir Ecuación 5.3 como

\[u(t) \leq \int_0^t \widetilde{c}(s) \bigl( u(s) + v(s) \bigr) ds,\]

aplicando la desigualdad de Gronwall

\[u(t) \leq \int_0^t \widetilde{c}(s) v(s) \exp\!\left( \int_s^t \widetilde{c}(r) \, dr \right) ds.\]

Multiplicamos ambos lados por \(e^{-b_0 A(t)}\), donde \(A(t) = \int_0^t 4\widetilde{c}(r),dr,\) entonces

\[e^{-b_0 A(t)}u(t) \leq e^{-b_0 A(t)}\int_0^t \widetilde{c}(s) v(s) \exp\!\left( \int_s^t \widetilde{c}(r) \, dr \right) ds.\]

Notemos que

\[\int_s^t \widetilde{c}(r) \, dr = \frac{1}{4} \bigl( A(t) - A(s) \bigr),\]

y por lo tanto,

\[\begin{align*}e^{-b_0 A(t)} u(t)&\leq \int_0^t \widetilde{c}(s)v(s)\exp\!\left( \frac{1}{4}\bigl( A(t) - A(s) \bigr) -b_0 A(t)\right) ds \\ & = \int_0^t \widetilde{c}(s)v(s)exp\left(-\left(b_0-\frac{1}{4}\right)A(t) - \frac{1}{4}A(s)\right)ds.\end{align*}\]

Como \(v(s) \leq e^{b_0A(s)}\|{X}\|_M^2\), se tiene

\[\begin{align*}e^{-b_0 A(t)} u(t)&\leq \|{X}\|_M^2 \int_0^t \widetilde{c}(s)exp\left(-\left(b_0-\frac{1}{4}\right)A(t) - \frac{1}{4}A(s)\right)ds\end{align*}\]

simplificando lo que esta dentro de la exponencial

\[\left(-\left(b_0-\frac{1}{4}\right)A(t) - \frac{1}{4}A(s)\right) = \left(b_0-\frac{1}{4}\right)(A(s) -A(t)),\]

se reduce a \[\begin{align*} e^{-b_0 A(t)} u(t) &\leq \|{X}\|_M^2 \int_0^t \widetilde{c}(s)exp \left(\left(b_0-\frac{1}{4}\right)(A(s) -A(t))\right) ds. \end{align*}\] Dado que \(A(s)-A(t)\leq 0\), el término exponencial es menor que uno si \(b_0\geq\frac{1}{4}.\) Por lo que haciendo un cambio de variable \(U = A(s)\), \(dU=\widetilde{c}(s)ds,\) y \(A(t)= \int_0^t \widetilde{c}(s)ds\) \[\begin{align*} \int_0^t \widetilde{c}(s)exp\left(\left(b_0 - \frac{1}{4}\right) \cdot A(s(-A(t)))\right)ds & = \int_0^{A(t)}exp\left(\left( b_0 - \frac{1}{4}\right)(U-A(t))\right)dU\\ & = exp\left(-\left( b_0 - \frac{1}{4}\right)A(t)\right) \\ & \ \ \ \ \ \ \ \ \ \cdot \int_0^{A(t)}exp\left(\left( b_0 - \frac{1}{4}\right)U\right)dU, \end{align*}\] Si \(b_0>\frac{1}4{}\)

\[\int_0^{A(t)}exp\left(\left( b_0 - \frac{1}{4}\right)U\right)dU = \frac{1}{b_0 - \frac{1}{4}}\left[exp\left(\left(b_0-\frac{1}{4}\right)A(t)\right)-1\right],\] entonces \[e^{-b_0A(t)} u(t) \leq \|{X}\|_M^2 \frac{1}{b_0-\frac{1}{4}}\left[1-exp\left(-\left(b_0-\frac{1}{4}\right)A(t)\right)\right]\leq\|{X}\|_M^2\frac{1}{b_0-\frac{1}{4}},\] por lo tanto \[\|{Y}\|_M^2 = \sup_{t\in[0,T]}e^{-b_0A(t)}u(t)\leq\frac{1}{b_0-\frac{1}{4}} \|{X}\|_M^2.\] Elegimos apropiadamente a \(b_0>\frac{5}{4}\), para que \(\frac{1}{b_0-\frac{1}{4}}<1\), en consecuencia \(\Phi\) es contractivo. Por el principio de contracción de Banach, \(\Phi\)tiene un único punto fijo en \(H\) , que es la solución única de la SDE.

Ahora se demostrará que la solución es única por trayectoria. Sea \(x^{\prime}_{t}\), una versión RCLL(Definición 4.8) del proceso \(x_t\) que es solución de Ecuación 5.1, es decir para cada \(t \in [0,T]\), \(P(x^{\prime}_{t} \neq x_t) = 0\), \(x^{\prime}_{t}\) es solución de Ecuación 5.1 y es un proceso continuo por la derecha y con limite por la izquierda en \(t.\)

Denotemos \(x^{\prime\prime}_{t}\) y \(y_t\) como \[\begin{align*} x^{\prime\prime}_t = x_0 &+ \int_0^t b(s,x_s,\omega)\,ds + \int_0^t \sigma(s,x_s,\omega)\,dw_s \\ & \ \ \ \ \ \ \ \ \ \ \ + \int_0^t\!\int_Z R(s,x_{s-},z,\omega)\,\tilde{N}_t(ds,dz), \qquad t\ \in [0,T] \end{align*}\] \[\begin{align*} y_t = x_0 &+ \int_0^t b(s,x^{\prime}_s,\omega)\,ds + \int_0^t \sigma(s,x^{\prime}_s,\omega)\,dw_s \\ & \ \ \ \ \ \ \ \ \ \ \ + \int_0^t\!\int_Z R(s,x^{\prime}_{s-},z,\omega)\,\tilde{N}_t(ds,dz), \qquad t\in [0,T]. \end{align*}\] Dado que \(x^{\prime}\) es una versión RCLL de un proceso adaptado, por el teorema () \(x^{\prime}\) es adaptado. \ Puesto que \(x_t \in L^2(\Omega \times [0,T])\) y ademas ambos procesos son medibles como funciones \((t,\omega) \mapsto x_t(\omega)\) con respecto a la \(\sigma-\)álgebra producto \(\mathcal{B}([0,T])\bigotimes\mathcal{F}.\) Entonces para cada \(t\), \(|x^{\prime}_t - x_t|^2 =0\) casi seguramente, es decir \[\mathbb{E}[|x^{\prime}_t - x_t|^2] = 0, \quad \text{para todo } t \in [0,T]. \] Ahora, bajo la suposición de medibilidad conjunta (que se cumple si, por ejemplo, los procesos son progresivamente medibles, lo cual es cierto para soluciones de SDEs con coeficientes medibles), podemos aplicar el (teorema de Fubini), \[\mathbb{E}[\int_0^T|x^{\prime}_t - x_t|^2dt] = \int_0^T\mathbb{E}[|x^{\prime}_t - x_t|^2]dt =0. \tag{5.4}\] Consideremos el conjunto donde los procesos no coinciden \[N := \{(t,\omega) \in [0,T]\times \Omega : x^{\prime}_t(\omega)\neq x_t(\omega)\},\] este conjunto es medible en \(\mathcal{B}([0,T])\bigotimes\mathcal{F}\) ya que \(x^{\prime}_t(\omega) - x_t(\omega)\) es una función medible y además es equivalente a \(N = \{(t,\omega) : |x^{\prime}_t(\omega)- x_t(\omega)|^2>0\}.\)

De la Ecuación 5.4 se sigue que \[(dt\bigotimes\mathbb{P})(N) = \int_0^T \mathbb{P}(x^{\prime}_t\neq x_t)dt = \mathbb{E} \left[\int_0^T 1_N(t,\omega)dt\right]= 0. \tag{5.5}\]

Como \(N\) tiene medida cero se puede decir que \(x^\prime_t = x_t\) para \((dt\bigotimes\mathbb{P})\)- casi todo \((t,\omega)\).

Ahora, consideremos el conjunto denso \(D:=\mathbb{Q}\cap[0,T]\) . Definimos el evento \[\Omega_0 := \bigcap_{t \in D} \left\{ \omega \in \Omega : x_t(\omega) = x'_t(\omega) \right\}.\] Dado que \(D\) es numerable y \(\mathbb{P}(x_t = x'_t) = 1\) para cada \(t \in D\), se tiene \(\mathbb{P}(\Omega_0) = 1\). Fijemos \(\omega \in \Omega_0\), como ambas trayectorias \(t \mapsto x_t(\omega)\) y \(t \mapsto x'_t(\omega)\) son RCLL (continuas por la derecha con límites por la izquierda) y coinciden en el conjunto denso \(D\), se sigue que \[x_t(\omega) = x'_t(\omega) \quad \text{para todo } t \in [0,T].\] Por lo tanto, el conjunto \[\left\{ \omega \in \Omega : x_t(\omega) = x'_t(\omega) \text{ para todo } t \in [0,T] \right\}\] contiene a \(\Omega_0\), y en consecuencia tiene probabilidad uno. Por lo tanto, coinciden para todo $ t [0,T].$ Por lo que se concluye que la solución de la ecuación estocástica diferencial con saltos es única por trayectoria. Además, como los coeficientes \(b\), \(\sigma\) y \(R\) son \(\mathcal{F}_t^{W,\widetilde{N}}\)-adaptados, se sigue la solución es fuerte.\(\quad \square\)

Definición 5.3 \[\tau^N := \inf\{ t \geq 0 : |x_t| > N \}\] Se demuestra que \(\tau^N \uparrow \infty\) c.s. usando: - Estimaciones en \(S^{2,\mathrm{loc}}\) vía BDG y Grönwall, - Cota uniforme en \(N\): \(\mathbb{E}[\sup_{t \leq T} |x_t^N|^2] \leq K_T < \infty\), - Argumento de contradicción: \(N^2 \mathbb{P}(\tau^N \leq T) \leq K_T \Rightarrow \mathbb{P}(\tau^N \leq T) \to 0\).

5.1.2 Teorema de existencia y unicidad local de una solución fuerte para la EDE con difusión y saltos

Teorema 5.2 Si la condición \(2°\) del Teorema anterior se debilita a \(2°'\) tal que para cada \(N = 1, 2,\cdots,\) existe una función no aleatoria \(\widetilde{c}^N(t)\) tal que para cada \(|x_1|, |x_2| \leq N\), \[|b(t, x_1, \omega) - b(t, x_2, \omega)| \leq \widetilde{c}^N(t) |x_1 - x_2|,\] \[|\sigma(t, x_1, \omega) - \sigma(t, x_2, \omega)|^2 + \int_Z |R(t, x_1, z, \omega) - R(t, x_2, z, \omega)|^2 \pi(dz) \leq \widetilde{c}^N(t) |x_1 - x_2|^2,\] donde \(\widetilde{c}^N(t) \geq 0\) satisface \[\int_0^T \widetilde{c}^N(t)\,dt < \infty \quad \text{para cada } T < \infty,\] manteniendo la condición de crecimiento lineal global (independiente de \(N\)): \[\begin{align*} |b(t,x,\omega)| &\leq \tilde{c}(t)(1 + |x|), \\ |\sigma(t,x,\omega)|^2 + \int_Z |R(t,x,z,\omega)|^2 \, \nu(dz) &\leq \tilde{c}(t)(1 + |x|^2), \end{align*}\] con \(\tilde{c}(t) \geq 0\) no aleatoria y \(\int_0^T \tilde{c}(t)\,dt < \infty\) para todo \(T > 0\), y todas las demás hipótesis del Teorema anterior siguen siendo válidas. Entonces la conclusión del Teorema anterior sigue siendo cierta.

Demostración. Sea \(b^{N}(t,x,\omega)\) definida de la siguiente manera \[\begin{split} b^{N}(t,x,\omega) = \left\lbrace\begin{array}{c}b(t,x,\omega), \quad \text{si }|x|\leq N, \\ b(t,N_{\frac{x}{|x|}},\omega), \quad \text{si } |x| > N.\end{array}\right. \end{split} \tag{5.6}\] De igual manera se hace para \(\sigma^{N}(t,x,\omega)\) y \(R^{N}(t,x,z,\omega),\) consideramos \[\begin{split} x_t = x_0 &+ \int_0^t b_N(s,x^N_s,\omega)\,ds + \int_0^t \sigma^N(s,x^N_s,\omega)\,dw_s \\ & \ \ \ \ \ \ \ \ \ \ \ + \int_0^t\!\int_Z R^N(s,x^N_{s-},z,\omega)\,\tilde{N}_t(ds,dz), \qquad t\geq 0 \end{split} \tag{5.7}\] Como \(b^N, \sigma^N, R^N\) son globalmente Lipschitz en \(x\) y satisfacen las condiciones de medibilidad y crecimiento del Teorema anterior, se deduce inmediatamente la existencia y unicidad de una solución fuerte \(\{x^N_t\}_{t\geq 0}\in S^{2,loc}_{\mathcal{F}}(\mathbb{R})\). Definimos el tiempo de paro \(\tau^N:=inf\{t\geq0:|x^N_t|> N\}\), en el intervalo estocástico \([0, \tau^N),\) se tiene \(x^N_t=x_t,\) donde \(x_t\) es una solución de la ecuación original(Ecuación 5.1). Para $ t < ^N$, se tiene \(|x_t^N| \leq N\). Por la definición de los coeficientes truncados, esto implica

\[b^N(t,x_t^N,\omega) = b(t,x_t^N,\omega), \quad \sigma^N(t,x_t^N,\omega) = \sigma(t,x_t^N,\omega),\]

\[R^N(t,x_{t-}^N,z,\omega) = R(t,x_{t-}^N,z,\omega).\] Por lo tanto, en \([0, \tau^N)\), la ecuación (7) coincide exactamente con la ecuación (1). Así, la restricción de \(x^N\) a \([0, \tau^N)\) es una solución local de (1).

Sea $ N < M$, entonces, en el intervalo \([0, \tau^N)\), ambas soluciones \(x^N\) y \(x^M\) satisfacen la misma SDE, por la unicidad del Teorema anterior aplicada a la ecuación original en el intervalo estocástico, se concluye que \[x_t^N = x_t^M \quad \text{para todo } t < \tau^N, \quad \text{c.s.}\] lo que permite definir un proceso $ x = {x_t}_{t }$ mediante \[x_t := x_t^N \quad \text{para } t \in [0, \tau^N).\] Gracias a la compatibilidad entre las soluciones truncadas , esta definición es independiente de \(N\), por lo tanto \(x\) está bien definido en todo \([0, \infty)\), siempre que \(\tau^N \to \infty\) casi seguramente cuando \(N \to \infty\). Supongamos ahora por contradicción que existe ( T_0 > 0 ) tal que \[\mathbb{P}\left( \lim_{N \to \infty} \tau^N \leq T_0 \right) > 0.\]

Definamos \(\tau := \lim_{N \to \infty} \tau^N\). Entonces, para el evento \(A := \{ \tau \leq T_0 \}\), se tiene \(\mathbb{P}(A) > 0\), y para todo \(N\), \(\tau^N \leq T_0\) en \(A\), con \(|x_{\tau^N}^N| = N.\) Aplicando la desigualdad de Itô a la solución truncada \(x^N\) \[|x_t^N|^2 = |x_0|^2 + 2\int_0^t x_s^N \cdot b^N(s,x_s^N) ds + 2\int_0^t x_s^N \cdot \sigma^N(s,x_s^N) dw_s\]

\[+ \int_0^t \|\sigma^N(s,x_s^N)\|^2 ds + \int_0^t \int_Z |c^N(s,x_{s-}^N,z)|^2 N(ds,dz)\]

\[+ 2\int_0^t \int_Z x_{s-}^N \cdot c^N(s,x_{s-}^N,z) \tilde{N}(ds,dz).\] Tomando supremo en \([0, T_0]\) y esperanza, y usando la desigualdad \((a+b+c)^2 \leq 3(a^2 + b^2 + c^2)\), obtenemos \[\mathbb{E}\left[ \sup_{0 \leq t \leq T_0} \|x_t^N\|^2 \right] \leq C\Bigg( \mathbb{E}[\|x_0\|^2] + \mathbb{E}\left[ \sup_{t \leq T_0} \left| \int_0^t x_s^N \cdot b^N(s,x_s^N)\,ds \right| \right] \] \[+ \mathbb{E}\left[ \sup_{t \leq T_0} \left| \int_0^t x_s^N \cdot \sigma^N(s,x_s^N)\,dW_s \right|^2 \right] + \mathbb{E}\left[ \int_0^{T_0} \|\sigma^N(s,x_s^N)\|^2 ds \right]\] \[+ \mathbb{E}\left[ \int_0^{T_0} \int_Z \|R^N(s,x_{s-}^N,z)\|^2 \nu(dz) ds \right] + \mathbb{E}\left[ \sup_{t \leq T_0} \left| \int_0^t \int_Z x_{s-}^N \cdot R^N(s,x_{s-}^N,z)\,\tilde{N}(ds,dz) \right|^2 \right] \Bigg).\] Ahora acotamos cada término usando la condición de crecimiento lineal global y la desigualdad de Burkholder–Davis–Gundy (BDG). Para el termino con drift aplicamos Cauchy–Schwarz y crecimiento lineal: \[\left| x_s^N \cdot b^N(s,x_s^N) \right| \leq \|x_s^N\| \cdot \tilde{c}(s)(1 + \|x_s^N\|) \leq \tilde{c}(s)\bigl(\|x_s^N\| + \|x_s^N\|^2\bigr) \leq \tilde{c}(s)\bigl(1 + 2\|x_s^N\|^2\bigr).\] Luego \[\begin{aligned} \mathbb{E}\left[ \sup_{t \leq T_0} \left| \int_0^t x_s^N \cdot b^N(s,x_s^N)\,ds \right| \right] \leq{}& \int_0^{T_0} \tilde{c}(s)\bigl(1 + 2\mathbb{E}[\|x_s^N\|^2]\bigr) ds \\ &\leq C\left(1 + \int_0^{T_0} \tilde{c}(s) \mathbb{E}\left[ \sup_{r \leq s} \|x_r^N\|^2 \right] ds\right). \end{aligned}\] Ahora para el término browniano por la desigualdad de BDG con \(p=2\), existe una constante universal \(C_{\mathrm{BDG}} > 0\) tal que \[\mathbb{E}\left[ \sup_{t \leq T_0} \left| \int_0^t x_s^N \cdot \sigma^N(s,x_s^N)\,dW_s \right|^2 \right] \leq C_{\mathrm{BDG}} \, \mathbb{E}\left[ \int_0^{T_0} \|x_s^N \cdot \sigma^N(s,x_s^N)\|^2 ds \right].\] Usando Cauchy–Schwarz y crecimiento lineal: \[\|x_s^N \cdot \sigma^N(s,x_s^N)\|^2 \leq \|x_s^N\|^2 \cdot \|\sigma^N(s,x_s^N)\|^2 \leq \|x_s^N\|^2 \cdot \tilde{c}(s)(1 + \|x_s^N\|^2) \leq \tilde{c}(s)\bigl(\|x_s^N\|^2 + \|x_s^N\|^4\bigr).\] Sin embargo, al trabajar con cotas en \(L^2\), es estándar usar directamente: \[\|\sigma^N(s,x_s^N)\|^2 \leq \tilde{c}(s)(1 + \|x_s^N\|^2),\] y por lo tanto:

\[\begin{align*} \mathbb{E}\left[ \sup_{t \leq T_0} \left| \int_0^t x_s^N \cdot \sigma^N(s,x_s^N)\,dW_s \right|^2 \right] \leq C_{\mathrm{BDG}} \int_0^{T_0} \tilde{c}(s)\left(1 + \mathbb{E}[\|x_s^N\|^2]\right) ds\\ \leq C\left(1 + \int_0^{T_0} \tilde{c}(s) \mathbb{E}\left[ \sup_{r \leq s} \|x_r^N\|^2 \right] ds\right). \end{align*}\]

Análogamente para el término de saltos, por la versión con saltos de BDG, se tiene \[\mathbb{E}\left[ \sup_{t \leq T_0} \left| \int_0^t \int_Z x_{s-}^N \cdot R^N(s,x_{s-}^N,z)\,\tilde{N}(ds,dz) \right|^2 \right] \leq C \, \mathbb{E}\left[ \int_0^{T_0} \int_Z \|x_{s-}^N \cdot R^N(s,x_{s-}^N,z)\|^2 \nu(dz) ds \right]\]

\[\leq C \int_0^{T_0} \tilde{c}(s)\left(1 + \mathbb{E}[\|x_s^N\|^2]\right) ds \leq C\left(1 + \int_0^{T_0} \tilde{c}(s) \mathbb{E}\left[ \sup_{r \leq s} \|x_r^N\|^2 \right] ds\right).\] Por crecimiento lineal global se acotan los términos de variación cuadrática \[\mathbb{E}\left[ \int_0^{T_0} \|\sigma^N(s,x_s^N)\|^2 ds \right] + \mathbb{E}\left[ \int_0^{T_0} \int_Z \|R^N(s,x_{s-}^N,z)\|^2 \nu(dz) ds \right] \leq C \int_0^{T_0} \tilde{c}(s)\left(1 + \mathbb{E}[\|x_s^N\|^2]\right) ds.\] Reuniendo todas las estimaciones, definimos \[u(t) := \mathbb{E}\left[ \sup_{0 \leq r \leq t} \|x_r^N\|^2 \right],\] y obtenemos \[u(t) \leq C \left( 1 + \mathbb{E}[\|x_0\|^2] + \int_0^t \tilde{c}(s) u(s) ds \right).\] Por la desigualdad de Grönwall, se deduce \[u(T_0) \leq C\left(1 + \mathbb{E}[\|x_0\|^2]\right) \exp\!\left( C \int_0^{T_0} \tilde{c}(s) ds \right) =: K_{T_0}.\] \(K_{T_0}\) no depende de \(N\), ya que \(\tilde{c}(t)\) es independiente de \(N\) por hipótesis.\ Ahora, observamos que en el evento \(A\) se tiene \(\tau_N \leq T_0\) y \(\|x^N_{\tau_N}\| = N\), luego \[N^2 \, \mathbb{P}(A) \leq \mathbb{E}\left[ \sup_{0 \leq t \leq \tau_N \wedge T_0} \|x^N_t\|^2 \right] \leq K_{T_0}.\] Esto implica \[\mathbb{P}(A) \leq \frac{K_{T_0}}{N^2} \xrightarrow{N \to \infty} 0,\] lo cual contradice \(\mathbb{P}(A) > 0\). Por lo tanto, \(\mathbb{P}(A) = 0\) para todo \(T_0 > 0\), y en consecuencia, \[\mathbb{P}\!\left( \lim_{N \to \infty} \tau_N = \infty \right) = 1.\] Esto garantiza que el proceso \(x = \{x_t\}_{t \geq 0}\) está definido para todo \(t \geq 0\), pertenece a \(S^{2,\mathrm{loc}}_{\mathcal{F}}(\mathbb{R})\), y es la única solución fuerte de la SDE Ecuación 5.1. La unicidad por trayectoria se sigue del argumento estándar usando densidad de \(\mathbb{Q} \cap [0,T]\) y la propiedad cádlág de las soluciones, como se demostró en el Teorema Teorema 5.1. \(\quad \square\)

5.2 Modelo de Cramér–Lundberg Extendido.

5.2.1 Formulación del modelo base (C-L clásico).

El modelo clásico de Cramér-Lundberg (C-L) constituye un pilar fundamental en la teoría de riesgo actuarial, ofreciendo una representación matemáticamente rigurosa de la evolución del capital de una aseguradora a lo largo del tiempo. Formalmente, consideramos un proceso estocástico \(\{U(t)\}_{t \geq 0}\) que representa la reserva de capital de la aseguradora en el instante \(t\). El modelo clásico de Cramér-Lundberg (Lundberg (1903)) postula que esta reserva evoluciona mediante: \[U(t) = u + ct - \sum_{i=1}^{N(t)} Y_i, \tag{5.8}\] donde:

  • \(U(t)\): Reserva o capital en el tiempo \(t\),

  • \(u\): Capital inicial,

  • \(c\): Tasa de entrada de primas (constante en el modelo clásico),

  • \(N(t)\): Proceso de conteo de siniestros, modelado como un proceso de Poisson homogéneo con intensidad \(\lambda > 0\). Formalmente, \(N(t)\) es un proceso y \(\mathbb{E}[N(t)] = \lambda t\).

  • \(\{Y_i\}_{i \geq 1}\): Secuencia de variables aleatorias independientes e idénticamente distribuidas (i.i.d.) que representan las magnitudes de los siniestros, con distribución \(F_Y\) y función de densidad \(f_Y\) (en caso de ser absolutamente continua). Se asume que \(\mathbb{E}[Y_1] = \mu < \infty\) y \(\text{Var}(Y_1) = \sigma^2 < \infty\) para garantizar la existencia de momentos necesarios en el análisis.

La suposición de parámetros constantes (especialmente la tasa de primas \(c\) y la intensidad del proceso de Poisson \(\lambda\)) limita su aplicabilidad en entornos dinámicos donde las condiciones del mercado cambian con el tiempo, como es el caso del mercado asegurador mexicano que enfrenta variaciones estacionales en los siniestros catastróficos, cambios en las tasas de inversión y fluctuaciones en la estructura de primas debido a factores macroeconómicos como la inflación.

5.2.2 Extensión del modelo (C-L) a un modelo con difusión y saltos.

Formalmente, extendemos el proceso de reservas \(\{U(t)\}_{t \geq 0}\) del modelo (C-L) que sigue la dinámica estocástica de una ecuación diferencial con difusión y saltos (EDES).

Las ecuaciones diferenciales estocásticas con saltos (EDES) constituyen una extensión natural del cálculo estocástico clásico de Itô,(Sección 4.7) permitiendo modelar dinámicas que combinan evolución continua con cambios abruptos discontinuos. Este marco teórico es esencial para representar fenómenos en los que coexisten tendencias suaves y eventos extremos, como es el caso de los mercados financieros y las carteras de seguros sujetas a siniestros catastróficos.

Una ecuación diferencial estocástica con saltos y parámetros dependientes del tiempo toma la forma general (Capítulo 5) \[dX(t) = a(t,X(t^-))dt + b(t,X(t^-))dW(t) + \int_{\mathbb{R}} R(t,X(t^-),x) \tilde{N}(dt,dx), \tag{5.9}\] donde los coeficientes \(a\), \(b\) y \(R\) satisfacen condiciones de Lipschitz y crecimiento lineal que garantizan existencia y unicidad de soluciones fuertes. La notación \(X(t^-)\) denota el valor del proceso predecible(Sección 4.6) inmediatamente antes del tiempo \(t\), crucial para manejar correctamente las discontinuidades inducidas por los saltos.(Teorema 5.1) \(N(dt,dx)\) es una medida de Poisson aleatoria que cuenta los saltos de tamaño \(x\) en el intervalo \(dt\), y \(\tilde{N}(dt,dx) = N(dt,dx) - \nu(dx)dt\) es su compensador con \(\nu\) siendo la medida de Poisson compensada. Esta descomposición separa explícitamente la componente difusiva continua (\(\sigma W(t)\)) de los saltos de pequeña magnitud (integrado compensado) y los saltos de gran magnitud (integrado puro).(Sección 4.5)

Para capturar la dinámica real del mercado Mexicano, extendemos el modelo incorporando dependencia temporal en todos los parámetros.

En el contexto actuarial, esta estructura matemática permite integrar de manera coherente tres elementos fundamentales:

  • La acumulación determinista de primas,

  • La evolución estocástica de las inversiones con volatilidad de mercado,

  • La ocurrencia aleatoria de siniestros catastróficos modelados como saltos negativos. El uso de parámetros dependientes del tiempo \((c(t)\), \(r(t)\), \(\sigma(t))\) refleja adecuadamente la estacionalidad en la frecuencia de siniestros, las fluctuaciones en las tasas de interés y la variabilidad de la volatilidad financiera observadas en mercados emergentes como el Mexicano. Incorporando los fundamentos teóricos al marco de la ecuación el proceso de reservas \(\{U(t)\}_{t \geq 0}\) se presenta como la siguiente ecuación diferencial estocástica con saltos (Ecuación 5.9) \[dU(t) = \underbrace{c(t)\,dt}_{\text{Primas}} + \underbrace{U(t^-)r(t)\,dt}_{\text{Rendimientos}} + \underbrace{U(t^-)\sigma(t)\,dW(t)}_{\text{Volatilidad}} - \underbrace{dJ(t)}_{\text{Siniestros}}, \tag{5.10}\] donde

  • \(c(t) > 0\) es la tasa de prima neta tiempo-dependiente, ajustada por inflación y estacionalidad en la demanda (Sección 7.1.1);

  • \(r(t)\) representa la tasa de interés instantánea de la cartera de inversiones, modelada como un proceso determinista que refleja la estructura de tasas de Banxico, los rendimientos de CETES y globales (ILS) (Sección 7.1.2) ;

  • \(\sigma(t) > 0\) es la volatilidad tiempo-dependiente de las inversiones, estimada mediante una combinación convexa de la volatilidad de activos locales (CETES) y globales (ILS), ponderada por la composición de la cartera según reportes de la CNSF (Sección 7.1.3);

  • \(W(t)\) es un movimiento browniano estándar que modela el riesgo de mercado continuo;

  • \(J(t)\): Proceso de saltos compuesto que modela siniestros catastróficos.

Por tanto las soluciones del proceso de reservas presentado por la ecuación (Ecuación 5.10) bajo las especificaciones del modelo (con tasas de prima, interés y volatilidad acotadas), cumple con las condiciones de Lipschitz y crecimiento lineal que garantizan existencia y unicidad de soluciones fuertes para el proceso de reservas.

  • \(N_m(t)\): Proceso de Poisson no homogéneo para eventos meteorológicos con intensidad \(\lambda_m(t)\),

  • \(N_s(t)\): Proceso de Poisson para eventos sísmicos con intensidad constante \(\lambda_s\),

  • \(Y_k^{(m)} \sim \text{TruncNormal}(\mu_m, \sigma_m^2)\): Severidad de siniestros meteorológicos,

  • \(Y_\ell^{(s)} \sim \text{TruncNormal}(\mu_s, \sigma_s^2)\): Severidad de siniestros sísmicos.

5.3 Análisis Asintótico y Estimación de Parámetros

5.3.1 Estimación de la Varianza Integrada

Teorema 5.3 Definamos la variación de bipotencia con retardo \(h = 1\), \[BV_n := \frac{1}{\mu_1^2} \sum_{i=2}^{n} \bigl|r_{i-1,n}\bigr| \cdot \bigl|r_{i,n}\bigr|, \quad \mu_1 = \sqrt{\frac{2}{\pi}},\] se quiere demostrar que es un estimador consistente en probabilidad de la varianza integrada \[IV := \int_0^1 \sigma^2(t)\,dt,\] es decir, \[BV_n \xrightarrow[n\to\infty]{\mathbb{P}} IV.\]

Demostración. Cada retorno se descompone en su parte continua y su parte por saltos \[r_{i,n} = C_{i,n} + S_{i,n},\] donde \[C_{i,n} = \int_{(i-1)\Delta}^{i\Delta} \sigma(t)\,dW(t), \quad S_{i,n} = \sum_{(i-1)\Delta < t \leq i\Delta} \Delta J_t.\] Por la hipótesis de actividad finita de los saltos, se tiene que \[\mathbb{P}\bigl(S_{i-1,n} \neq 0 \text{ y } S_{i,n} \neq 0\bigr) \xrightarrow[n\to\infty]{} 0.\] Por lo tanto, con probabilidad \(1\), \[|r_{i-1,n}| \cdot |r_{i,n}| = |C_{i-1,n}| \cdot |C_{i,n}| + o_p(n^{-1}).\] Dado que \(\sigma(t)\) es cádlág, es localmente constante en el límite. Así, condicionalmente, \[\mathbb{E}\bigl[|C_{i-1,n}| \cdot |C_{i,n}| \mid \mathcal{F}_{(i-1)\Delta}\bigr] = \mu_1^2 \cdot \sigma^2((i-1)\Delta) \cdot \frac{1}{n} + o(n^{-1}),\] donde \(\mu_1 = \mathbb{E}[|Z|] = \sqrt{2/\pi}\), \(Z \sim N(0,1)\). Sumando sobre \(i = 2,\dots,n\), obtenemos \[\mathbb{E}[BV_n] = \frac{1}{\mu_1^2} \sum_{i=2}^n \mathbb{E}\bigl[|r_{i-1,n}| \cdot |r_{i,n}|\bigr] = \sum_{i=2}^n \sigma^2((i-1)\Delta) \cdot \frac{1}{n} + o(1). \quad \square\]

5.3.2 Hipótesis técnicas

  • Hipotesis 1 (Cádlág y previsibilidad) El proceso \(\sigma^2(t)\) es cádlág (continuo por la derecha con límites por la izquierda) y predecible.

  • Hipótesis 2 (Acotamiento local) Existe una sucesión creciente de tiempos de parada \((\tau_m)_{m \geq 1}\), con \(\tau_m \uparrow \infty\) casi seguramente, tal que \[\sup_{t \leq \tau_m} \sigma^2(t) < \infty \quad \text{c.s.}\]

  • Hipótesis 3 (Integrabilidad) \[\int_0^1 \sigma^2(t)\,dt < \infty \quad \text{casi seguramente}.\]

Teorema 5.4 Bajo las Hipótesis \(1\)\(3\) y la condición de actividad finita de los saltos, se cumple: \[BV_n \xrightarrow[n\to\infty]{\mathbb{P}} \int_0^1 \sigma^2(t)\,dt.\] Es decir, la variación de bipotencia es un estimador consistente en probabilidad de la varianza integrada.

Sea \((\Omega, \mathcal{F}, (\mathcal{F}_t)_{t \in [0,1]}, \mathbb{P})\) un espacio de probabilidad filtrado que satisface las (completo y continuo por la derecha).

Supongamos que \(\sigma^2 = (\sigma^2(t))_{t \in [0,1]}\) es un proceso estocástico. Definimos la partición regular del intervalo \([0,1]\) como \(t_i^n := \frac{i}{n}, \quad i = 0,1,\dots,n.\) La suma de Riemann izquierda asociada a \(\sigma^2\) es \[S_n := \frac{1}{n} \sum_{i=1}^n \sigma^2\!\left(t_{i-1}^n\right) = \frac{1}{n} \sum_{i=1}^n \sigma^2\!\left(\frac{i-1}{n}\right).\] Denotamos el límite objetivo como la varianza integrada \[IV := \int_0^1 \sigma^2(t)\,dt.\] se busca demostrar que, para todo \(\varepsilon > 0\), \[\lim_{n \to \infty} \mathbb{P}\bigl( |S_n - IV| > \varepsilon \bigr) = 0,\] es decir, \(S_n \xrightarrow[n \to \infty]{\mathbb{P}} IV\).

Demostración. Supongamos que existe una constante \(M < \infty\) tal que \[\sigma^2(t, \omega) \leq M \quad \text{para todo } t \in [0,1], \text{ c.s.}\] Como \(\sigma^2(\cdot, \omega)\) es cádlág, para cada trayectoria fija \(\omega\), la función \(t \mapsto \sigma^2(t,\omega)\) es Lebesgue-integrable y Riemann-integrable en \([0,1]\) (pues las funciones cádlág tienen a lo sumo un número numerable de discontinuidades). Por resultados clásicos del análisis real, para cada \(\omega\) fijo, \[S_n(\omega) \xrightarrow[n \to \infty]{} IV(\omega).\] Es decir, la convergencia es casi segura. La convergencia casi segura implica convergencia en probabilidad: \[S_n \xrightarrow{\mathbb{P}} IV \quad \text{cuando } \sigma^2 \text{ está uniformemente acotado}.\] Dado que \(\sigma^2\) es localmente acotado, existe una sucesión creciente de tiempos de parada \((\tau_m)_{m \geq 1}\) tal que \(\tau_m \uparrow \infty\) c.s. cuando \(m \to \infty\) y \(\displaystyle \sup_{t \leq \tau_m} \sigma^2(t) \leq m \quad \text{c.s.}\)

Definimos el proceso truncado \[\sigma_m^2(t) := \sigma^2(t) \cdot \mathbf{1}_{\{t \leq \tau_m\}} + m \cdot \mathbf{1}_{\{t > \tau_m\}}.\]

Entonces: \(\sigma_m^2\) es uniformemente acotado por \(m\), - \(\sigma_m^2(t) \to \sigma^2(t)\) c.s. para cada \(t\), cuando \(m \to \infty\), - \(IV_m := \int_0^1 \sigma_m^2(t)\,dt \to IV\) c.s. por el teorema de convergencia monótona.

Definimos la suma de Riemann asociada al proceso truncado: \[S_n^{(m)} := \frac{1}{n} \sum_{i=1}^n \sigma_m^2\!\left(\frac{i-1}{n}\right).\] Del Paso 1, para cada \(m\) fijo, \[S_n^{(m)} \xrightarrow[n \to \infty]{\mathbb{P}} IV_m.\] Además, como \(\sigma_m^2 \to \sigma^2\) c.s. y ambas son acotadas por una función integrable (\(\sigma^2\)), se tiene: \[|S_n^{(m)} - S_n| \leq \frac{1}{n} \sum_{i=1}^n |\sigma_m^2(t_{i-1}^n) - \sigma^2(t_{i-1}^n)| \xrightarrow[m \to \infty]{} 0 \quad \text{c.s.}\] Fijemos \(\varepsilon > 0\). Queremos mostrar: \[\lim_{n \to \infty} \mathbb{P}(|S_n - IV| > \varepsilon) = 0.\] Por la desigualdad triangular, \[|S_n - IV| \leq |S_n - S_n^{(m)}| + |S_n^{(m)} - IV_m| + |IV_m - IV|.\] Luego, para cualquier \(m\), \[\begin{aligned} \mathbb{P}(|S_n - IV| > {}& \varepsilon) \leq \mathbb{P}(|S_n - S_n^{(m)}| > \varepsilon /3) + \mathbb{P}(|S_n^{(m)} - IV_m| > \varepsilon /3) \\ & \ \ \ \ +\mathbb{P}(|IV_m - IV| > \varepsilon /3). \end{aligned} \tag{5.11}\]

Por construcción, \(\sigma_m^2(t) \to \sigma^2(t)\) c.s. para cada \(t \in [0,1]\) cuando \(m \to \infty\). Además, como \(\sigma^2\) es localmente acotado y \(\int_0^1 \sigma^2(t)\,dt < \infty\) c.s., existe una variable integrable que domina la secuencia \((\sigma_m^2)_{m \geq 1}\). En efecto, para todo \(m\), \[0 \leq \sigma_m^2(t) \leq \sigma^2(t) + m \cdot \mathbf{1}_{\{t > \tau_m\}} \leq \sigma^2(t) + C,\] para alguna constante \(C\), y \(\sigma^2\) es integrable c.s., luego \(\sigma^2 + C \in L^1(\Omega \times [0,1])\). Por el teorema de convergencia dominada \[IV_m = \int_0^1 \sigma_m^2(t)\,dt \xrightarrow[m \to \infty]{\text{c.s.}} \int_0^1 \sigma^2(t)\,dt = IV.\] La convergencia casi segura implica convergencia en probabilidad, por lo que \[\mathbb{P}(|IV_m - IV| > \varepsilon/3) \xrightarrow[m \to \infty]{} 0.\] Por lo tanto, existe \(m_0\) tal que para todo \(m \geq m_0\), \[\mathbb{P}(|IV_m - IV| > \varepsilon/3) < \frac{\varepsilon}{3}.\] Para el segundo termino se tiene que \[|S_n - S_n^{(m)}| \leq \frac{1}{n} \sum_{i=1}^n \left| \sigma^2\!\left(\frac{i-1}{n}\right) - \sigma_m^2\!\left(\frac{i-1}{n}\right) \right|.\] Tomando esperanza y usando la linealidad \[\mathbb{E}[|S_n - S_n^{(m)}|] \leq \frac{1}{n} \sum_{i=1}^n \mathbb{E}\left[ \left| \sigma^2\!\left(\frac{i-1}{n}\right) - \sigma_m^2\!\left(\frac{i-1}{n}\right) \right| \right].\] Dado que la partición es fina y la función \(t \mapsto |\sigma^2(t) - \sigma_m^2(t)|\) es no negativa, la suma de Riemann está acotada por la integral \[\frac{1}{n} \sum_{i=1}^n \mathbb{E}\left[ \left| \sigma^2\!\left(\frac{i-1}{n}\right) - \sigma_m^2\!\left(\frac{i-1}{n}\right) \right| \right] \leq \mathbb{E}\left[ \int_0^1 |\sigma^2(t) - \sigma_m^2(t)|\,dt \right].\] Nuevamente, por el teorema de convergencia dominada, el lado derecho tiende a 0 cuando \(m \to \infty\), y esta cota no depende de \(n\). Por lo tanto \[\sup_{n \geq 1} \mathbb{E}[|S_n - S_n^{(m)}|] \xrightarrow[m \to \infty]{} 0.\] Aplicando la desigualdad de Markov(citar) \[\mathbb{P}(|S_n - S_n^{(m)}| > \varepsilon/3) \leq \frac{\mathbb{E}[|S_n - S_n^{(m)}|]}{\varepsilon/3} \leq \frac{\sup_n \mathbb{E}[|S_n - S_n^{(m)}|]}{\varepsilon/3}.\] Como el numerador tiende a \(0\) uniformemente en \(n\), se concluye \[\sup_{n \geq 1} \mathbb{P}(|S_n - S_n^{(m)}| > \varepsilon/3) \xrightarrow[m \to \infty]{} 0.\] Así, para el mismo para \(m_0\) \[\mathbb{P}(|S_n - S_n^{(m)}| > \varepsilon/3) < \frac{\varepsilon}{3} \quad \text{para todo } n\] Ahora para \(m\) fijo, \(\sigma_m^2\) es uniformemente acotado por \(m\), cádlág y predecible. Por lo tanto, para cada \(\omega \in \Omega\), la función \(t \mapsto \sigma_m^2(t,\omega)\) es Riemann-integrable en \([0,1]\), pues posee a lo sumo un número numerable de discontinuidades. Por lo que para cada \(\omega\), la suma de Riemann izquierda converge a la integral \[S_n^{(m)}(\omega) \xrightarrow[n \to \infty]{} IV_m(\omega).\] Esto implica \(S_n^{(m)} \xrightarrow{\text{c.s.}} IV_m\). Dado que la convergencia casi segura implica convergencia en probabilidad, luego \[\mathbb{P}(|S_n^{(m)} - IV_m| > \varepsilon/3) \xrightarrow[n \to \infty]{} 0.\] Para el \(m_0\) elegido anteriormente, existe \(N \in \mathbb{N}\) tal que \(\forall n \geq N\), \[\mathbb{P}(|S_n^{(m_0)} - IV_{m_0}| > \varepsilon/3) < \varepsilon/3.\] Sustituyendo en (2), para todo \(n \geq N\), \[\mathbb{P}(|S_n - IV| > \varepsilon) < \frac{\varepsilon}{3} + \frac{\varepsilon}{3} + \frac{\varepsilon}{3} = \varepsilon.\] Como \(\varepsilon > 0\) fue arbitrario, concluimos \[\lim_{n \to \infty} \mathbb{P}(|S_n - IV| > \varepsilon) = 0.\] es decir, \(S_n \xrightarrow{\mathbb{P}} IV. \quad \square\)

5.4 Estimación de la Intensidad de Saltos.

5.4.1 Estimador \(\hat{\lambda}_n\) y elección del umbral \(\tau_n = \alpha \Delta_n^{\varpi}\) .

Definimos el estimador de intensidad de saltos mediante el método de conteo con umbral: \[\hat{\lambda}_n := \frac{1}{T} \sum_{i=1}^n \mathbf{1}_{\{ |\Delta_i^n X| > \tau_n \}}, \tag{5.12}\]

donde \(\tau_n > 0\) es un umbral determinista que depende de \(n\). Siguiendo la metodología de (Aı̈t-Sahalia y Jacod (2009)) (ver Sección 4.3 y la ecuación (24)), elegimos el umbral de la forma \[ \tau_n = \alpha \Delta_n^{\varpi}, \quad \alpha > 0, \quad \varpi \in \left(0, \frac{1}{2}\right). \tag{5.13}\] Esta elección es crucial y satisface dos propiedades asintóticas fundamentales:

  1. Detección de saltos: \(\tau_n \to 0\) cuando \(n \to \infty\). Esto asegura que, asintóticamente, cualquier salto de tamaño fijo (no nulo) será detectado, ya que su magnitud superará al umbral.

  2. Eliminación del ruido difusivo: \(\tau_n / \sqrt{\Delta_n} = \alpha \Delta_n^{\varpi - 1/2} \to \infty\). Esto asegura que los incrementos correspondientes a la parte continua del proceso (de orden estocástico \(\sqrt{\Delta_n}\)) rara vez superarán el umbral, controlando así los falsos positivos.

Teorema 5.5 (Consistencia del estimador de intensidad). Supongamos que el proceso \(X\) satisface el modelo (Ecuación 6.2) bajo el Assumption 1 de (Aı̈t-Sahalia y Jacod (2009)) y tiene actividad finita de saltos, \(\lambda = \int_E \lambda(dx) < \infty\).

Considérese un régimen asintótico de alta frecuencia en el que \(\Delta_n \to 0\) y \(T = n \Delta_n \to \infty\) cuando \(n \to \infty\). Entonces, bajo la elección del umbral (Ecuación 5.12) con \(\varpi \in (0, 1/2)\), el estimador (Ecuación 5.13) es consistente en probabilidad para \(\lambda\), es decir, \[\hat{\lambda}_n \xrightarrow{\mathbb{P}} \lambda.\]

Demostración. Un falso positivo ocurre cuando un incremento \(\Delta_i^n X\) sin salto (es decir, generado únicamente por la parte continua del proceso) excede el umbral \(\tau_n\). Para controlar este fenómeno, debemos analizar la magnitud de la parte continua. La herramienta fundamental es la cota proporcionada en la de (Aı̈t-Sahalia y Jacod (2009)) (Sección 8.1), derivada bajo el Assumption 1. Para cualquier \(\eta > 0\) y \(\theta \in (0,1)\), se cumple \[ \mathbb{E}_{i-1}^n \left( |\Delta_i^n X - \delta_i^n|^2 \wedge \eta^2 \right) \leq K \Delta_n (\eta^2 + \Delta_n^{\theta} + \epsilon(\theta)) \tag{5.14}\] donde - \(\mathbb{E}_{i-1}^n(\cdot) = \mathbb{E}(\cdot \mid \mathcal{F}_{(i-1)\Delta_n})\), - \(\delta_i^n = \sigma_{(i-1)\Delta_n} (W_{i\Delta_n} - W_{(i-1)\Delta_n})\) es la aproximación gaussiana de la parte continua, - \(\epsilon(\theta) \to 0\) cuando \(\theta \to 0\), - \(K\) es una constante que depende de los coeficientes del modelo.

Esta desigualdad implica que la parte continua del incremento es de orden \(O_p(\sqrt{\Delta_n})\). Ahora, utilizando la desigualdad de Chebyshev o argumentos de cola gaussiana, la probabilidad de que un incremento puramente difusivo exceda \(\tau_n\) se puede acotar por \[\mathbb{P}(|\Delta_i^n X| > \tau_n \mid \text{no hay salto en } [(i-1)\Delta_n, i\Delta_n]) \leq C \exp\left( -c \frac{\tau_n^2}{\Delta_n} \right).\] Dado que \(\tau_n^2 / \Delta_n = \alpha^2 \Delta_n^{2\varpi-1} \to \infty\) (porque \(\varpi < 1/2\)), el término exponencial decae a cero más rápido que cualquier potencia de \(\Delta_n\). Por lo tanto, el número esperado de falsos positivos, \(\mathrm{FP}_n\), satisface \[\mathbb{E}[\mathrm{FP}_n] = \sum_{i=1}^n \mathbb{P}(\text{falso positivo en } i) \leq n \cdot o(\Delta_n) = o(T).\] En consecuencia, \(\mathrm{FP}_n / T \xrightarrow{\mathbb{P}} 0\). Un falso negativo ocurre cuando un salto real \(J\) ocurre en un intervalo de muestreo, pero su magnitud \(|J|\) es menor o igual que \(\tau_n\), por lo que no se detecta. Sin embargo, dado que el proceso tiene actividad finita, el número de saltos en \([0,T]\) es finito c.s., y cada salto tiene tamaño \(|J_k| > 0\) c.s. Dado que \(\tau_n \to 0\) por construcción, existe un \(n_0(\omega)\) (aleatorio pero finito) tal que para todo \(n \geq n_0(\omega)\), se cumple \(\tau_n < \min_{k=1,\dots,N_T} |J_k|(\omega)\). Por lo tanto, asintóticamente, todos los saltos son detectados y el número de falsos negativos, \(\mathrm{FN}_n\), satisface \(\mathbb{E}[\mathrm{FN}_n] \to 0\), lo que implica \(\mathrm{FN}_n / T \xrightarrow{\mathbb{P}} 0\). Sea \(N_T\) el número real (y finito) de saltos en \([0,T]\). De los pasos anteriores, se deduce que el número de saltos detectados por el estimador coincide asintóticamente con \(N_T\): \[\sum_{i=1}^n \mathbf{1}_{\{ |\Delta_i^n X| > \tau_n \}} = N_T + \mathrm{FP}_n - \mathrm{FN}_n = N_T + o_{\mathbb{P}}(T). \tag{5.15}\] Dividiendo por \(T\), obtenemos \[\hat{\lambda}_n = \frac{N_T}{T} + o_{\mathbb{P}}(1). \tag{5.16}\] Finalmente, dado que la actividad de saltos es finita y la intensidad es constante \(\lambda\), el proceso de conteo \(N_T\) es un proceso de Poisson con media \(\mathbb{E}[N_T] = \lambda T\) y varianza \(\mathrm{Var}(N_T) = \lambda T\). Por la ley de los grandes números para procesos de Poisson, se tiene que cuando \(T \to \infty\), \[\frac{N_T}{T} \xrightarrow{\mathbb{P}} \lambda.\]

Combinando las dos últimas convergencias, concluimos que \[\hat{\lambda}_n \xrightarrow{\mathbb{P}} \lambda,\] lo cual demuestra el Teorema 5.5. \(\quad \square\)