PowerPoint PresentationVariáveis aleatórias
Embora os preços dos ativos financeiros possam ser observados no
presente e no passado, não é possível observar o que eles serão no
futuro. Os preços dos ativos são variáveis aleatórias e não
determinísticas.
Uma variável aleatória é uma função que associa a cada resultado de
um experimento um número real. O conjunto de todos os resultados
possíveis de um experimento é chamado de espaço amostral. Logo, uma
v.a. é uma função do espaço amostral no conjunto dos números
reais.
Exemplo: Seja o experimento lançar uma moeda duas vezes. Suponha
que estejamos interessados no número de caras.
Aula 2
X(w) = “número de caras observadas nos dois lançamentos”.
O espaço amostral S é {CC, CK, KC, KK} onde C = “cara” e K =
“coroa”. Assim, X(CC) = 2, X(CK) = X(KC) = 1 e X(KK) = 0.
Aula 2
Variáveis aleatórias
A v.a. X é discreta se toma um número finito ou numerável de
valores, isto é, se existe um conjunto finito ou enumerável de
valores {x1, x2, ... } tal que X(w) {x1, x2, ... } w S. A função
pX(xi) definida por pX(xi) = P(X = xi), i = 1, 2, ..., é chamada
função de probabilidade de X. A função de probabilidade caracteriza
a distribuição de X.
Exemplo: Seja o experimento lançar o dado uma única vez. Suponha
que o dado é perfeitamente equilibrado. Defina X(w) = “resultado da
face superior”, então temos que P(X = 1) = P(X = 2) = P(X = 3) =
P(X = 4) = P(X = 5) = P(X = 6) = 1/6.
Aula 2
Variáveis aleatórias
A variável aleatória X é contínua se existe uma função fX, ou
simplesmente f, denominada função densidade de probabilidade (fdp)
de X que satisfaça às seguintes condições:
fX(x) 0 para todo x.
.
Aula 2
Variáveis aleatórias
Não estaremos mais interessados em saber a probabilidade de um
determinado resultado, mas sim em conhecer a probabilidade do
resultado estar em determinado intervalo. Tentaremos responder
questões do tipo:
Qual a chance da altura de um brasileiro, sorteado ao acaso, ser
maior que 1,50m e menor que 1,70m ?
Qual a chance do preço de uma ação de Petrobras no fechamento de
amanhã ser maior que R$ 52,00 ?
Para responder a tais perguntas devemos, primeiramente, conhecer a
fdp da altura dos brasileiros e do preço da ação de Petrobrás no
fechamento de amanhã.
Aula 2
Variáveis aleatórias
Suponha que a fdp da altura dos brasileiros seja dada por h(x),
então, a resposta da segunda pergunta é
Aula 2
Distribuição Normal
Variáveis aleatórias
Seja X uma v.a. discreta assumindo os valores x1, x2, ..., xn,...,
chamamos de valor esperado ou esperança matemática ou média de X ao
valor
Se X for contínua com fdp fX(x), o valor esperado de X é definido
como
Qual o valor esperado do resultado do lançamento de um dado
honesto?
Aula 2
Variáveis aleatórias
Podemos também calcular o valor esperado condicionado a um conjunto
de informações.
Notação: E(X|F).
Exemplo: Qual o valor esperado do resultado do lançamento de um
dado, sabendo que ele é par? E se for ímpar?
Obs.: O valor esperado é linear, isto é, E[aX + b] = aE[X] + b.
Vale também que E[X + Y] = E[X] + E[Y].
Aula 2
Variáveis aleatórias
A variância de uma v.a. X, denotada por var(X) ou X2, é definida
por
A raiz quadrada positiva de X2 é chamada de desvio padrão de X, e é
denotada por X. Em finanças, é comum usar o termo volatilidade do
retorno de um ativo ao invés de desvio padrão.
A volatilidade é uma medida de dispersão da função de densidade de
probabilidade.
Obs.: var(aX + b) = a2var(X).
Variáveis aleatórias
O coeficiente de correlação entre duas variáveis X e Y, denotado
por ρXY, é definido por
O coeficiente de correlação mede o grau de dependência linear entre
duas v.a. O numerador dessa equação é a covariância.
A correlação é uma medida limitada de dependência. Primeiramente, a
correlação mede apenas a dependência linear. Isso significa que
duas v.a. podem ter correlação baixa mais terem outros tipos de
dependência. Ou seja, variáveis descorrelatadas não são
necessariamente independentes.
Aula 2
Além disso, no mercado financeiro as estimativas de correlação
freqüentemente apresentam falta de robustez.
Assim outros métodos têm surgido com o intuito de capturar a
dependência. Um dos mais famosos remete ao conceito de
cópulas.
Uma cópula é uma maneira geral de se representar uma distribuição
multivariada de tal maneira que vários tipos de dependência possam
ser capturados.
Aula 2
Variáveis aleatórias
cov(X, X) = var(X)
Cov(X, Y) = E[XY] - E[X]E[Y]
Var(X) = E[X2] - E[X]2
Aula 2
Estimação da volatilidade
O retorno rn de um ativo durante o dia n (isto é, entre o final do
dia n – 1 e o fim do dia n) pode ser definido de duas maneiras
diferentes:
Se o retorno é pequeno (próximo de zero, como são em geral os
retornos diários) essas duas definições conduzem aproximadamente ao
mesmo valor. Vamos usar preferencialmente a definição
“logarítmica”.
Aula 2
Estimação da volatilidade
Seja n|n – 1 a volatilidade do retorno rn com as informações
disponíveis no fim do dia n – 1. Quando não houver dúvidas, vamos
simplificar a notação n|n – 1 = n. Em outras palavras, seja Fn – 1
o conjunto de informação disponível ao final do dia n – 1. Então n2
= var(rn| Fn – 1).
Um estimador comumente usado para a variância n2 é a variância
amostral das m observações mais recentes:
Aula 2
Estimação da volatilidade
Esse estimador é não viesado (isto é, acerta na média) se os
retornos diários forem iid. Como veremos mais adiante, a equação
acima também representa o estimador de máxima verossimilhança da
variância, apenas substituindo “m – 1” por “m” no denominador, o
que faz pouca diferença se m é grande (maior que 30).
Se os retornos fossem realmente iid, o valor de m deveria ser o
maior possível a fim de minimizar o erro de estimação. No mercado
financeiro a hipótese de retornos iid nem sempre é verdadeira.
Assim, ao tomar m muito grande estaríamos introduzindo dados muito
antigos cuja realidade não corresponde mais a atual.
Aula 2
Estimação da volatilidade
Uma regra de dedo consiste em tomar m entre 90 e 180. No mercado
brasileiro, valores ainda menores como 20 e 30 dias são
usados.
No caso de retornos iid a estimativa da volatilidade h dias (h ≥ 1)
a frente também é dada pela equação anterior, i.e., n + h – 1|n – 1
= n. Logo a estrutura a termo da volatilidade é plana. Algo pouco
realista. Vale também a regra da raiz, isto é, a volatilidade para
um retorno de período t dias a frente, condicionado a informação
disponível em n – 1 é dada por:
Aula 2
Estimação da volatilidade
No caso de retornos diários, a estimativa do retorno médio não é
significativamente diferente de zero. Como estamos interessados em
estudar a variância, vamos considerar de agora em diante que os
retornos diários tem média zero. Pouco esforço é necessário para
generalizar os resultados sem essa hipótese. Além disso, tomar
desvios em relação ao zero, produz estimativas mais acuradas da
volatilidade (Figlewski, 1997).
A equação anterior pondera igualmente todos os retornos. Uma forma
muito comum de levar em conta o fato de que os retornos mais
recentes deveriam ter uma importância maior na determinação da
volatilidade futura consiste em considerar um processo ARCH para a
volatilidade (Engle, 1982), dando mais pesos as observações mais
recentes.
Aula 2
onde w1 > ... > wm > 0.
Ou levando-se em conta a existência de uma média de longo prazo
para a variância:
onde V é a média de longo prazo.
Um caso particular bem interessante é o modelo EWMA (Exponentially
Weighted Moving Average).
Aula 2
Estimação da volatilidade
Nesse caso V = 0 e os pesos seguem um padrão exponencial:
O parâmetro é denominado fator de decaimento. Quanto menor , maior
o peso das observações mais recentes.Valores típicos para entre
0,75 e 0,98. RiskMetrics sugere 0,94 (dados diários) e 0,97 (dados
mensais).
Aula 2
Estimação da volatilidade
O documento técnico do RiskMetrics avaliou que entre diferentes
mercados o valor de 0,94 fornecia o menor erro de previsão em
relação a variância realizada. A variância realizada em um dia foi
calculada como a média dos quadrados dos retornos nos 25 dias
subseqüentes.
Quando = 1 EWMA = Método Histórico Simples.
Outro método de estimação consiste no uso de máxima
verossimilhança, de modo semelhante ao procedimento usado nos
modelos GARCH.
Quando V 0 temos o modelo IGARCH.
Aula 2
Estimação da volatilidade
Se m é grande, o denominador da fórmula EWMA para a volatilidade é
aproximadamente igual a 1/(1 – ). Desse modo:
Recursivamente, temos
O primeiro termo da equação acima representa a persistência da
volatilidade. O segundo termo estabelece a reação da volatilidade
aos eventos do mercado.
Aula 2
A volatilidade reage mais rapidamente a choques no mercado.
Após um movimento extremo a volatilidade declina exponencialmente a
medida que o peso da observação do choque diminui. Em contraste, o
uso de média móvel simples leva a mudanças relativamente abruptas
no desvio padrão, uma vez que os movimentos extremos saem da
amostra considerada de forma não suavizada.
Aula 2
Estimação da volatilidade
Uma das deficiências do modelo EWMA refere-se ao fato de que a
estrutura a termo da volatilidade é plana, i.e, n + h – 1|n – 1 =
n. Modelos EWMA não são capazes de capturar clusters (agrupamento)
de volatilidades. De acordo como Mandelbrolt: “Large changes tend
to be followed by large changes, of either sign, and small changes
tend to be followed by small changes.”
Empiricamente, existe uma correlação positiva entre os quadrados
dos retornos. O termo técnico desse fenômeno é heterocedasticidade
condicional auto-regressiva.
A volatilidade tende a reverter para alguma média ao invés de
permanecer constante ou se mover monotonicamente ao longo do
tempo.
Aula 2
Aula 2
Estimação da volatilidade
No modelo GARCH(1,1) a soma dos parâmetros que representam a
influência da volatilidade passada e do retorno atual na
volatilidade do dia seguinte não somam necessariamente 1, como no
EWMA:
onde V, , > 0. A variância incondicional é dada por:
O processo é estacionário se + < 1.
Aula 2
Tempo (n – 1)
Retorno (n – 1)
Estimação da volatilidade
O processo GARCH pode ser extrapolado para h dias a frente.
Não vale a regra da raiz
Aula 2
Estimação da volatilidade
A estimação dos parâmetros do modelo GARCH é feita via o método de
máxima verossimilhança. Ou seja, escolher os parâmetros que
maximizam as chances de ocorrência dos dados observados.
Parâmetros:
Exemplo: Estimar a variância v de uma variável R com distribuição
normal e média nula, a partir de uma amostra independente de R de
tamanho m (r1, r2, ..., rm).
Aula 2
A verossimilhança é (considerando a distribuição normal):
Para o modelo GARCH, basta usar a regra de atualização da
volatilidade e fazer vi = i2. Assim o log da verossimilhança
é:
Aula 2
Estimação da volatilidade
Basta então encontrar os parâmetros do modelo que maximizam a
expressão anterior.
Outra alternativa de estimação consiste em considerar que a
distribuição dos retornos é uma t-student. Isso complica um pouco
mais o processo de otimização uma vez que a função densidade dessa
distribuição é menos tratável que a da normal.
Aula 2
Variantes do modelo GARCH:
GARCH assimétrico – O modelo GARCH padrão especifica a resposta da
volatilidade como simétrica em relação a notícias “ruins” e “boas”
do mercado. Para acomodar uma resposta assimétrica existem diversas
possibilidades. O modelo mais comum é o E-GARCH:
Se > 0 e < 0 então choques negativos no retorno induzem
respostas maiores na variância do que choques positivos.
Aula 2
Estimação da volatilidade
GARCH (p,q) – considera p lags na volatilidade e q lags nos
quadrados dos retornos.
N-GARCH, T-GARCH, GARCH-M, Q-GARCH, ...
Em geral, efeitos heterocedásticos estão presentes em dados de alta
freqüência (diários, intraday) e não são comuns em dados mensais.
Para detectar a presença de heterocedasticidade existem diversos
testes. Os principais deles procuram pela presença de
autocorrelação nos quadrados dos retornos.
Se um modelo GARCH capturou bem os efeitos de clusters, então a
razão deve apresentar baixa autocorrelação.
Teste usual para detectar autocorrelação – Ljung-Box.
Aula 2
Estimando covariâncias
Supondo que o dispomos de séries iid de tamanho m dos retornos de
dois ativos (r1 e r2), um estimador para a covariância entre eles
é:
Usando EWMA temos:
Para o GARCH(1,1):
Estimando covariâncias
A especificação do modelo GARCH anterior para a covariância é a
forma mais simples de incorporar os efeitos heterocedásticos. Essa
versão é conhecida como vech diagonal. O modelo é bastante
restritivo uma vez que as volatilidades passadas não entram na
equação da covariância atual. Ou seja, o modelo não captura o
aumento da correlação que freqüentemente acompanha o aumento de
volatilidades.
A especificação completa de um modelo GARCH multivariado envolve
uma quantidade enorme de parâmetros. Isto pode tornar impossível a
estimação. Por exemplo, a matriz de covariância de um modelo GARCH
bivariado completo é
Aula 2
Estimando covariâncias
onde A e B são matrizes de dimensão 3. Logo temos 21 parâmetros a
serem estimados!
Na versão vech diagonal, as matrizes A e B são diagonais e o número
de parâmetros a serem estimados se reduz para nove. Outra versão
bastante usada dos modelos GARCH multivariados é a BEKK (Baba,
Engle, Kraft e Kroner).
Aula 2
Estimando covariâncias
Mesmo usando simplificações na especificação de modelos GARCH
multivariados a estimação em geral é problemática, uma vez que o
número de parâmetros cresce rapidamente. Duas soluções são em geral
empregadas.
Bollerslev (1990) propõe que a matriz de covariância Ht seja
estimada da seguinte forma:
onde Dt é matriz diagonal das volatilidades GARCH e C é uma matriz
de covariância calculada com as covariâncias históricas ou via um
esquema EWMA com pesos constantes.
Aula 2
Estimando covariâncias
Outra solução é usar um modelo de fatores (como o CAPM):
Admitindo que não haja correlação condicional entre o mercado e os
riscos específicos, temos:
As covariâncias entre os riscos específicos podem ser determinadas
com as covariâncias históricas ou tomadas iguais a zero.
Aula 2
Capítulos 1, 2, 3, 4 e 5.
Hull, J. – Options, Futures and Other Derivatives, sixth edition,
2006.
Capítulo 17.
Capítulos 1, 2 e 3.
Bollerslev, T. e outros – ARCH Modelling in Finance. Journal of
Econometrics, 1992.
Bollerslev, T. Modelling the coherence in short-run nominal
exchange rates. Review of Economics and Statistics, 1990.
Aula 2
Jorion, (2007) – Value-at-Risk
Apêndice A - Distribuição Normal
A distribuição normal ou Gaussiana é uma das mais importantes
distribuições de probabilidade.
Ela serve como uma excelente aproximação para uma grande classe de
distribuições que têm enorme importância prática.
Notação: N(,2) significa distribuição normal com média e variância
2. Já Z = N(0,1) significa distribuição normal padrão, isto é, com
média zero e a variância unitária.
Aula 2
*
A maior parte dos dados se encontram em torno da média. A medida
que nos afastamos dela, tanto para mais como para menos, a
probabilidade de ocorrência de um resultado diminui de uma forma
simétrica, isto é, a distribuição é uma curva simétrica em relação
a .
O espalhamento do gráfico é determinado pelo desvio padrão .
A equação da curva é
Apêndice A - Distribuição Normal
Apêndice A - Distribuição Normal
Propriedade: Se X tem distribuição normal N(,2) então (X – )/ tem
distribuição normal padrão.
Tabela da distribuição normal padrão.
z
Apêndice A - Distribuição Normal
Exemplo: Suponha que a altura H de um brasileiro adulto seja
distribuída normalmente com média 170 cm e variância 100 cm2.
Calcule a probabilidade da altura de um brasileiro sorteado ao
acaso ser maior que 2,0 m.
P[H > 200] = P[H – 170 > 30] =
= P[(H – 170)/10 > 3] =
= P[Z > 3] = (simetria) =
Aula 2
Apêndice B - Distribuição t-student
Distribuição em forma de sino e simétrica em torno de zero.
Seus valores extremos se afastam mais de zero em comparação à
normal padrão.
Quanto mais graus de liberdade, maior a proximidade em relação à
normal padrão.
Sua fdp é:
*
Sejam duas V.A. independentes X ~ N(0;1) e Y ~ 2 (). Então, a V.A.
t de Student com graus de liberdade é definida como sendo t = Xn /
Y. Seus parâmetros são = 0 e 2 = / ( - 2), para > 2.
Aula 2