2015s

PowerPoint PresentationVariáveis aleatórias
Embora os preços dos ativos financeiros possam ser observados no presente e no passado, não é possível observar o que eles serão no futuro. Os preços dos ativos são variáveis aleatórias e não determinísticas.
Uma variável aleatória é uma função que associa a cada resultado de um experimento um número real. O conjunto de todos os resultados possíveis de um experimento é chamado de espaço amostral. Logo, uma v.a. é uma função do espaço amostral no conjunto dos números reais.
Exemplo: Seja o experimento lançar uma moeda duas vezes. Suponha que estejamos interessados no número de caras.
Aula 2
X(w) = “número de caras observadas nos dois lançamentos”.
O espaço amostral S é {CC, CK, KC, KK} onde C = “cara” e K = “coroa”. Assim, X(CC) = 2, X(CK) = X(KC) = 1 e X(KK) = 0.
Aula 2
Variáveis aleatórias
A v.a. X é discreta se toma um número finito ou numerável de valores, isto é, se existe um conjunto finito ou enumerável de valores {x1, x2, ... } tal que X(w) {x1, x2, ... } w S. A função pX(xi) definida por pX(xi) = P(X = xi), i = 1, 2, ..., é chamada função de probabilidade de X. A função de probabilidade caracteriza a distribuição de X.
Exemplo: Seja o experimento lançar o dado uma única vez. Suponha que o dado é perfeitamente equilibrado. Defina X(w) = “resultado da face superior”, então temos que P(X = 1) = P(X = 2) = P(X = 3) = P(X = 4) = P(X = 5) = P(X = 6) = 1/6.
Aula 2
A variável aleatória X é contínua se existe uma função fX, ou simplesmente f, denominada função densidade de probabilidade (fdp) de X que satisfaça às seguintes condições:
fX(x) 0 para todo x.
.
Aula 2
Não estaremos mais interessados em saber a probabilidade de um determinado resultado, mas sim em conhecer a probabilidade do resultado estar em determinado intervalo. Tentaremos responder questões do tipo:
Qual a chance da altura de um brasileiro, sorteado ao acaso, ser maior que 1,50m e menor que 1,70m ?
Qual a chance do preço de uma ação de Petrobras no fechamento de amanhã ser maior que R$ 52,00 ?
Para responder a tais perguntas devemos, primeiramente, conhecer a fdp da altura dos brasileiros e do preço da ação de Petrobrás no fechamento de amanhã.
Aula 2
Suponha que a fdp da altura dos brasileiros seja dada por h(x), então, a resposta da segunda pergunta é
Aula 2
Distribuição Normal
Seja X uma v.a. discreta assumindo os valores x1, x2, ..., xn,..., chamamos de valor esperado ou esperança matemática ou média de X ao valor
Se X for contínua com fdp fX(x), o valor esperado de X é definido como
Qual o valor esperado do resultado do lançamento de um dado honesto?
Aula 2
Podemos também calcular o valor esperado condicionado a um conjunto de informações.
Notação: E(X|F).
Exemplo: Qual o valor esperado do resultado do lançamento de um dado, sabendo que ele é par? E se for ímpar?
Obs.: O valor esperado é linear, isto é, E[aX + b] = aE[X] + b. Vale também que E[X + Y] = E[X] + E[Y].
Aula 2
A variância de uma v.a. X, denotada por var(X) ou X2, é definida por
A raiz quadrada positiva de X2 é chamada de desvio padrão de X, e é denotada por X. Em finanças, é comum usar o termo volatilidade do retorno de um ativo ao invés de desvio padrão.
A volatilidade é uma medida de dispersão da função de densidade de probabilidade.
Obs.: var(aX + b) = a2var(X).
O coeficiente de correlação entre duas variáveis X e Y, denotado por ρXY, é definido por
O coeficiente de correlação mede o grau de dependência linear entre duas v.a. O numerador dessa equação é a covariância.
A correlação é uma medida limitada de dependência. Primeiramente, a correlação mede apenas a dependência linear. Isso significa que duas v.a. podem ter correlação baixa mais terem outros tipos de dependência. Ou seja, variáveis descorrelatadas não são necessariamente independentes.
Aula 2
Além disso, no mercado financeiro as estimativas de correlação freqüentemente apresentam falta de robustez.
Assim outros métodos têm surgido com o intuito de capturar a dependência. Um dos mais famosos remete ao conceito de cópulas.
Uma cópula é uma maneira geral de se representar uma distribuição multivariada de tal maneira que vários tipos de dependência possam ser capturados.
Aula 2
cov(X, X) = var(X)
Cov(X, Y) = E[XY] - E[X]E[Y]
Var(X) = E[X2] - E[X]2
Aula 2
Estimação da volatilidade
O retorno rn de um ativo durante o dia n (isto é, entre o final do dia n – 1 e o fim do dia n) pode ser definido de duas maneiras diferentes:
Se o retorno é pequeno (próximo de zero, como são em geral os retornos diários) essas duas definições conduzem aproximadamente ao mesmo valor. Vamos usar preferencialmente a definição “logarítmica”.
Aula 2
Seja n|n – 1 a volatilidade do retorno rn com as informações disponíveis no fim do dia n – 1. Quando não houver dúvidas, vamos simplificar a notação n|n – 1 = n. Em outras palavras, seja Fn – 1 o conjunto de informação disponível ao final do dia n – 1. Então n2 = var(rn| Fn – 1).
Um estimador comumente usado para a variância n2 é a variância amostral das m observações mais recentes:
Aula 2
Esse estimador é não viesado (isto é, acerta na média) se os retornos diários forem iid. Como veremos mais adiante, a equação acima também representa o estimador de máxima verossimilhança da variância, apenas substituindo “m – 1” por “m” no denominador, o que faz pouca diferença se m é grande (maior que 30).
Se os retornos fossem realmente iid, o valor de m deveria ser o maior possível a fim de minimizar o erro de estimação. No mercado financeiro a hipótese de retornos iid nem sempre é verdadeira. Assim, ao tomar m muito grande estaríamos introduzindo dados muito antigos cuja realidade não corresponde mais a atual.
Aula 2
Uma regra de dedo consiste em tomar m entre 90 e 180. No mercado brasileiro, valores ainda menores como 20 e 30 dias são usados.
No caso de retornos iid a estimativa da volatilidade h dias (h ≥ 1) a frente também é dada pela equação anterior, i.e., n + h – 1|n – 1 = n. Logo a estrutura a termo da volatilidade é plana. Algo pouco realista. Vale também a regra da raiz, isto é, a volatilidade para um retorno de período t dias a frente, condicionado a informação disponível em n – 1 é dada por:
Aula 2
No caso de retornos diários, a estimativa do retorno médio não é significativamente diferente de zero. Como estamos interessados em estudar a variância, vamos considerar de agora em diante que os retornos diários tem média zero. Pouco esforço é necessário para generalizar os resultados sem essa hipótese. Além disso, tomar desvios em relação ao zero, produz estimativas mais acuradas da volatilidade (Figlewski, 1997).
A equação anterior pondera igualmente todos os retornos. Uma forma muito comum de levar em conta o fato de que os retornos mais recentes deveriam ter uma importância maior na determinação da volatilidade futura consiste em considerar um processo ARCH para a volatilidade (Engle, 1982), dando mais pesos as observações mais recentes.
Aula 2
onde w1 > ... > wm > 0.
Ou levando-se em conta a existência de uma média de longo prazo para a variância:
onde V é a média de longo prazo.
Um caso particular bem interessante é o modelo EWMA (Exponentially Weighted Moving Average).
Aula 2
Nesse caso V = 0 e os pesos seguem um padrão exponencial:
O parâmetro é denominado fator de decaimento. Quanto menor , maior o peso das observações mais recentes.Valores típicos para entre 0,75 e 0,98. RiskMetrics sugere 0,94 (dados diários) e 0,97 (dados mensais).
Aula 2
O documento técnico do RiskMetrics avaliou que entre diferentes mercados o valor de 0,94 fornecia o menor erro de previsão em relação a variância realizada. A variância realizada em um dia foi calculada como a média dos quadrados dos retornos nos 25 dias subseqüentes.
Quando = 1 EWMA = Método Histórico Simples.
Outro método de estimação consiste no uso de máxima verossimilhança, de modo semelhante ao procedimento usado nos modelos GARCH.
Quando V 0 temos o modelo IGARCH.
Aula 2
Se m é grande, o denominador da fórmula EWMA para a volatilidade é aproximadamente igual a 1/(1 – ). Desse modo:
Recursivamente, temos
O primeiro termo da equação acima representa a persistência da volatilidade. O segundo termo estabelece a reação da volatilidade aos eventos do mercado.
Aula 2
A volatilidade reage mais rapidamente a choques no mercado.
Após um movimento extremo a volatilidade declina exponencialmente a medida que o peso da observação do choque diminui. Em contraste, o uso de média móvel simples leva a mudanças relativamente abruptas no desvio padrão, uma vez que os movimentos extremos saem da amostra considerada de forma não suavizada.
Aula 2
Uma das deficiências do modelo EWMA refere-se ao fato de que a estrutura a termo da volatilidade é plana, i.e, n + h – 1|n – 1 = n. Modelos EWMA não são capazes de capturar clusters (agrupamento) de volatilidades. De acordo como Mandelbrolt: “Large changes tend to be followed by large changes, of either sign, and small changes tend to be followed by small changes.”
Empiricamente, existe uma correlação positiva entre os quadrados dos retornos. O termo técnico desse fenômeno é heterocedasticidade condicional auto-regressiva.
A volatilidade tende a reverter para alguma média ao invés de permanecer constante ou se mover monotonicamente ao longo do tempo.
Aula 2
Aula 2
No modelo GARCH(1,1) a soma dos parâmetros que representam a influência da volatilidade passada e do retorno atual na volatilidade do dia seguinte não somam necessariamente 1, como no EWMA:
onde V, , > 0. A variância incondicional é dada por:
O processo é estacionário se + < 1.
Aula 2
Tempo (n – 1)
Retorno (n – 1)
O processo GARCH pode ser extrapolado para h dias a frente.
Não vale a regra da raiz
Aula 2
A estimação dos parâmetros do modelo GARCH é feita via o método de máxima verossimilhança. Ou seja, escolher os parâmetros que maximizam as chances de ocorrência dos dados observados.
Parâmetros:
Exemplo: Estimar a variância v de uma variável R com distribuição normal e média nula, a partir de uma amostra independente de R de tamanho m (r1, r2, ..., rm).
Aula 2
A verossimilhança é (considerando a distribuição normal):
Para o modelo GARCH, basta usar a regra de atualização da volatilidade e fazer vi = i2. Assim o log da verossimilhança é:
Aula 2
Basta então encontrar os parâmetros do modelo que maximizam a expressão anterior.
Outra alternativa de estimação consiste em considerar que a distribuição dos retornos é uma t-student. Isso complica um pouco mais o processo de otimização uma vez que a função densidade dessa distribuição é menos tratável que a da normal.
Aula 2
Variantes do modelo GARCH:
GARCH assimétrico – O modelo GARCH padrão especifica a resposta da volatilidade como simétrica em relação a notícias “ruins” e “boas” do mercado. Para acomodar uma resposta assimétrica existem diversas possibilidades. O modelo mais comum é o E-GARCH:
Se > 0 e < 0 então choques negativos no retorno induzem respostas maiores na variância do que choques positivos.
Aula 2
GARCH (p,q) – considera p lags na volatilidade e q lags nos quadrados dos retornos.
N-GARCH, T-GARCH, GARCH-M, Q-GARCH, ...
Em geral, efeitos heterocedásticos estão presentes em dados de alta freqüência (diários, intraday) e não são comuns em dados mensais. Para detectar a presença de heterocedasticidade existem diversos testes. Os principais deles procuram pela presença de autocorrelação nos quadrados dos retornos.
Se um modelo GARCH capturou bem os efeitos de clusters, então a razão deve apresentar baixa autocorrelação.
Teste usual para detectar autocorrelação – Ljung-Box.
Aula 2
Estimando covariâncias
Supondo que o dispomos de séries iid de tamanho m dos retornos de dois ativos (r1 e r2), um estimador para a covariância entre eles é:
Usando EWMA temos:
Para o GARCH(1,1):
A especificação do modelo GARCH anterior para a covariância é a forma mais simples de incorporar os efeitos heterocedásticos. Essa versão é conhecida como vech diagonal. O modelo é bastante restritivo uma vez que as volatilidades passadas não entram na equação da covariância atual. Ou seja, o modelo não captura o aumento da correlação que freqüentemente acompanha o aumento de volatilidades.
A especificação completa de um modelo GARCH multivariado envolve uma quantidade enorme de parâmetros. Isto pode tornar impossível a estimação. Por exemplo, a matriz de covariância de um modelo GARCH bivariado completo é
Aula 2
onde A e B são matrizes de dimensão 3. Logo temos 21 parâmetros a serem estimados!
Na versão vech diagonal, as matrizes A e B são diagonais e o número de parâmetros a serem estimados se reduz para nove. Outra versão bastante usada dos modelos GARCH multivariados é a BEKK (Baba, Engle, Kraft e Kroner).
Aula 2
Mesmo usando simplificações na especificação de modelos GARCH multivariados a estimação em geral é problemática, uma vez que o número de parâmetros cresce rapidamente. Duas soluções são em geral empregadas.
Bollerslev (1990) propõe que a matriz de covariância Ht seja estimada da seguinte forma:
onde Dt é matriz diagonal das volatilidades GARCH e C é uma matriz de covariância calculada com as covariâncias históricas ou via um esquema EWMA com pesos constantes.
Aula 2
Outra solução é usar um modelo de fatores (como o CAPM):
Admitindo que não haja correlação condicional entre o mercado e os riscos específicos, temos:
As covariâncias entre os riscos específicos podem ser determinadas com as covariâncias históricas ou tomadas iguais a zero.
Aula 2
Capítulos 1, 2, 3, 4 e 5.
Hull, J. – Options, Futures and Other Derivatives, sixth edition, 2006.
Capítulo 17.
Capítulos 1, 2 e 3.
Bollerslev, T. e outros – ARCH Modelling in Finance. Journal of Econometrics, 1992.
Bollerslev, T. Modelling the coherence in short-run nominal exchange rates. Review of Economics and Statistics, 1990.
Aula 2
Jorion, (2007) – Value-at-Risk
Apêndice A - Distribuição Normal
A distribuição normal ou Gaussiana é uma das mais importantes distribuições de probabilidade.
Ela serve como uma excelente aproximação para uma grande classe de distribuições que têm enorme importância prática.
Notação: N(,2) significa distribuição normal com média e variância 2. Já Z = N(0,1) significa distribuição normal padrão, isto é, com média zero e a variância unitária.
Aula 2
*
A maior parte dos dados se encontram em torno da média. A medida que nos afastamos dela, tanto para mais como para menos, a probabilidade de ocorrência de um resultado diminui de uma forma simétrica, isto é, a distribuição é uma curva simétrica em relação a .
O espalhamento do gráfico é determinado pelo desvio padrão .
A equação da curva é
Propriedade: Se X tem distribuição normal N(,2) então (X – )/ tem distribuição normal padrão.
Tabela da distribuição normal padrão.
z
Exemplo: Suponha que a altura H de um brasileiro adulto seja distribuída normalmente com média 170 cm e variância 100 cm2. Calcule a probabilidade da altura de um brasileiro sorteado ao acaso ser maior que 2,0 m.
P[H > 200] = P[H – 170 > 30] =
= P[(H – 170)/10 > 3] =
= P[Z > 3] = (simetria) =
Aula 2
Apêndice B - Distribuição t-student
Distribuição em forma de sino e simétrica em torno de zero.
Seus valores extremos se afastam mais de zero em comparação à normal padrão.
Quanto mais graus de liberdade, maior a proximidade em relação à normal padrão.
Sua fdp é:
*
Sejam duas V.A. independentes X ~ N(0;1) e Y ~ 2 (). Então, a V.A. t de Student com graus de liberdade é definida como sendo t = Xn / Y. Seus parâmetros são = 0 e 2 = / ( - 2), para > 2.
Aula 2

Date post:	14-Sep-2015
Category:	Documents
Upload:	eduardolobox
View:	213 times
Download:	0 times

2015s

Documents