Tuesday 29 August 2017

Movimentação média modelo autocorrelação


A RIMA significa Autoregressive Integrated Moving Average models Único vetor univariante ARIMA é uma técnica de previsão que projeta os valores futuros de uma série inteiramente baseada em sua própria inércia Sua principal aplicação é na área de previsão de curto prazo, exigindo pelo menos 40 pontos de dados históricos Funciona melhor quando os seus dados exibem um padrão estável ou consistente ao longo do tempo com uma quantidade mínima de outliers Às vezes chamado Box-Jenkins após os autores originais, ARIMA é geralmente superior às técnicas de suavização exponencial quando os dados são razoavelmente longos ea correlação entre observações passadas é Estável Se os dados são curtos ou altamente voláteis, então algum método de alisamento pode funcionar melhor Se você não tiver pelo menos 38 pontos de dados, você deve considerar algum outro método que ARIMA. O primeiro passo na aplicação da metodologia ARIMA é para verificar a estacionaridade Stationarity Implica que a série permaneça a um nível bastante constante ao longo do tempo Se existir uma tendência, como na maioria dos ecossistemas Os dados também devem mostrar uma variação constante em suas flutuações ao longo do tempo Isso é facilmente visto com uma série que é fortemente sazonal e crescendo a uma taxa mais rápida Em tal caso, os altos e baixos Na sazonalidade se tornará mais dramática ao longo do tempo Sem que estas condições de estacionaridade sejam atendidas, muitos dos cálculos associados ao processo não podem ser computados. Se um gráfico dos dados indicar nonstationarity, então você deve diferenciar a série Differencing é uma excelente maneira de Transformando uma série não estacionária em uma estacionária Isso é feito subtraindo a observação no período atual da anterior Se essa transformação é feita apenas uma vez para uma série, você diz que os dados foram primeiro diferenciados Este processo elimina essencialmente a tendência se Sua série está crescendo a uma taxa bastante constante Se está crescendo a uma taxa crescente, você pode aplicar o mesmo procedimento e diferir Os dados novamente Seus dados seriam então segundo diferenciado. As autocorrelações são valores numéricos que indicam como uma série de dados está relacionada a si mesma ao longo do tempo. Mais precisamente, mede quão fortemente os valores de dados em um número específico de períodos separados estão correlacionados entre si ao longo do tempo. Por exemplo, uma autocorrelação no retardo 1 mede como os valores 1 intervalo de tempo são correlacionados entre si ao longo da série. Uma autocorrelação no retardo 2 mede como os dados dois períodos separados estão correlacionados ao longo da série As autocorrelações podem variar de 1 a -1 Um valor próximo a 1 indica uma alta correlação positiva, enquanto um valor próximo a -1 implica uma alta correlação negativa. Estas medidas são mais frequentemente avaliadas através de gráficos gráficos chamados correlagramas. Um correlagrama traça os valores de autocorrelação para uma dada série em diferentes retardos. Função de autocorrelação e é muito importante no método ARIMA. A metodologia ARIMA tenta descrever os Estacionária séries temporais em função do que são chamados de parâmetros auto-regressivos e de média móvel Estes são referidos como parâmetros AR auto-menstruação e MA parâmetros de média móvel Um modelo AR com apenas um parâmetro pode ser escrito como. out X t séries de tempo em investigação. A 1 O parâmetro autorregressivo de ordem 1.X t-1 a série de tempo retardada 1 período. E t o termo de erro do modelo. Isso significa simplesmente que qualquer dado valor X t pode ser explicado por alguma função de seu valor anterior, X t - 1, mais algum erro aleatório inexplicável, E t Se o valor estimado de A 1 era 30, então o valor atual da série seria relacionado a 30 de seu valor 1 período atrás Claro que a série poderia estar relacionada a mais do que apenas Um valor passado Por exemplo. X t A 1 X t-1 A 2 X t-2 E t. Isso indica que o valor atual da série é uma combinação dos dois valores imediatamente precedentes, X t-1 e X t - 2, mais algum erro aleatório E t Nosso modelo é agora um modelo autorregressivo de ordem 2.Moving Aver Um segundo tipo de modelo Box-Jenkins é chamado de modelo de média móvel Embora esses modelos pareçam muito semelhantes ao modelo AR, o conceito por trás deles é bastante diferente Os parâmetros de média móvel relacionam o que acontece no período t somente com os erros aleatórios que Em vez de X t-1, X t-2, Xt-3 como nas abordagens autorregressivas Um modelo de média móvel com um termo de MA pode ser escrito em períodos de tempo passados, ie E t-1, E t-2, Como segue. O termo B 1 é chamado MA de ordem 1 O sinal negativo em frente do parâmetro é usado para convenção só e é geralmente impresso automaticamente pela maioria dos programas de computador O modelo acima simplesmente diz que qualquer dado valor de X T está diretamente relacionada apenas ao erro aleatório no período anterior, E t-1 e ao termo de erro atual, E t Como no caso de modelos autorregressivos, os modelos de média móvel podem ser estendidos a estruturas de ordem superior cobrindo diferentes combinações E comprimento médio móvel. Metodologia ARIMA O permite a construção de modelos que incorporam tanto os parâmetros de média móvel como de auto-regressão. Estes modelos são frequentemente referidos como modelos mistos. Embora isto torne uma ferramenta de previsão mais complicada, a estrutura pode de facto simular melhor a série e produzir uma previsão mais precisa Modelos puros Implicam que a estrutura consiste apenas de AR ou MA parâmetros - não both. The modelos desenvolvidos por esta abordagem são geralmente chamados ARIMA modelos porque eles usam uma combinação de AR autorregressivo, integração I - referindo-se ao processo inverso de diferenciação para produzir a previsão, E a média móvel das operações de MA Um modelo ARIMA é geralmente indicado como ARIMA p, d, q Isso representa a ordem dos componentes autorregressivos p, o número de operadores de diferenciação d ea ordem mais alta do termo médio móvel Por exemplo, ARIMA 2, 1,1 significa que você tem um modelo autorregressivo de segunda ordem com um componente de média móvel de primeira ordem cuja série foi diferenciada onc E para induzir stationarity. Picking a especificação direita. O problema principal em Box-Jenkins clássico está tentando decidir-se que ARIMA especificação para usar - ie quantos parâmetros AR e ou MA para incluir Isto é o que muito de Box-Jenkings 1976 foi dedicado a O processo de identificação Depende da avaliação gráfica e numérica das funções de autocorrelação da amostra e de autocorrelação parcial Bem, para os seus modelos básicos, a tarefa não é muito difícil Cada um tem funções de autocorrelação que parecem uma certa maneira No entanto, quando você sobe em complexidade , Os padrões não são tão facilmente detectados Para tornar as questões mais difíceis, seus dados representam apenas uma amostra do processo subjacente Isso significa que os erros de amostragem outliers, erros de medição, etc pode distorcer o processo de identificação teórica É por isso que a modelagem ARIMA tradicional é uma arte Em vez de uma ciência. Purpose Check Randomness. Autocorrelation plots Box e Jenkins, pp 28-32 são uma ferramenta comumente usado para verificar randomn Ess em um conjunto de dados Esta aleatoriedade é determinada pela computação autocorrelações para valores de dados em diferentes intervalos de tempo Se aleatório, tais autocorrelações devem ser perto de zero para qualquer e todas as separações de tempo-lag Se não for aleatório, então uma ou mais autocorrelações será Significativamente não-zero. Além disso, as parcelas de autocorrelação são usadas na fase de identificação do modelo para modelos auto-regressivos Box-Jenkins, modelos de séries temporais móveis. A correlação é apenas uma medida de aleatoriedade. Observe que não correlacionada não significa necessariamente dados aleatórios com autocorrelação significativa Não é aleatório No entanto, os dados que não mostram autocorrelação significativa pode ainda exibir não-aleatoriedade de outras maneiras Autocorrelação é apenas uma medida de aleatoriedade No contexto de validação de modelo que é o tipo primário de aleatoriedade nós dicuss no Manual, a verificação de autocorrelação É tipicamente um teste de aleatoriedade suficiente, uma vez que os resíduos de um modelo de adaptação fraca tendem a apresentar valores não No entanto, algumas aplicações requerem uma determinação mais rigorosa da aleatoriedade. Nestes casos, uma bateria de testes, que podem incluir a verificação da autocorrelação, são aplicados, uma vez que os dados podem ser não aleatórios de muitas maneiras diferentes e muitas vezes sutis. Onde uma verificação mais rigorosa para a aleatoriedade é necessária seria no teste de geradores de números aleatórios. As autocorrelações do gráfico de amostragem devem ser próximas de zero para aleatoriedade. Tal não é o caso neste exemplo e, portanto, a hipótese de aleatoriedade falha. Esse gráfico de autocorrelação mostra que o tempo A série não é aleatória, mas sim tem um alto grau de autocorrelação entre adjacentes e quase adjacentes observações. Definição rh versus h. Autocorrelation parcelas são formados por. Eixo vertical Autocorrelation coefficient. where C h é a autocovariância function. and C 0 é o Note que R h está entre -1 e 1.Note que algumas fontes podem usar a seguinte fórmula para a função de autocovariância. A formulação 1 N tem algumas propriedades estatísticas desejáveis ​​e é a forma mais comumente usada na literatura estatística. Veja as páginas 20 e 49-50 em Chatfield para detalhes. Eixo horizontal Relação temporal hh 1, 2, 3.Acima Linha contém também várias linhas de referência horizontais A linha do meio está em zero As outras quatro linhas são 95 e 99 faixas de confiança Note que existem duas fórmulas distintas para gerar as bandas de confiança. Se o gráfico de autocorrelação está sendo usado para testar aleatoriedade ou seja, há Não há dependência de tempo nos dados, recomenda-se a seguinte fórmula. Onde N é o tamanho da amostra, z é a função de distribuição cumulativa da distribuição normal padrão e alfa é o nível de significância. Neste caso, as bandas de confiança têm largura fixa que depende de O tamanho da amostra Esta é a fórmula que foi usada para gerar as faixas de confiança no gráfico acima. As parcelas de autocorrelação também são usadas na fase de identificação do modelo para ajustar AR Modelos IMA Neste caso, um modelo de média móvel é assumido para os dados e as seguintes bandas de confiança devem ser geradas. Onde k é o atraso, N é o tamanho da amostra, z é a função de distribuição cumulativa da distribuição normal padrão e alfa é O nível de significância Nesse caso, as faixas de confiança aumentam à medida que o atraso aumenta. O gráfico de autocorrelação pode fornecer respostas às seguintes perguntas. São os dados aleatórios. É uma observação relacionada a uma observação adjacente. É uma observação relacionada a uma observação duas vezes - Removido etc. É a série de tempo observada ruído branco. É a série de tempo observada sinusoidal. Is a série de tempo observada autoregressive. What é um modelo apropriado para a série de tempo observada. É o modelo. valido e suficiente. É a fórmula ss sqrt válido. Importância Assegurar a validade das conclusões de engenharia. Aleatoriedade juntamente com modelo fixo, variação fixa e distribuição fixa é uma das quatro suposições que tipicamente estão subjacentes a todas as medições p A suposição de aleatoriedade é criticamente importante pelas três razões a seguir. A maioria dos testes estatísticos padrão depende da aleatoriedade A validade das conclusões do teste está diretamente ligada à validade da suposição de aleatoriedade. Muitas das fórmulas estatísticas utilizadas geralmente dependem da suposição de aleatoriedade, Sendo a fórmula mais comum a fórmula para determinar o desvio padrão da média da amostra. Onde s é o desvio padrão dos dados Embora fortemente utilizado, os resultados da utilização desta fórmula são de nenhum valor, a menos que a suposição de aleatoriedade se mantenha. Para dados univariados, Padrão é is. If os dados não são aleatórios, este modelo é incorreto e inválido, e as estimativas para os parâmetros como a constante tornar-se absurdo e invalid. In curto, se o analista não verificar aleatoriedade, então a validade de muitos Das conclusões estatísticas torna-se suspeito O gráfico de autocorrelação é uma excelente maneira de verificar essa aleatoriedade.2 1 Movendo Avera Modelos de MA Modelos de MA Modelos de séries de tempo conhecidos como modelos de ARIMA podem incluir termos autorregressivos ou termos de média móvel Na Semana 1, aprendemos um termo autorregressivo em um modelo de série de tempo para a variável xt é um valor retardado de xt Por exemplo, 1 termo autorregressivo é x t-1 multiplicado por um coeficiente Esta lição define termos de média móvel. Um termo de média móvel em um modelo de série temporal é um erro passado multiplicado por um coeficiente. Vamos sobrepor N 0, sigma 2w, significando que o wt São distribuídos de forma idêntica, independentemente, cada um com uma distribuição normal com média 0 e a mesma variância. O modelo de média móvel de ordem 1, denotado por MA 1 é. Xt mu wt theta1w. O modelo de média móvel de ordem 2, denotado por MA 2 é. Xt mu wt theta1w theta2w. O modelo de média móvel de ordem q, denotado por MA q é. Muitos textos e programas de software definem o modelo com sinais negativos antes dos termos Isto não muda as propriedades teóricas gerais do modelo, embora ele inverta os sinais algébricos de valores de coeficientes estimados e os termos não-quadrados em Fórmulas para ACFs e variâncias Você precisa verificar seu software para verificar se sinais negativos ou positivos foram usados ​​para escrever corretamente o modelo estimado R usa sinais positivos em seu modelo subjacente, como fazemos aqui. Propriedades Teóricas de uma Série de Tempo com Um MA 1 Model. Note que o único valor diferente de zero no ACF teórico é para atraso 1 Todas as outras autocorrelações são 0 Assim, uma amostra ACF com uma autocorrelação significativa apenas no intervalo 1 é um indicador de um possível modelo MA 1. Para os estudantes interessados, Provas dessas propriedades são um apêndice a este handout. Exemplo 1 Suponha que um modelo MA 1 é xt 10 wt 7 w t-1 onde wt overset N 0,1 Assim, o coeficiente 1 0 7 Th E o ACF teórico é dado por. Uma parcela deste ACF segue. O gráfico apenas mostrado é o ACF teórico para um MA 1 com 1 0 7 Na prática, uma amostra won t normalmente fornecer um tal padrão claro Usando R, simulamos n 100 Amostras usando o modelo xt 10 wt 7 w t-1 onde w t. iid N 0,1 Para esta simulação, um gráfico de séries temporais dos dados da amostra segue Podemos t dizer muito a partir deste gráfico. A amostra ACF para o simulada Os dados a seguir vemos um pico no intervalo 1 seguido por valores geralmente não significativos para atrasos anteriores 1 Observe que a amostra ACF não corresponde ao padrão teórico do MA 1 subjacente, que é que todas as autocorrelações para atrasos passado 1 será 0 A As amostras diferentes teriam uma ACF de amostra ligeiramente diferente mostrada abaixo, mas teriam provavelmente as mesmas características gerais. Propriedades teóricas de uma série de tempo com um modelo MA 2. Para o modelo MA 2, as propriedades teóricas são as seguintes. Note que o único não nulo Valores na ACF teórica são para os retornos 1 e 2 Autocorrelat Ions para desfasamentos maiores são 0 Assim, uma amostra ACF com autocorrelações significativas nos retornos 1 e 2, mas autocorrelações não significativas para retardos maiores indica um possível modelo MA 2. Os coeficientes são 1 0 5 e 2 0 3 Como este é um MA 2, o ACF teórico terá valores não nulos apenas nos retornos 1 e 2. Os valores das duas autocorrelações não nulas são. Um gráfico do ACF teórico segue. Como quase sempre é o caso, os dados de amostra não se comportam de forma bastante Tão perfeitamente como a teoria Nós simulamos n 150 valores de amostra para o modelo xt 10 wt 5 w t-1 3 w t-2 onde w t. iid N 0,1 O gráfico de série de tempo dos dados segue Como com o gráfico de séries de tempo para O exemplo é típico para situações em que um modelo de MA 2 pode ser útil Existem dois picos estatisticamente significativos nos retornos 1 e 2, seguidos de não - Valores significativos para outros atrasos Note que devido ao erro de amostragem, a ACF da amostra não correspondeu O padrão teórico exatamente. ACF para General MA q Modelos. A propriedade dos modelos MA q em geral é que existem autocorrelações diferentes de zero para os primeiros q lags e autocorrelações 0 para todos os retornos q. Não-unicidade da conexão entre os valores de 1 e rho1 No modelo MA 1. No modelo MA 1, para qualquer valor de 1, o recíproco 1 1 dá o mesmo valor para. Por exemplo, use 0 5 para 1 e depois use 1 0 5 2 para 1 Você obterá rho1 0 4 Em ambos os casos. Para satisfazer uma restrição teórica chamada invertibilidade, restringimos os modelos MA 1 para ter valores com valor absoluto menor que 1 No exemplo dado, 1 0 5 será um valor de parâmetro permitido, enquanto que 1 1 0 5 2 não. Invertibilidade de modelos de MA. Um modelo de MA é dito ser invertible se for algébricamente equivalente a um modelo de ordem AR convergente infinito Ao convergir, queremos dizer que os coeficientes de AR diminuem para 0 à medida que nos movemos de volta no tempo. A inviabilidade é uma restrição programada em Software de séries temporais usado para estimar o De modelos com termos MA Não é algo que verificamos na análise de dados Informações adicionais sobre a restrição de invertibilidade para modelos MA 1 são dadas no apêndice. Teoria Avançada Nota Para um modelo MA q com um ACF especificado, só existe Um modelo invertible A condição necessária para a invertibilidade é que os coeficientes têm valores tais que a equação 1- 1 y - - qyq 0 tem soluções para y que caem fora do círculo unitário. Código R para os Exemplos. No Exemplo 1, Teórica ACF do modelo xt 10 wt 7w t-1 e, em seguida, simulados n 150 valores a partir deste modelo e traçou a série de tempo de amostra e da amostra ACF para os dados simulados Os comandos R utilizados para traçar o ACF teórica foram. acfma1 ARMAacf ma c 0 7, 10 lags de ACF para MA 1 com theta1 0 7 lags 0 10 cria uma variável chamada atraso que varia de 0 a 10 atrasos de trama, acfma1, xlim c 1,10, ylab r, tipo h, ACF principal para MA 1 Com theta1 0 7 abline h 0 adiciona um eixo horizontal ao plot. Th E o primeiro comando determina o ACF e o armazena em um objeto chamado acfma1 nossa escolha de nome. O comando de plotagem do 3º comando traça os retornos em relação aos valores ACF para os retornos 1 a 10 O parâmetro ylab rotula o eixo y e o parâmetro principal coloca um Título na trama. Para ver os valores numéricos do ACF simplesmente usar o comando acfma1.The simulação e parcelas foram feitas com os seguintes comandos. Lista ma c 0 7 Simula n 150 valores de MA 1 x xc 10 adiciona 10 para fazer média 10 Padrões de simulação para 0 gráfico x, tipo b, principal MA1 dados simulados acf x, xlim c 1,10, ACF principal para simulação Exemplo 2, traçamos o ACF teórico do modelo xt 10 wt 5 w t-1 3 w t-2 e depois simulamos n 150 valores a partir deste modelo e traçamos a série de tempo de amostra e a amostra ACF para o modelo simulado Dados Os comandos R utilizados foram. acfma2 ARMAacf ma c 0 5,0 3, acfma2 atrasos 0 10 retornos de trama, acfma2, xlim c 1,10, ylab r, tipo h, ACF principal para MA 2 com theta1 0 5, theta2 0 3 abline h 0 lista ma c 0 5, 0 3 x xc 10 trama x, tipo b, principal simulado MA 2 série acf x, xlim c 1,10, ACF principal para simulado MA 2 Dados. Apêndice Prova de Propriedades de MA 1.Para os estudantes interessados, aqui estão as provas para as propriedades teóricas do modelo MA 1.Texto de variância xt texto mu wt theta1 w 0 texto wt texto theta1w sigma 2w theta 21 sigma 2w 1 teta 21 sigma 2w. When h 1, a expressão anterior 1 W 2 Para qualquer h 2 , A expressão anterior 0 A razão é que, por definição de independência do wt E wkwj 0 para qualquer kj Além disso, porque o wt tem média 0, E wjwj E wj 2 w 2.Para uma série de tempo. Apply este resultado para obter O ACF dado acima. Um inversível MA modelo é aquele que pode ser escrito como uma ordem infinita AR modelo que converge para que os coeficientes AR convergem para 0 como nos movemos infinitamente de volta no tempo Vamos demonstrar invertibilidade para o modelo MA 1.Nós então Substituição 2 para wt-1 na equação 1. 3 zt wt theta1 z - theta1w wt theta1z - theta 2w. At time t-2 a equação 2 torna-se. Nós então substituimos a relação 4 para w t-2 na equação 3. zt wt Theta1 z - teta 21w wt theta1z - theta 21 z - theta1w wt theta1z - theta1 2z theta 31w. Se continuássemos infinitamente, obteríamos o modelo de ordem infinita AR. No entanto, se 1 1, os coeficientes multiplicando os desfasamentos de z aumentarão infinitamente em tamanho à medida que retrocedermos no tempo Para evitar isso, precisamos de 1 1 Isto é A condição para um modelo MA invertible. Modelo de MA de Ordem Intrínseca. Na semana 3, veremos que um modelo AR 1 pode ser convertido em um modelo de MA de ordem infinita. Esta somatória de termos de ruído branco passado é conhecida como a representação causal de um AR 1. Em outras palavras, xt é um tipo especial de MA com um número infinito de termos Voltando no tempo Isto é chamado uma ordem infinita MA ou MA Uma ordem finita MA é uma ordem infinita AR e qualquer ordem finita AR é uma ordem infinita MA. Recall na Semana 1, notamos que um requisito para um AR 1 estacionário é que 1 1 Vamos calcular o Var xt usando a representação causal. Esta última etapa usa um fato básico sobre séries geométricas que requer phi1 1 caso contrário a série diverge.

No comments:

Post a Comment