Diferença between moving average and autoregressive


Um RIMA significa os modelos da Média Móvel Integrada Autoregressive. Univariada (vetor único) ARIMA é uma técnica de previsão que projeta os valores futuros de uma série baseada inteiramente em sua própria inércia. Sua principal aplicação é na área de previsão de curto prazo que requer pelo menos 40 pontos de dados históricos. Funciona melhor quando seus dados exibem um padrão estável ou consistente ao longo do tempo com uma quantidade mínima de exceções. Às vezes chamado Box-Jenkins (depois dos autores originais), o ARIMA é geralmente superior às técnicas de suavização exponencial quando os dados são razoavelmente longos e a correlação entre as observações passadas é estável. Se os dados forem curtos ou altamente voláteis, algum método de suavização poderá ter um melhor desempenho. Se você não tiver pelo menos 38 pontos de dados, deve considerar algum outro método além do ARIMA. O primeiro passo na aplicação da metodologia ARIMA é verificar a estacionariedade. A estacionariedade implica que a série permaneça em um nível razoavelmente constante ao longo do tempo. Se houver uma tendência, como na maioria dos aplicativos comerciais ou econômicos, seus dados NÃO são estacionários. Os dados também devem mostrar uma variação constante em suas flutuações ao longo do tempo. Isto é facilmente visto com uma série que é fortemente sazonal e cresce a um ritmo mais rápido. Nesse caso, os altos e baixos da sazonalidade se tornarão mais dramáticos ao longo do tempo. Sem essas condições de estacionariedade, muitos dos cálculos associados ao processo não podem ser calculados. Se uma plotagem gráfica dos dados indicar não-estacionariedade, você deverá diferenciar a série. A diferenciação é uma excelente maneira de transformar uma série não estacionária em uma estacionária. Isso é feito subtraindo a observação no período atual da anterior. Se essa transformação é feita apenas uma vez para uma série, você diz que os dados foram primeiro diferenciados. Esse processo essencialmente elimina a tendência se sua série está crescendo a uma taxa razoavelmente constante. Se estiver crescendo a uma taxa crescente, você pode aplicar o mesmo procedimento e diferenciar os dados novamente. Seus dados seriam então diferenciados em segundo lugar. Autocorrelações são valores numéricos que indicam como uma série de dados está relacionada a si mesma ao longo do tempo. Mais precisamente, ele mede a intensidade com que os valores de dados em um intervalo especificado de períodos estão correlacionados entre si ao longo do tempo. O número de períodos separados é geralmente chamado de atraso. Por exemplo, uma autocorrelação no desfasamento 1 mede como os valores de 1 período separados são correlacionados entre si ao longo da série. Uma autocorrelação no atraso 2 mede como os dados separados por dois períodos estão correlacionados ao longo da série. Autocorrelações podem variar de 1 a -1. Um valor próximo de 1 indica uma correlação positiva alta, enquanto um valor próximo de -1 implica uma alta correlação negativa. Essas medidas são mais frequentemente avaliadas por meio de gráficos gráficos chamados correlagramas. Um correlograma plota os valores de autocorrelação para uma determinada série em diferentes lags. Isso é chamado de função de autocorrelação e é muito importante no método ARIMA. A metodologia ARIMA tenta descrever os movimentos em uma série temporal estacionária como uma função do que é chamado de parâmetros autorregressivos e de média móvel. Estes são referidos como parâmetros AR (autoregessivo) e parâmetros MA (médias móveis). Um modelo AR com apenas 1 parâmetro pode ser escrito como. X (t) A (1) X (t-1) E (t) onde X (t) séries temporais sob investigação A (1) parâmetro autorregressivo de ordem 1 X (t-1) série temporal defasada 1 período E (t) o termo de erro do modelo Isto significa simplesmente que qualquer dado valor X (t) pode ser explicado por alguma função do seu valor anterior, X (t-1), mais algum erro aleatório inexplicável, E (t). Se o valor estimado de A (1) fosse 0,30, então o valor atual da série estaria relacionado a 30 de seu valor 1 período atrás. Claro, a série pode estar relacionada a mais do que apenas um valor passado. Por exemplo, X (t) A (1) X (t-1) A (2) X (t-2) E (t) Isso indica que o valor atual da série é uma combinação dos dois valores imediatamente anteriores, X (t-1) e X (t-2), mais algum erro aleatório E (t). Nosso modelo é agora um modelo autorregressivo de ordem 2. Modelos de Média Móvel: Um segundo tipo de modelo Box-Jenkins é chamado de modelo de média móvel. Embora esses modelos pareçam muito semelhantes ao modelo AR, o conceito por trás deles é bem diferente. Parâmetros de média móvel relacionam o que acontece no período t apenas aos erros aleatórios que ocorreram em períodos de tempo passados, ie E (t-1), E (t-2), etc. em vez de X (t-1), X ( t-2), (Xt-3) como nas abordagens autorregressivas. Um modelo de média móvel com um termo MA pode ser escrito como segue. X (t) - B (1) E (t-1) E (t) O termo B (1) é chamado de MA de ordem 1. O sinal negativo na frente do parâmetro é usado apenas para a convenção e geralmente é impresso automaticamente pela maioria dos programas de computador. O modelo acima diz simplesmente que qualquer valor dado de X (t) está diretamente relacionado apenas ao erro aleatório no período anterior, E (t-1), e ao termo de erro atual, E (t). Como no caso dos modelos autoregressivos, os modelos de média móvel podem ser estendidos para estruturas de ordem superior cobrindo diferentes combinações e comprimentos médios móveis. A metodologia ARIMA também permite a construção de modelos que incorporam parâmetros autorregressivos e de média móvel. Esses modelos são geralmente chamados de modelos mistos. Embora isso crie uma ferramenta de previsão mais complicada, a estrutura pode simular melhor a série e produzir uma previsão mais precisa. Modelos puros indicam que a estrutura consiste apenas em parâmetros AR ou MA - não em ambos. Os modelos desenvolvidos por essa abordagem são geralmente chamados de modelos ARIMA porque usam uma combinação de autorregressivo (AR), integração (I) - referindo-se ao processo inverso de diferenciação para produzir as operações de previsão e média móvel (MA). Um modelo ARIMA é geralmente declarado como ARIMA (p, d, q). Isso representa a ordem dos componentes autoregressivos (p), o número de operadores de diferenciação (d) e a ordem mais alta do termo de média móvel. Por exemplo, ARIMA (2,1,1) significa que você tem um modelo autoregressivo de segunda ordem com um componente de média móvel de primeira ordem cuja série foi diferenciada uma vez para induzir a estacionariedade. Escolhendo a Especificação Certa: O principal problema no Box-Jenkins clássico é tentar decidir qual especificação ARIMA usar - por exemplo. Quantos parâmetros AR e / ou MA incluir? Isso é o que muito de Box-Jenkings 1976 foi dedicado ao processo de identificação. Dependia da avaliação gráfica e numérica das funções de autocorrelação e autocorrelação parcial da amostra. Bem, para seus modelos básicos, a tarefa não é muito difícil. Cada um tem funções de autocorrelação que parecem de uma certa maneira. No entanto, quando você sobe em complexidade, os padrões não são tão facilmente detectados. Para tornar as coisas mais difíceis, seus dados representam apenas uma amostra do processo subjacente. Isso significa que erros de amostragem (outliers, erro de medição, etc.) podem distorcer o processo de identificação teórica. É por isso que a modelagem ARIMA tradicional é uma arte e não uma ciência. O que são relação e diferença entre séries temporais e regressão Para modelos e suposições. É correto que os modelos de regressão assumam independência entre as variáveis ​​de saída para diferentes valores da variável de entrada, enquanto o modelo de série temporal não Existem algumas outras diferenças Existem várias abordagens para análise de séries temporais, mas as duas mais conhecidas são as método de regressão e o método Box-Jenkins (1976) ou ARIMA (Média Móvel Integrada Regressiva). Este documento introduz o método de regressão. Eu considero o método de regressão muito superior ao ARIMA por três razões principais. Eu não entendo muito bem qual é o método de regressão para séries temporais no website, e como ele é diferente do método Box-Jenkins ou ARIMA. Eu aprecio se alguém puder dar algumas ideias sobre essas questões. Obrigado e cumprimentos Eu realmente acho que esta é uma boa pergunta e merece uma resposta. O link fornecido é escrito por um psicólogo que afirma que um método caseiro é a melhor maneira de fazer análises de séries temporais do que Box-Jenkins. Espero que minha tentativa de resposta encoraje outras pessoas, mais conhecedoras de séries temporais, a contribuir. De sua introdução, parece que Darlington está defendendo a abordagem de apenas encaixar um modelo AR em mínimos quadrados. Ou seja, se você quiser ajustar o modelo zt alpha1z cdots alphakz-varepsilont à série temporal zt, você pode apenas regredir a série zt da série com lag 1, lag 2 e assim por diante até lag k, usando um regressão múltipla ordinária. Isto é certamente permitido em R, é mesmo uma opção na função ar. Testei-o, e ele tende a dar respostas semelhantes ao método padrão para ajustar um modelo de RA em R. Ele também defende a regressão de coisas como t ou potências de t para encontrar tendências. Mais uma vez, isso é absolutamente bem. Muitos livros sobre séries temporais discutem isso, por exemplo, Shumway-Stoffer e Cowpertwait-Metcalfe. Normalmente, uma análise de séries temporais pode prosseguir nas seguintes linhas: você encontra uma tendência, remove-a e depois ajusta um modelo aos resíduos. Mas parece que ele também está defendendo o ajuste excessivo e depois usando a redução no erro médio-quadrado entre a série ajustada e os dados como evidência de que seu método é melhor. Por exemplo: sinto que os correlogramas estão agora obsoletos. Seu objetivo principal era permitir que os trabalhadores adivinhem quais modelos melhor se adequariam aos dados, mas a velocidade dos computadores modernos (pelo menos em regressão, se não em modelos de série de tempo) permite que um trabalhador simplesmente encaixe vários modelos e veja exatamente como cada um se encaixa conforme medido pelo erro quadrático médio. A questão da capitalização sobre o acaso não é relevante para essa escolha, uma vez que os dois métodos são igualmente suscetíveis a esse problema. Isso não é uma boa ideia, porque o teste de um modelo deve ser o quão bem ele pode prever, não o quão bem ele se ajusta aos dados existentes. Em seus três exemplos, ele usa o erro médio quadrático ajustado como critério para a qualidade do ajuste. É claro que o ajuste excessivo de um modelo fará com que uma estimativa de erro na amostra seja menor, portanto, sua alegação de que seus modelos são melhores porque têm RMSE menor está errada. Em suma, uma vez que ele está usando o critério errado para avaliar o quão bom é um modelo, ele chega a conclusões erradas sobre a regressão versus ARIMA. Aposto que, se ele tivesse testado a capacidade preditiva dos modelos, o ARIMA teria saído por cima. Talvez alguém possa tentar se tiver acesso aos livros que menciona aqui. Suplementar: para saber mais sobre a ideia de regressão, talvez você queira conferir livros de séries temporais antigos que foram escritos antes de o ARIMA se tornar o mais popular. Por exemplo, Kendall, Time-Series. 1973, o capítulo 11 tem um capítulo inteiro sobre este método e comparações com o ARIMA. Até onde posso dizer, o autor nunca descreveu seu método caseiro em uma publicação revisada por pares e as referências à e da literatura estatística parecem mínimas e suas principais publicações sobre tópicos metodológicos datam dos anos 70. Estritamente falando, nada disso prova nada, mas sem tempo ou experiência suficiente para avaliar as alegações, eu seria extremamente relutante em usar qualquer uma delas. ndash Gala Jul 18 13 at 11: 31Há uma série de abordagens para modelar séries temporais. Nós descrevemos algumas das abordagens mais comuns abaixo. Tendência, Decomposições Residuais Sazonais Uma abordagem é decompor as séries temporais em um componente de tendência, sazonal e residual. A suavização exponencial tripla é um exemplo dessa abordagem. Outro exemplo, chamado de loess sazonal, é baseado em mínimos quadrados ponderados localmente e é discutido por Cleveland (1993). Não discutimos loess sazonais neste manual. Métodos Baseados em Freqüência Outra abordagem, comumente usada em aplicações científicas e de engenharia, é analisar as séries no domínio da frequência. Um exemplo dessa abordagem na modelagem de um conjunto de dados do tipo senoidal é mostrado no estudo de caso de deflexão do feixe. O gráfico espectral é a principal ferramenta para a análise de freqüência de séries temporais. Modelos autorregressivos (AR) Uma abordagem comum para modelar séries temporais univariadas é o modelo autoregressivo (AR): Xt delta phi1 X phi2 X cdots phip X At, onde (Xt) é a série temporal, (At) é ruído branco e delta esquerda (1 - soma p phii direita) mu. com (mu) denotando a média do processo. Um modelo autoregressivo é simplesmente uma regressão linear do valor atual da série em relação a um ou mais valores anteriores da série. O valor de (p) é chamado a ordem do modelo AR. Os modelos AR podem ser analisados ​​com um dos vários métodos, incluindo técnicas lineares de mínimos quadrados. Eles também têm uma interpretação direta. Modelos de média móvel (MA) Outra abordagem comum para modelar modelos de séries temporais univariadas é o modelo de média móvel (MA): Xt mu At - theta1 A - theta2 A - cdots - thetaq A, onde (Xt) é a série temporal, (mu ) é a média da série, (A) são termos de ruído branco, e (theta1,, ldots,, thetaq) são os parâmetros do modelo. O valor de (q) é chamado a ordem do modelo MA. Ou seja, um modelo de média móvel é conceitualmente uma regressão linear do valor atual da série contra o ruído branco ou choques aleatórios de um ou mais valores anteriores da série. Supõe-se que os choques aleatórios em cada ponto provenham da mesma distribuição, tipicamente uma distribuição normal, com localização na escala zero e constante. A distinção neste modelo é que esses choques aleatórios são propagados para valores futuros da série temporal. Ajustar as estimativas MA é mais complicado do que com os modelos AR porque os termos de erro não são observáveis. Isso significa que procedimentos iterativos de ajuste não linear precisam ser usados ​​no lugar de mínimos quadrados lineares. Os modelos MA também têm uma interpretação menos óbvia do que os modelos AR. Às vezes, o ACF e o PACF sugerem que um modelo MA seria uma melhor opção de modelo e, às vezes, os termos AR e MA devem ser usados ​​no mesmo modelo (ver Seção 6.4.4.5). Observe, no entanto, que os termos de erro após o ajuste do modelo devem ser independentes e seguir as suposições padrão para um processo univariado. Box e Jenkins popularizaram uma abordagem que combina a média móvel e as abordagens autoregressivas no livro Análise de Séries Temporais: Previsão e Controle (Box, Jenkins e Reinsel, 1994). Embora ambas as abordagens autoregressiva e média móvel já fossem conhecidas (e foram originalmente investigadas por Yule), a contribuição de Box e Jenkins foi no desenvolvimento de uma metodologia sistemática para identificar e estimar modelos que pudessem incorporar ambas as abordagens. Isso faz dos modelos Box-Jenkins uma poderosa classe de modelos. As próximas seções discutirão esses modelos em detalhes.

Comments