Ich bin wirklich versuchen, aber kämpfen, zu verstehen, wie Autoregressive und Moving Average arbeiten. Ich bin ziemlich schrecklich mit Algebra und Blick auf es nicht wirklich verbessern mein Verständnis von etwas. Was ich wirklich lieben würde, ist ein extrem einfaches Beispiel für 10 zeitabhängige Beobachtungen, damit ich sehen kann, wie sie funktionieren. So können Sie sagen, dass Sie die folgenden Datenpunkte des Goldpreises haben: Zum Beispiel, was wäre der Moving Average von Lag 2, MA (2), oder MA (1) und AR (1) oder AR (2) Ich lernte traditionell über Moving Average so etwas wie: Aber wenn man ARMA-Modelle betrachtet, wird MA als eine Funktion der vorherigen Fehler-Begriffe erklärt, die ich nicht bekommen kann meinen Kopf. Ist es nur eine fancier Art und Weise der Berechnung der gleiche Sache fand ich diesen Beitrag hilfreich: (Wie SARIMAX intuitiv zu verstehen), aber Whist die Algebra hilft, kann ich nicht sehen, etwas wirklich klar, bis ich ein vereinfachtes Beispiel davon zu sehen. Angesichts der Goldpreisdaten, würden Sie zunächst schätzen das Modell und dann sehen, wie es funktioniert (Impulsantwort-Prognosen). Vielleicht sollten Sie verengen Sie Ihre Frage nur auf den zweiten Teil (und verlassen Schätzung beiseite). Das heißt, Sie würden ein AR (1) oder MA (1) oder was auch immer Modell (z. B. xt0.5 x varepsilont) und fragen Sie uns, wie funktioniert dieses Modell arbeiten. Ndash Richard Hardy Für jedes AR (q) - Modell ist die einfache Möglichkeit, die Parameter (s) zu schätzen, ist OLS verwenden - und führen Sie die Regression von: pricet beta0 beta1 cdot Preis dotso betaq cdot Preis Lets do so (In R): (Okay, also ich betrogen ein wenig und verwendet die Arima-Funktion in R, aber es liefert die gleichen Schätzungen wie die OLS-Regression - versuchen Sie es). Nun kann man sich das MA (1) - Modell ansehen. Jetzt unterscheidet sich das MA-Modell vom AR-Modell. Der MA ist gewichteter Durchschnitt von Fehlern der Vergangenheit, wobei, da das AR-Modell die vorherigen Perioden die tatsächlichen Datenwerte verwendet. Der MA (1) ist: pricet mu wt theta1 cdot w Wo mu der Mittelwert ist und wt die Fehlerterme sind - nicht der previoes-Wert des Preises (wie im AR-Modell). Nun, leider, können wir nicht schätzen die Parameter durch etwas so einfach wie OLS. Ich werde nicht die Methode hier zu decken, aber die R-Funktion arima verwendet maximale likihood. Lets try: Hoffe, das hilft. (2) Was die Frage MA (1) betrifft. Sie sagen, der Rest ist 1.0023 für den zweiten Zeitraum. Das macht Sinn. Mein Verständnis des Restes ist die Differenz zwischen dem prognostizierten Wert und dem beobachteten Wert. Aber Sie sagen dann den prognostizierten Wert für Periode 2, wird mit dem Rest für Periode 2 berechnet. Ist das richtig Isn39t der prognostizierte Wert für Periode 2 nur (0.54230 4.9977) ndash Will T-E Aug 17 15 um 11: 241. Hintergrundinformationen zu den Zeitreihendaten: Der erste Zweck dieses Blogs ist es, den Modellbauansatz, der allgemein als Box-Jenkins - oder ARIMA-Methodik bekannt ist, zu demonstrieren. (ARIMA steht für autoregressiven integrierten gleitenden Durchschnitt.) Der zweite Zweck ist, zu demonstrieren, wie Prognosen vom gepaßten ARIMA Modell produziert werden können. Dieser Blog verwendet eine Zeitreihe mit 75 Beobachtungen. Ich nenne diese Zeitreihe Yt, die für Prognosemodelle normal ist. Was bedeutet, dass die Beobachtungen wurden über die Zeit gesammelt und in den Computer (Minitab) in chronologischer Reihenfolge eingegeben. Die Zeitreihe wird zunächst mit Autokorrelation und partiellen Autokorrelationsfunktionen untersucht. Diese vorläufige Untersuchung legt nahe, dass ein autoregressives Modell der Ordnung 1 zu den Daten passt. Dieses autoregressive Modell der Ordnung 1, auch bekannt als AR (1) - Modell, wird gebaut und Koeffizienten werden geschätzt. Die Modelle Angemessenheit wird mit einer Reihe von diagnostischen Tests, um sicherzustellen, dass die Residuen sind zufällig, normal verteilt und enthalten wenige Ausreißer überprüft. Dann werden vier Prognosen gemacht. Unten ist die Zeitreihenfolge von Yt. 2. Identifizieren eines Modells, das vorläufig unterhalten werden soll: Um ein mögliches Modell unter Verwendung der Box-Jenkins-Methodik zu identifizieren, erzeugen wir zunächst die Autokorrelationsfunktion und die partielle Autokorrelationsfunktion für die ursprünglichen Zeitreihendaten. Dann werden diese beiden grafischen Ausgänge mit theoretischen grafischen Ausgängen verglichen, um zu sehen, ob eine Übereinstimmung zwischen ihnen gefunden werden kann. Dieser Matching-Prozess hilft einzugrenzen, welche Art von Modell sollten wir bauen. Wir haben zahlreiche Optionen wie den Aufbau eines autoregressiven Modells, ein gleitendes Durchschnittsmodell, ein gemischtes Modell, ein differenziertes Datenmodell und sogar ein Modell mit saisonalen Komponenten. Wir haben weitere Optionen, zum Beispiel könnten wir ein autoregressives Modell der Ordnung 1 oder der Ordnung 2 oder der Ordnung 3 wählen, abhängig von der Anzahl der Begriffe, die wir auf der rechten Seite der Gleichung einschließen möchten. Daher verwenden wir diesen grafischen Matching-Prozess, um die Anzahl der Optionen, die wir berücksichtigen müssen, zu reduzieren. Die Autokorrelationsfunktion ist eine graphische Anzeige verschiedener Autokorrelationskoeffizienten für verschiedene Zeitverzögerungen. Ein Autokorrelationskoeffizient ist ein Maß für die Korrelation zwischen zwei Variablen: die ursprüngliche Zeitreihenvariable und die verzögerte Version dieser gleichen Zeitreihenvariablen. Zum Beispiel ist ein Verzögerungs-2-Autokorrelationskoeffizient ein Maß für die Korrelation zwischen den ursprünglichen Daten und den ursprünglichen Daten, die zwei Perioden verzögert sind. Für monatliche Daten, vernachlässigen zwei Perioden bedeutet, dass wir eine Beobachtung von Januar bis März verschieben und dass wir verschieben eine Beobachtung von Februar bis April und so weiter. Eine Verzögerung 3 Autokorrelation würde eine Verlagerung einer Beobachtung von Januar bis April und würde eine Verschiebung einer Beobachtung von Februar bis Mai beinhalten. Der Graph setzt die verschiedenen Zeitverzögerungen auf die horizontale Achse und zeichnet die Autokorrelationskoeffizienten als schwarze Linien auf, die sich nach oben oder unten erstrecken. Die Autokorrelationskoeffizienten sind die kleinen schwarzen Linien, die auf - oder absteigen, und sie erscheinen ganz über dem mittleren Abschnitt des Graphen. Die partielle Autokorrelationsfunktion ist konzeptionell sehr ähnlich der Autokorrelationsfunktion. Es ist auch eine graphische Ausgabe, die verschiedene partielle Autokorrelationskoeffizienten enthält, die für verschiedene Zeitverzögerungen berechnet werden. Wiederum werden die verschiedenen Zeitverzögerungen entlang der horizontalen Achse und die partiellen Autokorrelationskoeffizienten als schwarze Linien aufgetragen, die sich nach oben oder unten erstrecken. Darüber hinaus kann ein partieller Autokorrelationskoeffizient als eine Korrelation zwischen den ursprünglichen Zeitreihendaten und einer verzögerten Version der Zeitreihendaten angesehen werden. Der Unterschied zwischen den partiellen Autokorrelationskoeffizienten und den Autokorrelationskoeffizienten besteht darin, daß die partiellen Autokorrelationskoeffizienten so berechnet werden, daß die Wirkungen der dazwischenliegenden Zeitverzögerungen berücksichtigt werden. So ist beispielsweise ein partieller Autokorrelationskoeffizient bei Zeitverzögerung 12 die Korrelation zwischen den ursprünglichen Zeitreihen und den zeitreihenverzögerten 12 Perioden und wir haben uns auf die Effekte der dazwischen liegenden Werte eingestellt, dh wir haben uns auf die Auswirkungen der verzögerten 1 eingestellt Durch verzögerte 11 Daten. Hier sind die Autokorrelation und die partiellen Autokorrelationsfunktionen für die ursprünglichen Zeitreihendaten. Das auffälligste Merkmal dieser beiden Diagramme ist der stark negative (nach unten weisende) partielle Autokorrelationskoeffizient bei der Verzögerung 1. Dann sind die restlichen partiellen Autokorrelationskoeffizienten alle sehr klein und nahe bei null, dh die schwarzen Linien zum anderen verzögert Sind alle sehr kurz. Dies deutet auf eine autoregressive Modell der Ordnung 1, in der Regel abgekürzt AR (1). Der Grund dafür ist, dass ich diese partielle Autokorrelationsfunktion mit den theoretischen Graphen aus einem Buch verglichen habe, das ich habe und dieses Bild unter der AR (1) - Funktion klassifiziert wird. 3. Schätzen von Parametern im vorläufig unterhaltenen Modell: Um das autoregressive Modell der Ordnung 1 oder AR (1) zu schätzen, verwende ich das Minitabs-ARIMA-Programm. Der Computer lief 7 Iterationen und schätzte dann die Parameter des Modells. Die Minitab-Ergebnisse werden als nächstes präsentiert. Abschließende Schätzungen der Parameter Typ Coef SE Coef T P AR 1 -0.5376 0.0986 -5.45 0.000 Konstant 115.829 1.356 85.42 0.000 Durchschnitt 75.3310 0.8818 Minitab hat die folgende Gleichung abgeschätzt: Minitab schätzt auch die Werte der Koeffizienten. Die Schätzwerte der Koeffizienten sind: Schließlich können wir mit diesen Koeffizientenschätzungen leicht die Prognosefunktion ableiten. (In der Regressionsterminologie würde dies die Y-Hut-Funktion genannt werden). Mit dieser Funktion können wir zukünftige Werte von Yt prognostizieren. Natürlich müssen wir zunächst überprüfen, ob das AR (1) - Modell ausreichend ist. Diese Prognosefunktion lautet: Es müssen mehrere Tests durchgeführt werden, um sicherzustellen, dass das Modell zufriedenstellend ist. Wir wollen sicherstellen, dass die Residuen dieses AR (1) - Modells zufällig sind. Darüber hinaus wollen wir auch dafür sorgen, dass die Residuen normal verteilt sind und wenige Ausreißer enthalten. Die einzelnen Restautokorrelationen müssen überprüft werden, um sicherzustellen, dass sie klein und nahe bei Null liegen. Ein Gesamttest der Modelladäquanz wird durch den Chi-Quadrat-Test basierend auf der Ljung-Box Q-Statistik bereitgestellt. Dieser Gesamttest betrachtet die Größen der restlichen Autokorrelationen als Gruppe. (Es ist ein Portmanteau-Test). Der erste Test, dass ich laufe, ist die Modified Box-Pierce oder Ljung-Box Chi-Quadrat-Test. Dieser Test überprüft eine Anzahl von Restautokorrelationen gleichzeitig, um zu sehen, ob sie alle zufällig sind oder nicht. Wenn der p-Wert klein ist, d. h. weniger als 0,05, wird das Modell als unzureichend angesehen. Da dieser Test bei 12, 24, 36 und 48 p-Werte aufweist, die alle viel größer als 0,05 sind, kann das Modell als ausreichend angesehen werden. Was dieser Test sagt, ist, dass ein Satz von verbleibenden Autokorrelationen nicht signifikant verschieden ist von dem, was wir erwarten würden, wenn man einen Satz von zufälligen Residuen betrachtet. Mit anderen Worten, die Residuen sind zufällig. Modified Box-Pierce (Ljung-Box) Chi-Quadrat-Statistik Lag 12 24 36 48 Chi-Quadrat 9.3 29.8 37.2 58.2 DF 10 22 34 46 P-Wert 0.508 0.124 0.324 0.107 Der nächste Graph ist die Autokorrelationsfunktion der Residuen. Diese Darstellung zeigt die einzelnen Restautokorrelationen. Die 95 Konfidenzgrenze wird verwendet, um zu testen, ob ein Rest-Autokorrelationskoeffizient signifikant von Null verschieden ist. Ein verbleibender Autokorrelationskoeffizient würde sich signifikant von Null unterscheiden, wenn die schwarze Linie sich von oben nach unten erstrecken und durch eines der Konfidenzintervalle (die roten Linien) durchdringen würde. Da dies in dieser Darstellung nie geschieht, können wir wieder schließen, dass die Residuen zufällig sind, die restlichen Autokorrelationen unterscheiden sich nicht signifikant von Null. Der nächste Graph ist die partielle Autokorrelationsfunktion der Residuen. Wir interpretieren sie unter Verwendung der gleichen allgemeinen Regeln, die für die Autokorrelationsfunktion verwendet werden. Wenn eine schwarze Linie durch eine rote Linie durchdringt, müssen wir uns Sorgen machen, weil dies nicht-zufällige Residuen suggeriert. Wenn die schwarzen Linien nicht durch die roten Linien dringen, dann haben wir höchstwahrscheinlich zufällige Residuen. Wir können wieder schließen, dass die Residuen aus diesem Graphen. Die nächsten beiden Graphen werden verwendet, um die Residuen auf Normalität zu überprüfen. Das Normalwahrscheinlichkeitsdiagramm ist eine visuelle Art der Überprüfung auf Normalität. Wenn die Residuen normal verteilt sind, sollte der Plot erscheinen, um entlang einer geraden Linie zu fallen. Wenn viele Residuen radikal von der Geraden abweichen, dann sind die Residuen nicht normal. Die Anderson-Darling Normalität Test ist ein weiterer Weg, um die Residuen für die Normalität zu überprüfen. Dieser Test hat eine Nullhypothese, die besagt, dass die Residuen einer Normalverteilung folgen. Da der p-Wert für diesen Test 0,539 ist, können wir die Nullhypothese nicht zurückweisen und schließen, dass die Residuen höchstwahrscheinlich normalverteilt sind. Der letzte Test, den ich laufe, ist, die Residuen gegen die Reihenfolge der Daten zu zeichnen. Beachten Sie, dass fast alle Residuen um 0, plus oder minus 20 herum gruppiert sind. Dies ist ein ermutigendes Zeichen, weil wir erwarten, dass der Durchschnittswert der Residuen Null sein sollte und die Residuen eine konstante Varianz über die Zeit haben sollten. Es gibt nur wenige Residuen, die außerhalb dieses Bandes abweichen. Dies deutet darauf hin, dass wenige Residuen als Ausreißer klassifiziert werden könnten. Wir wollen nur wenige Ausreißer dieser Handlung bestätigen, dass wir nur wenige von ihnen haben. Da das Modell die Diagnosephase bestanden hat, kann es verwendet werden, um Prognosen zukünftiger Werte zu entwickeln. Ich benutze noch einmal Minitab, um vier Prognosen zu erstellen. Die Daten in der ursprünglichen Zeitreihe liefen vom Zeitraum 1 bis zum Zeitraum 75. Folglich werden die vier Prognosen für die Zeitperioden 76, 77, 78 und 79 durchgeführt. Die Ergebnisse werden als nächstes dargestellt. Prognosen von Periode 75 95 Percent Limits Period Prognose Niedrig Oben Actual 76 77.122 54.102 100.142 77 74.368 48.232 100.504 78 75.849 48.879 102.818 79 75.053 47.847 102.258 Die Prognosen und in der zweiten Spalte oben dargestellt. Die 95 Grenzen geben uns eine Reihe von Werten für diese Prognosen, weil die Prognosen eine gewisse Unsicherheit enthalten. Beispielsweise beträgt die Prognose für den Zeitraum 76 77,122. Der Grenzwert von 95 weist jedoch darauf hin, dass der tatsächliche Wert sehr wahrscheinlich zwischen 54 und 100 liegen könnte. Diese Ausbreitung von möglichen Werten warnt den Benutzer davor, dass die 77.122-Zahl nicht als unbestreitbare Wahrheit zu betrachten ist. Es ist einfach eine Punktschätzung, die die AR (1) - Gleichung löst. Autoregressive gleitende durchschnittliche Fehlerprozesse (ARMA-Fehler) und andere Modelle, die Verzögerungen von Fehlertermen beinhalten, können durch Verwendung von FIT-Anweisungen geschätzt und mit Hilfe von SOLVE-Anweisungen simuliert oder prognostiziert werden. ARMA-Modelle für den Fehlerprozess werden oft für Modelle mit autokorrelierten Residuen verwendet. Mit dem AR-Makro können Modelle mit autoregressiven Fehlerprozessen spezifiziert werden. Mit dem MA-Makro können Modelle mit gleitenden Durchschnittsfehlern angegeben werden. Autoregressive Fehler Ein Modell mit autoregressiven Fehler erster Ordnung, AR (1), hat die Form, während ein AR (2) Fehlerprozess die Form hat und so weiter für Prozesse höherer Ordnung. Beachten Sie, dass die s unabhängig und identisch verteilt sind und einen Erwartungswert von 0 haben. Ein Beispiel für ein Modell mit einer AR (2) - Komponente ist usw. für Prozesse höherer Ordnung. Zum Beispiel können Sie ein einfaches lineares Regressionsmodell mit MA (2) gleitenden Durchschnittsfehlern schreiben, da MA1 und MA2 die gleitenden Mittelwerte sind. Beachten Sie, dass RESID. Y automatisch durch PROC MODEL definiert wird. Die ZLAG-Funktion muss für MA-Modelle verwendet werden, um die Rekursion der Verzögerungen zu verkürzen. Dadurch wird sichergestellt, dass die verzögerten Fehler in der Lag-Priming-Phase bei Null beginnen und fehlende Werte nicht ausbreiten, wenn Lag-Priming-Periodenvariablen fehlen und stellt sicher, dass die zukünftigen Fehler null sind, anstatt während Simulation oder Prognose fehlen. Einzelheiten zu den Verzögerungsfunktionen finden Sie im Abschnitt Lag Logic. Dieses mit dem MA-Makro geschriebene Modell lautet wie folgt: Allgemeine Form für ARMA-Modelle Das allgemeine ARMA-Verfahren (p, q) hat die folgende Form Ein ARMA-Modell (p, q) kann wie folgt angegeben werden: wobei AR i und MA j repräsentieren Die autoregressiven und gleitenden Durchschnittsparameter für die verschiedenen Verzögerungen. Sie können beliebige Namen für diese Variablen verwenden, und es gibt viele äquivalente Möglichkeiten, die die Spezifikation geschrieben werden könnte. Vektor-ARMA-Prozesse können auch mit PROC MODEL geschätzt werden. Beispielsweise kann ein zweidimensionaler AR (1) - Prozeß für die Fehler der beiden endogenen Variablen Y1 und Y2 wie folgt spezifiziert werden: Konvergenzprobleme mit ARMA-Modellen ARMA-Modelle können schwer abzuschätzen sein. Wenn die Parameterschätzwerte nicht innerhalb des geeigneten Bereichs liegen, wachsen exponentiell gleitende Modellrestriktionen. Die berechneten Residuen für spätere Beobachtungen können sehr groß sein oder überlaufen. Dies kann entweder geschehen, weil falsche Startwerte verwendet wurden oder weil sich die Iterationen von vernünftigen Werten entfernt haben. Bei der Auswahl der Anfangswerte für ARMA-Parameter sollte Sorgfalt angewendet werden. Startwerte von 0,001 für ARMA-Parameter arbeiten normalerweise, wenn das Modell die Daten gut passt und das Problem gut konditioniert ist. Man beachte, dass ein MA-Modell oft durch ein höherwertiges AR-Modell angenähert werden kann und umgekehrt. Dies kann zu einer hohen Kollinearität bei gemischten ARMA-Modellen führen, was wiederum zu ernsthaften Konditionierungen in den Berechnungen und der Instabilität der Parameterschätzungen führen kann. Wenn Sie Konvergenzprobleme haben, während Sie ein Modell mit ARMA-Fehlerprozessen schätzen, versuchen Sie in Schritten abzuschätzen. Verwenden Sie zuerst eine FIT-Anweisung, um nur die strukturellen Parameter mit den auf Null gehaltenen ARMA-Parametern zu schätzen (oder zu vernünftigen vorherigen Schätzungen, falls verfügbar). Als nächstes verwenden Sie eine andere FIT-Anweisung, um die ARMA-Parameter nur unter Verwendung der strukturellen Parameterwerte aus dem ersten Lauf zu schätzen. Da die Werte der Strukturparameter wahrscheinlich nahe an ihren endgültigen Schätzwerten liegen, können die ARMA-Parameterschätzungen nun konvergieren. Verwenden Sie schließlich eine andere FIT-Anweisung, um simultane Schätzungen aller Parameter zu erzeugen. Da die Anfangswerte der Parameter nun sehr nahe an ihren endgültigen gemeinsamen Schätzungen liegen, sollten die Schätzungen schnell zusammenlaufen, wenn das Modell für die Daten geeignet ist. AR Anfangsbedingungen Die Anfangsverzögerungen der Fehlerterme von AR (p) - Modellen können auf unterschiedliche Weise modelliert werden. Die von SAS / ETS-Prozeduren unterstützten autoregressiven Fehlerstartmethoden sind die folgenden: bedingte kleinste Fehlerquadrate (ARIMA - und MODEL-Prozeduren) unbedingte kleinste Fehlerquadrate (AUTOREG, ARIMA und MODEL) maximale Wahrscheinlichkeit (AUTOREG, ARIMA und MODEL) Yule-Walker (Nur AUTOREG-Prozedur) Hildreth-Lu, der die ersten p-Beobachtungen löscht (nur MODELL-Verfahren) Siehe Kapitel 8, Die AUTOREG-Prozedur für eine Erklärung und Diskussion der Vorzüge verschiedener AR (p) - Startmethoden. Die CLS-, ULS-, ML - und HL-Initialisierungen können mit PROC MODEL durchgeführt werden. Bei AR (1) Fehlern können diese Initialisierungen wie in Tabelle 18.2 dargestellt erzeugt werden. Diese Verfahren sind in großen Proben äquivalent. Tabelle 18.2 Initialisierungen durchgeführt durch PROC MODELL: AR (1) ERRORS Die anfänglichen Verzögerungen der Fehlerausdrücke von MA (q) - Modellen können auch unterschiedlich modelliert werden. Die folgenden gleitenden durchschnittlichen Fehlerstartparadigmen werden von den ARIMA - und MODEL-Prozeduren unterstützt: unbedingte kleinste Fehlerquadrate bedingte kleinste Fehlerquadrate Die bedingte Methode der kleinsten Fehlerquadrate zur Schätzung der gleitenden durchschnittlichen Fehlerterme ist nicht optimal, da sie das Startproblem ignoriert. Dies verringert die Effizienz der Schätzungen, obwohl sie unverändert bleiben. Die anfänglichen verzögerten Residuen, die sich vor dem Start der Daten erstrecken, werden als 0 angenommen, ihr unbedingter Erwartungswert. Dies führt zu einer Differenz zwischen diesen Residuen und den verallgemeinerten Resten der kleinsten Quadrate für die gleitende durchschnittliche Kovarianz, die im Gegensatz zum autoregressiven Modell durch den Datensatz fortbesteht. Normalerweise konvergiert diese Differenz schnell auf 0, aber für fast nicht-invertierbare gleitende Durchschnittsprozesse ist die Konvergenz ziemlich langsam. Um dieses Problem zu minimieren, sollten Sie viele Daten haben, und die gleitenden Durchschnittsparameter-Schätzungen sollten gut innerhalb des invertiblen Bereichs liegen. Dieses Problem kann auf Kosten des Schreibens eines komplexeren Programms korrigiert werden. Unbedingte Kleinste-Quadrate-Schätzungen für das MA (1) - Prozeß können durch Spezifizieren des Modells wie folgt erzeugt werden: Gleitende Durchschnittsfehler können schwer abgeschätzt werden. Man sollte erwägen, eine AR (p) - Näherung für den gleitenden Durchschnitt zu verwenden. Ein gleitender Durchschnitt kann in der Regel durch einen autoregressiven Prozess gut approximiert werden, wenn die Daten nicht geglättet oder differenziert sind. Das AR-Makro Das SAS-Makro AR erzeugt Programmieranweisungen für PROC MODEL für autoregressive Modelle. Das AR-Makro ist Teil der SAS / ETS-Software, und es sind keine speziellen Optionen erforderlich, um das Makro zu verwenden. Das autoregressive Verfahren kann auf die strukturellen Gleichungsfehler oder auf die endogenen Reihen selbst angewendet werden. Das AR-Makro kann für folgende Arten von Autoregression verwendet werden: uneingeschränkte Vektorautoregression beschränkte Vektorautoregression Univariate Autoregression Um den Fehlerausdruck einer Gleichung als autoregressiven Prozess zu modellieren, verwenden Sie die folgende Anweisung nach der Gleichung: Angenommen, Y ist eine Linearen Funktion von X1, X2 und einem AR (2) Fehler. Sie würden dieses Modell wie folgt schreiben: Die Aufrufe zu AR müssen nach allen Gleichungen kommen, auf die sich der Prozess bezieht. Der vorhergehende Makroaufruf AR (y, 2) erzeugt die in der LIST-Ausgabe in Abbildung 18.58 gezeigten Anweisungen. Abbildung 18.58 LIST Optionsausgabe für ein AR (2) - Modell Die PRED-Präfixvariablen sind temporäre Programmvariablen, die verwendet werden, so dass die Verzögerungen der Residuen die korrekten Residuen sind und nicht die, die durch diese Gleichung neu definiert werden. Beachten Sie, dass dies den Aussagen entspricht, die explizit im Abschnitt Allgemeine Formulare für ARMA-Modelle beschrieben sind. Sie können die autoregressiven Parameter auch bei ausgewählten Verzögerungen auf Null setzen. Wenn Sie zum Beispiel autoregressive Parameter in den Lags 1, 12 und 13 wünschen, können Sie die folgenden Anweisungen verwenden: Diese Anweisungen erzeugen die in Abbildung 18.59 dargestellte Ausgabe. Abbildung 18.59 LIST-Option Ausgang für ein AR-Modell mit Lags bei 1, 12 und 13 Die MODEL-Prozedurauflistung der kompilierten Programmcode-Anweisung als Parsed PRED. yab x1 c x2 RESID. y PRED. y - ACTUAL. y ERROR. y PRED. Y - y OLDPRED. y PRED. y yl1 ZLAG1 (y - perdy) yl12 ZLAG12 (y - perdy) yl13 ZLAG13 (y - perdy) RESID. y PRED. y - ACTUAL. y ERROR. y PRED. y - y Es gibt Variationen der Methode der bedingten Kleinste-Quadrate, je nachdem, ob Beobachtungen am Anfang der Serie zum Aufwärmen des AR-Prozesses verwendet werden. Die AR-bedingte Methode der kleinsten Quadrate verwendet standardmäßig alle Beobachtungen und nimmt Nullen für die Anfangsverzögerungen autoregressiver Terme an. Wenn Sie die M-Option verwenden, können Sie anfordern, dass AR die unbedingte Methode der kleinsten Fehlerquadrate (ULS) oder Maximum-Likelihood (ML) anwendet. Zum Beispiel, Diskussionen dieser Methoden wird im Abschnitt AR Anfangsbedingungen zur Verfügung gestellt. Unter Verwendung der Option MCLS n können Sie anfordern, dass die ersten n Beobachtungen verwendet werden, um Schätzungen der anfänglichen autoregressiven Verzögerungen zu berechnen. In diesem Fall beginnt die Analyse mit der Beobachtung n 1. Beispielsweise können Sie mit dem AR-Makro ein autoregressives Modell an die endogene Variable anstelle des Fehlerterms über die Option TYPEV anwenden. Wenn Sie beispielsweise die fünf letzten Lags von Y der Gleichung im vorherigen Beispiel hinzufügen möchten, können Sie AR verwenden, um die Parameter und die Lags mit den folgenden Anweisungen zu generieren: Die obigen Anweisungen erzeugen die in Abbildung 18.60 dargestellte Ausgabe. Abbildung 18.60 LIST Option Ausgang für ein AR-Modell von Y Dieses Modell prognostiziert Y als lineare Kombination von X1, X2, einem Intercept und den Werten von Y in den letzten fünf Perioden. Unrestricted Vector Autoregression Um die Fehlerausdrücke eines Gleichungssystems als vektorautoregressiven Prozess zu modellieren, verwenden Sie die folgende Form des AR-Makros nach den Gleichungen: Der Name des Prozessnamens ist ein beliebiger Name, den Sie für AR verwenden, um Namen für den autoregressiven Namen zu verwenden Werden. Mit dem AR-Makro können Sie verschiedene AR-Prozesse für verschiedene Sätze von Gleichungen modellieren, indem Sie für jeden Satz unterschiedliche Prozessnamen verwenden. Der Prozessname stellt sicher, dass die verwendeten Variablennamen eindeutig sind. Verwenden Sie für den Prozess einen kurzen Prozessname-Wert, wenn Parameter-Schätzwerte in einen Ausgabedatensatz geschrieben werden sollen. Das AR-Makro versucht, Parameternamen zu erstellen, die kleiner oder gleich acht Zeichen sind, aber dies ist durch die Länge des Prozessnamens begrenzt. Die als Präfix für die AR-Parameternamen verwendet wird. Der Variablenlistenwert ist die Liste der endogenen Variablen für die Gleichungen. Beispielsweise wird angenommen, dass Fehler für die Gleichungen Y1, Y2 und Y3 durch einen autoregressiven Prozess der zweiten Ordnung erzeugt werden. Sie können die folgenden Aussagen verwenden, die für Y1 und ähnlichen Code für Y2 und Y3 erzeugen: Für Vektorprozesse kann nur die Methode der bedingten kleinsten Quadrate (MCLS oder MCLS n) verwendet werden. Sie können auch das gleiche Formular mit Einschränkungen verwenden, dass die Koeffizientenmatrix bei ausgewählten Verzögerungen 0 ist. Zum Beispiel verwenden die folgenden Aussagen einen Vektorprozess der dritten Ordnung auf die Gleichungsfehler, wobei alle Koeffizienten bei Verzögerung 2 auf 0 beschränkt sind und die Koeffizienten bei den Verzögerungen 1 und 3 unbeschränkt sind: Sie können die drei Reihen Y1Y3 als vektorautoregressiven Prozess modellieren In den Variablen statt in den Fehlern, indem Sie die Option TYPEV verwenden. Wenn Sie Y1Y3 als Funktion von vergangenen Werten von Y1Y3 und einigen exogenen Variablen oder Konstanten modellieren möchten, können Sie mit AR die Anweisungen für die Lag-Terme erzeugen. Schreiben Sie eine Gleichung für jede Variable für den nichtautoregressiven Teil des Modells und rufen Sie dann AR mit der Option TYPEV auf. Zum Beispiel kann der nichtautoregressive Teil des Modells eine Funktion von exogenen Variablen sein, oder es können Abfangparameter sein. Wenn es keine exogenen Komponenten für das Vektorautoregressionsmodell gibt, die keine Abschnitte enthalten, dann weisen Sie jeder der Variablen Null zu. Es muss eine Zuordnung zu jeder der Variablen vorhanden sein, bevor AR aufgerufen wird. Dieses Beispiel modelliert den Vektor Y (Y1 Y2 Y3) als eine lineare Funktion nur seines Werts in den vorherigen zwei Perioden und einen Weißrauschenfehlervektor. Das Modell hat 18 (3 3 3 3) Parameter. Syntax des AR-Makros Es gibt zwei Fälle der Syntax des AR-Makros. Wenn Einschränkungen für einen Vektor-AR-Prozess nicht benötigt werden, hat die Syntax des AR-Makros die allgemeine Form, die ein Präfix für AR spezifiziert, das beim Konstruieren von Namen von Variablen zum Definieren des AR-Prozesses verwendet werden soll. Wenn der Endolist nicht angegeben wird, ist die endogene Liste standardmäßig der Name. Der der Name der Gleichung sein muss, auf die der AR-Fehlerprozess angewendet werden soll. Der Name darf nicht länger als 32 Zeichen sein. Ist die Reihenfolge des AR-Prozesses. Gibt die Liste der Gleichungen an, auf die der AR-Prozess angewendet werden soll. Wenn mehr als ein Name gegeben wird, wird ein unbeschränkter Vektorprozess mit den strukturellen Residuen aller Gleichungen erzeugt, die als Regressoren in jeder der Gleichungen enthalten sind. Wenn nicht angegeben, verwendet endolist standardmäßig den Namen. Gibt die Liste der Verzögerungen an, zu denen die AR-Terme hinzugefügt werden sollen. Die Koeffizienten der Terme, die nicht aufgelistet sind, werden auf 0 gesetzt. Alle aufgelisteten Lags müssen kleiner oder gleich nlag sein. Und es dürfen keine Duplikate vorhanden sein. Wenn nicht angegeben, wird die Verzögerungsliste standardmäßig auf alle Verzögerungen 1 bis nlag gesetzt. Gibt die zu implementierende Schätzmethode an. Gültige Werte von M sind CLS (bedingte Schätzungen der kleinsten Quadrate), ULS (unbedingte Schätzungen der kleinsten Quadrate) und ML (Maximum Likelihood Estimates). MCLS ist die Voreinstellung. Nur MCLS ist erlaubt, wenn mehr als eine Gleichung angegeben wird. Die ULS - und ML-Methoden werden für AR-AR-Modelle von AR nicht unterstützt. Dass das AR-Verfahren auf die endogenen Variablen anstelle der strukturellen Residuen der Gleichungen angewendet werden soll. Eingeschränkte Vektorautoregression Sie können steuern, welche Parameter in den Prozess eingeschlossen werden, wobei die Parameter auf 0 begrenzt werden, die Sie nicht einschließen. Verwenden Sie zuerst AR mit der Option DEFER, um die Variablenliste zu deklarieren und die Dimension des Prozesses zu definieren. Verwenden Sie dann zusätzliche AR-Aufrufe, um Ausdrücke für ausgewählte Gleichungen mit ausgewählten Variablen bei ausgewählten Verzögerungen zu generieren. Zum Beispiel sind die erzeugten Fehlergleichungen wie folgt: Dieses Modell besagt, daß die Fehler für Y1 von den Fehlern sowohl von Y1 als auch von Y2 (aber nicht von Y3) bei beiden Verzögerungen 1 und 2 abhängen und daß die Fehler für Y2 und Y3 davon abhängen Die vorherigen Fehler für alle drei Variablen, aber nur bei Verzögerung 1. AR-Makro-Syntax für eingeschränkten Vektor-AR Eine alternative Verwendung von AR kann Einschränkungen für einen Vektor-AR-Prozess durch Aufruf von AR mehrmals aufrufen, um verschiedene AR-Terme und - Lags für verschiedene anzugeben Gleichungen. Der erste Aufruf hat die allgemeine Form spezifiziert ein Präfix für AR zu verwenden, bei der Konstruktion von Namen von Variablen benötigt, um den Vektor AR-Prozess zu definieren. Gibt die Reihenfolge des AR-Prozesses an. Gibt die Liste der Gleichungen an, auf die der AR-Prozess angewendet werden soll. Gibt an, dass AR den AR-Prozess nicht generieren soll, sondern auf weitere Informationen warten soll, die in späteren AR-Aufrufen für denselben Namenwert angegeben sind. Die nachfolgenden Anrufe haben die allgemeine Form ist die gleiche wie im ersten Aufruf. Spezifiziert die Liste der Gleichungen, auf die die Spezifikationen in diesem AR-Aufruf angewendet werden sollen. Nur Namen, die im endolistischen Wert des ersten Aufrufs für den Namenswert angegeben sind, können in der Liste der Gleichungen in eqlist erscheinen. Spezifiziert die Liste der Gleichungen, deren verzögerte strukturelle Residuen als Regressoren in die Gleichungen in eqlist aufgenommen werden sollen. Nur Namen im Endolisten des ersten Aufrufs für den Namenswert können in varlist erscheinen. Wenn nicht angegeben, wird varlist standardmäßig Endolist. Gibt die Liste der Verzögerungen an, zu denen die AR-Terme hinzugefügt werden sollen. Die Koeffizienten der Terme, die nicht aufgelistet sind, werden auf 0 gesetzt. Alle aufgelisteten Verzögerungen müssen kleiner oder gleich dem Wert von nlag sein. Und es dürfen keine Duplikate vorhanden sein. Wenn nicht angegeben, verwendet laglist standardmäßig alle Verzögerungen 1 bis nlag. Der MA-Makro Der SAS-Makro MA generiert Programmieranweisungen für PROC MODEL für gleitende Durchschnittsmodelle. Das MA-Makro ist Teil der SAS / ETS-Software, und es sind keine speziellen Optionen erforderlich, um das Makro zu verwenden. Der gleitende Mittelwertfehlerprozeß kann auf die strukturellen Gleichungsfehler angewendet werden. Die Syntax des MA-Makros entspricht dem AR-Makro, außer es gibt kein TYPE-Argument. Wenn Sie die kombinierten MA - und AR-Makros verwenden, muss das Makro MA dem AR-Makro folgen. Die folgenden SAS / IML-Anweisungen erzeugen einen ARMA-Fehlerprozeß (1, (1 3)) und speichern ihn im Datensatz MADAT2. Die folgenden PROC MODEL-Anweisungen werden verwendet, um die Parameter dieses Modells unter Verwendung der maximalen Wahrscheinlichkeitsfehlerstruktur zu schätzen: Die Schätzungen der durch diesen Durchlauf erzeugten Parameter sind in Abbildung 18.61 dargestellt. Abbildung 18.61 Schätzungen aus einem ARMA-Prozess (1, (1 3)) Es gibt zwei Fälle der Syntax für das MA-Makro. Wenn Beschränkungen für einen Vektor-MA-Prozess nicht erforderlich sind, hat die Syntax des MA-Makros die allgemeine Form, die ein Präfix für MA vorgibt, das beim Konstruieren von Namen von Variablen verwendet wird, die benötigt werden, um den MA-Prozess zu definieren, und ist der Standard-Endolist. Ist die Reihenfolge des MA-Prozesses. Spezifiziert die Gleichungen, auf die das MA-Verfahren angewendet werden soll. Wenn mehr als ein Name angegeben wird, wird die CLS-Schätzung für den Vektorprozess verwendet. Gibt die Verzögerungen an, zu denen die MA-Bedingungen hinzugefügt werden sollen. Alle aufgelisteten Verzögerungen müssen kleiner oder gleich nlag sein. Und es dürfen keine Duplikate vorhanden sein. Wenn nicht angegeben, wird die Verzögerungsliste standardmäßig auf alle Verzögerungen 1 bis nlag gesetzt. Gibt die zu implementierende Schätzmethode an. Gültige Werte von M sind CLS (bedingte Schätzungen der kleinsten Quadrate), ULS (unbedingte Schätzungen der kleinsten Quadrate) und ML (Maximum Likelihood Estimates). MCLS ist die Voreinstellung. Nur MCLS ist erlaubt, wenn mehr als eine Gleichung im Endolisten angegeben ist. MA-Makro-Syntax für eingeschränkte Vektorbewegungsmittel Eine alternative Verwendung von MA ist es, Beschränkungen für einen Vektor-MA-Prozeß durch Aufruf von MA mehrere Male aufzuerlegen, um verschiedene MA-Terme und Verzögerungen für verschiedene Gleichungen anzugeben. Der erste Aufruf hat die allgemeine Form spezifiziert ein Präfix für MA, um beim Erstellen von Namen von Variablen für die Definition der Vektor-MA-Prozess zu verwenden. Spezifiziert die Reihenfolge des MA-Prozesses. Spezifiziert die Liste der Gleichungen, auf die das MA-Verfahren angewendet werden soll. Spezifiziert, daß MA nicht den MA-Prozeß erzeugen soll, sondern auf weitere Informationen, die in späteren MA-Aufrufen für denselben Namenwert spezifiziert werden, wartet. Die nachfolgenden Anrufe haben die allgemeine Form ist die gleiche wie im ersten Aufruf. Spezifiziert die Liste der Gleichungen, auf die die Spezifikationen in diesem MA-Aufruf angewendet werden sollen. Spezifiziert die Liste der Gleichungen, deren verzögerte strukturelle Residuen als Regressoren in die Gleichungen in eqlist aufgenommen werden sollen. Gibt die Liste der Verzögerungen an, zu denen die MA-Bedingungen hinzugefügt werden sollen.
Comments
Post a Comment