Friday 13 January 2017

Verhältnis Zu Bewegen Durchschnitt Multiplikativ

Multiplikative Anpassung: Betrachten Sie den Schaubild des gesamten Einzelhandelsumsatzes von Automobilen von Januar 1970 bis Mai 1998 in Milliarden-Dollar-Einheiten, wie damals vom US-Büro für Wirtschaftsanalyse berichtet: Ein großer Teil der Tendenz ist lediglich auf Inflation zurückzuführen. Die Werte können deflationiert, d. h. in Einheiten von konstanten statt nominalen Dollar umgewandelt werden, indem sie durch einen geeigneten Preisindex dividiert werden, der auf einen Wert von 1,0 in jedem beliebigen Jahr als Basisjahr skaliert ist. Hier ist das Ergebnis der Division durch den US-Verbraucherpreisindex (CPI) auf 1,0 im Jahr 1990 skaliert, der die Einheiten in Milliarden von 1990 Dollar umwandelt: (Die Daten können in dieser Excel-Datei gefunden werden, und es wird auch detailliert analysiert Die Seiten zu saisonalen ARIMA-Modellen auf dieser Seite.) Es gibt noch einen allgemeinen Aufwärtstrend, und die zunehmende Ausprägung von saisonalen Schwankungen suggeriert ein multiplikatives saisonales Muster: Der saisonale Effekt drückt sich in Prozent aus, also die absolute Größe der Saison Wenn die Serie im Laufe der Zeit wächst. Ein solches Muster kann durch eine multiplikative saisonale Anpassung entfernt werden. Was erreicht wird, indem jeder Wert der Zeitreihe durch einen saisonalen Index (eine Zahl in der Nähe von 1,0) dividiert wird, der den Prozentsatz des Normalwerts darstellt, der typischerweise in dieser Saison beobachtet wird. Zum Beispiel, wenn Dezembers Verkäufe sind in der Regel 130 des normalen monatlichen Wert (basierend auf historischen Daten), dann jeder Decembers Umsatz saisonbereinigt werden durch die Division durch 1,3. Ebenso, wenn Januar-Verkäufe sind in der Regel nur 90 von normal, dann jeder Januar-Verkauf würde saisonbereinigt durch die Division durch 0,9. Demzufolge würde der Dezembers-Wert nach unten angepasst werden, während die Jänner nach oben angepasst werden würden, was den erwarteten saisonalen Effekt korrigiert. Abhängig davon, wie sie aus den Daten geschätzt wurden, könnten die Saisonindizes von einem Jahr zum nächsten gleich bleiben, oder sie können sich mit der Zeit langsam ändern. Die saisonalen Indizes, die durch das saisonale Zersetzungsverfahren in Statgraphics berechnet werden, sind über die Zeit konstant und werden über die sogenannte quotratio-zu-gleitende Durchschnittsmethode berechnet. (Für eine Erläuterung dieser Methode siehe die Diagramme der Prognose mit Saisonbereinigung und Die Hinweise zur Tabellenkalkulation saisonale Anpassung.) Hier sind die multiplikativen saisonalen Indizes für Auto-Verkäufe, wie durch das saisonale Zersetzungsverfahren in Statgraphics berechnet: Schließlich ist hier die saisonbereinigte Version der deflationierten Auto-Verkäufe, die durch die Division von jedem Monat-Wert erhalten wird Seinen geschätzten saisonalen Index: Beachten Sie, dass das ausgeprägte saisonale Muster weg ist und was bleibt, sind der Trend und die zyklischen Komponenten der Daten, plus zufälliges Rauschen. Additive Anpassung: Als Alternative zur multiplikativen saisonalen Anpassung ist es auch möglich, additive saisonale Anpassung durchzuführen. Eine Zeitreihe, deren saisonale Schwankungen im Großen und Ganzen unabhängig von dem aktuellen Durchschnittsniveau der Serie ungefähr konstant sind, wäre ein Kandidat für additive saisonale Anpassung. In der additiven saisonalen Anpassung wird jeder Wert einer Zeitreihe durch Addieren oder Subtrahieren einer Menge, die den Absolutbetrag darstellt, um den der Wert in jener Jahreszeit tendenziell unter oder über dem Normalwert liegt, wie aus vergangenen Daten geschätzt, eingestellt. Additive saisonale Muster sind in der Natur etwas selten, aber eine Reihe, die ein natürliches multiplikatives saisonales Muster hat, wird zu einem mit einem additiven saisonalen Muster konvertiert, indem eine logarithmische Transformation auf die ursprünglichen Daten angewendet wird. Deshalb, wenn Sie saisonale Anpassung in Verbindung mit einer Logarithmus-Transformation verwenden, sollten Sie eher additive als multiplikative saisonale Anpassung verwenden. Akronyme: Bei der Betrachtung der Beschreibungen von Zeitreihen in Datadisk und anderen Quellen wird die Abkürzung SA (Akronym SA) verwendet Steht für saisonbereinigt, während NSA steht für nicht saisonbereinigt. Eine saisonbereinigte jährliche Rate (SAAR) ist eine Zeitreihe, in der jeder Periodenwert für die Saisonalität angepasst wurde und dann mit der Anzahl der Perioden in einem Jahr multipliziert wird, als ob der gleiche Wert in jedem Zeitraum für ein ganzes Jahr erhalten worden war. (Zurück zum Anfang der Seite.) Koef de correlacion correlaciones espreas 218 EL coeficiente DE CORRELACIN Y CORRELACIONES ESPREAS Erick Lahura Enero 2003 DOCUMENTO DE TRABAJO 218 pucp. edu. pe economia pdf DDD218.pdf EL coeficiente DE CORRELACIN Y CORRELACIONES ESPREAS Erick Lahura RESUMEN En este ensayo se presenta y analisa el coeficiente de correlacin, una herramienta estadstica elementare e importante para el estudio ökonomische de relaciones lineales bivariadas que involucran el uso de dato de corte transversal o serie de tiempo. En insbesondere, se analiza su relacin con las denominadas correlaciones espreas o sin sentido. Asimismo, se muestran aplicaciones Gebrauchsdaten von para la economa peruana. ABSTRAKT Ein wichtiges statistisches Werkzeug für die ökonometrische Untersuchung der linearen bivariaten Beziehung, die die Verwendung von Querschnitts - oder Zeitreihendaten beinhaltet, wird in diesem Aufsatz vorgestellt und analysiert: der Korrelationskoeffizient. Insbesondere wird deren Beziehung zu falschen oder nicht-sinnlichen Korrelationen analysiert. Ebenso werden empirische Anwendungen auf der Basis peruanischer Daten gezeigt. 2 EL coeficiente DE CORRELACIN Y CORRELACIONES ESPREAS1 Erick Lahura2 1. INTRODUCCIN La Econometra es el campo de la Economa que se ocupa de la medicin emprica (estimacin, inferencia y prediccin) de las relaciones entre Variablen que establece la Teora econmica, ein travs de la Aplicacin de mtodos estadsticos, matemticos und computacionales. El propsito grundlegende es proporcionar contenido emprico ein las relaciones tericas. Una manera elementar de llevar ein cabo este propsito und analisar relaciones entre dos variablen. Si bien es cierto existen muchas relaciones econmicas de naturaleza keine lineal y o que involucran ms de dos Variablen (relaciones multivariadas), existen otras relaciones relevantes lineales y bivariadas. Como Grundierung ejemplo, considrese el modello clsico de demanda von dinero real, que relaciona linealmente la demanda von dinero y el ingreso reales ein travs de la siguiente ecuacin: t t Y P M 21 (1.1) donde y. (Y) pueden ser representados por las Serie de tiempo kreisförmig real y PBI real 01 02 3 medidas 1 Este ensayo forma parte de uno de los capto del libro Econometra Bsica : Teora y Aplicaciones in der Nähe von Encuentra en elaboracin. 2 Profesor de Departamento de Departamento de la Pontificia Universidad de Ciencias - Seccin Matemticas. El autor agradece el apoyo von Magrith Mena, Ana M. Whittembury und Manuel Barrn von den Arbeitskräften als Investigacin. Asimismo, Agradece ein Gisella Chiang, Kristian Lpez, Julio Villavicencio, Luis Orezzoli, Martn Tello, Carla Murgua, Caroline Postigo, Donita Rodriguez y al arbitro Annimo, por sus valiosos comentarios y sugerencias. 3 Ms adelante se detallar auf dem Laufenden cada uno de estos datos. 3 mensualmente, se obtiene el siguiente grfico que muestra la evolucin de los valores de cada una de ellas (EJE vertikal) entre enero de 1993 y diciembre de 2001 (EJE horizontal): Figura 1: Grfico del circulante y PBI Reales (enero1993-diciembre 2001) 2,4 2,6 2,8 3,0 3,2 3,4 8,8 8,9 9,0 9,1 9,2 9,3 93 94 95 96 97 98 99 00 01 Circulante Real (Protokolle) PBI Real (Protokolle) La Figura 1 muestra que tanto el cirkulante como el PBI echte tienden ein crecer ein lo Es hat sich gelohnt, crecen con el tiempo. Es ist Ihnen nicht erlaubt, auf Beiträge zu antworten. Es ist Ihnen nicht erlaubt, Anhänge hochzuladen. Es ist Ihnen nicht erlaubt, Ihre Beiträge zu bearbeiten. Dies ist ein maschinell übersetzter Artikel. Como segundo ejemplo, considrese uno de modo de tipo keynesiano con el que se intenta explicar el de la una rega para un ao Bestimmung: ii YC 21 (1.2) donde. Es el consumo de la i-sima familia e Sie haben keine Berechtigung zur Stellungnahme. La figura 2 muestra el comportamiento de las cantidades de consumo e ingreso Reales (EJE vertikal) para 200 Observaciones generadas artificialmente (EJE horizontal), que constituyen datos de corte transversal: 01 10 2 Figura 2: Grfico del Consumo e Ingreso (200 Observaciones) 200 400 600 800 1000 1200 1400 0 400 800 1200 1600 25 50 75 100 125 150 175 200 CONSUMO INGRESO En este caso, eine Variante der Modellreihe von dinero real, las Serie keine presentan una tendencia clara ein crecer o deccercer, sino ms Bien parecen revertir ein un valor promedio constante ein lo largo de todas las observaciones. De este modo, no es posible Schlussfolgerung fcilmente a partir del grfico si las Reihe se mueven juntas, en el mismo sentido o en sentidos opuestos. De esta manera, tanto en el konstruktion de modello de demanda por dinero (serie de tiempo) como en el modello de verbrauch (corte transversal), se hace necesario un instrumento que permita determinierung la fuerza y ​​el sentido de la posible relacin lineal existente entre Los pares de variables mencionados. Ste se denomina coeficiente de correlacin.4 El coeficiente de correlacin es es una herramienta estadstica elementaren e importante para el estudio ökonomischen de relaciones lineales bivariadas que involucran el uso de dato de corte transversal o serie de tiempo. Sin embargo, este instrumento puede fallar en algunas ocasiones al sugerir la presencia de una relacin estadsticamente signifikanten entre dos variablen que en verdad nein tienen sentido o nein posen relacin lineal alguna, es dezir, que presentan una correlacin esprea. 4 El coeficiente de correlacin es solamente uno de los estadsticos que existente para medir el grado de asociacin entre Variablen, lo cual depende de la clase de Variablen analizadas (categrica, continua, etc.). Una referencia ms amplia von los diversos estadsticos existentes es Liebetrau (1983). 5 En este ensayo Se analiza el coeficiente de Berichtigung und su relacin con las denominadas correlaciones espreas o sin sentido. En la seccin 2 se prüfung estadsticamente el coeficiente de correlacin. En la seccin 3 se definieren el problema de correlaciones espreas o sin sentido. Klicken Sie auf das Gütesiegel, um die Gültigkeit zu prüfen. En la seccin 5 se analiza la presencia de correlaciones espreas und un kontexto de serie de tiempo. Finalmente, en la seccin 6 se vorgestelltes aplicaciones utilizando datos de la economa peruana. 2. EL COEFICIENTE DE CORRELACION Es handelt sich hierbei um eine unabhän - gige Abweichung. Bsicamente, esta informacin se refiere ein dos caractersticas von la relacin lineal: la direccin o sentido y la cercana o fuerza. Es ist sehr wichtig, dass Sie sich für die Suche nach dem passenden Produkt in den Warenkorb legen können. Si sta keine Fuera keine lineal, el coeficiente de correlacin slo indigore la ausencia de una relacin lineal ms nein la ausencia de relacin alguna. Debido a esto, muchas veces el coeficiente de correlacin se definieren - de manera ms allgemein - como un instrumento estadstico que mide el grado de asociacin lineal entre dos variables. 2.1. Desviaciones y grfico de dispersin Seien Sie una muestra de n observaciones o muestra de tamao n para dos Variablen X e Y, denotada por:), () ,, () ,, (2211 nn YXYXYXM K (2.1) donde cada par (representa los Valoren de cada Variable para la i-sima observacin, Asimismo, Meer X), ii YX ni. 2,1 K i-i-sima Beobachtungsstelle der Variablen X y X El valor promedio de las n beobachtungen de la misma. con esto, se definieren la desviacin de la i-sima observacin de la Variable X respecto de su Heldenmut promedio observado, o simple desviacin de Xi, como: 6 XXx ii (2.2) La Variable xi puede tomar valores positivos o negativos dependiendo del Tapferkeit De cada observacin, es dezir, si es bürgermeister o menor que el valor promedio Beobachtungsstelle Cuando xi 0 se dice que la desviacin de la variabel Xi es positiva, mientras que si xi XXX ii AYX 011 El punto A, situado en el primer cuadrante de la Figura 2a, Vertre los valores de las Variablen X e Y correspondientes a la i-sima observacin de la muestra. en este punto, el Valor de cada variable es Bürgermeister que sus correspondientes valores Promedios, es decir, las desviaciones de ambas Variablen Son positivas De esta forma, las Variablen X e Y varan Konjunktion und en mismo sentido, es dezir, covaran positivamente. En este caso, se dice que existe una relacin linear und positiv entre ambas variables. El punto B, situado en el tercer cuadrante de la Figura 2a, repräsentieren die Werte der Variablen X e Y correspondientes la (i1) - sima observacin de la muestra. En este punto, las desviaciones de ambas Variablen son negativas. Als, se tiene que X e Y varan Konjunktion und en mismo sentido, es decir, covaran positivamente. En este caso, se dice que un punto como Implizite la existencia de una relacin lineal y positiva entre estas Variablen. Si la relacin entre las Variablen X e Y estuviera representada slo por las dos Observaciones de la Figura 2a (puntos A y B), se dice que la relacin entre estas Variablen es in gerader Linie y positiva o que las Variablen covaran positivamente. 022 XXx ii 033 YYy ii 2iY D C Y X 3iX2iX 3iY X Y Abbildung 2b: Desviaciones de Xe y en direcciones opuestas. 8 El punto C, situado en el segundo cuadrante de la Figura 2b, repräsentieren die Werte der Variablen X e Y correspondientes a la (i2) - sima observacin de la muestra. En este punto, las desviacin de X es negativa y la desviacin de Y es positiva. Als, las-Variablen X e Y varan Konjunktion und en sentidos opuestos es dezir, covaran negativamente. En este caso, se dice que existe una relacin lineal negativa entre ambas Variablen. El punto D, situado en el cuarto cuadrante de la Figura 2b, repräsentieren die Werte von X e Y correspondientes a la (i3) - sima observacin de la muestra. Anloga De manera al caso anterioren, el anlisis de los signos de las desviaciones permite afirmar que existe una relacin lineal negativa entre X e Y. Si las Variablen X e Y estn representadas slo por las dos Observaciones de la Figura 2 (puntos C y D ), Entonces la relacin entre estas Variablen sera lineal y negativa. Para el caso de un grfico en el cual las Variablen X e Y estuvieran representadas por cuatro Observaciones iguales a los puntos A, B, C y D, Geschichten que las desviaciones Positivas y negativas se compensaran entre s, entonces se concluye que no existe relacin Lineare Entre-las-Variablen. 2.2. La covarianza Muestral si los n pares de observaciones se ubicaran en el primer und tercer cuadrante (es dezir, si la relacin entre X e Y fuera positiva), die multiplicacin de sus desviaciones. Tendra signo positivo. Por Por Por......................................... (2.5) De esta forma, el signo de (2.5) griechischen Ursprungs. Si se trazara una lnea tal que represente aproximadamente la distribucin de los pares ordenados, el signo de (2,5) indicara el signo de la pendiente de esa lnea, como se muestra en Figura 3. 9 YX Figura 3: Relacin lineal y positiva entre las Variablen X e Y. Ein travs de un anlisis anlogo al anterioren, se tiene que si los n pares de Observaciones se ubicaran en el Segundo y cuarto Cuadrante (es decir, si la relacin lineal entre las Variablen X e Y fuera negativa), tendramos : 0 1 Dadas las desigualdades (2.5), (2.6) y (2.7) y una muestra de 21 nnn Beobachtungen para un par de Variablen X y cuyo grfico de dispersin consta de puntos ubicados en el primer und tercer cuadrante: 1n 0 1 n ii yx y puntos ubicados en el Segundo y cuarto Cuadrante: 2n 0 2 n ii n ii yxyx o equivalentemente: 0 21 n ii n ii yxyx entonces la relacin lineal predominante entre las Variablen es positiva. En este caso, se dice que las Variablen X e Y covaran lineal y positivamente. (2) Si los puntos ubicados en el Segundo y cuarto Cuadrante Sohn ms importantes que los ubicados en el Primer y tercer Cuadrante, es decir: 0 21 o equivalentemente: 0 21 Estas tres afirmaciones se resumen en la Figura 4: -3 -2 -1 0 1 2 3 -3 -2 -1 0 1 2 3 XY RELACIN LINEAL POSITIVA -3 -2 -1 0 1 2 3 -3 -2 -1 0 1 2 3 XY RELACIN LINEAL NEGATIVA -4 -2 0 2 4 -3 -2 -1 0 1 2 3 XY RELACIN LINEAL NULA -3 -2 -1 0 1 2 3 -3 -2 -1 0 1 2 3 XY RELACIN NO LINEAL Abbildung 4: Relaciones Lineales und keine Lineales Si el nmero De observaciones, o tamao de muestra, fuera muy großartig y si las variablen presentaran algn tipo de comovimiento lineal (positivo o negativo), die expresin crecera con el tamao de muestra. Debido a esto, es mejor promediar Überprüfen Sie die Verfügbarkeit von cada desviacin, obtenindose de esta manera el estadstico conocido como covarianza muestral: ni ii yx 1 ni ii yx 1 13 ni iii nii yxn YYXX n YXCov 11 1 1)) ((1 1), ((2,8) El promedio de la Suma de desviaciones se obtiene ein travs de un Faktor igual a (n-1) porque basta con la informacin (Tapferkeit) de las primeras n-1 desviaciones para conocer la informacin (Tapferkeit) (2) (2) (21 Entonen, bastara con conocer la primera desviacin (el valor de y 1X X) para conocer el valor de Dado que (2.8) depende de2X Ni ii yx1 el anlisis priorente impllica que la covarianza muestral Permite identificar la direccin o sentido de la relacin lineal entre las Variablen, ein travs de su signo. Esta es la nica informacín relevante que proporciona la covarianza muestral para el anlisis de la relacin entre Dos-Variablen 2.3 El coeficiente de correlacin Intuitivamente, la fuerza o cercana de la relacin Entre dos Variablen podra medirse eine travs de la covarianza muestral: mientras ms grande meer el valor de la covarianza muestral, ms fuerte ser la relacin entre las variablen. Sin embargo, los valores que puede tomar la covarianza muestral dezidiert de las unidades de medida de las Variablen involucradas, lo cual podra conducir ein interpretaciones äquivocadas acerca de la fuerza de la relacin. Para ilustrar este problema, considrese las Variablen X tasa de inters activa e Y tasa de inters pasiva, para las cuales se cuenta con una muestra ficticia de 10 Beobachtungen:) 50,100 () 45,90 () 40,80 () 35,70 () 30,60 () 25,20 () 20,40 () 15,30 () 10,20 () 5,10 (Es gibt keine Produkte mit dem Suchbegriff: 0 al 100 (por ejemplo, 10 Vertre 10 por ciento) La covarianza muestral entre X e Y, dados estos valores muestrales, es igual a:.. 5412), (YXCov 14 Este resultado indica que existe una relacin lineal positiva entre la tasa de inters activa y pasiva Si se (25,050,0 () 20,040,0 () 15,030,0 () 10,020,0 () 05.010,0 (M) 50.000,1 () 45.090, enthalten sind , 0 () 40,080,0 () 35,070,0 () 30,060,0 donde las Variablen estn expresadas como porcentajes en la escala von 0 al 1 (por ejemplo, 0,10 repräsentiert 10 por ciento). En este caso, la covarianza muestral entre X e Y, dados estos valores muestrales, es igual. A: 04125,0), (YXCov Este resultado confirma que la relacin entre las tasas de inters activa y pasiva es positiva As, el sentido de una relacin lineal Medido por la covarianza muestral es invariante ein cambios en las unidades de medida. Sin embargo, luego de reducir la escala de las Variablen, el valor de la covarianza disminuye (se hace prcticamente cero) respecto del caso Original. de esta forma , Si se utilizara el valor, absoluto de la covarianza, para medir, la fuerza de la relacin, lineal, entre, las, Variablen, se podran, obtener, Schlussfolgerungen, äquivocadas: en el primer, caso, se afirmara, que la relacin, es muy fuerte, mientras que en el segundo caso que la relacin es muy DBIL, lo cual es inconsistente pues se est analizando la misma relacin en ambos casos. Da la Fuerza de una relacin lineal medida por la covarianza muestral es sinnvoll, ein cambios en las unidades de medida5. Para obtener un indicador de la Fuerza de La relacin lineal entre dos variables que keine abhängigen de las unidades de medida de las mismas, se deber expresar las desviaciones en unidades de desviacin estndar. La covarianza muestral estandarizada se denomina coeficiente de correlacin muestral, y se denota usualmente como r: ni YiXi S y S xn rYXCorr 11 1), ((2,9) 5 La demostracin matemtica de este resultado se muestra en el apndice (demostracin 1 2 nx S i X (2,9) 1 2 ny S i Y (2,9) Es gibt keine Unterschiede zwischen den beiden Systemen Cada Variable: YX SS YXCovr), ((2,10) Alternativamente, el coeficiente de correlacin puede ser expresado como: niiniini ii yx yx r 1 2 1 2 1 (2,11) 2 11 2 2 11 2 111 niiniiniiniiniiniini ii YYnXXn YXYXn r (2.12 2.4) Interpretacin del coeficiente de correlacin El coeficiente de correlacin muestral, adems de ser independiente de las unidades de medida de las Variablen, se caracteriza por tomar valores dentro del intervalo cerrado -1,16. 11 r 6 La demostracin matemtica se presenta en El apndice (demostracin 2). 16 o equivalentemente: 1 r r.......................................................... Para los propsitos del presente ensayo, se asume que el Nmero de Observaciones de la muestra (tamao de muestra), es tal que la muestra es representativa: presenta las mismas CARACTERSTICAS de la poblacin. De esta manera, las Schlussfolgerungen que puedan extrakte a partir del anlisis del coeficiente de Korrelatin sern vlidas para la relacin poblacional. A partir de la expresin (2.9), Dado que y solamente pueden tomar valores keine negativos, se tiene que el signo del coeficiente de correlacin muestral depender del signo de la Suma del producto de Todas las desviaciones, XS YS ni ii yx1. Da el signo de r indica la Direccin de la relacin in gerader Linie (al igual que la covarianza muestral): valores positivos Indican una relacin directa y Valores negativos una relacin inversa entre las Variablen involucradas. Por otro lado, el valor Absoluto del coeficiente de Korrelacin indica la fuerza de la relacin lineal. Un coeficiente de correlacin muy cercano a uno en Tapferkeit absoluto indica que la relacin entre las Variablen es muy fuerte, mientras que si es muy cercano a cero, indica que la relacin es muy DBIL. El cuadro 1 muestra las posibles interpretaciones von coeficiente von correlacin muestral. Cuadro 1: Interpretacin del coeficiente de Correlacin Muestral VALOR DEL coeficiente INTERPRETACIN 10 El coeficiente de correlacin muestral, ein diferencia de la covarianza muestral, kein solamente mide el sentido de la relacin entre las Variablen sino tambin la Fuerza de la relacin lineal o grado de asociacin Lineal. La figura 5 relaciona el grado von asociacin lineal mit verschiedenen Arten von Mehltests. -3 -2 -1 0 1 2 3 -3 -2 -1 0 1 2 3 XY r 0 -3 -2 -1 0 1 2 3 -3 -2 -1 0 1 2 3 XY r 0,5 -3 -2 -1 0 1 2 3 -3 -2 -1 0 1 2 3 XY r 0,95 -3 -2 -1 0 1 2 3 -3 -2 -1 0 1 2 3 XY r 1 Figur 5: Coeficiente de Correlacin Muestral y Grado de Asociacin lineal es importante Beobachter que un coeficiente de Korrelacin bajo keine Bedeutungen que keine existe relacin alguna entre las Variablen, sino simplemente que keine existe relacin lineal entre ellas. A partir del anlisis precedente sobre las desviaciones muestrales de las Variablen, se puede concluir que si la relacin es nicht in gerader Linie, la expresin ni ii yx1 puede tener un Tapferkeit muy cercano a cero, lo cual implica que el coeficiente de correlacin muestral r tambin Tendr Un valor muy cercano ein cero. Wie, el coeficiente de correlacin muestral keine 18 proporciona informacin adecuada sobre la existencia de una relacin keine lineare entre dos Variablen. Como nota adicional, es importante saber que el coeficiente de correlacin kein proporciona informacin sobre la causalidad entre las Reihe. Sie sind nicht eingeloggt. Existene pruebas estadsticas que Permiten determinar en cierta medida la causalidad entre Variablen, Komo por ejemplo la prueba de causalidad a la Granger (1969). Sin embargo, ein este nivel bsico de econometra la nica Forma de determinar causalidad ser eine travs de la teora econmica. 2.5. Uso del coeficiente de correlacin: Un modelo Simulado Para finalizar, considrese el caso de la relacin entre el consumo y el ingreso de una muestra simulada de 200 familias representativas de una Regin, que se vorhanden en la seccin 1. La simulacin se Ausfüh de tal Forma que exista una relacin lineal significativa entre el consumo y el ingreso, como se muestra en la Figura 6. -4 -2 0 2 4 -3 -2 -1 0 1 2 3 INGRESO CON SU MO Figura 6: Grfico de Dispersin entre Consumo e Ingreso Für eine grössere Darstellung klicken Sie auf das Bild. (2.11), se obtiene un coeficiente von correlacin igual a 0.99, de Usualmente, los paquetes economtricos permiten mostrar el coeficiente de correlacin ein 19 travs de una matriz de correlaciones, donde los elementos de la diagonal Sohn siempre iguales a 1 (pues muestran la correlacin entre cada variable consigo misma) y los que estn fuera de la diagonal Miden la correlacin entre cada par de variables. Matriz de Correlaciones: Consumo e Ingreso INGRESO CONSUMO INGRESO 1.000000 0.993350 CONSUMO 0.993350 1.000000 3. CORRELACIONES ESPREAS En esta seccin, se definieren el concepto de correlacin esprea. Adems, se presentan las CARACTERSTICAS ms importantes que pueden presentar los datos empricos utilizados para representar las Variablen econmicas, las cuales sern elementos importantes para analizar las causas de la presencia de correlaciones espreas 3.1. Definicin de Correlaciones Espreas El coeficiente de correlacin muestral permite establecer estadsticamente el grado de asociacin lineal entre dos Variablen a partir de una muestra o Conjunto de Observaciones representativas para cada una de ellas. Esto signa que el coeficiente de Korrelacin permite establecer la fuerza und el sentido de una posible relacin lineal entre dos Variablen, ein partir de una muestra repräsentativa. Sin embargo, muchas veces es posible encontrar un elevado coeficiente de correlacin entre dos Variablen que no tienen relacin alguna, es decir, Variablen que no presentan relacin justificada ein travs de alguna Teora especfica (Biologa, astronoma, Economa, entre otras). Cuando sucede esto, se dice que la korrelacin estadstica existente entre estas Variablen es una Korrelacin esprea o sin sentido. De esta forma, es posible Hablar de Korrelacin esprea entre Variablen relacionadas a la Wirtschaft, a la biologa, a la astronoma, entre otras. 20 formal, se dice que un alto coeficiente de correlacin entre dos Variablen es espreo si ste se explica por la presencia de un tercer Faktor y keine debido a la existencia de una relacin con sentido entre las Variablen analizadas. En este caso, la correlacin estadsticamente bedeutungsvolles entre las variables es una korrelacin esprea o sin sentido. Karl Pearson (1897) fue el primero en utilizar el trmino Korrelatin esprea para ilustrar el origen de una Korrelatin sin sentido entre Verhältnisse, ein travs del siguiente caso. Considrese un grupo de esqueletos que son desarmados en cada uno de sus huesos komponenten und que se vuelven ein armar unos nuevos utilizando huesos elegidos aleatoriamente de los distintos esqueletos originales. Si para verificar que los huesos de cada nuevo esqueleto corresponden al mismo individuo (lo cual no es cierto), se correlacionan la longitud de varios huesos de cada nuevo esqueleto divididos por la longitud del nuevo esqueleto al cual pertenecen, se obtiene un coeficiente de correlacin Muy alto y estadsticamente significativo. Si bien es cierto este resultado sugiere que los huesos de cada esqueleto analisado (los nuevos esqueletos) corresponden a los mismos individuos, esta no es una finalusin cierta. En este caso, se dice que existe una correlacin esprea pues la alta correlacin se explica por la presencia de un tercer componente: la Divisin de la longitud de los huesos que se correlacionaban por la longitud de cada nuevo esqueleto al cual pertenecen. Este casa ser estudiado en detalle en la seccin 4.1. Durante el siglo XX se estudiaron vieles casos de correlaciones espreas entre Variablen medidas ein travs de Daten de corte transversal y Serie de tiempo. El caso ms anecdtico de una correlacin esprea en un contexto de corte transversal fue presentado por J. Neyman en 1952. Neyman analiz la relacin entre la tasa de Nacimientos y la poblacin de cigeas en varias regiones, y encontr un alto coeficiente de correlacin entre estas Variablen. G. Udny Yule (1926) y Ploser und Schwerpunkt (1978). Por un lado, utilizando datos anuales para el perodo 1866-1911, G. Udny Yule encontr que el coeficiente de correlacin entre la tasa de mortalidad en Inglaterra y Gales y el PORCENTAJE de matrimonios en la Iglesia de Inglaterra Ära de 0,95. Por otro lado, utilizando datos anuales para el perodo 1897-1958, Ploser y Schwert encontraron que el coeficiente de correlacin 21 entre el Logaritmo del ingreso nominal de Estados Unidos y Logaritmo de la acumulacin de manchas solares Zeitalter de 0.91. Estos casos sugieren que kein siempre es posible asociér un coeficiente de correlacín alto a la existencia de una relacin lineale konzeptionelle (econmico, biolgico, o algn otro) entre dos variables. Entonces, lo nico seguro es que el coeficiente de correlacin permite deter la Fuerza y ​​sentido de una relacin lineal estadstica entre dos Variablen, ms kein necesariamente de una relacin lineal con sentido entre las mismas. Dado este problema, es importante analizar las causas por las cuales pueden surgir correlaciones espreas. Como se muestra en las siguientes secciones, las razones por las cuales surgen correlaciones espreas en un kontexto de corte transversal y en uno de serie de tiempo pueden ser distintas. Sin embargo, antes de realizar este anlisis, ser importante conocer la estructura de una serie que puede repräsentieren eine una variable econmica. 3.2. Estructura de una Serie Econmica En allgemeines, las Serie econmicas pueden presentan los siguientes componentes: a. Un componente tendencial, que puede ser determinstico (lineal o keine lineal) o estocstico. B. Unkomplizierte Beschaffenheit, Beschränkung der Beschaffenheit. C. Un componente unregelmäßig o modelable7. Es importante Siegel que kein todas las Serie econmicas presentan necesariamente los tres components. Por ejemplo, si los valores de las variables en cuestin estn representados por datos de corte transversal, es usual que no presenten componentes tendenciales ni estacionales. Sin embargo, con datos de series de tiempo, es muy probable que las variables presenten los tres componentes. 7 Existe un cuarto componente denominado cclico que muchas veces como en este caso se asume como parte del componente irregular o modelable. 22 En general, el componente ms importante de una serie econmica es el componente irregular o modelable, ya que contiene la mayor parte de la informacin econmicamente relevante. Sin embargo, existen situaciones en las que los componentes tendenciales determinsticos y o estocsticos poseen interpretacin econmica. Un caso muy conocido en el que el componente tendencial determinstico (lineal o no lineal) tiene sentido econmico lo constituye la tendencia determinstica del PBI real8. Esta tendencia representa el PBI potencial, el cual crece a una tasa igual a la pendiente de la tendencia. As, la diferencia entre la serie observada del PBI real y la tendencia (lineal o no lineal), permite obtener una aproximacin de las fluctuaciones del PBI o ciclo econmico. En la Figura 6 se muestra la serie mensual del PBI real de la economa peruana para el perodo enero 1933 - diciembre 2001, el PBI potencial (representado por una tendencia determinstica no lineal) y el ciclo econmico. 8.8 8.9 9.0 9.1 9.2 9.3 93 94 95 96 97 98 99 00 01 LPBIRSA HLPBIRSA -0.08 -0.04 0.00 0.04 0.08 93 94 95 96 97 98 99 00 01 CICLO Figura 6: El PBI real, el PBI potencial y el ciclo econmico Asimismo, las tendencias estocsticas de dos o ms series econmicas podran presentar una relacin con sentido econmico. Si dos series presentan tendencias estocsticas relacionadas entre s (es decir, comparten una tendencia estocstica), se dice que las variables cointegran. En trminos econmicos, si la relacin tiene sustento terico, se dice que estas variables presentan una relacin de largo plazo econmicamente significativa. En este caso, la tendencia estocstica que comparten las variables se interpreta como un camino comn del cual pueden desviarse temporalmente (corto plazo), pero no permanentemente (largo plazo). 8 Aunque tambin tiene sentido la tenencia estocstica. 23 4. CORRELACIONES ESPREAS Y DATOS DE CORTE TRANSVERSAL En esta seccin se muestran tres posibles formas en las que pueden presentarse correlaciones espreas en un contexto de corte transversal: el uso de ratios, observaciones atpicas o extraordinarias y grupos no relacionados. 4.1. Correlaciones Espreas y el uso de Ratios K. Pearson (1898) y R. Kronmal (1993) muestran que las correlaciones espreas pueden surgir entre dos variables que se miden como cocientes o ratios respecto de una tercera variable. Pearson, a travs de su ejemplo de los esqueletos construidos aleatoriamente, muestra la existencia de un coeficiente de correlacin significativo entre dos ratios cuyos componentes variables no presentan relacin alguna. Para entender esto, considrese las variables W, X, Y y Z, tales que se cumplen las siguientes condiciones: a. Y y X son independientes, por lo que no presentan relacin significativa alguna. B. Z es igual a la suma de Y, X y W En el contexto del caso analizado por Pearson, X e Y representan las longitudes de diferentes huesos que fueron correlacionados. Estos huesos pertenecen al mismo esqueleto aleatoriamente construido, por lo cual no estn relacionados. Z representa la longitud total del esqueleto aleatorio y W la longitud de los huesos de cada esqueleto aleatorio que no fueron utilizados en la correlacin. Si se contara con 200 esqueletos construidos aleatoriamente a partir de 200 esqueletos originales, entonces se tienen los siguientes pares de observaciones: ),( ),( ),( 200200 22 11 XY XY XY M 24 donde representa la longitud de un primer grupo de huesos del esqueleto artificial 1, representa la longitud de un segundo grupo de huesos del esqueleto artificial 1 Y representa la longitud de un primer grupo de huesos del esqueleto artificial 2 y representa la longitud de un segundo grupo de huesos del esqueleto artificial 2 y as sucesivamente. Si se dividen cada una de estas observaciones por la longitud total del esqueleto artificial al cual pertenecen, se obtienen las siguientes observaciones: 1Y 1X 2 2X ) , ( , ) , ( 200200200200 2222 1111 ZXZY ZXZY ZXZY M donde representa la longitud de un primer grupo de huesos del esqueleto artificial 1 como porcentaje de la longitud total de ste esqueleto, representa la longitud de un segundo grupo de huesos del esqueleto artificial 1 como porcentaje de la longitud total de este esqueleto y as sucesivamente. 11 ZY 11 ZX Para simular los resultados del caso presentado por Pearson, se construyeron artificialmente las variables W y YX. Z. con las caractersticas del problema que han sido mencionadas. Al analizar el coeficiente de correlacin entre las observaciones de Y y X, el resultado es un coeficiente de correlacin cercano a cero consistente con la realidad analizada: Matriz de Correlaciones entre X e Y X Y X 1.000000 -0.006123 Y -0.006123 1.000000 25 Esto puede observarse claramente en el grfico de dispersin de las mismas (Figura 7): -4 -2 0 2 4 6 -4 -2 0 2 4 X Y Figura 7: Relacin entre X e Y Sin embargo, al analizar la correlacin entre Y y X utilizando los ratios X Z e Y Z (cuyos componentes variables son X e Y), se obtiene un alto coeficiente de correlacin: Matriz de Correlaciones entre X Z e Y Z X Z Y Z X Z 1.000000 -0.965746 Y Z -0.965746 1.000000 lo cual tambin puede observarse claramente en el grfico de dispersin de las mismas. Como se muestra en la Figura 8: 26 -4 -2 0 2 4 -4 -2 0 2 4 XZ YZ Figura 8: Relacin entre X Z e Y Z De esta manera, la alta correlacin entre X Z e Y Z sera esprea o sin sentido. La alta correlacin est explicada por un tercer componente, Z, que esta relacionado a cada uno de los componentes variables, X e Y, que son independientes entre s. En el contexto del caso analizado por Pearson, dado que se sabe que no existe relacin entre las longitudes de los huesos de los esqueletos artificiales, un alto coeficiente de correlacin entre las longitudes de los huesos como porcentaje de la longitud total del esqueleto artificial al cual pertenecen es espreo o sin sentido. La explicacin de este alto coeficiente de correlacin est en la divisin de las longitudes de los huesos por la longitud total del esqueleto artificial al cual pertenecen. Una forma simple de detectar la presencia de correlaciones espreas cuando se utilizan ratios es analizar el grfico de dispersin y el coeficiente de correlacin entre los componentes variables de los mismos (cuando sea posible obtenerlos). 4.2. Presencia de Observaciones Atpicas (Out layers) Un segundo caso en el cual puede surgir correlaciones espreas se presenta cuando existen observaciones atpicas (out layers) tan importantes en magnitud que pueden generar un alto coeficiente de correlacin entre dos variables que no tienen relacin alguna. 27 Para mostrar este caso, se crearon dos series artificiales S1 y S2 independientes entre s, como se muestra en la matriz de correlaciones: Matriz de Correlaciones entre S1 y S2 S1 S2 S1 1.000000 0.024656 S2 0.024656 1.000000 y en el grfico de dispersin correspondiente: -4 -2 0 2 4 6 8 10 12 14 S1 S2 Figura 9: Relacin entre S1 y S2 Si una de las observaciones de esta muestra sta compuesta por valores muy diferentes a los usuales (relativamente muy grandes o muy pequeos), denominados atpicos u out layers, se obtendra la siguiente la matriz de correlaciones: Matriz de Correlaciones entre S1 y S2 con un out layer S1 S2 S1 1.000000 0.906860 S2 0.906860 1.000000 28 y el siguiente grfico de dispersin: -5 0 5 10 15 -5 0 5 10 15 S1 S2 S2 vs. S1 Figura 10: Relacin entre S1 y S2 Claramente, el alto coeficiente de correlacin (0.91) entre las variables S1 y S2 se debe a la presencia de un out layer, el cual fuerza la existencia de una relacin lineal entre las mismas (como se muestra en la Figura 10), a travs de una lnea que representa los datos. De manera natural, este resultado se puede generalizar a ms de un out layer. La identificacin de la existencia de correlaciones espreas entre dos variables debida a la presencia de uno o ms out layers, puede ser identificada fcilmente analizando el grfico de dispersin de las mismas. 4.3. Grupos No Relacionados Un tercer caso en el cual pueden surgir correlaciones espreas se presenta cuando existen dos o ms grupos de observaciones que relacionan dos variables, tales que el coeficiente de correlacin es bajo en cada grupo, pero alto cuando se analizan todos los grupos simultneamente. A estos grupos de observaciones se les denomina grupos no relacionados. 29 Para mostrar este caso, se crearon dos grupos de observaciones para dos variables ficticias C1 y C2 tales que estas no tienen relacin alguna, como se puede apreciar en sus respectivos grficos de dispersin: 7 8 9 10 11 12 13 6 8 10 12 14 C1 C 2 26 28 30 32 34 28 29 30 31 32 33 C1 C 2 Grupo 1 Grupo 2 Figura 11: Grupos No Relacionados y en sus matrices de correlaciones: Matriz de Correlaciones entre C1 y C2 en el Grupo 1 C1 C2 C1 1.000000 -0.066483 C2 -0.066483 1.000000 Matriz de Correlaciones entre S1 y S2 en el Grupo 2 C1 C2 C1 1.000000 0.062029 C2 0.062029 1.000000 30 Sin embargo, al analizar de manera conjunta ambos grupos de observaciones, se obtiene un grfico de dispersin donde se muestra que las observaciones pueden ser representadas por una lnea recta: 0 10 20 30 40 0 10 20 30 40 C1 C 2 C2 vs. C1 Figura 12: Correlacin entre Conglomerados y Correlacin Esprea La matriz de correlaciones confirma la existencia de una relacin lineal estadsticamente significativa: Matriz de Correlaciones entre C1 y C2 C1 C2 C1 1.000000 0.988784 C2 0.988784 1.000000 De esta manera, es posible encontrar un coeficiente de correlacin alto entre dos variables no relacionadas entre s, o correlacin esprea, si se analizan de manera conjunta dos o ms grupos no relacionados de observaciones. 31 Este caso de correlacin esprea entre grupos no relacionados puede ser considerado como una generalizacin del caso de correlaciones espreas cuando existen out-layers: un grupo estara constituido por el out-layer y el segundo por las observaciones restantes. El caso de correlacin esprea presentado por Neyman, a travs de su ejemplo de las cigeas, puede ser considerado como un caso de grupos no relacionados. Los datos utilizados por Neyman que se presentan en la cuadro 2 corresponden al nmero de mujeres (por cada 10 mil), cigeas y nacimientos, para una muestra de 54 localidades. El nmero de mujeres est aproximado a nmeros enteros es decir, si en una localidad existen 14 mil mujeres, entonces el nmero de mujeres por cada 10 mil es 1. 32 Cuadro 2: Informacin sobre Mujeres, Nacimientos y Cigeas 1 1 2 10 2 1 2 15 3 1 2 20 4 1 3 10 5 1 3 15 6 1 3 20 7 1 4 10 8 1 4 15 9 1 4 20 10 2 4 15 11 2 4 20 12 2 4 25 13 2 5 15 14 2 5 20 15 2 5 25 16 2 6 15 17 2 6 20 18 2 6 25 19 3 5 20 20 3 5 25 21 3 5 30 22 3 6 20 23 3 6 25 24 3 6 30 25 3 7 20 26 3 7 25 27 3 7 30 28 4 6 25 29 4 6 30 30 4 6 35 31 4 7 25 32 4 7 30 33 4 7 35 34 4 8 25 35 4 8 30 36 4 8 35 37 5 7 30 38 5 7 35 39 5 7 40 40 5 8 30 41 5 8 35 42 5 8 40 43 5 9 30 44 5 9 35 45 5 9 40 46 6 8 35 47 6 8 40 48 6 8 45 49 6 9 35 50 6 9 40 51 6 9 45 52 6 10 35 53 6 10 40 54 6 10 45 Corr (C, N) 0,83 NacimientosLocalidad Mujeres Cigeas Si se analiza toda la muestra, se observa que el coeficiente de correlacin entre el nmero de cigeas y el nmero de nacimientos es 0.83, lo cual indicara la existencia de una relacin lineal estadsticamente significativa entre estas variables. Sin embargo, no existe una relacin con algn sentido diferente del estadstico, pues no es posible afirmar a partir de este 33 resultado que las cigeas traen a los bebs (a mayor nmero de cigeas, mayor nmero de nacimientos). Cuadro 3: Informacin por Grupos 1 1 2 10 2 1 2 15 3 1 2 20 4 1 3 10 5 1 3 15 6 1 3 20 7 1 4 10 8 1 4 15 9 1 4 20 Corr (C, N) 0.00 10 2 4 15 11 2 4 20 12 2 4 25 13 2 5 15 14 2 5 20 15 2 5 25 16 2 6 15 17 2 6 20 18 2 6 25 Corr (C, N) 0.00 19 3 5 20 20 3 5 25 21 3 5 30 22 3 6 20 23 3 6 25 24 3 6 30 25 3 7 20 26 3 7 25 27 3 7 30 Corr (C, N) 0.00 28 4 6 25 29 4 6 30 30 4 6 35 31 4 7 25 32 4 7 30 33 4 7 35 34 4 8 25 35 4 8 30 36 4 8 35 Corr (C, N) 0.00 37 5 7 30 38 5 7 35 39 5 7 40 40 5 8 30 41 5 8 35 42 5 8 40 43 5 9 30 44 5 9 35 45 5 9 40 Corr (C, N) 0.00 46 6 8 35 47 6 8 40 48 6 8 45 49 6 9 35 50 6 9 40 51 6 9 45 52 6 10 35 53 6 10 40 54 6 10 45 Corr (C, N) 0.00 G R U PO 5 G R U PO 6 G R U PO 1 G R U PO 2 G R U PO 3 G R U PO 4 Localidad Mujeres Cigeas Nacimientos 34 La existencia de un coeficiente de correlacin alto se explica por la presencia de grupos de datos no relacionados en la muestra analizada. El cuadro 3 muestra la informacin utilizada por Neyman en seis grupos de localidades de acuerdo al nmero de mujeres de las mismas. Al analizar el coeficiente de correlacin y el grfico de dispersin entre el nmero de cigeas y de nacimientos para cada grupo de localidades (Figura 13), se observa que en cada grupo de localidades el nmero de cigeas y de nacimientos no estn correlacionados, como era de esperarse. 8 10 12 14 16 18 20 22 1.5 2.0 2.5 3.0 3.5 4.0 4.5 CIGEAS N AC IM IE N TO S 14 16 18 20 22 24 26 3.5 4.0 4.5 5.0 5.5 6.0 6.5 CIGEAS N AC IM IE N TO S 18 20 22 24 26 28 30 32 4.5 5.0 5.5 6.0 6.5 7.0 7.5 CIGEAS N AC IM IE N TO S 24 26 28 30 32 34 36 5.5 6.0 6.5 7.0 7.5 8.0 8.5 CIGEAS N AC IM IE N TO S 28 30 32 34 36 38 40 42 6.5 7.0 7.5 8.0 8.5 9.0 9.5 CIGEAS N AC IM IE N TO S 34 36 38 40 42 44 46 7.5 8.0 8.5 9.0 9.5 10.0 10.5 CIGEAS N AC IM IE N TO S Figura 13: Relacin entre nacimientos y cigeas para cada grupo de localidades. Sin embargo, al considerar (por ejemplo) los grupos 1 y 6 en una sola muestra, se obtiene un coeficiente de correlacin alto (0.92), al igual que cuando se consideran todos los grupos simultneamente (0.82), lo cual se muestra a travs de los grficos de dispersin correspondientes de la Figura 14. De esta forma, se concluye que el alto coeficiente de correlacin entre las cigeas y los nacimientos es una correlacin esprea, explicada por la presencia de conglomerados. 35 0 10 20 30 40 50 0 2 4 6 8 10 12 CIGEAS N A C IM IE N TO S RELACIN ENTRE NACIMIENTOS Y CIGEAS: GRUPOS 1 Y 6 0 10 20 30 40 50 0 2 4 6 8 10 12 CIGEAS N A C IM IE N TO S RELACIN ENTRE NACIMIENTOS Y CIGEAS: GRUPOS 1 AL 6 Figura 14:Relacin lineal entre grupos no relacionados 5. CORRELACIONES ESPREAS Y SERIES DE TIEMPO En el contexto de series de tiempo, las correlaciones espreas pueden surgir por las mismas razones consideradas para el contexto de corte transversal: el uso de ratios, la presencia de out layers y grupos no relacionados. Sin embargo, las tendencias determinsticas o estocsticas - propias de la mayora de series de tiempo tambin pueden generar correlaciones espreas entre variables que no tienen sentido alguno. 5.1. Simulacin de Series de Tiempo Para demostrar que la presencia de componentes tendenciales pueden generan coeficientes de correlacin significativamente altos, se utilizan dos series de tiempo de 100 observaciones cada una que representan a dos variables X e Y. Estas series se construyen artificialmente de tal forma que no presentan relacin lineal alguna (considerando alguna teora especfica), como lo muestra la matriz de correlaciones: 36 Matriz de Correlaciones para X e Y X Y X 1.000000 0.032141 Y 0.032141 1.000000 A partir de sta matriz se observa que la correlacin entre X e Y es prcticamente cero (0.03), lo cual es consistente con la construccin de las dos series. La Figura 15 muestra el comportamiento de estas variables a lo largo de las 100 observaciones. -3 -2 -1 0 1 2 -3 -2 -1 0 1 2 3 10 20 30 40 50 60 70 80 90 X Y Figura 15: Series Artificiales X e Y A partir de esta figura, no es posible afirmar que si una de las variables aumenta, la otra tambin aumenta, disminuye o no se mueve. Es decir, no es posible inferir la existencia de una relacin positiva, negativa o simplemente que no exista relacin. Sin embargo, el grfico de dispersin para X e Y - en el cual se han normalizado las unidades de medida de las series9 - s permite afirmar que no existe relacin lineal entre estas variables, como se muestra en la Figura 16. En este ejemplo, el coeficiente de correlacin funciona bien, pues es posible afirmar que no existe relacin lineal estadstica ni significativa. 9 En adelante, los grficos de dispersin que se presenten utilizarn datos normalizados. 37 -3 -2 -1 0 1 2 3 -3 -2 -1 0 1 2 X Y Figura 16: Grfico de dispersin entre X e Y. No existe relacin lineal significativa. Si a cada una de estas dos series construidas artificialmente se les aade una tendencia determinstica (lineal) que crece con el tiempo10, pero sin significado alguno: 1tXXT tt 2tYYT tt se obtiene una matriz de correlaciones como la siguiente: Matriz de Correlaciones para XT e YT XT YT XT 1.000000 0.997099 YT 0.997099 1.000000 Como se puede observar a partir de la matriz de correlaciones, el simple hecho de aadir una tendencia lineal creciente a cada una de las variables originales, genera una fuerte relacin lineal positiva entre las nuevas variables XT e YT (r 0,99). 10 Tambin podra ser una tendencia lineal decreciente, los resultados son similares en trminos de la existencia de una relacin lineal significativa estadsticamente, pero negativa. 38 -20 0 20 40 60 80 100 10 20 30 40 50 60 70 80 90 XT YT Figura 17: Series Artificiales XT e YT A partir de la Figura 17, se puede observar que ambas series crecen a lo largo del tiempo, lo cual muestra la posible existencia de una relacin positiva entre las variables XT e YT, cuya fuerza y linealidad pueden inferirse a partir del grfico de dispersin (Figura 18). Adems, el alto grado de correlacin se refleja por el hecho de que los puntos que representan las observaciones estn muy cercanos entre s y alrededor de una recta. -2 -1 0 1 2 -2 -1 0 1 2 XT YT Figura 18: Grfico de dispersin entre XT e YT. 39 Estos mismos resultados se obtienen si se aade una tendencia estocstica11 (sin ningn significado especial) a cada una de las series originalmente creadas, X e Y, crendose de esta forma dos nuevas variables, XRW e YRW: 1 ttt ZXXRW 2 ttt ZYYRW Las nuevas variables, como en el caso anterior, muestran un coeficiente de correlacin muy cercano a uno: Matriz de Correlaciones para XRW e YRW XRW YRW XRW 1.000000 0.989578 YRW 0.989578 1.000000 Al observar el grfico de las series (Figura 19), se puede apreciar que ambas crecen, lo cual inducira a pensar (al menos estadsticamente) que la correlacin entre las variables es positiva y aparentemente fuerte. -10 0 10 20 30 40 0 10 20 30 40 10 20 30 40 50 60 70 80 90 XRW YRW Figura 19: Series Artificiales XW e YW 11 Una tendencia estocstica es de la forma: ttt ZZ 1. donde. Tambin se le conoce como paseo aleatorio o random walk. ),0( 2 iidt 40 En efecto, al observar el grfico de dispersin de las variables XW e YW (Figura 20), se puede apreciar que la correlacin es significativamente alta (fuerte) y positiva. -2 -1 0 1 2 -2 -1 0 1 2 XRW YR W Figura 20: Relacin lineal significativa entre XW e YW. Estos ejemplos, que utilizan series artificiales, muestran que un coeficiente de correlacin alto entre dos variables que no tienen relacin alguna puede ser producto de la existencia de una tendencia lineal (determinstica) o una tendencia estocstica. 5.2. Tendencias y Correlaciones Espreas Considrense las variables XT e YT tales que cada una de ellas contiene un componente modelable (X e Y) y una tendencia lineal determinstica ( t y ), como las simuladas anteriormente: 1 2t 1tXXT tt 2tYYT tt Dada la estructura de las series, podran presentarse cuatro situaciones diferentes: 41 a. Relacin con sentido entre los componentes irregulares o modelables ( X e Y ) y entre los componentes tendenciales ( t y ). 1 2t b. Relacin con sentido entre los componentes irregulares o modelables ( X e Y ), pero no entre los componentes tendenciales ( t y t ). 1 2 c. No existe relacin con sentido entre los componentes irregulares o modelables ( X e Y ), pero s entre los componentes tendenciales ( t y ). 1 2t d. No existe relacin con sentido entre los componentes irregulares o modelables ( X e Y ) ni entre los componentes tendenciales ( t y ). 1 2t En todos los casos, a excepcin de la situacin d, se afirma que existe una relacin con sentido entre XT e YT, pues existe relacin con sentido entre al menos uno de sus componentes. Sin embargo, en todos los casos existe una relacin estadsticamente significativa entre XT e YT medida a travs del coeficiente de correlacin entre las variables, lo cual se explica por la presencia de las tendencias lineales (pesar de que no estn relacionadas significativamente). Este resultado sera el mismo si el componente tendencial de las variables fuera estocstico. As, cuando se analizan dos series temporales que presentan tendencias que no tienen significado alguno, el coeficiente de correlacin no siempre esta asociado a una relacin con sentido. Cuando esto sucede, como en el caso d, se dice que la correlacin es esprea o sin sentido: el factor que genera la correlacin esprea es el componente tendencial. En otro caso, el coeficiente de correlacin si estara asociado a una relacin con sentido entre las variables. 5.3. Identificacin de Correlaciones Espreas Dado que es posible la existencia de correlaciones espreas en series de tiempo que presentan tendencias (determinsticas o estocsticas), que no tienen algn significado especial, es importante tratar de establecer alguna metodologa para identificar este problema. 42 Para este propsito, es necesario entender el concepto de variables en niveles y en primeras diferencias, pues la metodologa de identificacin consistir en el anlisis de los coeficientes de correlacin de las mismas. 5.3.1. Variables en niveles y primeras diferencias Una variable en niveles es cualquier variable que se toma como punto de partida para cualquier transformacin posterior. Por ejemplo, el nivel del PBI nominal en 1999 es el valor del PBI nominal en 1999, el nivel del gasto pblico en 1999 es el saldo del gasto pblico en 1999, el nivel de la tasa de crecimiento anual del PBI en 1999 es la tasa de crecimiento registrada entre 1999 y 1998, entre otros ejemplos. Una variable est expresada en primeras diferencias en el perodo t si se obtiene como la diferencia entre su valor actual y su valor pasado: 1 ttt XXX (4.1) As, por ejemplo, la primera diferencia del PBI nominal en 1999 es la diferencia entre el valor del PBI nominal en 1999 y el valor del PBI nominal en 1998 la primera diferencia del gasto pblico en 1999 es la diferencia entre el saldo del gasto pblico en 1999 y el saldo del gasto pblico en 1998 la primera diferencia de la tasa de crecimiento anual del PBI en 1999 es la diferencia entre la tasa de crecimiento entre 1999 y 1998 y la tasa de crecimiento entre 1998 y 1997. Los ejemplos planteados muestran que la definicin de variable en niveles y en primeras diferencias es relativa. As, la primera diferencia de podra considerarse como una variable en niveles, mientras que la segunda diferencia de. definida como: tX Xt )()( 211 2 ttttt XXXXX (4.2) podra considerarse como la primera diferencia de la primera diferencia de . tX 43 5.3.2. Primeras Diferencias y Eliminacin de Tendencias Dadas las definiciones de variables en niveles y primeras diferencias, es fcil mostrar que si una variable en niveles presenta una tendencia lineal, su primera diferencia ya no presenta ese componente tendencial. Para verificar esto, considrense las variables simuladas XT e YT: 1tXXT tt 2tYYT tt donde las tendencias no tienen significado alguno. La primera diferencia de la serie X est dada por: )1 11 1 1 (t X-tXXTXTXT ttttt 111 1 t-X-tXXT ttt )X-XXT ttt 1(1 tt XXT 1 (3.3) De manera anloga, la primera diferencia de Y est dada por: )1 11 1 1 (t Y-tYYTYTYT ttttt tt YYT 1 (3.5) As, la primera diferencia de una variable elimina todo componente tendencial determinstico existente en su expresin en niveles. Sin embargo, las primeras diferencias de los componentes irregulares o modelables permanecen. Si las variables en niveles presentaran un componente tendencial estocstico, la primera diferencia tambin lo eliminara12. Dado el supuesto que Xt y Yt no estn relacionados, si se calcula el coeficiente de correlacin entre las primeras diferencias de las variables, ste sera bajo a pesar de que el coeficiente en niveles es alto, cmo se mostr en la seccin 5.1. 12 Este es un ejercicio que el lector debera resolver. 44 Matriz de Correlaciones para las primeras diferencias de XT e YT XT YT XT 1.000000 0.002450 YT 0.002450 1.000000 De esta manera, la relacin esprea entre X e Y presenta un coeficiente de correlacin alto para los niveles de las variables y uno bajo para las primeras diferencias de las variables. Sin embargo, si existiera una relacin con sentido entre Xt e Yt, entonces el coeficiente de correlacin entre los niveles de las variables sera alto, al igual que el coeficiente de correlacin para sus primeras diferencias. El anlisis precedente permite establecer la siguiente metodologa de identificacin de correlaciones espreas en un contexto de series de tiempo, bajo el supuesto de que los componentes tendenciales (determinsticos o estocsticos) no tienen sentido alguno: a. Si el coeficiente de correlacin de los niveles de las variables es significativamente alto, pero el coeficiente de correlacin de las primeras diferencias de las mismas es bajo, entonces la correlacin entre los niveles de las variables es una correlacin esprea o sin sentido alguno. B. Si el coeficiente de correlacin de los niveles y de las primeras diferencias de las variables es significativamente alto, entonces la correlacin entre los niveles de las variables es una correlacin con sentido. 5.3. Correlaciones Espreas y Correlaciones con Sentido Econmico En muchas ocasiones, la teora econmica establece que es posible encontrar relaciones con sentido entre pares de variables bajo ciertas circunstancias. Por ejemplo, no siempre existe una relacin con sentido econmico entre los precios de todos los bienes de la economa, pero s entre los precios de los bienes producidos por dos empresas que compiten en el mismo mercado. De hecho, si los precios de dos bienes cualesquiera presentan un componente tendencial sin sentido econmico, es posible encontrar un coeficiente de correlacin alto entre ellos sin que eso implique que guarden alguna relacin con sentido. 45 En casos como estos, donde es posible que exista relacin con sentido econmico y se intenta encontrar evidencia sobre ello, es posible aplicar la metodologa presentada en la seccin anterior. As, bajo el supuesto de que los componentes tendenciales de cada una de las variables econmicas relacionadas no tiene sentido: a. Si el coeficiente de correlacin de los niveles de las variables es significativamente alto, pero el coeficiente de correlacin de las primeras diferencias de las mismas es bajo, entonces la correlacin entre los niveles de las variables es una correlacin esprea o sin sentido econmico. B. Si el coeficiente de correlacin de los niveles y de las primeras diferencias de las variables es significativamente alto, entonces la correlacin entre los niveles de las variables es una correlacin con sentido econmico. Esta metodologa para identificar correlaciones espreas a partir de los coeficientes de correlacin, fue utilizada por Stigler y Sherwin (1985). La hiptesis principal del artculo en el cual ponen en prctica la metodologa es la siguiente: Si dos bienes o servicios compiten en el mismo mercado, sus precios deberan estar muy correlacionados. Sin embargo, como la mayora de precios muestran movimientos tendenciales en el tiempo (que se asumen que no tienen interpretacin econmica en muchos casos), los autores analizaron la correlacin entre los niveles de los precios y sus primeras diferencias (cambio en lo precios), para poder identificar la existencia de una correlacin con sentido econmico. Los resultados del anlisis mostraron que el valor del coeficiente de correlacin no disminuye drsticamente al utilizar las variables en niveles y en primeras diferencias. De esta manera, los autores concluyen que los bienes estudiados compiten en el mismo mercado. 46 6. APLICACIONES: IDENTIFICACIN DE RELACIONES ESPREAS ENTRE VARIABLES ECONMICAS En esta seccin se presentan aplicaciones del coeficiente de correlacin para el anlisis de relaciones bivariadas y la identificacin de posibles correlaciones espreas. Para este fin, se analizan diferentes relaciones bivariadas entre variables econmicas empleando datos mensuales para el Per (series de tiempo) que abarcan el perodo enero 1993 - diciembre 2001. 6.1. Descripcin de los datos utilizados Los datos empleados para realizar las aplicaciones han sido obtenidos del Banco Central de Reserva del Per (Boletines Semanales, Memorias Anuales y pgina web13), y corresponden a ocho variables importantes para la economa peruana. Las series escogidas como variables proxy (aproximadas) para cada una de las variables econmicas utilizadas fueron: la emisin primaria (EMISION), el ndice de precios al consumidor con base 1994 (IPC94), el circulante nominal (CIR), el producto bruto interno real (PBIR), el tipo de cambio informal promedio (TCIP), el crdito de las empresas bancarias al sector privado en moneda extranjera (CREME), la tasa de inters pasiva en moneda nacional (TIPMN) y la tasa de inters activa en moneda extranjera (TAMEX). Para obtener series que permitan representar relaciones bivariadas con sentido econmico, se realizaron algunas transformaciones. En primer lugar, se eliminaron los componentes cclicos o estacionales de las series EMISIN, CIR y PBIR, a travs del procedimiento de desestacionalizacin ratio moving average-multiplicative del programa Eviews. Las series desestacionalizadas se denominaron EMISIONSA, CIRSA y PBIRSA. Los componentes estacionales dependen de la economa analizada. Por ejemplo, la emisin monetaria en el caso peruano presenta un componente estacional representado por picos en los meses de julio y diciembre, que se observan en la figura 21. 13 bcrp. gob. pe 47 1000 2000 3000 4000 5000 6000 93 94 95 96 97 98 99 00 01 EMISION Figura 21: La Emisin en el Per y su estacionalidad Luego de aplicar a la serie EMISIN el proceso ratio moving average-multiplicative, la serie desestacionalizada (EMISIONSA) ya no presenta el componente cclico, como se muestra en la Figura 22: 1000 2000 3000 4000 5000 6000 93 94 95 96 97 98 99 00 01 EMISIONSA Figura 22: Emisin desestacionalizada Como segundo las variables nominales CIR, CREME, TAMEX y TCIP fueron transformadas a reales (CR, CRERME, TARMEX y TCIPR), utilizando el IPC94 y el TCIP para el caso de las variables denominadas en moneda extranjera. Finalmente, para 48 homogenizar la escala de las variables se aplicaron logaritmos a todas las series con excepcin de las tasas de inters, generando as las series finales LEMISIONSA, LCR, LPBIRSA, LIPC94, LCRERME y LTCIPR. 6.2. Relaciones Econmicas y Correlaciones Espreas Para aplicar los conceptos de correlacin y correlaciones espreas, se analizarn seis relaciones bivariadas importantes propuestas por la teora macroeconmica convencional: dinero y precios, demanda por dinero real e ingreso, demanda por dinero real y tasa de inters nominal en moneda nacional, produccin y tasa de inters real en moneda extranjera, produccin y crdito real en moneda extranjera, produccin y tipo de cambio real. 6.2.1. Dinero y Precios Para analizar la relacin entre dinero y precios se utilizaron como variables proxy LEMISIONSA y LIPC94. La teora macroeconmica establece la existencia de una relacin positiva entre estas variables. Por un lado, la ecuacin cuantitativa del dinero, definida como: PQMV establece que en el largo plazo bajo el supuesto que la velocidad de circulacin del dinero (V) es estable y que el producto est en su nivel potencial o de pleno empleo - un aumento de la cantidad de dinero tendr efectos nicamente sobre el nivel de precios as, un aumento de 10 por ciento en la cantidad de dinero generar en el largo plazo un incremento de 10 por ciento en el nivel de precios. Este resultado es uno de los supuestos que subyacen a la nueva macroeconoma clsica. Por otro lado, considerando el modelo de la sntesis neoclsica (que asume una oferta agregada con pendiente positiva), un aumento de la cantidad de dinero genera un aumento en la demanda agregada y por lo tanto un aumento en el producto (fenmeno denominado demanda efectiva), el cual va acompaado de un aumento del nivel de precios, como se muestra en la Figura 23: 49 DA(M0) DA(M1) OA P1 P0 Y0 Y1 Figura 23: Demanda, Oferta, Produccin y Precios Para verificar la existencia de un sustento emprico de esta relacin terica entre dinero y precios, se grafican (Figura 24) las series LEMISIONSA e IPC94 para el periodo enero 1993 diciembre 2001: 7.2 7.6 8.0 8.4 8.8 4.2 4.4 4.6 4.8 5.0 5.2 93 94 95 96 97 98 99 00 01 LEMISIONSA LIPC94 Figura 24: Dinero y Precios El grfico muestra que ambas series crecen a lo largo del tiempo y de forma parecida. Para verificar la existencia de una relacin lineal se utiliza el grfico de dispersin de ambas series: 50 -3 -2 -1 0 1 2 -3 -2 -1 0 1 2 LEMISIONSA LI PC 94 Figura 25: Grfico de dispersin entre los niveles de Emisin y Precios Como se puede apreciar en la Figura 25, la relacin entre LEMISIONSA y LIPC94 es aproximadamente lineal (los puntos pueden ser representados por una lnea recta) y positiva. Para determinar la fuerza de la relacin entre estas variables se utiliza la matriz de correlaciones: LEMISIONSA LIPC94 LEMISIONSA 1.000000 0.988957 LIPC94 0.988957 1.000000 Como era de esperar por lo establecido por la teora econmica, la correlacin entre los niveles de las variables es positiva y fuerte (0.99). Para comprobar si la relacin lineal entre las variables analizadas es o no esprea, es necesario analizar la correlacin entre las primeras diferencias de las variables. DLEMISIONSA DLIPC94 DLEMISIONSA 1.000000 0.224576 DLIPC94 0.224576 1.000000 51 La matriz de correlaciones entre las primeras diferencias de las variables muestra una relacin lineal positiva y dbil entre DLEMISIONSA y DLIPC94 (0.22), lo cual tambin puede observarse en el grfico de dispersin: -2 0 2 4 6 -4 -2 0 2 4 DLEMISIONSA D LI PC 94 Figura 26: Grfico de dispersin entre las primeras diferencias de la Emisin y los Precios Bajo el supuesto de que las tendencias de las series no tienen sentido alguno, este resultado permitira concluir que la relacin entre el dinero y el nivel de precios de la economa es esprea. Sin embargo, si se considera la teora monetarista de la determinacin de los precios, las tendencias que presentan cada una de las series se interpretan como la senda de largo plazo que siguen as, en este caso la correlacin sera una correlacin con sentido econmico: el dinero determina los precios en el largo plazo. 6.2.2. Demanda por Dinero Real e Ingreso Real. Como segundo ejemplo, se analiza la relacin entre la demanda por dinero real y el ingreso real, relacionados tericamente a travs del modelo clsico de demanda por dinero real. En este modelo, el dinero se utiliza solamente para realizar transacciones. Para verificar empricamente la existencia de sta relacin terica se utilizaron como variables proxy LCR (para la demanda por dinero real) y LPBIRSA (para el ingreso real). 52 El grfico de la demanda por dinero real y el ingreso real (figura 27), permite apreciar un comportamiento creciente en ambas series, para el periodo enero 1993 diciembre 2001: 2.4 2.6 2.8 3.0 3.2 3.4 8.8 8.9 9.0 9.1 9.2 9.3 93 94 95 96 97 98 99 00 01 Circulante Real (logs) PBI Real (logs) Figura 27: Dinero e Ingreso reales El grfico de dispersin (Figura 28), sugiere la existencia de una relacin aproximadamente lineal positiva entre las variables LCR y LPBIRSA. -3 -2 -1 0 1 2 -3 -2 -1 0 1 2 LCR LP BI R SA Figura 28: Grfico de dispersin entre los niveles de Dinero e Ingreso reales 53 La matriz de correlaciones indica que la existencia de un grado de asociacin lineal entre las variables positivo y bastante alto (0.95), corroborndose de esta forma lo establecido por la teora econmica y lo observado preliminarmente en el grfico de dispersin: Matriz de Correlaciones en Niveles: Dinero e Ingreso Reales LCR LPBIRSA LCR 1.000000 0.953381 LPBIRSA 0.953381 1.000000 Sin embargo, para determinar si la correlacin entre estas variables es una correlacin esprea, es necesario analizar la matriz de correlaciones entre las primeras diferencias de las mismas: Matriz de Correlaciones en Primeras Diferencias: Dinero e Ingreso Reales DLCR DLPBIRSA DLCR 1.000000 0.036931 DLPBIRSA 0.036931 1.000000 La matriz muestra una relacin lineal dbil entre las primeras diferencias de las variables. Por lo tanto, se concluye que la correlacin entre la demanda por dinero real y el ingreso es esprea o sin sentido, lo cual implica que la correlacin entre las variables est explicada por la presencia de componentes tendenciales. Nuevamente, bajo el supuesto de que las tendencias de las series no tienen sentido alguno, este resultado permitira concluir que la relacin entre el dinero real y el ingreso real es esprea. Sin embargo, si se considera como relevante la relacin de largo plazo entre el dinero real y el ingreso real, entonces las tendencias que presentan cada una de las series se interpretan como la senda de largo plazo que siguen cada una de ellas en este caso, la correlacin sera una correlacin con sentido econmico: en el largo plazo la demanda real por dinero esta ntimamente relacionada con el ingreso real. 54 6.2.3 Produccin, Tasa de Inters, Crdito y Tipo de Cambio reales La teora macroeconmica tradicional establece relaciones econmicamente significativas entre la produccin, la tasa de inters, el crdito y tipo de cambio - todas expresadas en trminos reales. Por un lado, un aumento de la tasa de inters real encarece el crdito y por lo tanto desincentiva la inversin en trminos reales, generndose finalmente un efecto adverso sobre la produccin. Por ello, existe una relacin directa o positiva entre el producto real y el crdito real, y una relacin inversa o negativa entre el producto real y la tasa de inters real. Por otro lado, la relacin entre el producto real y el tipo de cambio real no es nica y depende de las caractersticas de la economa. Por ejemplo, en una economa como la peruana donde aproximadamente el 80 por ciento de los activos monetarios estn denominados en dlares y la carga de la deuda externa tambin denominada en dlares constituye ms del 20 por ciento del producto, un aumento del tipo de cambio tendra efectos negativos sobre el producto. Sin embargo, en otras economas, la relacin entre el producto y el tipo de cambio reales es positiva: un incremento del tipo de cambio real incentiva las exportaciones netas, generndose un aumento de la demanda agregada y en consecuencia por demanda efectiva un aumento del producto. 8.8 8.9 9.0 9.1 9.2 9.3 0.004 0.006 0.008 0.010 0.012 0.014 0.016 0.018 0.020 93 94 95 96 97 98 99 00 01 LPBIRSA TARMEX 8.8 8.9 9.0 9.1 9.2 9.3 3.0 3.5 4.0 4.5 93 94 95 96 97 98 99 00 01 LPBIRSA LCRERME 55 8.8 8.9 9.0 9.1 9.2 9.3 -3.95 -3.90 -3.85 -3.80 -3.75 -3.70 -3.65 93 94 95 96 97 98 99 00 01 LPBIRSA LTCIPR Figura 29: Producto, Tasa de Inters, Crdito y Tipo de Cambio reales Las variables proxy utilizadas para medir la produccin, la tasa de inters, el crdito y el tipo de cambio reales fueron LPBIRSA, TARMEX, CRERME y LTCIPR, respectivamente. Para el caso de la tasa de inters y el crdito, se utilizaron las series correspondientes a moneda extranjera, dada la importancia de la dolarizacin de la economa peruana para el periodo estudiado. La contrapartida emprica para las relaciones bivariadas establecidas por la teora econmica se aprecia en los grficos de las series de la Figura 29, verificndose el sentido de las relaciones establecidas por la teora. -2 0 2 4 -3 -2 -1 0 1 2 LPBIRSA TA R M EX -2 -1 0 1 2 3 -3 -2 -1 0 1 2 LPBIRSA LT C IP R 56 -3 -2 -1 0 1 2 -3 -2 -1 0 1 2 LPBIRSA LC R ER M E Figura 30: Relaciones Bivariadas entre Producto, Tasa de Inters, Crdito y Tipo de Cambio Reales. Los grficos de dispersin de la Figura 30, confirman la existencia de una relacin lineal inversa, tanto para el caso del producto real vs. la tasa de inters real como para el del producto real vs. el tipo de cambio real, y una relacin directa entre el producto y el crdito reales. La matriz de correlaciones de las variables permite determinar la fuerza de estas relaciones bivariadas lineales: LPBIRSA TARMEX LCRERME LTCIPR LPBIRSA 1.000000 -0.940297 0.947747 -0.431767 TARMEX -0.940297 1.000000 -0.871744 0.256799 LCRERME 0.947747 -0.871744 1.000000 -0.440914 LTCIPR -0.431767 0.256799 -0.440914 1.000000 Bajo el supuesto de que los componentes tendenciales que presentan cada una de las series no tienen sentido alguno, la matriz de correlaciones en primeras diferencias de las mismas permite concluir que las relaciones bivariadas entre el producto y la tasa de inters, el crdito y el tipo de cambio reales son espreas: 57 DLPBIRSA DTARMEX DLCRERME DLTCIPR DLPBIRSA 1.000000 -0.178665 0.248468 0.077523 DTARMEX -0.178665 1.000000 -0.016953 0.090657 DLCRERME 0.248468 -0.016953 1.000000 -0.131397 DLTCIPR 0.077523 0.090657 -0.131397 1.000000 El grfico de dispersin de las variables en primeras diferencias (Figura 31), refuerza la conclusin, pues muestra la ausencia de relacin alguna entre las variables: -4 -2 0 2 4 -4 -2 0 2 4 DLPBIRSA D TA M EX R -4 -2 0 2 4 -4 -2 0 2 4 DLPBIRSA D LC R ER M E -4 -2 0 2 4 -4 -2 0 2 4 DLPBIRSA D LT C IP R Figura 31: Grficos de dispersin de las primeras diferencias de las series. Sin embargo, una vez ms, si la teora econmica establece la posibilidad de una relacin de largo plazo entre cualquiera de los pares de variables analizados, entonces los componentes tendenciales tendran sentido (en este caso econmico) y por lo tanto las correlaciones no seran espreas. 58 7. CONCLUSIONES (1) El coeficiente de correlacin es un instrumento estadstico que permite establecer la fuerza y direccin de una relacin lineal estadstica entre dos variables a partir de una muestra determinada, bajo el supuesto de que sta es representativa. (2) Existen casos en los que un coeficiente de correlacin significativo entre dos variables es consecuencia de un tercer factor diferente de ellas y no de la existencia de una relacin lineal con algn sentido entre las mismas bajo la consideracin de alguna teora conocida (por ejemplo, biolgica, fsica, econmica, entre otras). Cuando esto sucede, se dice que la correlacin es esprea. La correlaciones espreas pueden presentarse cuando las variables analizadas son medidas a travs de datos de corte transversal o series de tiempo. (3) Entre las principales causas de las correlaciones espreas en un contexto de corte transversal figuran el uso de ratios, la presencia de datos atpicos (out layers) y de grupos no relacionados. Para el caso de correlaciones espreas causadas por el uso de ratios, la deteccin implica el anlisis de la correlacin y sentido de los componentes variables (numeradores) de los mismos. Para el caso de datos atpicos el grfico de dispersin es un instrumento muy importante para identificarlos. Para el caso de grupos no relacionados, es posible detectar la presencia de correlaciones espreas analizando el grfico de dispersin y la estructura de la muestra. (4) Para el caso de series temporales, adems de las causas mencionadas para el contexto de corte transversal, la presencia de tendencias (determinsticas o estocsticas) que carecen de sentido alguno tambin pueden generar correlaciones espreas. Bajo estas circunstancias, es posible detectar la presencia de correlaciones espreas analizando el coeficiente de correlacin de los niveles y las primeras diferencias de las series. Si el coeficiente de correlacin es considerado significativamente alto en niveles y en primeras diferencias, entonces la correlacin no es esprea. Si el coeficiente de correlacin es considerado significativamente alto en niveles mas no as en primeras diferencias, entonces la correlacin es esprea. 59 Referencias Bibliogrficas Banco Central de Reserva del Per Memoria Anual. Varios nmeros. Banco Central de Reserva del Per Boletn Semanal. Varios nmeros. Granger, C. W. 1969 Investigating Causal Relations by Econometric Models and Cross-Spectral Methods. Economtrica, Vol. 37. Kronmal, Richard 1993 Spurious Correlation and the Fallacy of the Standard Ratio Revisited. Journal of the Royal Statistical Society. Vol. 156, parte 3, p. 379-392. Liebetrau, Albert M. 1983 Mesures of Association. Newbury Park: Sage. Lima, Elon Lages 1997 Anlisis Real. Lima: Per Offset, Vol. 1. Mendenhall, William Scheaffer, Richard L. y Dennis D. Wackerly 1994 Estadstica Matemtica con Aplicaciones. Mxico: Grupo Editorial Iberoamerica. 2da. Edicin. Neyman, Jerzy 1952 Lectures and Conferences on Mathematical Statistics and Probability. Washington DC: US Department of Agriculture. 2da, ed. P. 143-154. 1952. Pearson, Karl 1897 Mathematical contributions to the theory of evolution on the form of spurious correlation which may arise when indices are used in the measurements of organs. Proceedings of the Royal Society of London. Vol. 60, p. 268-286. 1897. Stigler, George J. y Robert A. Sherwin 1985 Extent of the Market. Journal of Political Economics, Vol. 28, 1985. 60 APNDICE Demostracin 1: La covarianza es sensible a las unidades de medida de las variables Sean dos variables X e Y para las cuales se cuenta con n valores observados. Sus valores muestrales promedio estn dados por: n XX X n K1 n YY Y n K1 y su covarianza por: n i ii YYXXn YXCov 1 ))(( 1 1),( Si todos los valores de X e Y fueran multiplicados por y . tales que y. las unidades de medida de ambas variables se incrementaran porcentualmente en dichos factores, al igual que sus respectivas medias muestrales: 1 1 X n XX n XX nn )( 11 KK Y n YY n YY nn )( 11 KK Dado esto, tenemos que: n i ii n i ii YYXXn YYXX n YXCov 11 ))(( 1 1))(( 1 1),( ),())(( 1 ),( 1 YXCovYYXX n YXCov n i ii 61 ),(),( YXCovYXCov Es decir, el valor de la covarianza entre las variables se altera en una proporcin igual a . Sin embargo, el signo no se altera. Demostracin 2: -1


No comments:

Post a Comment