Logo

DEFINIÇÕES E CONCEITOS IMPORTANTES

UNIVERSIDADE FEDERAL DA PARAÍBA

Prof. Dr. Sinézio Fernandes Maia
Monitores: Victor Andrade Medeiros e Josué de Meneses Lopes
Atualização: 19.02.2025

Introdução

Segundo BOX e JENKINS (1976), uma série temporal é um conjunto de observações ordenadas, \(y_t\), cada uma observada em um instante de tempo.

São exemplos de séries temporais:

  • i) Valores diários do preço das ações da Petrobrás na IBOVESPA;
  • ii) Valores diários da temperatura da cidade de João Pessoa;
  • iii) Valores mensais do índice de produto industrial no Brasil;
  • iv) Registro de marés no porto de Cabedelo-PB.

Nos exemplos i e iii, temos séries temporais discretas, ao passo que em iv é um exemplo de uma série contínua. Assim, podemos definir, a partir dos dados, as características das séries de tempo da seguinte forma:

Tipo de Dados:

  • Séries Temporais: Tempo Varia
  • Painel: Tempo e Indivíduos Variam
  • Corte Transversal: Tempo é Fixo

Tipo de Séries Temporais:

  • Discreta Tempo: Varia Discretamente
  • Contínua Tempo: Varia de Forma Contínua

Obs: é possível obter uma série temporal discreta a partir de amostragens de uma série temporal contínua em intervalos de tempo iguais, \(\Delta_t\).

1. Objeto de Análise

O objetivo é analisar um conjunto de dados onde as observações foram feitas ao longo do tempo. Dado um conjunto de observações de séries temporais, selecionar e estimar um modelo estocástico que possivelmente tenha gerado a série. Para isso, utiliza-se o seguinte procedimento:

  1. Postular um modelo matemático geral;
  2. Escolher um modelo particular;
  3. Estimar os parâmetros do modelo (uso dos dados);
  4. Checar a validade do modelo.

Obs: se o modelo for adequado, usa-se para explicar o comportamento da série e/ou prever valores futuros.

Dessa forma, existem dois principais motivos para usar modelos de séries temporais:

  1. Entender o mecanismo do sistema gerador da série temporal;
  2. Predizer o comportamento futuro do sistema.

Para isso, problemas de interesse são:

  1. Descrever o comportamento da série. Neste caso, constituem ferramentas úteis: construção de gráficos da série, construção de histogramas e diagramas de dispersão, obtenção de estatísticas descritivas simples, verificação de tendências, ciclos e variações sazonais, observações espúrias e pontos de mudanças.

  2. Investigar o mecanismo gerador da série temporal significa procurar periodicidades relevantes nos dados.

  3. Efetuar “previsões” de valores futuros da série a partir de valores passados.

  4. Estimar a “função de transferência” \(\phi(t)\) conhecendo-se as séries de entrada \(X(t)\) e saídas \(Y(t)\).

  5. Estudar comportamento do sistema, simulando-se a série de entrada.

  6. Obter um esquema simples de controle para observar os possíveis desvios de suas metas, isto é, controlar a série de saída \(Y(t)\) de modo a trazê-la o mais próximo possível de um valor desejado, ajustando-se convenientemente a série de entrada \(X(t)\). Este controle é necessário, devido às perturbações que normalmente afetam um sistema.

  7. Representar o efeito de uma “intervenção” sobre o comportamento de uma série.

Com uma série temporal bem modelada é possível efetuar previsões seguras de valores futuros. Como em qualquer análise de dados, procura-se obter um modelo matemático que descreva o sistema de maneira parcimoniosa para o objetivo desejado. Sua forma funcional deve ser simples e o número de parâmetros, o mínimo possível.

O modelo deve, se possível, ser parametrizado de tal forma que cada parâmetro possa ser interpretado facilmente e identificado com algum aspecto da realidade. Sua forma funcional deve permitir uma fácil manipulação matemática necessária para inferência a seu respeito.

Como o objeto da análise de série temporal é sumarizar as propriedades da série e caracterizar seu comportamento identificando ou sugerindo um modelo adequado, é necessário determinar os enfoques de abordagens.

Há basicamente, dois enfoques usados na análise de séries temporais e, em ambos, o objetivo é construir modelos para as séries. No primeiro enfoque, a análise é feita da seguinte forma:

  1. Análise da série no domínio do tempo: Estamos interessados na magnitude de eventos que ocorrem em determinado instante de tempo e na relação entre observações em diferentes instantes de tempo. A ferramenta utilizada é a função de autocorrelação e a análise baseada nos modelos paramétricos, com um número finito de parâmetros (ex. modelos ARIMA).

  2. Análise da série no domínio da frequência: Estamos interessados na frequência com que certos eventos ocorrem em um período de tempo (movimentos cíclicos). A ferramenta utilizada é o espectro (que é uma transformada da função de autocorrelação) e a análise é baseada em modelos não paramétricos. No domínio da frequência temos a análise espectral que consiste em decompor a série de dados em componentes de frequência.

Ambos os enfoques são justificados por teoremas de representação (Wold e Cramer) e pode-se dizer que a análise no domínio da freqüência é conveniente em processos de características determinísticos da série temporal, enquanto a análise no domínio do tempo é usada na análise de processos não determinísticos.

2. Extensões de Análises

Em econometria convencional, o modelo de regressão padrão pode ser expresso da seguinte forma: \(Y = X\beta + e\) em que \(e=(e_1 \dots e_n)^T\)

As hipóteses para a existência deste modelo são:

As hipóteses para a existência deste modelo são:

  1. \(E(e_i) = 0\)

  2. \(\text{VAR}(e_i) = \sigma^2\)

  3. \(e_i \sim N(0, \sigma^2)\)

  4. \(\text{COV}(e_i, e_j) = 0\ \forall\ i \neq j\)

onde os erros tem distribuição normal gaussiana e, violar a normalidade cria-se dificuldades de inferência estatística. Além disso, o componente de erro deve ser independente. Em economia, esta hipótese é violada criando-se o problema de auto-correlação dos erros, isto é, os dados econômicos são influenciados pela proximidade dos dados do período anterior. Assim, em modelo de séries econômicas de tempo, este pressuposto é violado.

Em modelos de econometria convencional, quando o problema da auto-correlação existe, usa-se o Mínimo Quadrado Generalizado, como medida corretiva. Neste caso, é preciso definir um sistema de equações não-lineares para obter o MQ Generalizado. Além desta dificuldade, para estimar um modelo de regressão é necessário especificar as variáveis explicativas \((X)\) que farão parte do modelo geral para obter \((Y)\), isto é,

\[Y_i = \beta_0 + \beta_1X_1 + \beta_2X_2 + \dots+ \beta_pX_p+e_i\]

Surge aí, a necessidade de criar um modelo autoregressivo (AR) de ordem \((P)\), onde a variável explicativa é a própria variável dependente defasada em \((p)\) períodos, AR\((p)\). Neste caso, para efeitos de previsões da variável dependente, não precisa-se mais procurar uma matriz de variáveis explicativas \((X)\).

\[Y_y = \beta_0 + \beta_1Y_{t-1} + \beta_2Y_{t-2} + \dots+ \beta_pY_{t-p}+e_i\]

A análise univariada descreve uma série de tempo usando somente observações passadas da variável em questão. Usa-se o conceito estatístico de correlação para medir a relação entre observações do tempo (t) e seus respectivos períodos anteriores. Em outras palavras, estes modelos descrevem como todas as observações atuais estão relacionadas com as observações passadas e, utiliza-se este tipo de modelo para previsões de valores futuros desta variável em questão.

Neste caso, utiliza-se a abordagem de Box-Jenkins (B-J) para séries univariadas de tempo que, por sua vez, apresenta três vantagens sobre os demais métodos tradicionais de previsões:

  1. O conceito associado a \(\text{B-J}\) são derivados de sólidos fundamentos da teoria clássica de probabilidade e estatística matemática. Muitos outros métodos univariados são derivados por um processo ad hoc ou intuitivo, ao contrário do método \(\text{B-J}\).

  2. Modelos ARIMA são de uma família de modelos e não somente de um modelo simples. \(\text{B-J}\) tem desenvolvido estratégias que guiam os analistas em escolhas de um ou mais modelos apropriados.

  3. Pode ser mostrado que um modelo ARIMA produz previsões ótimas, isto é, o modelo padrão de série univariada pode oferecer previsões com pequeno erro quadrado médio.

Em suma, o modelo univariado de Box-Jenkins fornece um conjunto de situações e uma previsão mais acurada para o trato de curto prazo, do que qualquer outra técnica de série univariada. Entretanto, a construção de um modelo Box-Jenkins pode requerer mais experiência e tempo computacional do que qualquer outro método univariado.

3. Formalizações

Os modelos utilizados para descrever séries temporais são processos estocásticos, isto é, processos controlados por leis probabilísticas. Qualquer que seja a classificação que façamos para os modelos de séries temporais, podemos considerar um número muito grande de modelos diferentes para descrever o comportamento de uma série particular. A construção destes modelos depende de vários fatores, tais como o comportamento do fenômeno ou o conhecimento a priori que temos de sua natureza, e do objetivo da análise.

Uma série temporal é um conjunto de observações feitas sequencialmente no tempo. Entretanto, tempo pode ser substituído por qualquer variável como espaço, profundidade, etc. As observações vizinhas são dependentes e o estudo de uma série temporal consiste em analisar e modelar esta dependência.

Novas técnicas e resultados têm-se desenvolvido para aplicação específica em séries temporais, cujo estudo se constitui uma importante área da estatística. Exemplos em economia podem ser os preços diários de uma ação, desemprego mensal, exportação mensal, etc.

O objetivo consiste em apresentar métodos para construção, identificação, estimação e checagem de sistemas dinâmicos e de séries econômicas de tempo.

Formalmente, a série temporal é representada por um conjunto de observações \(\{Y(t) \mid t \in T\}\) de uma variável \(Y\), onde o conjunto \(T\) é um conjunto de índices (tempo, espaço, profundidade, etc). Dependendo da natureza de \(T\) e de \(Y\), a série temporal pode ser:

  1. Discreta, quando \(T\) é um conjunto finito de pontos, \(T = \{1, 2, \ldots, T\}\). Por exemplo, o valor das exportações mensais de 1980 até 2000 (Notação \(y_t\));

  2. Contínua, quando \(T\) é um intervalo finito, \(T = \{t \mid 0 < t < T\}\). Por exemplo, medições durante dois minutos de um eletrocardiograma (Notação \(y(t)\));

  3. Multivariada (discreta ou contínua), \(\{Y_1(t), \ldots, Y_k(t) \mid t \in T\}\) ou \(\{Y(t) \mid t \in T\}\). Por exemplo, vendas (\(y_{1t}\)) e gastos com propagandas semanais de um produto (\(y_{2t}\));

  4. Multidimensional, quando temos \(\{Y(t) \mid t \in T\}\) e \(t\) é um vetor. Por exemplo, \(\{Y(t, r, l) \mid t \in T\}\) onde \(Y\) é a altura de um ponto do oceano, \(t\) o tempo, \(r\) a latitude e \(l\) a longitude. Ou ainda, \(\{y(t, b) \mid t \in T\}\) onde \(y\) é o número de casos de dengue semanais (\(t\)) por cidade (\(b\)).

Em resumo, a variável observada \(Y\) pode ser discreta ou contínua, univariada ou multivariada, e o índice “tempo” pode ser discreto ou contínuo, unidimensional ou multidimensional. Em geral, vamos supor que \(t\) é discreto, unidimensional e observado em intervalos equiespaçados.