quarta-feira, 14 de maio de 2014

Correlações espúrias

Os exemplos abaixo mostram porque o R-quadrado de uma regressão não significa muita coisa. E porque Econometria não faz sentido sem Economia.

Correlação entre gastos com ciência/tecnologia e suicídios por enforcamento, estrangulamento e sufocamento nos Estados Unidos = 0.99.












Correlação entre consumo per capita de queijo e mortes causadas por amputamento nos Estados Unidos = -0.97.


Fonte: http://www.tylervigen.com, que contém uma série exemplos tão bizarros como os mostrados acima.

14 comentários:

  1. Mauro, a questão aqui não é Econometria sem Economia, como vc disse, mas simplesmente Econometria mal feita.Deixar as séries estacionárias por si só já resolve.

    ResponderExcluir
    Respostas
    1. Descordo. A Economia ajuda a estabelecer um conjunto de variáveis a serem correlacionadas, para as quais se espera alguma relação. É isso que separa economistas de estatísticos e engenheiros: identificar variáveis dependentes e explicativas (e, especificamente, uma direção de causalidade) com base na teoria.

      No caso, não faz sentido correlacionar consumo de queijo com mortes por amputamento in the first place. Não vale a pena nem começar isso. E, se vc encontrar alguma relação, vai precisar explicar os mecanismos para essa bizarrice.

      Excluir
    2. O q eu disse eh q seu exemplo nao eh bom para mostrar q economia eh necessaria para a analise correta. A econometria aih ta errada!

      Excluir
  2. Câmbio e Crescimento pode entrar nessa lista?

    ResponderExcluir
    Respostas
    1. Não. Tem uma possível história conectando essas variáveis.

      Excluir
    2. Seja causalidade de câmbio em crescimento válido ou não empiricamente, é uma coisa que faria sentido econômico.
      Gastos em tecnologia e enforcamentos não, não há teoria que indique essa causalidade.

      Excluir
  3. endogeneidade != correlação espúria

    ResponderExcluir
    Respostas
    1. Ele quis dizer diferente acho.
      Provavelmente era uma resposta para o Marcelo, acima.

      Excluir
    2. Mauro, era uma resposta ao Marcelo

      Excluir
  4. Discordo Mauro,

    A teoria demanda estatística para ser corroborada, mas não o contrário.

    Acho que a teoria pode ajudar no processo modelagem estatística, mas isso não a torna imprescindível para análise dos dados, até porque os dados podem dizer a que a teoria não é valida!

    Um relação não espúria entre variáveis não precisa de teoria para nos assegurarmos de que a relação existe.

    Uma relação espúria não precisa de ausência de teoria para ser detectada, inclusive nos exemplos que você passou.

    ResponderExcluir
    Respostas
    1. Acho que estamos dizendo a mesma coisa. A teoria ajuda-nos a determinar histórias em tese plausíveis, mas que podem ser objeto de teste (ou seja, a determinar quem fica do lado esquerdo e do lado direito da equação a ser estimada). Mas não supõe que determinada história tem suporte empírico de cara. Isso são os dados que vão dizer.

      Excluir