Cluster analysis for demand model selection

Wednesday, July 9th, 2008

[First, a note. The title kind of oversells the post. This isn't publishable material or about econometric theory at all, it's just about something I do in practice based on statistical intuition and some graduate-level knowledge of economic theory. I did spend my entire two years in graduate school (a real MSc. program, not an MBA) doing econometrics, which is why I'm comfortable appealing to statistical and economic intuition, not to mention aware of some huge gaping caveats. On the other hand, I don't know anything about the asymptotics of clustering algorithms (though I do know how algorithms work and that some asymptoptic theory for k-means is well-established). The thing is, I don't have time to do proper theoretical research right now. So this is all seat-of-the-pants advice.]

So, you’re stuck with the universal problem of econometrics: you don’t know how to specify your model — how to choose the equation you’ll estimate.

Maybe they’ve told you they want demand estimates, so accurate prediction takes priority over accurate elasticity estimation (though they do want elasticity estimates so they can do back-of-the-envelope calculations). You can’t just let unknown factors slip into the error on a FWL theorem invocation — you want good R^2, and not in an artificial way.

So you go — demand is a function of price, income and other stuff.

Now, we all know from our microeconomics courses (the real ones, that work you through Mas-Collel) that you can’t just go summing individual demands into a consistent (functional, where for every x there’s one and only one y) demand curve, unless you have all these fancy constraints on utility functions — most notably separability into a Gorman polar form.

I’m a man, I’m ahead, I’m the first mammal to wear pants…

Thursday, August 9th, 2007

Até muito recentemente, eu era um econometrista amador que se deleitava em inferências sutis obtidas acidentalmente a partir de dados descolados rapidamente de uma tabela qualquer — passatempo de outsider no buraco em que minha carreira acadêmica descendente tinha me jogado.

Agora que eu estou trabalhando numa instituição de consultoria/pesquisa bastante grande, o jogo é outo — eu tenho objetivos concretos especificados de antemão e prazos razoavelmente fixos — e logo modelos que deve ser bem melhor especificados.

Por outro lado, tenho um estagiário para obter os dados e transformá-los para o formato que melhor me convier. Como todo estagiário, ele comete erros, às vezes graves; quer dizer, eu já fui estagiário e errava muito ao digitar tabelas impressas de livros antigos, coisa que o meu estagiário ainda não teve de fazer mas deverá fazer a partir de hoje.

Eu devo dizer, às vezes me invade uma dúvida existencial quando percebo que estou estimando 400 parâmetros a partir de 700 observações. Basta que um estagiário no IPEA ou na FIPE ou na FIRJAN ou na FIESP tenha errado para que o trabalho de dezenas de econometristas teóricos durante 30 anos de desenvolvimento metodológico não sirvam pra nada.

Eu já o vejo, um estagiário da FIESP com sotaque irritante e cabelinho de emo querendo “sair mais cedo do estágio, mano.” — com sotaque. E digitando tudo errado.

A econometria é um resumo da condição humana, meus caros.

Sardenberg e o câmbio

Friday, April 6th, 2007

As far as econopundits go, Carlos Sardenberg é notoriamente bom. Economista, deve ter sido contratado pela Globo nos meses em que o diploma de jornalismo não foi obrigatório por obra de uma liminar. Assim sendo, caracteriza-se por um estilo de argumentação mais baseado em dados e fatos do que em hearsay. Este, portanto, é um post típico em seu blog journal do portal G1:

E o dólar, hein? Não tem como encarecer. O dólar caro do passado refletia a situação de uma economia que tinha pesados compromissos na moeda americana (importações a pagar, juros e dívida a amortizar) e, ao mesmo tempo, uma fraca capacidade de gerar dólares. Ou seja, o dólar era caro porque era escasso. (…) Quando o dólar custava mais de três reais, as reservas do Banco Central brasileiro eram de US$ 35 bilhões, as exportações, de US$ 60 bilhões, o superávit comercial mal aparecia, e a dívida externa era de US$ 220 bilhões. Agora estamos no terceiro ano seguido de superávit em torno dos US$ 45 bilhões; as reservas chegam a US$ 110 bilhões e a dívida caiu para US$ 150 bilhões. Sendo que a dívida pública não chega a US$ 80 bilhões. Ou seja, o governo hoje é credor em dólares. Com tudo isso, cai o risco de aplicar e emprestar ao Brasil. Governo e companhias privadas tomam empréstimos no exterior a juros cada vez menores – e é mais dólar que entra. O dólar não está barato, o dólar é barato.

A intuição e o senso comum de Sardenberg estão certos, ao menos do ponto de vista predominante na teoria macroeconômica — na qual o Brasil é uma “pequena” economia aberta em que as flutuações cambiais são resultado de flutuações no mercado doméstico de câmbio. E, claro, o dólar hoje “é” barato em boa parte porque as reservas estão pelas alturas. Mas vamos observar a relação entre câmbio (real) e reservas:

Os números são meses, contando a partir de janeiro de 2000. A história toda começa

Free counter and web stats