18/09/2019
Decision Making Units (DMU) ou firmas ou entidades
Outputs (Produto ou Saída)
Inputs (Entrada ou insumos)
Idealmente poderiamos avaliar a performance utilizando uma função custo.
O gráfico mostra um excesso de custo (distância vertical entre o custo atual e o mínimo)
\[\text{Ineficiencia} = \frac{\text{Custo atual} - \text{Custo mínimo}}{\text{Custo atual}}\]
\[\text{Eficiência} = 1 - \text{Ineficiência}\]
Conclusão: Se tivessemos um modelo apropriado de performance ideal (ex. função custo), poderiamos fazer uma avaliação ideal.
A isoquanta (Tecnologia, \(T\)) mostra o produto máximo possível para dado inputs.
A preferência é dada pela função de utilidade \(U(\cdot)\) representada por uma curva de indiferença.
\[ \text{Efetividade} = \frac{\text{Perfom. atual}}{\text{Perfom. ideal}} = \frac{U(A)}{\max_{y \in T} U(y)} = \frac{U(A)}{U(\text{Ideal})}\]
Conclusão: No mundo ideal não é fácil aplicar essas receitas microeconômicas: (1) Não temos informação clara sobre \(U\) ou desconhecemos as possibilidades de produção \(T\).
Exemplo:
Retorno sobre os ativos: \[ = \frac{\text{Renda líquida}}{\text{Ativos totais}}\]
Margem bruta: \[ = \frac{\text{Lucro bruto}}{\text{Vendas líquidas}}\]
Geralmente, um Key Performance Indicator (KPI) é uma razão entre output (produto) e input (entrada). Ou seja, uma medida de produtividade.
\[E = \frac{y^1 / x^1}{y^2 / x^2 } = \frac{y^1 / y^2}{x^1 / x^2}\]
onde \((x^1,y^1)\) e \((x^2, y^2)\) são a combinação input-output das duas firmas.
O uso desses indicadores são baseados em algumas suposições implícitas:
Estamos assumindo Retornos Constantes de Escala:. Importante, sobretudo quando comparamos firmas de tamanho diferentes.
Os indicadores representam Avaliações parciais:. Firmas possuem múltiplos inputs e outputs: produto por unidade de trabalho, produto por unidade de capital usado, etc. Cada KPI poderia identificar uma firma diferente como a mais produtiva.
| Hospital | Cura | Prevenção | Total |
|---|---|---|---|
| 1 | 10/20 = 0.50 | 10/40 = 0.25 | 20/60 = 0.33 |
| 2 | 2/3 = 0.66 | 21/80 = 0.26 | 23/83 = 0.29 |
Exemplo: Hospital 1 cura 20 pacientes ao custo de 10, de modo que seu custo unitário de cura é de 0,50.
Tanto o custo unitário de cura quanto de prevenção (indicadores parciais) são menores no hospital 1.
Contudo, o custo unitário total (indicador total) é maior no hospital 1.
| Hospital | Cura | Prevenção | Total |
|---|---|---|---|
| 1 | 10/20 = 0.50 | 10/40 = 0.25 | 20/60 = 0.33 |
| 2 | 2/3 = 0.66 | 21/80 = 0.26 | 23/83 = 0.29 |
A razão é que a firma 2 depende mais do tratamento de prevenção, que é mais barato.
Conclusão:* Como superar essas limitações nos KPI?
Vamos procurar uma definição de eficiência \(E\) com a mesma interpretação, mas que não sofra com o problema de escala. Ou seja, que inputs e outputs cresçam na mesma escala.
\[E(x,y) = \min \{ e | ex \text{ can produce } y \}\]
Mas para determinar se um input pode produzir um output precisamos conhecer a o conjunto tecnologia \(T\).
\[T = \{ (x,y): x \text{ can produce } y \}\]
Podemos utilizar as combinações de input-output observadas pelas firmas para construir esse conjunto tecnologia. A lógica é que se essas combinações foram observadas, esse nível de produção é FACTÍVEL.
Free disposability : Podemos descartar de qualquer input e output indesejado sem custos. Então se podems produzir uma certa quantidade de y usando \(x\), então podemos produzir o mesmo \(y\) com mais \(x\).
Free disposability : Se uma combinação \((x_i, y_i)\) é factível para uma firma, então outra combinação \((x_j,x_j)\) vai ser factível se o input é maior e o o output é menor também é factível (também está no conjunto tecnologia).
Convexity : Se duas combinações \((x, y)\) são factíveis, então uma mistura dessas combinações também seria. Uma mistura de combinações é chamada combinação convexa . Assim, com free-disposability e convexidade temos:
Convexity : O objetivo é aumentar a tecnologia, sendo conveniente principalmente quando temos poucas observações.
Mas ela vem com seus problemas:
convexidade não leva em consideração economias de escala e de escopo.
Preços podem depender de quantidade e convexidade pode não ser uma conveniencia sem custos…
Se torna menos obvio qual a firma que devemos comparar.
Exemplo de eficiência no input:
Firma 2 é um ponto interior no conjunto tecnologia. Atualmente ela produz 2 unidades (\(y_2 = 2)\) a um custo de 3 (\(x_2 = 3\)), mas é possível produzir \(y_2 = 2\) com apenas \(x_2^* = 2\).
Exemplo de eficiência no input:
Assim, a eficiência de input da firma 2 é
\[E_2 = \frac{x_2^*}{x_2} = \frac{2}{3} = 0.67\]
assim, \(x_2^* = 0.67x_2\).
Exemplo de eficiência no input:
assim, \(x_2^* = Ex_2\) ou \(x_2^* = 0.67 \times 3 = 2\). De modo que a firma poderia poupar \((1 - E)x_2\) ou \((1 - 0,67)\times 3 = 1\) unidade de input.
Exemplo de eficiência no output:
Fixando o input em \(x_2 = 3\), a firma produz \(y_2 = 2\) mas poderia produzir \(y_2^* = 4\). A eficiência é dada por:
\[F = \frac{y_2^*}{y_2} = \frac{4}{2} = 2\]
Exemplo de eficiência no output:
De modo que \(y_2^* = Fy_2\) ou \(y_2^* = 2 \times 2 = 4\). Logo, é possível aumentar o produto em \((F - 1)y_2\) ou \((2 - 1)2 = 1\) unidade.
Conclusão : Com um KPI comparamos uma firma com a melhor firma. Com uma tecnologia estimada, comparamos a firma com o que é factível dado o conjunto tecnológico (fronteira).
Outra limitação dos KPI eram que:
Os indicadores representam Avaliações parciais. Firmas possuem múltiplos inputs e outputs: produto por unidade de trabalho, produto por unidade de capital usado, etc. Cada KPI poderia identificar uma firma diferente como a mais produtiva. .
Possível solução: combinar inputs como agregados (ex. custo) e todos os outputs em um único agregado (ex. receita), de modo que temos apenas um KPI ou uma fronteira tecnologica simples.
Problema : Agregações nem sempre são possíveis. Exemplo:
Como agregar medicos e enfermeiras e cirurgias tão diferentes, que usam diferentes combinações de input?
Assim, usaremos uma abordagem para orientada a sistemass para as DMUs.
Utilizando todos os inputs e outputs simultaneamente.
Exemplo:
Em (a) a firma poderia ser mais eficiente ao produzir a mesma quantidade de output (\(y\)), utilizando menos dos inputs 1 e 2, ou seja, \(x^*\) em vez de \(x\).
Em (b), utilizando a mesma quantidade dos inputs, poderia produzir mais output, de \(y\) para \(y^*\), sendo assim mais efetiva.
A ideia das medidas de Farrell é a de focar em mudanças proporcionais – a mesma redução percentual em todos os inputs (ou outputs). Tais mudanças correspondem a caminhar ao longo da linha pontilhada.
A eficiência de inputs de Farrell: quanto podemos reduzir o input (proporcionalmente) e ainda produzir a mesma quantidade de output?
\[E = \min\{ e|ex \text{ pode produzir } y \} = \frac{|x^*|}{|x|} \]
Dito de outra forma:
\[E = \min\{E > 0 | (Ex,y) \in T \}\]
ie.: Se \(E = 0,8\), isso indica que poderiamos poupar 20% dos inputs e ainda produzir a mesma quantidade.
A eficiência de output pergunta: quanto podemos aumentar o produto mantendo o mesmo uso de inputs?
\[E = \max\{ f|x \text{ pode produzir } fy \} = \frac{|y^*|}{|y|} \] Dito de outra forma:
\[F = \max \{ F > 0 \ (x, Fy) \in T \}\] Ex.: Se \(F = 1,3\), poderiamos expandir o produto em 30% sem utilizar mais recursos.
Exemplo Numérico:
| Firma | Input A | Input B | Output C | Output D |
|---|---|---|---|---|
| 1 | 10 | 20 | 20 | 20 |
| 2 | 20 | 10 | 40 | 20 |
| 3 | 20 | 30 | 60 | 80 |
| 4 | 30 | 30 | 80 | 60 |
| Nossa | 30 | 20 | 36 | 10 |
Suposições: Free disposability. Logo, vamos procurar por firmas que usam menos inputs para produzir mais output que nossa firma.
Exemplo Numérico:
| Firma | Input A | Input B | Output C | Output D |
|---|---|---|---|---|
| 1 | 10 | 20 | 20 | 20 |
| 2 | 20 | 10 | 40 | 20 |
| 3 | 20 | 30 | 60 | 80 |
| 4 | 30 | 30 | 80 | 60 |
| Nossa | 30 | 20 | 36 | 10 |
Exemplo Numérico:
| Firma | Input A | Input B | Output C | Output D |
|---|---|---|---|---|
| 1 | 10 | 20 | 20 | 20 |
| 2 | 20 | 10 | 40 | 20 |
| 3 | 20 | 30 | 60 | 80 |
| 4 | 30 | 30 | 80 | 60 |
| Nossa | 30 | 20 | 36 | 10 |
Exemplo Numérico:
| Firma | Input A | Input B | Output C | Output D |
|---|---|---|---|---|
| 1 | 10 | 20 | 20 | 20 |
| 2 | 20 | 10 | 40 | 20 |
| 3 | 20 | 30 | 60 | 80 |
| 4 | 30 | 30 | 80 | 60 |
| Nossa | 30 | 20 | 36 | 10 |
\[\text{input A: } E = \frac{20}{30} = 0.67\]
Exemplo Numérico:
| Firma | Input A | Input B | Output C | Output D |
|---|---|---|---|---|
| 1 | 10 | 20 | 20 | 20 |
| 2 | 20 | 10 | 40 | 20 |
| 3 | 20 | 30 | 60 | 80 |
| 4 | 30 | 30 | 80 | 60 |
| Nossa | 30 | 20 | 36 | 10 |
\[\text{input B: } E = \frac{10}{20} = 0.50\]
Exemplo Numérico:
| Firma | Input A | Input B | Output C | Output D |
|---|---|---|---|---|
| 1 | 10 | 20 | 20 | 20 |
| 2 | 20 | 10 | 40 | 20 |
| 3 | 20 | 30 | 60 | 80 |
| 4 | 30 | 30 | 80 | 60 |
| Nossa | 30 | 20 | 36 | 10 |
Como queremos reduzir ambos os inputs, a menor redução factível é a de 20/30:
\[E = 20/30 = 0.67\]
Exemplo Numérico:
| Firma | Input A | Input B | Output C | Output D |
|---|---|---|---|---|
| 1 | 10 | 20 | 20 | 20 |
| 2 | 20 | 10 | 40 | 20 |
| 3 | 20 | 30 | 60 | 80 |
| 4 | 30 | 30 | 80 | 60 |
| Nossa | 30 | 20 | 36 | 10 |
\[\text{Output C: } F = \frac{40}{36} = 1.111111\]
Exemplo Numérico:
| Firma | Input A | Input B | Output C | Output D |
|---|---|---|---|---|
| 1 | 10 | 20 | 20 | 20 |
| 2 | 20 | 10 | 40 | 20 |
| 3 | 20 | 30 | 60 | 80 |
| 4 | 30 | 30 | 80 | 60 |
| Nossa | 30 | 20 | 36 | 10 |
\[\text{Output D: } F = \frac{20}{10} = 2\]
Exemplo Numérico:
| Firma | Input A | Input B | Output C | Output D |
|---|---|---|---|---|
| 1 | 10 | 20 | 20 | 20 |
| 2 | 20 | 10 | 40 | 20 |
| 3 | 20 | 30 | 60 | 80 |
| 4 | 30 | 30 | 80 | 60 |
| Nossa | 30 | 20 | 36 | 10 |
Como queremos o maior aumento possível que funcione para ambos os outputs, vamos escolher 40/36:
\[F = 40/36 = 1.11\]
Importante: As vezes um dos inputs ou dos outputs são fixos ou fora do controle da firma (ao menos no curto prazo).
Uma forma de lidar com esses problemas é apenas olhar para as variáveis discricionárias.
Os problemas se tornam:
\[E = \min\{ E > 0 | (Ex_v, x_f, y_v, y_f) \in T \}\] \[F = \max\{ F > 0 | (x_v, x_f, Fy_v, y_f) \in T \}\] # Outras Tecnologias
Retornos constantes de Escala (CRS)
Retornos Crescentes de Escala (IRS)
O output tende a crescer mais rápido que o input.
Retornos Decrescentes de Escala (DRS)
O output tende a crescer menos que o input.
| Modelo | FD | Convexidade | Retornos | Aditividade |
|---|---|---|---|---|
| FDH | x | \(\kappa = 1\) | ||
| VRS | x | x | \(\kappa = 1\) | |
| DRS | x | x | \(\kappa \leq 1\) | |
| IRS | x | x | \(\kappa \geq 1\) | |
| CRS | x | x | \(\kappa \geq 0\) | |
| FRH | x | \(\kappa = 1\) | x |
DEA estima a tecnologia \(T\) a partir de dados históricos.
Para tanto utiliza o princípio de minimal extrapolation principle: ela procura encontrar o menor conjunto que inclua (ou envelope) as observações \((x,y)\) observadas.
Define qual a unidade de referência vamos comparar a firma \(o\)
Elas geralmente são interpretadas como as firmas que mostram como \(o\) podere melhorar.
\[\text{Peer} = \{k \in \{1,...,K\} | \lambda^k > 0 \}\]
| Firma | Input | Output |
|---|---|---|
| A | 20 | 20 |
| B | 40 | 30 |
| C | 40 | 50 |
| D | 60 | 40 |
| E | 70 | 60 |
| F | 50 | 20 |
Setting
Temos \(K\) firmas (K = 6)
que usam \(m\) inputs e \(n\) outputs (m = 1 e n = 1)
Deixe \(x^k = (x^k_1, ..., x_m^k) \in {\rm I\!R}^m_+\) serem os inputs usados
Deixe \(y^k = (y_1^k, ..., y_n^k) \in {\rm I\!R}^n_+\) serem os outputs utilizados pelas firmas \(k = 1,...,K\)
Deixe a tecnologia (ou o conjunto de possibilidade de produções ser dado por:
\[T = \{ (x,y) \in {\rm I\!R}^m_+ \times {\rm I\!R}^n_+ | x \text{ can produce } y \}\]
Se a tecnologia é convexa, podemos usar a representação dual para resolver o problema. Por exemplo, se quisessemos encontrar a eficiência da firma B, teriamos que resolver o seguinte problema:
\(\min E\)
\[\text{s.a. } E \cdot 40 \geq \lambda^A 20 + \lambda^B 40 + \lambda^C 40 + \lambda^D 60 + \lambda^E 70 + \lambda^F 50\] \[30 \leq \lambda^A 20 + \lambda^B 30 + \lambda^C 50 + \lambda^D 40 + \lambda^E 60 + \lambda^F 20\] \[= \lambda^A + \lambda^B + \lambda^C + \lambda^D + \lambda^E + \lambda^F,\] \[\lambda^A \geq 0,...,\lambda^F \geq 0\]
Tecnologia VRS:
## A B C D E F ## 1.0000000 0.6666667 1.0000000 0.5555556 1.0000000 0.4000000
Tecnologia CRS:
## A B C D E F ## 0.8000000 0.6000000 1.0000000 0.5333333 0.6857143 0.3200000
Se firmas estão exatamente na fronteira, suas eficiências serão iguais a 1. Como diferencia-las?
Firmas com score de 1 podem ter pouco incentivo a melhorar
Podemos calcular a eficiência de \((x^k, y^k)\) (uma fronteira com todas as DMUs) relativa a \(T^*(\gamma, -k)\) (uma fronteira sem \(k\)).
\[E^{SUP k} = E((x^k, y^k); T^*(\gamma, -k))\]
\[F^{SUP k} = F((x^k, y^k); T^*(\gamma, -k))\] onde \(\gamma\) é uma suposição qualquer.
| Firma | Input | Output |
|---|---|---|
| A | 20 | 20 |
| B | 40 | 30 |
| C | 40 | 50 |
| D | 60 | 40 |
| E | 70 | 60 |
| F | 50 | 20 |
Sem super-eficiência (VRS)
## A B C D E F ## 1.0000 0.6667 1.0000 0.5556 1.0000 0.4000
Com super-eficiência (VRS)
## A B C D E F ## 2.0000 0.6667 1.4375 0.5556 Inf 0.4000
<To be continue…>
Porque usar testes estatísticos com DEA:
Testar as hipóteses de retornos de escala.
Testar inputs relevantes e irrelevantes
Testar diferenças entre grupos de firmas em termos de eficiência
Testar se eficiência depende de fatores externos
Como conduzir os testes:
Testes não-paramétricos
Testes paramétricos (só úteis para grandes amostras)
Bootstrap
\[H_0: g_1 = g_2 \times H_A: g_1 \neq g_2\]
Vamos dividir as firmas em dois grupos: \(K_1\) e \(K_2\). Onde \(K = K_1 + K_2\).
Temos que \(t(F)\) é a distribuição do DEA estimado e \(t(\phi)\) a distribuição do verdadeiro valor de eficiência de Farrell.
\[\phi = \max\{ F | (x, Fy) \in T \}\] \[F = \max \{ F (x, Fy) \in T_{\gamma}^* \}\] - É possível mostrar que \(F\) é um estimador de maxima verossimilhança de \(\phi\).
Se \(t(\phi)\) segue uma chi-quadrado (com df =2), então \(\sum_{k=1}^K t(F^k)\) é assintoticamente uma \(\chi^ 2\) (com df = 2K).
Sob \(H_0\), os dois grupos tem a mesma distribuição e a razão
\[T_{EX} = \frac{\sum_{k \in K_1} t(F^k)/K_1}{\sum_{k \in K_2} t(F^k)/K_2}\] é a razão de duas distribuições \(\chi^2\) e é assintoticamente uma distribuição de Fischer com \(2K_1\) e \(2K_2\) graus de liberdade: \(T_{EX} \sim F(2K_1, 2K_2)\)
\[T_{EX} = \frac{\sum_{k \in K_1} t(F^k - 1)/K_1}{\sum_{k \in K_2} t(F^k - 1)/K_2}\] e rejeita a hipótese se \(T_{EX}\) é maior que o 95% quantil na distribuição \(F(2K_1,2K_2\).
\[T_{HN} = \frac{\sum_{k \in K_1} t(F^k)^2/K_1}{\sum_{k \in K_2} t(F^k)^2/K_2}\] que é distribuida como \(F(K_1, F_2)\).
Se não temos uma suposição a priori sobre \(\phi\), então usamos o teste não paramétrico de Kolmogorov-Smirnov:
\[T_{KS} = \max_{k = 1,...,K} \{ | G_1(F^k) - G_2(F^k) | \}\]
onde \(G_1\) e \(G_2\) são as distribuições acumuladas nos dois subconjuntos tal que \(T_{KS}\) é a maior distância vetical entre as distribuições.
A ideia é retirar amostras com reposição e criar várias replicas dos dados originais.
Exemplo: Imagine que temos 7 números: 94,197,16,38,99,141 e 23
É fácil calcular o valor do desvio-padrão da média (ou a variÂncia) quando temos uma fórmula fechada, como \(se = \frac{sd}{\sqrt{n}}\)
numeros = c(94,197,16,38,99,141,23) mean(numeros)
## [1] 86.85714
sd(numeros)
## [1] 66.76683
sd(numeros)/sqrt(length(numeros))
## [1] 25.23549
Selecionar B amotras com reposição.
Calcular a estimativa para cada amostra. \(t(x^b) = (b = 1,...,B)\)
Estimar o erro padrão usando o erro padrão amostral das B replicas
\[\hat{s_B} = \sqrt{\frac{1}{B-1} \left(\sum_{b=1}^B (t(x^b)- \frac{1}{B}\sum_{b=1}^B t(x^b)\right)^2}\]
library(boot) treat <- c(94, 197, 16, 38, 99, 141, 23) func <- function(d,i) { median(d[i]) } B <- 200 boo <- boot(treat, func, B) sqrt(var(boo\(t)) mean(boo\)t) hist(boo$t,main=NULL)
A estimativa de DEA tende a superestimar as medidas de eficiência.
Para eliminar o viés, podemos estimar o viés e obter uma estimativa livre de viés.
\[\text{viés}^k = E(\hat{\theta})-\theta^k\] - Como não sabemos a distribuição de \(\hat{\theta^k}\), não temos como calcular \(E(\hat{\theta})\). Para tanto, vamos usar o bootstrap:
\[\text{viés}^{k*} = \frac{1}{B} \sum_{b=1}^B \theta^{kb} - \hat{\theta}^k = \bar{\theta}^{k^*} - \hat{\theta}^k\]
O estimador de \(\theta^k\) se torna
\[\tilde{\theta}^k = \hat{\theta}^k - \text{viés}^{k*} = \hat{\theta}^k - \bar{\theta}^{k^*} + \hat{\theta}^k = 2\hat{\theta}^k - \bar{\theta}^{k^*}\]
A precisão da estimativa pode ser determinada baseada na variância da estimativa de bootstrap:
\[\hat{\sigma}^2 = \frac{1}{B} \sum_{b=1}^B (\theta^{kb}-\bar{\theta}^{k*})^2\]
x <- matrix(c(100,200,300,500,100,200,600),ncol=1) y <- matrix(c(75,100,300,400,25,50,400),ncol=1) b <- dea.boot(x,y, NREP=2000) b$bias
## [1] 0.14372795 0.07372737 0.15719483 0.12154497 0.08741432 0.05111297 0.10128748
Medidas de eficiência com preços
Custo
Receita
Eficiência de lucro
Eficiência dinâmica (ao longo do tempo). Exemplo: Índice de Malmquist
Eficiência de rede ou estrutura (avaliar fusão de empresas, etc)
| Deterministico | Estocástico | |
|---|---|---|
| Paramétrico | Corrected OLS | Análise de Fronteira Estocástica (SFA) |
| Não-paramétrico | DEA | DEA Estocástico (SDEA) |