Introducción
El objetivo del artículo es comprobar si la teoría del Redes Sociales tiene capacidad para describir el consumo familiar.
La teoría económica tiende a caracterizar el consumo bajo un supuesto de la elección entre bienes en base a las funciones de utilidad, pero se puede adoptare un supuesto más sociológico basado en la elección siguiendo un patrón determinado, aquí supondremos que cada individuo elige imitando el comportamiento de otros individuos. En lo que en teoría de redes se conoce como el modelo neutral.
Utilizaremos técnicas de análisis cluster, jerarquías en arboles mínimos de expansión, y técnicas de análisis de redes sociales, aplicadas a la Encuesta de Presupuestos Familiares de España y Europa, para caracterizar estas redes, que ofrecen una explicación aceptable a las estructuras de consumo de España y Europa.
Teoría del consumo
Son tres los modelos sobre los que se basa la investigación en economía sobre el consumo: la hipótesis del ingreso absoluto de Keynes (1936), la hipótesis del ingreso permanente de Friedman (1957) y la hipótesis del ciclo de vida de Modigliani (1949). La investigación moderna del consumo se basa, en diferentes grados, en una de estas aproximaciones.
En todas las teorías, y la del consumo es una de ellas, se hacen simplificaciones en orden a explicar la realidad. Las claves que asumen los modelos económicos son, las siguientes (Ormerod, P. ,2016):
Cada agente tiene preferencias ya fijadas
Las preferencias son independientes de las decisiones de otros agentes
Eligen sobre alternativas conociendo toda la información que poseen los otros agentes (información perfecta)
Toman la mejor decisión posible (la optima)
Estas simplificaciones se han relajado en dos sentidos:
Se asume que los agentes tienen información incompleta (Akerlof y Stigliz). Información asimétrica.
Se reconocen los costes que implica obtener y procesar la información.
En opinión de Ormerod (2016), los mercados de consumo, en donde las familias son de diferente condición y tienen diferentes atributos, estas simplificaciones conducen a no entender sus decisiones actuales.
El efecto de la publicidad en las decisiones individuales de consumo, la imitación de los modelos de consumo de las élites sociales, el elegir productos claramente adictivos como lo es la droga o los juegos de azahar. Hay muchas cuestiones en el comportamiento de los consumidores que escapan a estos modelos ideales. En opinión de Ormerod (2016), hay que entender el comportamiento de los agentes en la ciber-sociedad. El número de elecciones es asombroso hoy día (El Wall-Mark cercano al aeropuerto JFK tiene más de 100.000 item en stock). Herb Simon en los años 60 expresaba serias dudas acerca de la posibilidad de que los agentes obtuvieran y procesaran toda la información que precisa una elección racional. Y aunque se incorporara de alguna u otra forma los costes de información a la teoría de la elección racional, Simon argumenta que, en muchas situaciones, el concepto de optimización no tiene sentido práctico. En lugar de intentar optimizar, los agentes pueden escoger una regla “heuristica” (arte, técnica o procedimiento práctico o informal, para resolver problemas), que les de resultados satisfactorios.
El reto más importante para los economistas es construir modelos nulos (básicos) que puedan ser adaptados a situaciones particulares. Los econo-físicos utilizan modelos nulos basados en el modelo de partículas de la estadística física. El comportamiento de los agentes esta gobernado básicamente por las interacciones con otros agentes. Los gustos y preferencias no son fijos sino que se alteran cuando interaccionan con otros. Estos agentes tienen cero de inteligencia (Ormerod,2016)
Una extensión de este tipo de modelos de comportamiento se ha desarrollado en la teoría de la evolución cultural. La mayor parte de los agentes eligen copiar las elecciones que han hecho otros agentes que tienen alrededor, pero ocasionalmente la elección esta basada en una forma de selección aleatoria. En este tipo de modelos, la estructura de conexión entre agentes es muy importante.
Para Bentley A.R , Ormerod P, y Batty M (2011), en el comportamiento ecológico se asume que los cambios en el comportamiento humano necesitan resolver un problema adaptativo, a través de un rango de posibles estrategias que ellos pueden racionalizar, en orden a optimizar el gasto de energía, de tiempo, beneficios reproductivos y otros. Los cazadores y recolectores optimizan la adquisición de proteinas y calorías, al tiempo que la atracción entre las personas se basan en atributos de salud o de aptitud reproductiva. El ratio optimo entre la cintura y la cadera de la mujer, o la simetría en la cara del hombre.
El comportamiento ecológico humano puede en general predecirse pero teniendo en cuenta restricciones funcionales en las decisiones humanas, entre estas restricciones esta que a menudo se eligen actividades “fashionables” (de moda), como la alfarería, la música, el arte, el humor, el lenguaje y la cultura, y los cambios en la evolución cultural estaban presentes aún y cuando eran cruciales la reproducción y la alimentación.
Comparada con la pequeña escala de las sociedades prehistóricas el rango de elecciones culturales en el mundo occidental actual es de una magnitud infinitamente mayor. La manera de elegir es la misma pero el orden es mucho mayor, y pocas son las elecciones se pueden explicar exclusivamente en términos de coste-beneficios que impliquen calorías, energía, tiempo o otras valoraciones.
El proceso de aprendizaje social es complejo, hay un amplio rango de estrategias que la gente utiliza para elegir que son imitadas y copiadas, lo que facilita el desarrollo de diferentes normas y creencias entre grupos. En las pequeñas sociedades estas diferencias sociales pueden ser delimitadas, pero en las grandes poblaciones, por ejemplo, entre la gente que acude a las grandes superficies, o la población que utiliza Internet, tales patrones de copia virtualmente existen, aunque las personas individuales tengan una razón particular para elegir pongamos por caso el libro que van a leer.
Las poblaciones grandes de individuos con sesgos de aprendizaje son virtualmente intratables y necesitan de una aproximación apropiada que trate la población agregada, como si todos los posibles sesgos e individuos racionales se equilibraran mutuamente.
Uno de los resultados del aprendizaje social en poblaciones grandes es que las frecuencias de elementos culturales sean tratadas por cambios estocásticos. Un modelo simple de copia aleatoria entre individuos (con innovación ocasional) es conocido como modelo neutral.
Bentley A.R , Ormerod P, y Batty M (2011), proponen un modelo que es una evolución del modelo neutral, pero añadiendo un parámetro de memoria. En su modelo cada individuo que tiene una idea, su idea va a ser copiada por otros individuos. Por tanto las ideas se replican con probabilidad proporcional a los individuos que han tenido esa idea. Este tipo de modelos se utilizado para explicar como se elige el nombre de los niños, la citación en los papeles académicos, o cambios entre las ciudades elegidas para vivir.
En el proceso de aprendizaje social hay un amplio rango de estrategias que la gente utiliza para elegir que son imitadas y copiadas, lo que facilita el desarrollo de diferentes normas y creencias entre grupos. En las pequeñas sociedades estas diferencias sociales pueden ser delimitadas. En las grandes poblaciones los patrones de copia existen, aunque sean más difíciles de identificar. Centrándonos en el mundo del consumo, dichos patrones se danta tanto entre la gente que acude a las grandes superficies o la que compra en internet, hecho este que de alguna y otra manera es ampliamente reconocido en el ámbito del marketing. Nielsen en su ‘Global Trust in advertising 2015’, pone de manifiesto que la publicidad más creíble son las recomendaciones de su familia y amigos ya que más de ocho de cada diez encuestados (83%) otorga mayor confianza a la experiencia de las personas de su entorno. La Word of Mouth Marketing Association (WOMMA) en un estudio de 2007 concluía que el 92% de las decisiones de compra son tomadas bajo la influencia de recomendaciones, mientras que el 74% se producen bajo el impacto de un anuncio publicitario. En el de 2014 se afirma que el boca a boca genera cinco veces más ventas que la publicidad pagada, y que una tercera parte de las compras son atribuibles al boca a boca. En el Informe Consumer Insights Survey 2018 de PwC, relativo a nuestro país, se destaca que en los últimos tres años, el porcentaje de los consumidores españoles que acuden a las tiendas físicas, al menos una vez a la semana, ha crecido del 40% al 46%. Parece que buscan algo más que solo el producto y esperan una experiencia de compra sensorial y social. Los consumidores - se señala en el informe - quieren saber qué piensan sus iguales. El estudio resalta el peso cada vez mayor que están tomando las redes sociales a la hora de inspirar las compras de los consumidores tanto en España como en el mundo. A la pregunta sobre que medio online usa regularmente para encontrar inspiración a la hora de realizar sus compras, el 48% asegura hacerlo en las redes sociales (redes sociales y redes sociales virtuales), seguidas a distancia por las webs multimarca, 31%:
Es evidente que como consecuencia de la extensión de las nuevas tecnologías de información y el internet, ha aumentado el papel de las redes sociales y sus influencer en la formación las opiniones y los gustos, de manera que las estrategias de marketing hoy día pasan por aprovechar dicho potencial, lo que ha impulsado el desarrollo de la ciencia de los datos, el big data y el “machine learning”, en el ámbito de la empresa.
En definitiva, lo que ocurre en el mundo del consumo, conduce a considerar la decisión de gastar, en vez de un proceso individual de racionalidad, como un proceso social, en donde la manera más sencilla de abordarlo, es considerarlo como un modelo simple de copia entre individuos en la linea del modelo neutral desarrollado en el marco de la ecobiología.
El modelo neutral supone que todas las especies son idénticas en su aptitud o adecuación biodiversidad y en el efecto que tienen unas sobre otras. La teoría propone que los individuos de todas las especies de un determinado nivel trófico tienen idénticas probabilidades en sus tasas demográficas de natalidad, mortalidad, especiación y migración. De manera que a que la abundancia de una especie dentro de una comunidad, dependerá, de su abundancia relativa dentro de la metacomunidad (archipiélago). Es decir, cada comunidad será un reflejo de la metacomunidad en la que está inmersa. El mecanismo que provoca esta semejanza es la inmigración de individuos desde la metacomunidad hacia la comunidad o isla. Las especies que tengan mayor abundancia en la metacomunidad aportarán un número mayor de migrantes a las islas, de manera que si se dan infinitos eventos de migración, las abundancias relativas en la isla se asemejarán a las de la metacomunidad que la rodea (Leriana, 2004).
Las Redes Sociales
El estudio de las redes sociales se inicia a mitad de la década pasada, el antropólogo de la Escuela de Mánchester J. A. Barnes comenzó a utilizar sistemáticamente el término para mostrar patrones de lazos, abarcando los conceptos tradicionalmente utilizados por los científicos sociales: grupos delimitados (p. ej., tribus, familias) y categorías sociales (p. ej., género, etnia). El estudio de una red social se efectúa fundamentalmente a partir de dos grandes grupos de técnicas estrechamente relacionadas: la teoría de grafos y la teoría de matrices. Ambas permiten representar y describir una red de una manera sistemática y, por lo tanto, posibilitarán una más sencilla aproximación al estudio de las mismas, así como clarificar determinados comportamientos o actitudes.
La estructura de relaciones social que se representan con una red social se compone de: los nodos, que representan elementos de la red (los individuos) y las aristas o relaciones entre ellos. Las aristas pueden tener diferentes pesos dependiendo de la “fuerza” o profundidad del lazo afectivo de la relación entre los elementos correspondientes a los extremos de la arista. Estos lazos de diferente intensidad definirán pesos de las aristas de la gráfica. Las redes de libre escala es una propuesta de Barbasí y Albert. La teoría surge del mapeo de la WWW, en donde se observa un patrón en el que pocas paginas están altamente conectada, a las que se denominaron hubs, en tanto que la mayoría de las demás paginas (mas del 80%) estaban enlazadas como máximo a otras cuatro. Se define como una red cuya distribución de grados sigue una ley de potencias de exponente negativo, \(p_k \sim k^{-\gamma}\).
En general, en los ejemplos de la naturaleza y de la vida real \(2<\gamma<3\). De esta manera, estas redes contienen una cantidad relativamente pequeña de nodos (hubs) muy conectados y una gran mayoría de vertices que tienen pocas conexiones (Wikipedia). Otra de las características es que no son redes aleatorias.
Ejemplos de redes que son consideradas de libre escala son: La red de amistades entre personas (redes de llamadas telefónicas, de envíos postales y de correo electrónico), la red de contactos sexuales entre personas, las redes del crimen organizado, la red de distribución eléctrica, las redes de comercio internacional, etc…
Un ejemplo en R de una red de libre escala sería:
library(igraph)
##
## Attaching package: 'igraph'
## The following objects are masked from 'package:stats':
##
## decompose, spectrum
## The following object is masked from 'package:base':
##
## union
library(network)
## network: Classes for Relational Data
## Version 1.13.0.1 created on 2015-08-31.
## copyright (c) 2005, Carter T. Butts, University of California-Irvine
## Mark S. Handcock, University of California -- Los Angeles
## David R. Hunter, Penn State University
## Martina Morris, University of Washington
## Skye Bender-deMoll, University of Washington
## For citation information, type citation("network").
## Type help("network-package") to get started.
##
## Attaching package: 'network'
## The following objects are masked from 'package:igraph':
##
## %c%, %s%, add.edges, add.vertices, delete.edges,
## delete.vertices, get.edge.attribute, get.edges,
## get.vertex.attribute, is.bipartite, is.directed,
## list.edge.attributes, list.vertex.attributes,
## set.edge.attribute, set.vertex.attribute
# Elemplo red de libre escala
number.of.added.edges <- c(1, 1, 1, 1, 1, 1, 1, 1, 2, 1, 1, 2, 1, 1, 1, 1, 2, 1, 2, 2, 1, 2, 1, 1, 1, 1, 1)
random.scale.free.graph <- barabasi.game(n=27,out.seq=number.of.added.edges,directed=FALSE)
plot(random.scale.free.graph,vertex.size=4,vertex.label=NA,edge.label=NA,layout=layout.graphopt)

g.1=random.scale.free.graph
La distribución del grado de nodos de una red \(G=(V,E)\) se define como:
\(P(k)= \frac {m_k} {m}\)
donde \(m_k\) es el número de nodos con grado \(k\) y \(m\) es el orden de \(G\) número de nodos de la red.
Podemos obtener la distribución del grado de nodos de una red usando la función degree.distribution con entrada sólo dicha red. Por ejemplo, podemos obtener la distribución del grado de nodos de nuestra red. Dado que en la función el primer elemento es la frecuencia relativa de vértices de grado cero, los segundos vértices con grado uno, etc., se excluyen los elementos de grado cero en la gráfica:
plot(degree.distribution(g.1)[-1],type="h")

Un tipo especial de redes de importancia en fenómenos biológicos son las redes de libre escala. Dada una red \(G=(V,E)\) diremos que es libre de escala si su distribución del grado de nodos sigue una distribución exponencial negativa:
\(P(k)=ck^{-Y}\)
La función de igraph power.law.fit que recibe como entrada la distribución del grado de los nodos nos permite realizar un análisis estadístico basado en el test de Kolmogorov-Smirnov sobre el ajuste de la topología de una red a la propiedad libre de escala. Esta función devuelve un objeto donde el valor \(KS.p\) es el p-valor correspondiente a rechazar la hipotesis nula. Por lo tanto, un valor alto de \(KS.p\) indica la ausencia de evidencia para afirmar que la red estudiada no es libre de escala:
network.degree.distribution <- degree.distribution(g.1)
fit.scale.free <- power.law.fit(network.degree.distribution)
fit.scale.free[["KS.p"]]
## [1] 0.8710662
Red social de consumo en países europeos.
Utilizando grupos de gasto (12 grupos) de los países que tienen datos de 2015 en la Household budget surveys de EUROSTAT, exceptuando a Malta, valorada en estandares de poder de adquisición (PPA), se construye una Red Social que ofrece una explicación adecuada de las diferencias entre países en cuanto a las estructuras de consumo de los hogares.
datos=read.csv("hbs_exp_t121.csv",header=TRUE,sep=";",dec=".",row.names = 1)
datos1=datos[-16,]
Si realizamos un análisis cluster tomando como distancia la euclediana, y realizamos un corte de 5 cluster, encontramos en el cluster 5 los países mediterráneos (España, Italia, Chipre) junto a Eslovaquia, en el 4 un conjunto de paises situados en el este europeo (Grecia, Croacia, Lituania, Hungría, Polonia), en el cluster 3 encontramos únicamente a Estonia, enn el cluster 2 a Bulgaria, la Republica Checa, Bulgaria, Rumanía y Latvia, y en por ultimo en el 1 a Bélgica, Alemania, Suecia, Austria, Luxemburgo, Holanda, Irlanda y Finlandia. No cabe duda que la agrupación que obtenemos tiene una buena parte carácter geo-político, pero tambien es indudable que cada cluster agrupa a países con similares rentas per cápita. En el cluster que hemos denominado 1, exceptuando a Eslovenia, estan todos los países con rentas per cápita superiores a la media europea (Datos de 2018)
plot(hclust(dist(datos1)),hang=-1,cex=0.5)

cluster=cutree(hclust(dist(datos1)),k=5)
rpc.UE=read.csv("rpcUE.csv",sep=";")
rpc.UE[c(-2,-3,-4,-5)]
## Países PIB.Per.Capita.1 IDH cluster
## 1 Luxemburgo [+] 102.989$ 0,904 1
## 2 Irlanda [+] 68.206$ 0,938 1
## 3 Dinamarca [+] 55.352$ 0,929 NA
## 4 Suecia [+] 53.358$ 0,933 1
## 5 Holanda [+] 48.487$ 0,931 1
## 6 Austria [+] 47.607$ 0,908 1
## 7 Finlandia [+] 45.346$ 0,920 1
## 8 Alemania [+] 44.659$ 0,936 NA
## 9 Bélgica [+] 42.933$ 0,916 1
## 10 Reino Unido [+] 39.252$ 0,922 NA
## 11 Francia [+] 38.678$ 0,901 NA
## 12 TOTAL: UE 33.665$ NA
## 13 Italia [+] 31.413$ 0,880 5
## 14 España [+] 28.104$ 0,891 5
## 15 Malta [+] 27.328$ 0,878 NA
## 16 Chipre [+] 25.456$ 0,869 5
## 17 Eslovenia [+] 23.707$ 0,896 1
## 18 Portugal [+] 21.378$ 0,847 NA
## 19 República Checa [+] 20.735$ 0,888 2
## 20 Estonia [+] 19.710$ 0,871 3
## 21 Grecia [+] 18.624$ 0,870 4
## 22 Eslovaquia [+] 17.637$ 0,855 5
## 23 Lituania [+] 16.733$ 0,858 4
## 24 Letonia [+] 15.509$ 0,847 2
## 25 Hungría [+] 14.317$ 0,838 4
## 26 Polonia [+] 13.693$ 0,865 4
## 27 Croacia [+] 13.397$ 0,831 4
## 28 Rumanía [+] 10.756$ 0,811 2
## 29 Bulgaria [+] 8.085$ 0,813 2
Usando la teoría de las redes y los árboles de clasificación, se construye una red jerárquica que muestre los enlaces dominantes entre individuos (países) estudiados. Para hacer la red es necesario filtrar la matriz de distancias eucledianas por un árbol de expansión mínimo.
Dada un grafo, su árbol mínimo generador (o árbol de peso mínimo o árbol mínimo de expansión) es un árbol que pasa por todos los vértices y que la suma de sus aristas es la de menor peso. La gráfica siguiente presenta un árbol de expansión de 7 nodos, con las medidas de distancia que hay entre ellos. Partiendo de la distancia menor, 29, entre el nodo 8 y 4, se inicia el árbol mínimo de expansión, en el nodo 4, encuentra la mínima distancia en su enlace con el nodo 2, 31, y en el nodo 2, la menor distancia la encuentra con el nodo 5, operando de esta manera hasta tener enlazados todos los nodos. Como se puede observar en la figura, un nodo puede tener, más de un enlace con otros nodos, tal y como ocurre en el gráfico, nodo 3.
Realizamos este ejercicio con la matriz de distancias eucledianas de los grupos de gasto entre los paises de la UE.
d <- dist(datos1) # find distance matrix
#Function spantree finds a minimum spanning tree (MTA) connecting all points, but disregarding dissimilarities that are at or above the threshold or NA.
library(vegan)
## Loading required package: permute
##
## Attaching package: 'permute'
## The following object is masked from 'package:igraph':
##
## permute
## Loading required package: lattice
## This is vegan 2.5-3
##
## Attaching package: 'vegan'
## The following object is masked from 'package:igraph':
##
## diversity
tr <- spantree(d)
## Plot as a dendrogram
cl <- as.hclust(tr)
plot(cl)

## cut hclust tree to classes and show in colours in spantree
plot(tr, col=cluster,type = "t")
## Initial stress : 0.02136
## stress after 10 iters: 0.01000, magic = 0.500
## stress after 20 iters: 0.00929, magic = 0.500
## stress after 30 iters: 0.00906, magic = 0.500
## stress after 40 iters: 0.00900, magic = 0.500

Representamos los resultados del análisis anterior ahora bajo el enfoque de una red social:
red1=data.frame(var1=seq(2,23),var2=tr$kid,weight=tr$dist)
# Empezamos a usar igraph ---------------
g <- graph.data.frame(red1, directed = FALSE) # Crea igraph
etiquetas=c(rownames(datos1)[-1],rownames(datos1)[1])
plot(g, vertex.size=5, vertex.label=etiquetas)

En teoría de redes, se considera red de libre escala a aquellas en donde algunos nodos están altamente conectados, es decir, poseen un gran número de enlaces a otros nodos, en tanto el grado de conexión de casi todos los nodos es bastante bajo. Una red de consumo en donde la mayorías de los individuos presentan imitan o copian aleatoriamente los patrones de gasto de otros individuos, y en la que existen unos pocos consumidores que ejercen el papel de “influencer” tendrá por tanto la característica de libre escala.
En la red que hemos construido, Finlandia, es entre los países más ricos, el nodo con más enlaces (hub), Eslovenia y Bulgaria ocuparían este puesto entre los países de baja renta.
La red que se creada con las distancias eucledianas de los gastos de consumo entre países presentaría el siguiente p-valor para el estadístico \(KS.p\):
network.degree.distribution <- degree.distribution(g)
fit.scale.free <- power.law.fit(network.degree.distribution)
fit.scale.free[["KS.p"]]
## [1] 0.7977388
Red social de consumo de las regiones españolas.
Utilizando la distribución en grupos de gasto (12 grupos) de las CCAA en la Encuesta de Presupuestos Familiares de 2017 .
datos=read.csv("25143sc.csv",header=TRUE,sep=";",dec=".",row.names = 1)
datos1=datos[3:21,2:13]
Si realizamos un análisis cluster tomando como distancia la euclediana, encontramos dos grupos de regiones, las del norte y centro, agrupadas en uno de los cluster, y las del sur, salvo Galicia, en otro de los cluster.
plot(hclust(dist(datos1)),hang=-1,cex=0.5)
## Warning in dist(datos1): NAs introducidos por coerción

cluster=cutree(hclust(dist(datos1)),k=5)
## Warning in dist(datos1): NAs introducidos por coerción
Usando la teoría de las redes y los árboles de clasificación, se construye una red jerárquica que muestre los enlaces entre las estructuras de consumo en las regiones españolas.
d <- dist(datos1) # find distance matrix
## Warning in dist(datos1): NAs introducidos por coerción
#Function spantree finds a minimum spanning tree (MTA) connecting all points, but disregarding dissimilarities that are at or above the threshold or NA.
library(vegan)
tr <- spantree(d)
## Plot as a dendrogram
cl <- as.hclust(tr)
plot(cl)

## cut hclust tree to classes and show in colours in spantree
plot(tr, col=cluster,type = "t")
## Initial stress : 0.06282
## stress after 10 iters: 0.02429, magic = 0.500
## stress after 20 iters: 0.02348, magic = 0.500
## stress after 30 iters: 0.02336, magic = 0.500
## stress after 40 iters: 0.02335, magic = 0.500

Representamos los resultados del análisis anterior ahora bajo el enfoque de una red social:
library(igraph)
library(network)
red1=data.frame(var1=seq(2,19),var2=tr$kid,weight=tr$dist)
# Empezamos a usar igraph ---------------
g <- graph.data.frame(red1, directed = FALSE) # Crea igraph
etiquetas=c(rownames(datos1)[-1],rownames(datos1)[1])
plot(g, vertex.size=5, vertex.label=etiquetas)

En la red que hemos construido, Valencia aparece como hub central, y tres regiones Andalucía, Cantabria y la Rioja que enlazan con una serie de regiones próximas en lo geográfico y lo social.
La red que se creada con las distancias eucledianas de los porcentajes de gastos de consumo entre regiones presentaría el siguiente p-valor para el estadístico \(KS.p\):
network.degree.distribution <- degree.distribution(g)
fit.scale.free <- power.law.fit(network.degree.distribution)
fit.scale.free[["KS.p"]]
## [1] 0.6632747
Red Social de consumo en la Encuesta de Presupuesto Familiares: Microdatos de hogares.
Utilizando los datos de gastos de hogares del fichero de microdatos de la Encuesta de Presupuestos Familiares de 2017. Base 2006 (EPF), se puede construir también una red social de este tipo. Para ellos seleccionaremos muestras aleatorias de los microdatos de la EPF.
Se leen los datos de ingresos y gastos de hogares del fichero de microdatos de la Encuesta de Presupuestos Familiares de 2017. Base 2006.
## re-encoding from UTF-8
## NUMERO NMIEMB ING GAST
## 00001 : 1 Min. : 1.00 Min. : 0 Min. : 43.73
## 00002 : 1 1st Qu.: 2.00 1st Qu.: 1192 1st Qu.: 1458.91
## 00003 : 1 Median : 2.00 Median : 1744 Median : 2159.20
## 00004 : 1 Mean : 2.63 Mean : 2092 Mean : 2502.30
## 00005 : 1 3rd Qu.: 4.00 3rd Qu.: 2705 3rd Qu.: 3161.43
## 00006 : 1 Max. :11.00 Max. :22083 Max. :17799.91
## (Other):22037
## re-encoding from UTF-8
## 'data.frame': 2084799 obs. of 14 variables:
## $ ANOENC : Factor w/ 1 level "2017": 1 1 1 1 1 1 1 1 1 1 ...
## $ NUMERO : Factor w/ 22043 levels "00001","00002",..: 1 1 1 1 1 1 1 1 1 1 ...
## $ CODIGO : Factor w/ 361 levels "01111","01112",..: 1 2 3 4 5 6 7 8 9 10 ...
## $ GASTO : num 5304 2132 118115 213047 9686 ...
## $ PORCENDES: num 100 100 69.7 24.1 100 ...
## $ PORCENIMP: num 0 0 0 0 0 0 0 0 0 0 ...
## $ CANTIDAD : num NA NA 49099 49126 NA ...
## $ GASTMON : num 5304 2132 118115 213047 9686 ...
## $ GASTNOM1 : num NA NA NA NA NA NA NA NA NA NA ...
## $ GASTNOM2 : num NA NA NA NA NA NA NA NA NA NA ...
## $ GASTNOM3 : num NA NA NA NA NA NA NA NA NA NA ...
## $ GASTNOM4 : num NA NA NA NA NA NA NA NA NA NA ...
## $ GASTNOM5 : num NA NA NA NA NA NA NA NA NA NA ...
## $ FACTOR : num 1258 1258 1258 1258 1258 ...
## - attr(*, "variable.labels")= Named chr
## ..- attr(*, "names")= chr
## - attr(*, "codepage")= int 65001
Los microdatos de la ECF se agrupan por los grandes grupos de consumo de la clasificación COICOP.
Gasto$COD = substring(Gasto$COD, 1, 2) #para cadenas de texto
Gasto.a <- tapply(Gasto$GASTO/Gasto$FACTOR,list(Gasto$NUMERO,Gasto$COD),sum) # agrupo datos
Gasto.a[is.na(Gasto.a)]=0
str(Gasto.a)
## num [1:22043, 1:12] 2994 2184 7006 5745 5232 ...
## - attr(*, "dimnames")=List of 2
## ..$ : chr [1:22043] "00001" "00002" "00003" "00004" ...
## ..$ : chr [1:12] "01" "02" "03" "04" ...
Incorporamos los percentiles y deciles de ingresos al fichero con los gastos agrupados.
##
## Attaching package: 'gtools'
## The following object is masked from 'package:permute':
##
## permute
## The following object is masked from 'package:igraph':
##
## permute
Gasto.b = tapply(Gasto$GASTMON,list(Gasto$NUMERO,as.factor(Gasto$COD)),FUN=sum)
Gasto.b <- cbind(Gasto.b,Perc=Gasto.H$perc.i,Dec=Gasto.H$dec.i)
Gasto.c <- data.frame(Gasto.b)
str(Gasto.c)
## 'data.frame': 22043 obs. of 14 variables:
## $ X01 : num 3766032 1425524 9951934 3282012 2756253 ...
## $ X02 : num 1596848 NA 1360 NA 109883 ...
## $ X03 : num 2449637 39698 5996695 781885 1756307 ...
## $ X04 : num 2725304 2777344 9595297 757462 3354640 ...
## $ X05 : num 120260 2683 6888598 348757 1474539 ...
## $ X06 : num 153033 NA 424306 141320 615822 ...
## $ X07 : num 3540061 NA 6284477 13716053 642301 ...
## $ X08 : num 1153796 383712 1058287 411292 316103 ...
## $ X09 : num 1310321 NA 2862002 1320159 1075155 ...
## $ X10 : num 2012464 NA 681849 NA NA ...
## $ X11 : num 5064934 NA 9096330 2904892 1910963 ...
## $ X12 : num 1481767 NA 10064611 619937 519274 ...
## $ Perc: num 66 7 87 27 39 61 20 58 32 53 ...
## $ Dec : num 7 1 9 3 4 7 2 6 4 6 ...
Gasto.c[is.na(Gasto.c)]=0
Si realizamos un cluster jerárquico con árbol de expansión entre los 400 hogares. Las etiquetas y los colores del gráfico corresponden al decil de renta en el que se encuadran los hogares
d <- dist(datos2) # find distance matrix
#Function spantree finds a minimum spanning tree (MTA) connecting all points, but disregarding dissimilarities that are at or above the threshold or NA.
library(vegan)
tr <- spantree(d)
## plot
#plot(tr,type = "t",col=Gasto.e$Dec,labels=Gasto.e$Dec)
Utilizamos la información del árbol para construir la red social:
library(igraph)
library(network)
red1=data.frame(var1=seq(2:400),var2=tr$kid,weight=tr$dist)
# Empezamos a usar igraph ---------------
g <- graph.data.frame(red1, directed = FALSE) # Crea igraph
plot(g, vertex.size=5,vertex.label=NA)

La distribución del grado de nodos de la red usando la función degree.distribution ofrece el siguiente resultado:
plot(degree.distribution(g)[-1],type="h")

El test de Kolmogorov-Smirnov sobre el ajuste de la topología de una red a la propiedad libre de escala devuelve el siguiente p-valor:
network.degree.distribution <- degree.distribution(g)
fit.scale.free <- power.law.fit(network.degree.distribution)
fit.scale.free[["KS.p"]]
## [1] 0.4954319
Los resultados obtenidos apuntan a que la red de las distancias euclideas de los gastos de consumo de los hogares sería de libre escala.
Conclusiones
La teoría actual del consumo hace una serie de simplificaciones (cada agente tiene preferencias ya fijadas e independientes de las decisiones de otros agentes, información perfecta, decisión optima)
En los mercados de consumo, en donde las familias son de diferente condición y tienen diferentes atributos, estas simplificaciones conducen a no entender sus decisiones actuales. El número de elecciones que realizan las familias a la hora de la compra es asombroso hoy día, existiendo serias dudas acerca de la posibilidad de que los agentes obtengan y procesen toda la información que precisa una elección racional. En lugar de intentar optimizar, los agentes pueden escoger una regla “heuristica” (arte, técnica o procedimiento práctico o informal, para resolver problemas), que les de resultados satisfactorios.
Una extensión de este tipo de modelos de comportamiento se ha desarrollado en la teoría de la evolución cultural. La mayor parte de los agentes eligen copiar las elecciones que han hecho otros agentes que tienen alrededor, pero ocasionalmente la elección esta basada en una forma de selección aleatoria. En este tipo de modelos, la estructura de conexión entre agentes es muy importante.
Las poblaciones grandes de individuos con sesgos de aprendizaje son virtualmente intratables y necesitan de una aproximación apropiada que trate la población agregada, como si todos los posibles sesgos e individuos racionales se equilibraran mutuamente.
Uno de los resultados del aprendizaje social en poblaciones grandes es que las frecuencias de elementos culturales sean tratadas por cambios estocásticos. Un modelo simple de copia aleatoria entre individuos (con innovación ocasional) es conocido como modelo neutral. Este tipo de modelos se utilizado para explicar como se elige el nombre de los niños, la citación en los papeles académicos, o cambios entre las ciudades elegidas para vivir.
Usando la teoría de las redes y los árboles de clasificación, se puede construir una red jerárquica, filtrando la matriz de distancias eucledianas por un árbol de expansión mínimo, que destaque los enlaces dominantes entre agentes (países o regiones) estudiados.
Este análisis implementado sobre las estructuras de gastos de consumo en Europa y España, ofrece resultados interesantes:
Entre los países Europeos: Finlandia, es entre los paises más ricos, el nodo con más enlaces (hub), Eslovenia y Bulgaria ocuparían este puesto entre los países de baja renta.
Entre las regiones españolas, Valencia aparece como hub central, y tres regiones Andalucia, Cantabria y la Rioja que enlazan con una serie de regiones próximas en lo geográfico y lo social.
Los resultados obtenidos apuntan además a que las red de las distancias euclideas de los gastos de consumo de los hogares serían de libre escala, tanto en los estudios de países europeos, regiones españoles, o muestras aleatorias de hogares individuales.
Bibliografía
Bentley A.R , Ormerod P, y Batty M., Evolving social influence in large populations.Behav Ecol Sociobiol (2011) 65:537-546 DOI 10.1007/s00265-010-1102-1
Bunting, D.,The compsumption function paradox Journal of Post Keynesian Economics. vol 11, nº 3, 1989, pp. 347-359.
Bunting, D., Keynes Law and Its Critics, Journal of Post Keynesian Economics vol. 24, nº 1, 2001, pp. 149- 163.
Community Ecology Package: URL: https://cran.r-project.org, https://github.com/vegandevs/vegan
Deaton, A. y Muellbauer, J. (1980). «An Almost IdealDemand System». American Economic Review,nº 70, vol. 3,pp. 312-326.
Durbin, J., Tests for Serial Correlation in Regression Analysis based on the Periodogram ofLeast-Squares Residuals, Biometrika, 56, (No. 1, 1969), 1-15.
Engle, Robert F. (1974), Band Spectrum Regression,International Economic Review 15,1-11.
Fernández-Corugedo, E, Consumption Theory, Centro de Estudios de Banca Central, del Banco de Inglaterra, en Handbooks in Central Banking, no 23, Londres EC2R 8AH, julio de 2004
Friedman, M., 1957. A theory of the consumption function (Princeton University Press, Princeton, NJ).
Friedman, M. and Kuznets, S., 1945. Income from independent professional practice (National Bureau of Economic Research, NY).
García Montalvo J.(2015), NOTA: ANGUS DEATON, PREMIO NOBEL DE ECONOMÍA 2015: DEL ANÁLISIS DEL CONSUMO A LA AYUDA AL DESARROLLO, Revista de Economía Industrial, nº 398, 4 trimestre de 2015.
Harvey, A.C. (1978), Linear Regression in the Frequency Domain, International Economic Review, 19, 507-512.
Jorgeson, D.W.; Lau, L.J. y Stoker, T.M. (1980), Welfare Comparison under Exact Aggregation. American Economic Review, nº 70, vol. 2, pp. 268-272.
Keynes, J. M., 1936. The general theory of employment, interest and money (Harcourt, Brace & World, NY).
Kuznets, S., 1942. Uses of national income in peace and war, Occasional paper 6 (National Bureau of Economic Research, NY).
Leriana, J. (2004). Dos problemas: la riqueza de especies y su rareza en las comunidades, ¿hay una respuesta única?.Revista de la Universidad aUtónoma de YUcatán.Número 228.Primer trimestre de 2004.
Mantegna, R. N., “Hierarchical Structure in Financial Markets” in arXiv:cond-mat/9802256 [cond-mat.stat-mech] (or arXiv:cond-mat/9802256v1 [cond-mat.stat-mech] for this version) (1998). https://arxiv.org/pdf/cond-mat/9802256.pdf
Mantegna, R. N., Degree of Correlation Inside a Financial Market in [Proc. of the ANDM 97 International Conference], Edited by J. Kadtke, AIP press, (1997).
Modigliani, F. and Brumberg, R.,1954. “Utility analysis and the consumption function: an interpretation of cross-sectional data” in Kurihara, K. K. (ed.) Post Keynesian economics (Rutgers University Press, New Brunswick, NJ) 388-436.
Nielsen. Global Trust in Advertising : https://www.nielsen.com/us/en/insights/reports/2015/global-trust-in-advertising-2015.html
Ormerod P, Ten years after “Worrying trends in econophysics”: developments and current challenges. Eur. Phys. J. Special Topics 225, 3281-3291 (2016) The Author(s) 2016 DOI: 10.1140/epjst/e2016-60126-7
PWC España: Consumer Insights Survey 2018. https://www.pwc.es/es/retail-consumo/2018-global-consumer-insights-survey.html
Parra F (2015): Seasonal Adjustment by Frequency Analysis. Package R Version 1.2. https://cran.r-project.org/web/packages/descomponer/index.html
Tello N. y de la Peña J.A.: ,Modelos matemáticos de la sociedad y aplicaciones. Introducción.REDES- Revista hispana para el análisis de redes sociales Vol.24,1, Junio 2013 http://ddd.uab.cat/record/106550
WOMMA (Word of Mouth Marketing Association):The State of Word of Mouth Survey 2014.https://www.ama.org/resources/Pages/default.aspx