El siguiente informe es el resultado de una toma de datos que se ha realizado de manera experimental en mi emprendimiento Naturn, esta busca determinar la cantidad de tela que se debe utilizar para la confección de sacos. La idea surge como solución al problema de que se estaba teniendo para calcular los costos de producción, los cuales varian dependiendo de la cantidad de tela usada para fabricar los sacos la cual se relaciona con las tallas de los mismos , estas van desde la Xs hasta la XXl y gastan de 145cm a 190cm de tela. Por consiguiente luego de hacer 149 ventas por mercado libre y hacer una toma de datos juciosa decidimos llevar a cabo el análisis de los mismos y observar de que manera se comportan estos datos , lo cual se espera que nos ayude a tomar mejores decisiones en la siguiente producción. Las variables que se tuvieron en cuenta en la toma de datos son el nombre de cliente, la edad, el genero,la cantidad de ventas y la cantidad de tela. Las variables significativas son el genero, la cantidad de ventas y la cantidad de tela usada para esta venta.

DATOS

Inicialmente se presenta un histograma de la cantidad de tela utilizada, con el objetivo de estudiar el comportamiento de esta variable.Más adelante se mostrara este histograma con la curva normal haciendo uso de a libreria ggplot. Se puedo observar que la cantidad de tela usada esta distribuida de una manera normal a pesar de lo anterior como la muestra es bastante pequeña queremos realizar la comparacion con la linea de la normal con el objetivo de comparar los valores de esta variables con las observaciones esperadas para una distribucion normal.

Grafica Q-Q

Con esta grafica podemos observar que hay divirgencia entre los quantiles teoricos y los reales especialmente en la cola baja y alta. Lo cual quiere decir que se debe hacer un análisis respecto a la razón de esta dispersión, por lo tanto se procedera a graficar una de las variables con mayor sensibilidad con respecto a las tallas (el genero). Esta grafica nos permitira observar de manera más detallada la razón por la cual encontramos esta desviación.

Observaciones de genero

Luego de observar la grafica se comprueba la hipotesis de que la razon principal de la desiviación de los quantiles experientales con respecto a los teoricos es el genero, dado que los sacos destinados a hombres requieren una mayor cantidad de tela a comparación de los sacos para mujeres.

Calculos numericos respecto a la muestra

Se procede a realizar los calculos sugeridos en la clase con el objetivo de medir la capacidad del proceso de producción se hace uso de calculos de estadistica descriptiva como la media, la desviación, la mediana y la moda. Además de los limites inferiores y superiores. Finalmente se realizara una tabla de frecuencia.

## tibble [149 x 6] (S3: tbl_df/tbl/data.frame)
##  $ Numero : num [1:149] 1 2 3 4 5 6 7 8 9 10 ...
##  $ Id     : num [1:149] 833917 898539 379678 807564 383291 ...
##  $ Cliente: chr [1:149] "Gonzales, Christina" "Lozano, T'Hani" "Williams, Hanh" "Nem, Denzel" ...
##  $ Genero : chr [1:149] "Female" "Female" "Female" "Male" ...
##  $ Edad   : num [1:149] 19 19 22 19 19 19 19 19 19 19 ...
##  $ Tela   : num [1:149] 160 172 168 183 175 189 156 167 195 165 ...
##      Numero          Id           Cliente             Genero         
##  Min.   :  1   Min.   :131435   Length:149         Length:149        
##  1st Qu.: 38   1st Qu.:323852   Class :character   Class :character  
##  Median : 75   Median :531029   Mode  :character   Mode  :character  
##  Mean   : 75   Mean   :553624                                        
##  3rd Qu.:112   3rd Qu.:806369                                        
##  Max.   :149   Max.   :980136                                        
##       Edad            Tela    
##  Min.   :19.00   Min.   :145  
##  1st Qu.:19.00   1st Qu.:162  
##  Median :19.00   Median :170  
##  Mean   :19.02   Mean   :170  
##  3rd Qu.:19.00   3rd Qu.:176  
##  Max.   :22.00   Max.   :195
## [1] "la media es igual a 169.96644295302"
## [1] "la mediana es igual a 170"
## [1] "la moda igual a 172"
## [1] "la desviacion es igual a  10.4754643239556"
## [1] "el limite inferior es igual a 138.540049981153"
## [1] "el limite superior es igual a 201.392835924887"
## [1] "el numero de datos es 149"

Se puede observar que los valores de produccion se encuentran dentro de los limites inferiores y superiores lo cual es un indicio de que el proceso es capaz, a pesar de lo anterior el valor minimo y maximo se salieron de las especificaciones(politicas de producción), lo cual nos lleva a pensar que una correcion es necesaria, dado que el producto final se ve afectado lo que puede generar inconformidades por parte los clientes.

Adicionalmente los limites de la tabla de frecuencia realizada con el procedimiento indicado en clase no son acertados para este dataset por ende se presenta una tabla de fecuencia con los rangos ajustando segun la regla de Sturges. Grafica de la normal

Histograma con la curva normal

A continuación se presenta el histograma con la curva normal para realizar un análisis más detallado de esta variable.

La curva de la grafica muestra que el comportamiento de la variable de tallas se asemeja al normal, pero tenemos ciertas variaciones las cuales indican que se debe prestar atención a tallas como la S y la xs, a parte de la XL o XXL los cuales se encuentran a los extremos de la curva. Por otro lado la media es 170 por ende el presupuesto se puede ajustar a esta cantidad de tela, posteriormente se calculara la probailidad de que una proxima venta haga uso de esta cantidad de tela. Ajuste final de los costos

Finalmente deseamos calcular la probabilidad de que la cantidad de la tela utilizada para una venta sea de 170cm para realizar un presupuesto en la proxima produccion, lo cual nos permitira hacer unos calculos más cercanos a la realidad.

## [1] "la probabilidad es igual a 0.830921977473628"

Conclusiones

Luego de realizar la toma de datos y el analisis sobre los mismos podemos concluir en primera medida que el proceso ha sido capaz ya que los valores minimos y maximos se encuentran dentro de los limites inferiores y superiores. Por otro lado, se observo que los sacos que se han vendido a mujeres usan una menor cantidad de tela, este resultado nos permite ajustar la proxima producción y hacer un uso más eficiente de la tela. Además se concluye que la media de las tallas es 170cm y que la probabilidad de que una venta use esta cantidad de tela es del 83%, con dicho resultado se ajusta el presupuesto para tener unos costos más cercanos a la realidad y de esta manera poder llevar un costeo más preciso y eficiente. Finalemente se concluyé que este trabajo de toma y análisis de datos aportó gran valor al emprendimiento dado que permitió ajustar nuestro presupuesto, e identificar ciertas tendecias de nuestros clientes.