Comparando mecanismos para jukebox sociais

Introdução

O relatório estimará IC’s com dados de pesquisa real.

Dados

Os dados foram retirados de uma pesquisa real sobre a comparação de mecanismos para jukebox sociais. Abaixo tem mais detalhes sobre os dados.

## Rows: 115
## Columns: 4
## $ user_id      <chr> "1", "2", "3", "4", "5", "6", "7", "8", "9", "10", "11",…
## $ satisfaction <dbl> 2.0, 3.0, 1.5, 1.0, 2.0, 2.5, 2.0, 3.0, 2.0, 2.0, 2.0, 2…
## $ scenario     <chr> "baseline", "baseline", "baseline", "baseline", "baselin…
## $ group        <chr> "3", "1", "2", "2", "1", "1", "3", "3", "2", "1", "3", "…

Uma das variáveis que iremos avaliar nesse relatório é a de cenários da avaliação.

## # A tibble: 5 x 2
##   scenario      qtd_cenario
## * <chr>               <int>
## 1 baseline               23
## 2 combined               23
## 3 like/dislike           23
## 4 skip                   23
## 5 up/downvoting          23

Qual o tamanho do efeito de cada uma das alternativas do sistema comparada com o baseline? Esse efeito é relevante? Vale à pena para um desenvolvedor implementar uma delas?

Like/Dislike: 0.0434783
Combined: 0.3478261
Skip: -0.1304348
Up/Downvoting: -0.4782609

As diferenças entre baseline e as outras classificações foram pouco relevantes, algumas com theta chapéu negativo (baseline-like/dislike e baseline-skip) e as restantes com as positivas. Entre as medidas de theta chapéu de skip-baseline teve valor 0, não podemos saber se há relevância, dessa maneira, talvez essa medida não possa valer a pena implementar.

Qual o tamanho do efeito da combinação de alternativas (a combined) em relação às alternativas separadas?

Like/Dislike: 0.1304348
Baseline: -0.0869565
Skip: -0.0869565
Up/Downvoting: 0.173913

As medidas de theta chapéu para as variáveis combined-up/downvoting e combined-skip, não tiveram muita relevãncia, principalmente para o combined-skip com medida de theta chapéu: -0.0869565.

Considerando a escolha entre skip e up/downvoting, você recomendaria a alguém interessado em aumentar a satisfação de usuários que se prefira a implementação de um deles?

Como podemos observar, o theta chapéu foi relevante, existindo muitas amostras dentro do intervalo, no entanto existem muita amostras fora do intervalo do theta chapéu. E a somas das diferenças foi menor que o theta chapéu / tamanho das diferenças.

Se ela é mais trabalhosa, em que situação você recomendaria a implementação das várias alternativas juntas em um sistema?

A diferença entre skip-up/downvoting tem uma grande diferença entre os thetas chapéu analisados, e outro theta chapéu alto, é a diferença entre baseline-combined, pois tem valor de -0.0869565 com umas das maiores diferenças.